English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية
Le tableau de données (Data frame) peut être compris comme le "tableau" que nous appelons couramment.
Le tableau de données est une structure de données R, une liste à deux dimensions spéciale.
Chaque colonne du tableau de données a un nom de colonne unique, de longueur égale, le type de données de la même colonne doit être cohérent, les types de données des colonnes différentes peuvent varier.
Le langage de programmation R utilise la fonction data.frame() pour créer un tableau de données, la syntaxe est la suivante :
data.frame(…, row.names = NULL, check.rows = FALSE, check.names = TRUE, fix.empty.names = TRUE, stringsAsFactors = default.stringsAsFactors())
…: Vecteur de colonnes, peut être de n'importe quel type (charactère, numérique, logique), généralement représenté sous la forme tag = value, ou simplement value.
row.names: Le nom de ligne, par défaut NULL, peut être configuré comme un nombre unique, une chaîne ou un vecteur de chaînes et de nombres.
check.rows: Vérifier si le nom de la ligne et la longueur sont identiques.
check.names: Vérifier si les noms des variables de la boîte de données sont légaux.
fix.empty.names: Définir si les paramètres non nommés sont automatiquement nommés.
stringsAsFactors: Valeur booléenne, les chaînes de caractères sont-elles converties en facteurs, factory-fresh par défaut est TRUE, vous pouvez le modifier en définissant l'option (stringsAsFactors=FALSE).
Voici la création d'une boîte de données simple, contenant Nom, Numéro de travail, Salaire :
table = data.frame( Nom = c("Zhang San", "Li Si"), Numéro d'emploi = c("0012)), Salaire = c(1000, 2000) ) print(table) # Voir table données
结果 输出 执行 代码 以上
Nom Numéro d'emploi Salaire 1 Zhang San 001 1000 2 Li Si 002 2000
La structure des données de la boîte de données peut être affichée par str() La fonction pour afficher :
table = data.frame( Nom = c("Zhang San", "Li Si"), Numéro d'emploi = c("0012)), Salaire = c(1000, 2000) ) # Obtenir la structure des données str(table)
结果 输出 执行 代码 以上
'data.frame': 2 obs. of 3 variables: $ Nom: chr "Zhang San" "Li Si" $ Numéro de travail: chr "001" "002" $ Salaire: num 1000 2000
summary() Il est possible d'afficher les informations de résumé de la boîte de données :
table = data.frame( Nom = c("Zhang San", "Li Si"), Numéro d'emploi = c("0012)), Salaire = c(1000, 2000) ) # Afficher le résumé print(summary(table))
结果 输出 执行 代码 以上
Nom Nom Numéro de travail Salaire Longueur:2 Longueur:2 Min. :1000 Classe :character 1st Qu. :1250 Mode :character1500 Moyenne :character1500 3rd Qu. :1750 Max. :character2000
Nous pouvons également extraire des colonnes spécifiques :
table = data.frame( Nom = c("Zhang San", "Li Si"), Numéro d'emploi = c("0012)), Salaire = c(1000, 2000) ) # Extraire des colonnes spécifiques result <- data.frame(table$Nom,table$Salaire) print(result)
结果 输出 执行 代码 以上
table.Nom table.Salaire 1 Zhang San 1000 2 Li Si 2000
Les deux premières lignes sont affichées sous la forme suivante :
table = data.frame( Nom = c("Zhang San", "Li Si","Wang Wu"), Numéro d'emploi = c("00123)), Salaire = c(1000, 2000,3000) ) print(table) # Extraire les deux premières lignes print("---Sortir les deux premières lignes----]) result <- table[1:2,] print(result)
结果 输出 执行 代码 以上
Nom Numéro d'emploi Salaire 1 Zhang San 001 1000 2 Li Si 002 2000 3 Wang Wu 003 3000 [1] "---Sortir les deux premières lignes----" Nom Numéro d'emploi Salaire 1 Zhang San 001 1000 2 Li Si 002 2000
Nous pouvons lire les données d'une colonne spécifique d'une ligne spécifique sous forme de coordonnées, dans l'exemple suivant, nous lisons la ligne 2 、3 L'élément de la ligne 1 、2 Données de colonne ::
table = data.frame( Nom = c("Zhang San", "Li Si","Wang Wu"), Numéro d'emploi = c("00123)), Salaire = c(1000, 2000,3000) ) # Lire la ligne 2 、3 L'élément de la ligne 1 、2 Données de colonne : result <- table[c(2,3)),c(1,2)] print(result)
结果 输出 执行 代码 以上
Nom Numéro de travail 2 Li Si 002 3 Wang Wu 003
Nous pouvons étendre les données existantes de la boîte de données, dans l'exemple suivant, nous ajoutons une colonne Département :
table = data.frame( Nom = c("Zhang San", "Li Si","Wang Wu"), Numéro d'emploi = c("00123)), Salaire = c(1000, 2000,3000) ) # Ajouter une colonne Département table$Département <- c("Opération","Technologie","Édition") print(table)
结果 输出 执行 代码 以上
Nom Numéro de travail Salaire Département 1 Zhang San 001 1000 Opération 2 Li Si 002 2000 technique 3 Wang Wu 003 3000 éditer
Nous pouvons utiliser cbind() Fonction 合成 多个 向量 数据框 一个:
# 创建 向量 sites <- c("Google","w3codebox","Taobao") likes <- c(222,111,123) url <- c("www.google.com","fr.oldtoolbag.com,"www.taobao.com") # 将 向量 组合成 数据框 addresses <- cbind(sites,likes,url) # 查看 数据框 print(addresses)
结果 输出 执行 代码 以上
sites likes url [1,] "Google" "222" "www.google.com" [2,] "w3codebox" "111,] "oldtoolbag.com" [3,] "Taobao" "123" "www.taobao.com"
合并 两个 数据框 进行 若要对 使用 可以 rbind() Fonction:
table = data.frame( Nom = c("Zhang San", "Li Si","Wang Wu"), Numéro d'emploi = c("00123)), Salaire = c(1000, 2000,3000) ) newtable = data.frame( Nom = c("Xiao Ming", "Petit Blanc"), Numéro d'emploi = c("101",102)), Salaire = c(5000, 7000) ) # 合并 数据框 两个 result <- rbind(table,newtable) print(result)
结果 输出 执行 代码 以上
Nom Numéro d'emploi Salaire 1 Zhang San 001 1000 2 Li Si 002 2000 3 Wang Wu 003 3000 4 Xiao Ming 101 5000 5 Petit Blanc 102 7000