English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

数据框 R

Le tableau de données (Data frame) peut être compris comme le "tableau" que nous appelons couramment.

Le tableau de données est une structure de données R, une liste à deux dimensions spéciale.

Chaque colonne du tableau de données a un nom de colonne unique, de longueur égale, le type de données de la même colonne doit être cohérent, les types de données des colonnes différentes peuvent varier.

Le langage de programmation R utilise la fonction data.frame() pour créer un tableau de données, la syntaxe est la suivante :

data.frame(…, row.names = NULL, check.rows = FALSE,
           check.names = TRUE, fix.empty.names = TRUE,
           stringsAsFactors = default.stringsAsFactors())
  • : Vecteur de colonnes, peut être de n'importe quel type (charactère, numérique, logique), généralement représenté sous la forme tag = value, ou simplement value.

  • row.names: Le nom de ligne, par défaut NULL, peut être configuré comme un nombre unique, une chaîne ou un vecteur de chaînes et de nombres.

  • check.rows: Vérifier si le nom de la ligne et la longueur sont identiques.

  • check.names: Vérifier si les noms des variables de la boîte de données sont légaux.

  • fix.empty.names: Définir si les paramètres non nommés sont automatiquement nommés.

  • stringsAsFactors: Valeur booléenne, les chaînes de caractères sont-elles converties en facteurs, factory-fresh par défaut est TRUE, vous pouvez le modifier en définissant l'option (stringsAsFactors=FALSE).

Voici la création d'une boîte de données simple, contenant Nom, Numéro de travail, Salaire :

table = data.frame(
    Nom = c("Zhang San", "Li Si"),
    Numéro d'emploi = c("0012)),
    Salaire = c(1000, 2000)
    
)
print(table) # Voir table données

结果 输出 执行 代码 以上

Nom Numéro d'emploi Salaire
1 Zhang San  001 1000
2 Li Si  002 2000

La structure des données de la boîte de données peut être affichée par str() La fonction pour afficher :

table = data.frame(
    Nom = c("Zhang San", "Li Si"),
    Numéro d'emploi = c("0012)),
    Salaire = c(1000, 2000)
)
# Obtenir la structure des données
str(table)

结果 输出 执行 代码 以上

'data.frame':   2 obs. of  3 variables:
 $ Nom: chr  "Zhang San" "Li Si"
 $ Numéro de travail: chr  "001" "002"
 $ Salaire: num  1000 2000

summary() Il est possible d'afficher les informations de résumé de la boîte de données :

table = data.frame(
    Nom = c("Zhang San", "Li Si"),
    Numéro d'emploi = c("0012)),
    Salaire = c(1000, 2000)
    
)
# Afficher le résumé
print(summary(table))

结果 输出 执行 代码 以上

Nom  Nom  Numéro de travail  Salaire     
Longueur:2           Longueur:2           Min. :1000  
Classe :character   1st Qu. :1250  
Mode :character1500  
                                      Moyenne :character1500  
                                      3rd Qu. :1750  
                                      Max. :character2000

Nous pouvons également extraire des colonnes spécifiques :

table = data.frame(
    Nom = c("Zhang San", "Li Si"),
    Numéro d'emploi = c("0012)),
    Salaire = c(1000, 2000)
)
# Extraire des colonnes spécifiques
result <- data.frame(table$Nom,table$Salaire)
print(result)

结果 输出 执行 代码 以上

table.Nom table.Salaire
1       Zhang San       1000
2       Li Si       2000

Les deux premières lignes sont affichées sous la forme suivante :

table = data.frame(
    Nom = c("Zhang San", "Li Si","Wang Wu"),
    Numéro d'emploi = c("00123)),
    Salaire = c(1000, 2000,3000)
)
print(table)
# Extraire les deux premières lignes
print("---Sortir les deux premières lignes----])
result <- table[1:2,]
print(result)

结果 输出 执行 代码 以上

Nom Numéro d'emploi Salaire
1 Zhang San  001 1000
2 Li Si  002 2000
3 Wang Wu  003 3000
[1] "---Sortir les deux premières lignes----"
  Nom Numéro d'emploi Salaire
1 Zhang San  001 1000
2 Li Si  002 2000

Nous pouvons lire les données d'une colonne spécifique d'une ligne spécifique sous forme de coordonnées, dans l'exemple suivant, nous lisons la ligne 2 、3 L'élément de la ligne 1 、2 Données de colonne ::

table = data.frame(
    Nom = c("Zhang San", "Li Si","Wang Wu"),
    Numéro d'emploi = c("00123)),
    Salaire = c(1000, 2000,3000)
)
# Lire la ligne 2 、3 L'élément de la ligne 1 、2 Données de colonne :
result <- table[c(2,3)),c(1,2)]
print(result)

结果 输出 执行 代码 以上

Nom Numéro de travail
2 Li Si  002
3 Wang Wu  003

Étendre la boîte de données

Nous pouvons étendre les données existantes de la boîte de données, dans l'exemple suivant, nous ajoutons une colonne Département :

table = data.frame(
    Nom = c("Zhang San", "Li Si","Wang Wu"),
    Numéro d'emploi = c("00123)),
    Salaire = c(1000, 2000,3000)
)
# Ajouter une colonne Département
table$Département <- c("Opération","Technologie","Édition")
print(table)

结果 输出 执行 代码 以上

Nom Numéro de travail Salaire Département
1 Zhang San  001 1000 Opération
2 Li Si  002 2000 technique
3 Wang Wu  003 3000 éditer

Nous pouvons utiliser cbind() Fonction 合成 多个 向量 数据框 一个:

# 创建 向量
sites <- c("Google","w3codebox","Taobao")
likes <- c(222,111,123)
url <- c("www.google.com","fr.oldtoolbag.com,"www.taobao.com")
# 将 向量 组合成 数据框
addresses <- cbind(sites,likes,url)
# 查看 数据框
print(addresses)

结果 输出 执行 代码 以上

     sites likes url             
[1,] "Google" "222" "www.google.com"
[2,] "w3codebox" "111,] "oldtoolbag.com"
[3,] "Taobao" "123" "www.taobao.com"

合并 两个 数据框 进行 若要对 使用 可以 rbind() Fonction:

table = data.frame(
    Nom = c("Zhang San", "Li Si","Wang Wu"),
    Numéro d'emploi = c("00123)),
    Salaire = c(1000, 2000,3000)
)
newtable = data.frame(
    Nom = c("Xiao Ming", "Petit Blanc"),
    Numéro d'emploi = c("101",102)),
    Salaire = c(5000, 7000)
)
# 合并 数据框 两个
result <- rbind(table,newtable)
print(result)

结果 输出 执行 代码 以上

Nom Numéro d'emploi Salaire
1 Zhang San  001 1000
2 Li Si  002 2000
3 Wang Wu  003 3000
4 Xiao Ming  101 5000
5 Petit Blanc  102 7000