English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

Séries Pandas

Opérations de base de Pandas Series

pandas.Series

La structure de Series Pandas est la suivante :

pandas.Series( data, index, dtype, copy)

Les paramètres du constructeur sont les suivants-

data: les données peuvent être de diverses formes, par exemple ndarray, liste, constante index: les valeurs d'index doivent être uniques et hashables, et de la même longueur que les données. Si l'index n'est pas passé, par défaut, il est np.arange(n). dtype: dtype pour le type de données. Si None, le type de données est inféré copy: copie des données. Par défaut, faux

Il est possible de créer une Series avec diverses entrées, par exemple

Tableau Dictionnaire Valeur scalaire ou constante

Créer une Series vide

 >>> # Importer le paquet de dépendance pandas et l'aliaser
 >>> import pandas as pd
 >>> s = pd.Series()
 >>> print(s)
 Series([], dtype: float64)

Créer une Series à partir d'un ndarray

Si les données sont un ndarray, les indices passés doivent avoir la même longueur. Si aucun index n'est passé, par défaut, l'index sera range(n), où n est la longueur de l'array, c'est-à-dire [0,1,2,3…。范围(len(array))-1]。

 # Nom de fichier : pandas.py
 # Auteur par : fr.oldtoolbag.com 
 # Importer le paquet de dépendance pandas et utiliser un alias
 import pandas as pd
 import numpy as np
 data = np.array(['a','b','c','d'])
 s = pd.Series(data)
 print(s)

Résultat de l'exécution :

 0 a
 1 b
 2 c
 3 d
 dtype: object

Nous n'avons pas passé d'index, donc par défaut, l'index attribué est la plage de 0 à len(data)-1,即0到3。

 # Nom de fichier : pandas.py
 # Auteur par : fr.oldtoolbag.com 
 # Importer le paquet de dépendance pandas et utiliser un alias
 import pandas as pd
 import numpy as np
 data = np.array(['a','b','c','d'])
 s = pd.Series(data, index=[100,101,102,103]
 print(s)

Résultat de l'exécution :

 100 a
 101 b
 102 c
 103 d
 dtype: object

Nous avons passé ici les valeurs d'index. Nous pouvons donc voir les valeurs d'index personnalisées dans la sortie.

Créer une Series à partir d'un dictionnaire

Un dictionnaire peut être passé en entrée. Si l'index n'est pas spécifié, les clés du dictionnaire sont utilisées pour construire l'index dans l'ordre de tri. Si l'index est spécifié, les valeurs correspondantes aux étiquettes d'index seront extraites.

 # Nom de fichier : pandas.py
 # Auteur par : fr.oldtoolbag.com 
 # Importer le paquet de dépendance pandas et utiliser un alias
 import pandas as pd
 import numpy as np
 data = {'a' : 0., 'b' : 1., 'c' : 2}
 s = pd.Series(data)
 print(s)

Résultat de l'exécution :

 a 0.0
 b 1.0
 c 2.0
 dtype: float64

Les clés du dictionnaire sont utilisées pour construire l'index.

 # Nom de fichier : pandas.py
 # Auteur par : fr.oldtoolbag.com 
 # Importer le paquet de dépendance pandas et utiliser un alias
 import pandas as pd
 import numpy as np
 data = {

Résultat de l'exécution :

 b 1.0
 c 2.0
 d NaN
 a 0.0
 dtype: float64

L'ordre des indices est conservé, et les éléments manquants sont remplacés par NaN (non numérique).

Créer une Series à partir d'une valeur scalaire

Si les données sont des valeurs scalaires, l'index doit être fourni. Cette valeur sera répétée pour correspondre à la longueur de l'index.

 # Nom de fichier : pandas.py
 # Auteur par : fr.oldtoolbag.com 
 # Importer le paquet de dépendance pandas et utiliser un alias
 import pandas as pd
 import numpy as np
 s = pd.Series(5, index=[0, 1, 2, 3]
 print(s)

Résultat de l'exécution :

 
 0 5
 1 5
 2 5
 3 5
 dtype: int64

Accéder aux données à partir d'une Series positionnelle

Les données d'une Series peuvent être accédées de la même manière que les données d'un ndarray.
Recherche du premier élément. Il est bien connu que le comptage des tableaux commence à zéro, ce qui signifie que le premier élément est stocké à la position zéro, et ainsi de suite.

 # Nom de fichier : pandas.py
 # Auteur par : fr.oldtoolbag.com 
 # Importer le paquet de dépendance pandas et utiliser un alias
 import pandas as pd
 s = pd.Series([1,2,3,4,5], index = ['a', 'b', 'c', 'd', 'e'])
 # Recherche du premier élément de données
 print s[0]

Résultat de l'exécution :

1

Recherche des trois premiers éléments de la Series. Si vous les insérez avant, tous les éléments à partir de cet index seront extraits. Si vous utilisez deux paramètres (ils sont séparés par :) alors les éléments entre les deux indices (ne comprenant pas l'index de fin)

 # Nom de fichier : pandas.py
 # Auteur par : fr.oldtoolbag.com 
 # Importer le paquet de dépendance pandas et utiliser un alias
 import pandas as pd
 s = pd.Series([1,2,3,4,5], index = ['a', 'b', 'c', 'd', 'e'])
 # Recherche du début3éléments
 print s[:3]

Résultat de l'exécution :

 a 1
 b 2
 c 3
 dtype: int64

Recherche des trois derniers éléments.

 # Nom de fichier : pandas.py
 # Auteur par : fr.oldtoolbag.com 
 # Importer le paquet de dépendance pandas et utiliser un alias
 s = pd.Series([1,2,3,4,5], index = ['a', 'b', 'c', 'd', 'e'])
 # Recherche des trois derniers éléments
 print s[-3:]

Résultat de l'exécution :

 c 3
 d 4
 e 5
 dtype: int64

Recherche de données en utilisant des balises (index)

Les Series sont comme des dictionnaires de taille fixe, et peuvent obtenir et définir des valeurs via des balises d'index.
Recherche d'un seul élément en utilisant une valeur de balise d'index.

 # Nom de fichier : pandas.py
 # Auteur par : fr.oldtoolbag.com 
 # Importer le paquet de dépendance pandas et utiliser un alias
 import pandas as pd
 s = pd.Series([1,2,3,4,5], index = [

Résultat de l'exécution :

 1

Recherche de plusieurs éléments en utilisant une liste de valeurs de balise d'index.

 # Nom de fichier : pandas.py
 # Auteur par : fr.oldtoolbag.com 
 # Importer le paquet de dépendance pandas et utiliser un alias
 import pandas as pd
 s = pd.Series([1,2,3,4,5], index = [

Résultat de l'exécution :

 
 a 1
 c 3
 d 4
 dtype: int64

S'il n'y a pas de labels, une exception est déclenchée.

 # Nom de fichier : pandas.py
 # Auteur par : fr.oldtoolbag.com 
 # Importer le paquet de dépendance pandas et utiliser un alias
 import pandas as pd
 s = pd.Series([1,2,3,4,5], index = ['a', 'b', 'c', 'd', 'e'])
 # Recherche de plusieurs éléments
 print(s['f'])

Résultat de l'exécution :

   …
 KeyError: 'f'