English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية
Opérations de base de Pandas Series
La structure de Series Pandas est la suivante :
pandas.Series( data, index, dtype, copy)
Les paramètres du constructeur sont les suivants-
data: les données peuvent être de diverses formes, par exemple ndarray, liste, constante index: les valeurs d'index doivent être uniques et hashables, et de la même longueur que les données. Si l'index n'est pas passé, par défaut, il est np.arange(n). dtype: dtype pour le type de données. Si None, le type de données est inféré copy: copie des données. Par défaut, faux
Il est possible de créer une Series avec diverses entrées, par exemple
Tableau Dictionnaire Valeur scalaire ou constante
>>> # Importer le paquet de dépendance pandas et l'aliaser >>> import pandas as pd >>> s = pd.Series() >>> print(s) Series([], dtype: float64)
Si les données sont un ndarray, les indices passés doivent avoir la même longueur. Si aucun index n'est passé, par défaut, l'index sera range(n), où n est la longueur de l'array, c'est-à-dire [0,1,2,3…。范围(len(array))-1]。
# Nom de fichier : pandas.py # Auteur par : fr.oldtoolbag.com # Importer le paquet de dépendance pandas et utiliser un alias import pandas as pd import numpy as np data = np.array(['a','b','c','d']) s = pd.Series(data) print(s)
Résultat de l'exécution :
0 a 1 b 2 c 3 d dtype: object
Nous n'avons pas passé d'index, donc par défaut, l'index attribué est la plage de 0 à len(data)-1,即0到3。
# Nom de fichier : pandas.py # Auteur par : fr.oldtoolbag.com # Importer le paquet de dépendance pandas et utiliser un alias import pandas as pd import numpy as np data = np.array(['a','b','c','d']) s = pd.Series(data, index=[100,101,102,103] print(s)
Résultat de l'exécution :
100 a 101 b 102 c 103 d dtype: object
Nous avons passé ici les valeurs d'index. Nous pouvons donc voir les valeurs d'index personnalisées dans la sortie.
Un dictionnaire peut être passé en entrée. Si l'index n'est pas spécifié, les clés du dictionnaire sont utilisées pour construire l'index dans l'ordre de tri. Si l'index est spécifié, les valeurs correspondantes aux étiquettes d'index seront extraites.
# Nom de fichier : pandas.py # Auteur par : fr.oldtoolbag.com # Importer le paquet de dépendance pandas et utiliser un alias import pandas as pd import numpy as np data = {'a' : 0., 'b' : 1., 'c' : 2} s = pd.Series(data) print(s)
Résultat de l'exécution :
a 0.0 b 1.0 c 2.0 dtype: float64
Les clés du dictionnaire sont utilisées pour construire l'index.
# Nom de fichier : pandas.py # Auteur par : fr.oldtoolbag.com # Importer le paquet de dépendance pandas et utiliser un alias import pandas as pd import numpy as np data = {
Résultat de l'exécution :
b 1.0 c 2.0 d NaN a 0.0 dtype: float64
L'ordre des indices est conservé, et les éléments manquants sont remplacés par NaN (non numérique).
Si les données sont des valeurs scalaires, l'index doit être fourni. Cette valeur sera répétée pour correspondre à la longueur de l'index.
# Nom de fichier : pandas.py # Auteur par : fr.oldtoolbag.com # Importer le paquet de dépendance pandas et utiliser un alias import pandas as pd import numpy as np s = pd.Series(5, index=[0, 1, 2, 3] print(s)
Résultat de l'exécution :
0 5 1 5 2 5 3 5 dtype: int64
Les données d'une Series peuvent être accédées de la même manière que les données d'un ndarray.
Recherche du premier élément. Il est bien connu que le comptage des tableaux commence à zéro, ce qui signifie que le premier élément est stocké à la position zéro, et ainsi de suite.
# Nom de fichier : pandas.py # Auteur par : fr.oldtoolbag.com # Importer le paquet de dépendance pandas et utiliser un alias import pandas as pd s = pd.Series([1,2,3,4,5], index = ['a', 'b', 'c', 'd', 'e']) # Recherche du premier élément de données print s[0]
Résultat de l'exécution :
1
Recherche des trois premiers éléments de la Series. Si vous les insérez avant, tous les éléments à partir de cet index seront extraits. Si vous utilisez deux paramètres (ils sont séparés par :) alors les éléments entre les deux indices (ne comprenant pas l'index de fin)
# Nom de fichier : pandas.py # Auteur par : fr.oldtoolbag.com # Importer le paquet de dépendance pandas et utiliser un alias import pandas as pd s = pd.Series([1,2,3,4,5], index = ['a', 'b', 'c', 'd', 'e']) # Recherche du début3éléments print s[:3]
Résultat de l'exécution :
a 1 b 2 c 3 dtype: int64
Recherche des trois derniers éléments.
# Nom de fichier : pandas.py # Auteur par : fr.oldtoolbag.com # Importer le paquet de dépendance pandas et utiliser un alias s = pd.Series([1,2,3,4,5], index = ['a', 'b', 'c', 'd', 'e']) # Recherche des trois derniers éléments print s[-3:]
Résultat de l'exécution :
c 3 d 4 e 5 dtype: int64
Les Series sont comme des dictionnaires de taille fixe, et peuvent obtenir et définir des valeurs via des balises d'index.
Recherche d'un seul élément en utilisant une valeur de balise d'index.
# Nom de fichier : pandas.py # Auteur par : fr.oldtoolbag.com # Importer le paquet de dépendance pandas et utiliser un alias import pandas as pd s = pd.Series([1,2,3,4,5], index = [
Résultat de l'exécution :
1
Recherche de plusieurs éléments en utilisant une liste de valeurs de balise d'index.
# Nom de fichier : pandas.py # Auteur par : fr.oldtoolbag.com # Importer le paquet de dépendance pandas et utiliser un alias import pandas as pd s = pd.Series([1,2,3,4,5], index = [
Résultat de l'exécution :
a 1 c 3 d 4 dtype: int64
S'il n'y a pas de labels, une exception est déclenchée.
# Nom de fichier : pandas.py # Auteur par : fr.oldtoolbag.com # Importer le paquet de dépendance pandas et utiliser un alias import pandas as pd s = pd.Series([1,2,3,4,5], index = ['a', 'b', 'c', 'd', 'e']) # Recherche de plusieurs éléments print(s['f'])
Résultat de l'exécution :
… KeyError: 'f'