English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية
Exemple d'opération de visualisation Pandas
Cette fonction sur Series et DataFrame est simplement un emballage simple autour de la méthode plot() de la bibliothèque matplotlib.
import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(10,4),index=pd.date_range('1/1/2000', periods=10), columns=list('ABCD')) df.plot()
Les résultats de l'exécution sont les suivants :
Si l'index est composé de dates, il appelle gct().autofmt_xdate() pour formater l'axe des abscisses, comme montré dans le graphique ci-dessus.
Nous pouvons dessiner la relation entre une colonne et une autre en utilisant les mots-clés x et y.
En plus du graphique en ligne par défaut, les méthodes de dessin permettent d'utiliser plusieurs styles de dessin. Ces méthodes peuvent être fournies en tant que paramètres de la clé kind de plot(). Cela inclut :
Graphique en barres Histogramme Graphique en boîte Graphique en surface Graphique en nuage de points Diagramme en secteurs
Voici comment créer un graphique en barres :
import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d') df.plot.bar()
Les résultats de l'exécution sont les suivants :
Cela génère un graphique en colonnes empilées, vous pouvez configurer stacked=True
import pandas as pd df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d') df.plot.bar(stacked=True)
Les résultats de l'exécution sont les suivants :
Pour obtenir un graphique en barres horizontales, vous pouvez utiliser la méthode barh :
import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d') df.plot.barh(stacked=True)
Les résultats de l'exécution sont les suivants :
Il est possible de dessiner un histogramme en utilisant la méthode plot.hist(). Nous pouvons spécifier le nombre de bins.
import pandas as pd import numpy as np df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c': np.random.randn(1000) - 1}, columns=['a', 'b', 'c']) df.plot.hist(bins=20)
Les résultats de l'exécution sont les suivants :
Il est possible de dessiner des histogrammes différents pour chaque colonne en utilisant le code suivant :
import pandas as pd import numpy as np df=pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c': np.random.randn(1000) - 1}, columns=['a', 'b', 'c']) df.diff.hist(bins=20)
Les résultats de l'exécution sont les suivants :
Il est possible de dessiner un Boxplot en appelant Series.box.plot() et DataFrame.box.plot() ou DataFrame.boxplot() pour visualiser la distribution des valeurs dans chaque colonne.
Par exemple, c'est un diagramme en boîte, représentant des tests sur [0,1d'une variable aléatoire sur10cinq essais sur cinq observations.
import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E']) df.plot.box()
Les résultats de l'exécution sont les suivants :
Vous pouvez créer un graphique en surface en utilisant la méthode Series.plot.area() ou DataFrame.plot.area().
import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd']) df.plot.area()
Les résultats de l'exécution sont les suivants :
Pour créer un graphique en nuage de points, vous pouvez utiliser la méthode DataFrame.plot.scatter().
import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(50, 4), columns=['a', 'b', 'c', 'd']) df.plot.scatter(x='a', y='b')
Les résultats de l'exécution sont les suivants :
Pour créer un diagramme en secteurs, vous pouvez utiliser la méthode DataFrame.plot.pie().
import pandas as pd import numpy as np df = pd.DataFrame(3 * np.random.rand(4), index=['a', 'b', 'c', 'd'], columns=['x']) df.plot.pie(subplots=True)
Les résultats de l'exécution sont les suivants :