English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

Fonctions statistiques de NumPy

numpy.amin() et numpy.amax()

numpy.amin() est utilisé pour calculer la valeur minimale des éléments du tableau suivant l'axe spécifié.
numpy.amax() est utilisé pour calculer la valeur maximale des éléments du tableau suivant l'axe spécifié.

 import numpy as np 
 a 	= 	np.array([[3,7,5],[8,4,3],[2,4,9]) 
 print(('Notre tableau est :', a))
 print(('Appel de la fonction amin() :', np.amin(a,1))
 print(('Appel à nouveau de la fonction amin() :', np.amin(a, 0)))
 print(('Appel de la fonction amax() :', np.amax(a)))
 print(('Appel à nouveau de la fonction amax() :', np.amax(a, axis=0)))

Le résultat de la sortie est :

 Notre tableau est : [[3 7 5])
  [8 4 3])
  [2 4 9]
 Appel de la fonction amin() : [3 3 2])
 Appel à nouveau de la fonction amin() : [2 4 3])
 Appel de la fonction amax() : 9
 Appel à nouveau de la fonction amax() : [8 7 9])

numpy.ptp()

La fonction numpy.ptp() calcule la différence entre la valeur maximale et la valeur minimale des éléments de l'array (valeur maximale) - Valeur minimale).

 import numpy as np 
 a 	= 	np.array([[3,7,5],[8,4,3],[2,4,9]) 
 print('Appel de la fonction ptp() :', np.ptp(a))
 print 	('Sur l'axe 1 Appel de la fonction ptp() : ', np.ptp(a, axis= 1))
 print('Appel de la fonction ptp() sur l'axe 0 :', np.ptp(a, axis=0))

Le résultat de la sortie est :

 Appel de la fonction ptp() : 7
 Sur l'axe 1 Appel de la fonction ptp() : [4 5 7])
 Appel de la fonction ptp() sur l'axe 0 : [6 3 6])

numpy.percentile()

Les percentiles sont des mesures utilisées en statistique pour représenter la proportion des observations inférieures à cette valeur. La fonction numpy.percentile() accepte les paramètres suivants.

numpy.percentile(a, q, axis)

Description des paramètres :

a : array d'entrée q : le percentile à calculer, entre 0 ~ 100 entre axis : le long de l'axe où calculer les percentiles

Définissons d'abord les percentiles :

La p-ième quantile est une valeur telle que au moins p% des données sont inférieures ou égales à cette valeur, et au moins (100-p)% des données sont supérieures ou égales à cette valeur.
Prenez un exemple : Les résultats des examens d'admission des universités sont souvent rapportés sous forme de percentiles. Par exemple, supposons qu'un candidat ait obtenu un score brut de 54 La performance de l'étudiant par rapport aux autres étudiants participant au même examen est difficile à déterminer. Si la note brute54La note correspond exactement à la70 percentile, nous pouvons savoir environ70% des étudiants ont des notes inférieures à la sienne, et environ30% des étudiants ont des notes supérieures à la sienne.

Ici, p = 70.

 import numpy as np 
 a 	= 	np.array([[10, 7, 4], [3, 2, 1])
 # 50% de la quantile, c'est-à-dire la médiane après l'ordre de a
 print('Appel de la fonction percentile() :', np.percentile(a, 50)) 
 # axis est 0, sur la colonne verticale
 print(np.percentile(a, 50, axis=0)) 
 # axis est 1,sur la ligne horizontale
 print(np.percentile(a, 50, axis=1)) 
 # Maintenir les dimensions inchangées
 print(np.percentile(a, 50, axis=1, keepdims=True))

Le résultat de la sortie est :

 Appel de la fonction percentile() : 3.5
 [6.5 4.5 2.5])
 [7. 2.]
 [[7.]
 [2.]]

numpy.median()

La fonction numpy.median() est utilisée pour calculer la médiane des éléments de l'array a (valeur médiane)

 import numpy as np 
 a 	= 	np.array([[30,65,70],[80,95,10],[50,90,60]]) 
 print('Appel de la fonction median() :', np.median(a))
 print 	('Appel à la fonction 	median() sur l'axe 	0 : ', 	np.median(a, 	axis 	= 	0))
 print 	('Sur l'axe 1 Appel à la fonction 	median() :',	np.median(a, 	axis 	= 1))

Le résultat de la sortie est :

 Appel à la fonction 	median() : 65.0}
 Appel à la fonction 	median() sur l'axe 	0 : 	[50. 90. 60.]
 Sur l'axe 1 Appel à la fonction 	median() : 	[65. 80. 60.]

numpy.mean()

La fonction numpy.mean() retourne la moyenne arithmétique des éléments de l'array. Si un axe est fourni, elle le calcule le long de cet axe.
La moyenne arithmétique est le total des éléments sur l'axe divisé par le nombre d'éléments.

 import numpy as np 
 a 	= 	np.array([[1,2,3],[3,4,5],[4,5,6]) 
 print 	('Appel à la fonction 	mean() : ', 	(np.mean(a)))
 print 	('Appel à la fonction 	mean() sur l'axe 	0 : ', 	np.mean(a, 	axis 	= 	0))
 print 	('Sur l'axe 1 Appel à la fonction 	mean() :',	np.mean(a, 	axis 	= 1))

Le résultat de la sortie est :

 Appel à la fonction 	mean() :3.6666666666666665
 Appel à la fonction 	mean() sur l'axe 	0 : [2.66666667 3.66666667 4.66666667])
 Sur l'axe 1 Appel à la fonction 	mean() : [2. 4. 5.]

numpy.average()

La fonction numpy.average() calcule la moyenne pondérée des éléments de l'array en utilisant les poids fournis dans un autre array.
La fonction peut accepter un paramètre d'axe. Si aucun axe n'est spécifié, l'array est étendu.<
La moyenne pondérée multiplie chaque valeur par son coefficient correspondant, puis additionne ces valeurs pour obtenir la valeur totale, puis la divise par le nombre total d'unités.
Envisageons l'array [1,2,3,4], et les poids correspondants [4,3,2,1], calculée en ajoutant les produits de chaque élément par leurs poids correspondants, puis en divisant la somme par la somme des poids.

Moyenne pondérée 	= 	(1*4+2*3+3*2+4*1])/(4+3+2+1])
 import numpy as np 
 a 	= 	np.array([1,2,3,4]) 
 print 	('Appel à la fonction 	average() : ', 	np.average(a))
 # Ne pas spécifier de poids équivaut à la fonction 	mean
 wts 	= 	np.array([4,3,2,1]) 
 print 	('Appel à la fonction 	average() 	une fois de plus : ', 	np.average(a, 	weights 	= 	wts))
 # Si le paramètre 	returned 	est configuré à 	True, alors retourne la somme des poids 
 print 	('La somme des poids : ', 	np.average([1,2,3, 4], 	weights 	= 	[4,3,2,1], 	returned 	= 	True))

Le résultat de la sortie est :

 Appel à la fonction 	average() :2.5
 Appel à la fonction 	average() 	une fois de plus :2.0}
 La somme des poids : (2.0, 10.0)

Dans les tableaux multidimensionnels, vous pouvez spécifier l'axe à utiliser pour le calcul.

 import numpy as np 
 a = np.arange(6).reshape(3,2]) 
 wt = np.array([3,5]) 
 print ('Tableau modifié :',np.average(a, axis = 1, weights = wt))
 print ('Tableau modifié :',np.average(a, axis = 1, weights = wt, returned =  True))

Le résultat de la sortie est :

 Tableau modifié : [0.625 2.625 4.625])
 Tableau modifié : (array([0.625, 2.625, 4.625]), array([8. 8. 8.))

Écart type

L'écart type est une mesure de la dispersion de la moyenne des données d'un ensemble.
L'écart type est la racine carrée de la variance.
L'équation de l'écart type est la suivante :

 std = sqrt(mean((x - x.mean())**2))

Si l'array est [1,2,3,4],alors son moyenne est 2.5。 Par conséquent, le carré de la différence est [2.25,0.25,0.25,2.25]),et puis la racine carrée de la moyenne de son moyenne divisée par 4,c'est-à-dire sqrt(5/4) ,le résultat est 1.1180339887498949。

import numpy as np 
print (np.std([1,2,3,4))

Le résultat de la sortie est :

1.1180339887498949

Variance

La variance dans la statistique (variance de l'échantillon) est la moyenne des carrés des différences entre chaque valeur d'échantillon et la moyenne des valeurs d'échantillon, c'est-à-dire mean((x - x.mean())** 2)。
En d'autres termes, l'écart type est la racine carrée de la variance.

import numpy as np 
print (np.var([1,2,3,4))
1.25