« Python pour le calcul scientifique/Statistiques » : différence entre les versions

Contenu supprimé Contenu ajouté
intro
→‎Méthodes de matrices : Statistiques descriptives
Ligne 15 :
* <code>mean()</code> : moyenne ;
* <code>std()</code> : écart type ''({{lang|en|standard deviation}})''.
 
== Statistiques descriptives ==
 
NumPy fournit la fonction <code>quantile()</code> qui détermine les quantiles avec la syntaxe :
<source lang="python">
np.quantile(M, q)
</source>
où <code>M</code> est une matrice (ou une liste, un n-uplet, bref un itérable de nombres) et <code>q</code> est un quantile ou un vecteur de quantiles sous la forme d'un nombre entre 0 et 1. Par exemple, pour avoir les quartiles :
<source lang="python">
np.quantile(M, [0, 0.25, 0.5, 0.75, 1])
</source>
Si un des éléments de la matrice est un NaN, le résultat est un NaN. Pour éviter cela, on peut utiliser la fonction <code>nanquantile()</code> qui ignore les NaN.
 
Les fonctions <code>percentile()</code> et <code>nanpercentile()</code> donnent les centiles ; on indique alors le centile que l'on veut sous la forme d'un nombre entier entre 0 et 100.
 
Nous disposons également des fonctions suivantes :
* <code>amin()</code>, <code>nanmin()</code> : minimum ;
* <code>amax()</code>, <code>nanmax()</code> : maximum ;
* <code>ptp()</code> : amplitude.
 
Notons que pour toutes les fonctions, il est possible d'indiquer l'axe selon lequel on effectue le calcul. Par exemple,
<source lang="python">
M = np.arange(9).reshape(3, 3)
# [[0, 1, 2]
# [3, 4, 5]
# [6, 7, 8]]
print(np.quantile(M, [0.25, 0.5], 0))
# [[1.5 2.5 3.5] : 1er quartile des colonnes
# [3. 4. 5. ]] : médiane des colonnes
print(np.quantile(M, [0.25, 0.5], 1))
# [[0.5 3.5 6.5] : 1er quartile des lignes
# [1. 4. 7. ]] : médiane des lignes
</source>
 
== Notes et références ==