« Mathématiques avec Python et Ruby/Statistique inférentielle avec Python » : différence entre les versions
Contenu supprimé Contenu ajouté
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 47 :
</source>
Une variante pour la variance est donnée par
==Écart-type==
Ligne 59 :
print(ecartype(donnees))
</source>
==Échantillons==
On peut créer un échantillon de 100 nombres gaussiens d'espérance 16 et d'écart-type 2, puis calculer sa moyenne et son écart-type:
<source lang="python">
from random import *
echantillon=[]
for n in range(100):
echantillon.append(gauss(16,2))
print(moyenne(echantillon))
print(ecartype(echantillon))
</source>
On voit que la moyenne est proche de 16 et l'écart-type proche de 2. C'est rassurant. Mais si on y regarde de plus près, on voit un problème: En prenant des échantillons plus petits, on s'attend à ce que leurs moyenne et écart-type fluctuent mais que la moyenne des moyennes (sur beaucoup de petits échantillons) soit 16 et que la moyenne des écarts-types soit proche de 2. C'est vrai pour la moyenne des moyennes mais visiblement pas pour la moyenne des écarts-types:
<source lang="python">
m=[] #liste des moyennes des echantillons
s=[] #liste des ecarts-types des echantillons
for n in range(10000):
echantillon=[]
for k in range(5):
echantillon.append(gauss(16,2))
m.append(moyenne(echantillon))
s.append(ecartype(echantillon))
print(moyenne(m)) # Voisin de 16, c'est rassurant!
print(moyenne(s)) # Largement plus petit que 2!
print(ecartype(m)) # Le moyennage resserre les ecarts-types
print(2/5**0.5) # en les divisant par la racine de la taille de l'echantillon
</source>
=Intervalles de confiance=
|