« Mathématiques avec Python et Ruby/Statistique inférentielle avec Python » : différence entre les versions

Contenu supprimé Contenu ajouté
Ligne 98 :
 
==Pour des fréquences==
 
[[Fichier:VotingWomen.jpg|right]]
 
{{Cadre|Sur les 100 000 électeurs d'une ville, 43 000 s'apprêtent à voter pour le maire sortant, mais celui-ci ne le sait pas. Alors il commande un sondage, et l'institut de sondage constitue un échantillon de 100 habitants sur lesquels 52 disent vouloir voter pour le maire. Fou de joie, celui-ci achète le champagne pendant la campagne, avant les élections, et se fait battre lors des élections. Il accuse l'institut de sondage d'avoir triché. Qu'en penser?}}
Ligne 136 ⟶ 138 :
On voit que l'intervalle ''[0,42 ; 0,62]'' obtenu avec ''h=0,1'' est un intervalle à 50 %. En modifiant la valeur de ''h'' on constate que si ''h'' diminue (l'intervalle rétrécit), on perd de la confiance (la probabilité qu'il soit bon diminue aussi), et qu'il faut donc augmenter ''h'' si on veut arriver à 95 % de confiance. On voit aussi que pour ''h'' environ égale à 2, environ 98 % des échantillons sont dans l'intervalle obtenu, qui est donc un intervalle à 98 %. On trouve par tâtonnements la valeur de ''h'' pour laquelle la confiance de l'intervalle vaut 95 % (on trouve environ 0,18), puis par changement de la taille de l'échantillon, on peut conjecturer le lien entre ''h'' et la taille de l'échantillon.
 
''Remarque'': En théorie, pour un échantillon de 100 personnes, on devrait trouver ''h'' proche de 0,1 ce qui n'est pas le cas. Il semble que les tirages sans remise de ''Python'' ne soient pas assez aléatoires.
 
==Pour des moyennes==