math seconde intervalle de fluctuation (répertoire)
- Sujet de l'exercice :
- Niveau : seconde.
- Document : feuille de calcul Excel (ou Libre Office Calc)
Lien vers la feuille de calcul excel
- Objectifs :
- Vérifier "expérimentalement" la formule du cours (à partir d'une simulation) :
95% des échantillons sont dans l'intervalle [p − 1/√n ;
p + 1/√n ]
- Manipulation d'Excel
- Bien distinguer la statistique sur les échantillons de la statistique de la population.
Il s'agit d'une statistique sur (la population) des échantillons.
tout ce que nous savons de la population de départ est la proportion p de votants A. (Loi de Bernoulli B(p))
Les échantillons suivent la loi fournie dans le fichier Excel. (Loi binomiale B(n,p))
- Faire l'exercice sur 10 000 échantillons de taille 100 (n=100)
pris dans une population dont 30 % (p=0.30) des individus votent pour le candidat A.
- Modifier le fichier Excel : Dans les premières lignes, se trouvent les données :
- ligne 1 case D1 : p = proportion (de votants A) dans la population.
- ligne 2 case D2 : n = nombre d'individus dans les échantillons.
- ligne 3 case D3 : nombre d'échantillons visé (très grand : 10 000 ou plus)
- colonnes A, B et C : réduire la taille du tableau aux classes 0 à n.
- lignes 10 à 100 : Loi de probabilité des échantillons
- colonne A : numéro de classe k (qui va de 0 à n)
- colonne B : valeur = proportion (k / n) de votants A dans les échantillons de la classe k
- colonne C : effectif = nombre d'échantillons dans la classe (effectif de la classe) P(X = k)
- Travail demandé : Ici, avec solutions en couleur orange
- lignes 1 et 2 : entrer le couple (p, n) demandé
réduire le tableau des classes à n (≤ 100)
→ D1 : 0,3 et D2 : 100
- ligne 3 : calculer le nombre exact d'échantillons ?
→ H3 : =SOMME(C10:C110)
- ligne 4 : calculer 95 % du nombre d'échantillons ?
→ H4 : =0,95 * $H$3
- ligne 5 et 6 : avec la formule du cours, calculer l'intervalle de fluctuation à 95 % ? x inférieur et x supérieur
→ I5 : =$D$1 − 1/RACINE($D$2)
→ I6 : =$D$1 + 1/RACINE($D$2)
- ligne 8 et 9 : premier intervalle choisi : le plus grand intervalle contenu dans l'intervalle de fluctuation ?
→ I8 : valeur de I5 arrondie à la classe supérieure
→ I9 : valeur de I6 arrondie à la classe inférieure
- ligne 10 : nombre d'échantillons dans l'intervalle choisi ?
→ I10 : =SOMME(C30:C50)
contient-il au moins 95 % de la population ? (réponse : oui ou non)
→ L10 : oui
- lignes 12 et 13 : si l'intervalle précédent contient plus de 95 % des échantillons,
réduire l'intervalle d'une classe à chaque extrêmité et calculer le nouveau nombre d'échantillons dans l'intervalle.
→ 0,21 ; 0,39
jusqu'à ce que l'intervalle contiennent moins de 95 % des échantillons.
- ligne 14 : nombre d'échantillons dans l'intervalle choisi ?
→ I14 : =SOMME(C31:C49)
contient-il au moins 95 % de la population ? (réponse : oui ou non)
→ L14 : oui
- lignes 16 et 17 : si l'intervalle précédent contient plus de 95 % des échantillons,
réduire l'intervalle d'une classe à chaque extrêmité et calculer le nouveau nombre d'échantillons dans l'intervalle.
→ 0,22 ; 0,38
jusqu'à ce que l'intervalle contiennent moins de 95 % des échantillons.
- ligne 18 : nombre d'échantillons dans l'intervalle choisi ?
→ I18 : =SOMME(C32:C48)
contient-il au moins 95 % de la population ? (réponse : oui ou non)
→ L18 : non
- . . .
- Conclusion :
Observation des résultats et conclusion
1) l'intervalle de fluctuation à 95 % est-il respecté par la simulation.
il est respecté dans tous les cas (car le nombre d'échantillons est très grand)
2) peut-on améliorer l'intervalle (le réduire) pour les p qui s'éloignent de 0,5
(et si la taille n des échantillons est suffisante)
pour p = 0,5 l'intervalle du cours est le meilleur possible pour 95 % des échantillons
par contre quand on s'éloigne de 0,5 l'intervalle contient plus de 95 % et l'intervalle à 95 % est plus petit que celui du cours
l'intervalle ayant les bornes : p ± 1,96 √p (1 − p) / n est plus précis
quand p s'approche de 0 ou 1, l'intervalle optimum n'est plus symétrique.
- Pour les curieux, contruction des tableaux initiaux :
- numéro des classes k = nombre d'individus votant A : A10 = 0 ; puis A11 = A10 + 1
on recopie A11 de A12 à A110
- proportion de votants A dans les échantillons de la classe : B10 = k / n = A10/$D$2
avec n = $D$2 = nombre d'individus dans l'échantillon
on recopie B10 de B11 à B110
- nombre d'échantillons dans la classe : C10 = ARRONDI(LOI.BINOMIALE(A10;$D$2;$D$1;0)*$D$3)
la fonction LOI.BINOMIALE reçoit 4 arguments : k, n, p, 0 pour P(X = k)
4ème argument : 0 (0 → fréquence par classe ; 1 → fréquence cumulée)
on multiplie par le nombre d'échantillons total souhaité
puis on arrondit pour avoir un nombre entier d'échantillons
on recopie C10 de C11 à C110