--> Fluctuation d'échantillonnage 1Introduction Dans l'animation ci-dessous on simule, tous les dixièmes de seconde, 10 lancers d'une pièce équilibrée et on affiche la proportion de piles et de faces obtenus dans un diagramme.

Même principe dans cette nouvelle animation mais on lance cette fois-ci 100 pièces.

Idem mais avec 1000 lancers.

Et enfin, pour 10 000 lancers.

On remarque donc que toutes les fréquences fluctuent autour de la probabilité 12\dfrac{1}{2}, mais plus le nombre de lancers (la taille de l'échantillon) est importante, moins cette fluctuation l'est. 2Avec la loi binomiale Soit nn un entier naturel non nul et p[0;1]p\in[0\,;1]. On considère une variable XX qui suit la loi binomiale de paramètres nn et pp.

Puisque, pour tout entier kk, P(Xk)=P(X=0)+P(X=1)++P(X=k)P(X \leq k) = P(X=0)+P(X=1)+\cdots+P(X=k), la suite de nombres :

P(X0)P(X \leq 0), P(X1)P(X \leq 1), P(X2)P(X \leq 2), \dots , P(Xn)P(X \leq n)
est ordonnée dans l'ordre croissant, avec pour dernière valeur P(Xn)=1P(X \leq n)=1.

Ainsi, on peut trouver le plus grand entier aa tel que P(X<a)0,025P(X < a) \leq 0,025.

On peut également trouver le plus petit entier bb tel que P(Xb)0,975P(X \leq b)\geq 0,975.

On a alors que :

P(aXb)=P(Xb)P(X<a)P(a\leq X \leq b)=P(X\leq b)-P(X < a) \geq 0,9750,0250,975-0,025 == 0,950,95.

L'intervalle [an;bn]\left[ \dfrac{a}{n} \,; \dfrac{b}{n} \right] est appelé intervalle de fluctuation au seuil de 9595 % de la fréquence de succès. Exemple 1 On lance 100100 fois, de manière indépendante, une pièce équilibrée. La variable aléatoire XX qui compte le nombre de piles obtenu parmi les 100100 lancers, suit la loi binomiale de paramètres 100100 et 0,50,5.

À l'aide de la calculatrice on peut remplir le tableau suivant :
kk P(Xk)P(X\leq k)
3636 0,00330,003\,3
3737 0,00600,006\,0
3838 0,01040,010\,4
3939 0,01760,017\,6
4040 0,02840,028\,4
\cdots \cdots
5858 0,95570,955\,7
5959 0,97160,971\,6
6060 0,98240,982\,4
6161 0,98950,989\,5
On trouve que P(X<40)0,025P(X < 40) \leq 0,025 et P(X60)0,975P(X\leq 60) \geq 0,975, avec 4040 et 6060 respectivement les plus grands et plus petits entiers vérifiant ces inégalités.

Ainsi, l'intervalle [0,4;0,6][0,4\,; 0,6] est un intervalle de fluctuation au seuil de 9595 % de la fréquence de piles parmi les 100100 lancers.

L'algorithme ci-dessous simule 500500 expériences de 100100 lancers d'une pièce de monnaie équilibrée et affiche la proportion d'expériences où la fréquence de piles est dans l'intervalle [0,4;0,6][0,4\,; 0,6].
Exécuter
En exécutant plusieurs fois l'algorithme nous voyons que le seuil de 9595 % est quasiment toujours respecté, les résultats étant supérieurs à 0,950,95 dans l'immensité des cas. 3Intervalle de fluctuation d'échantillonnage asymptotique Dans les anciens programmes de terminale S et ES on trouvait une formule pour un autre intervalle de fluctuation d'échantillonnage au seuil de 9595 % (cf cours suivant).

On a la propriété suivante : Property 1
Soit nNn\in\mathbb{N}^* et p[0;1]p\in[0;1].
Si la variable aléatoire XnX_n suit B(n,p)\mathcal{B}(n,p), alors : limn+P(XnnIn)=0,95\lim_{n \to +\infty}P\left(\frac{X_{n}}{n}\in I_{n}\right)=0,95InI_{n} désigne l'intervalle [p1,96p(1p)n;p+1,96p(1p)n]\left[p-1,96\frac{\sqrt{p(1-p)}}{\sqrt{n}}\,;p+1,96\frac{\sqrt{p(1-p)}}{\sqrt{n}}\right].
Remark 1 En pratique l'approximation est considérée valable dès que n30n\geq30, np5np\geq5 et n(1p)5n(1-p)\geq5. Exemple 2 On lance 100100 fois, de manière indépendante, une pièce équilibrée. La variable aléatoire XX qui compte le nombre de piles obtenu parmi les 100100 lancers, suit la loi binomiale de paramètres n=100n=100 et p=0,5p=0,5.
On a bien n30n\geq30, np=505np=50 \geq 5 et n(1p)=505n(1-p)=50\geq 5, ainsi l'intervalle

[p1,96p(1p)n;p+1,96p(1p)n]\left[p-1,96\frac{\sqrt{p(1-p)}}{\sqrt{n}}\,;p+1,96\frac{\sqrt{p(1-p)}}{\sqrt{n}}\right] == [0,51,960,5×0,5100;0,5+1,960,5×0,5100]\left[0,5-1,96\frac{\sqrt{0,5\times0,5}}{\sqrt{100}}\,; 0,5+1,96\frac{\sqrt{0,5\times0,5}}{\sqrt{100}}\right] == [0,402;0,598][0,402 \,; 0,598 ]

est un intervalle de fluctuation au seuil de 9595 % de la fréquence de piles.

On trouve un résultat proche que celui, dit exact, obtenu avec la loi binomiale.

L'intervalle de fluctuation exacte est plus précis mais il n'est pas obtenu par une formule. L'intervalle de fluctuation asymptotique est lui déterminée par une formule ce qui est intéressant pour obtenir une intervalle de confiance. Exemple 3 Un dé à 66 faces est supposé être équilibré. On le lance 5050 fois et on obtient 1313 fois la face portant le numéro 6.
En moyenne (ou dans l'idéal) on aurait dû obtenir 50×16850\times\dfrac{1}{6} \approx 8 fois la face numéro 6. La question est de savoir si on peut affirmer que ce dé est truqué ou non.
On émet l'hypothèse que ce dé est équilibré. Le fait de le lancer une fois et de regarder si on obtient la face numéro 6 ou non est une épreuve de Bernoulli de paramètre 16\dfrac{1}{6} que l'on répète 5050 fois de manière indépendante. Ainsi, la variable aléatoire XX qui compte le nombre de face 6 obtenu suit la loi binomiale de paramètres n=50n=50 et p=16p=\dfrac{1}{6}.
On a n30n\geq30, et np8,35np\approx 8,3\geq5 et n(1p)41,75n(1-p)\approx 41,7\geq5 et donc l'intervalle

[p1,96p(1p)n;p+1,96p(1p)n]\left[p-1,96\frac{\sqrt{p(1-p)}}{\sqrt{n}}\,;p+1,96\frac{\sqrt{p(1-p)}}{\sqrt{n}}\right] == [0,113;0,220][0,113 \,; 0,220 ] est un intervalle de fluctuation au seuil de 9595 % de la fréquence de face numéro 6.

La fréquence 1350=0,26\dfrac{13}{50}=0,26 n'appartient pas à cet intervalle, on peut donc affirmer avec un risque d'erreur de 55 % que le dé est truqué.