2nde ∼ DST n°8 Une urne opaque contient $3$ boules blanches et $7$ boules noires indiscernables au toucher.
Lorsqu'on tire une boule dans cette urne, on ne ne peut voir ce qu'il se passe à l'intérieur et on mélange fortement les boules.
Après chaque tirage on remet la boule tirée dans l'urne et on effectue un nouveau mélange.
  1. Quelle est la probabilité de tirer une boule blanche dans cette urne ?
  2. Puisqu'il y a $3$ boules blanches parmi $10$ boules au total et que les informations de l'énoncé nous font comprendre qu'il y a équiprobabilité, la probabilité de tirer une boule blanche dans cette urne est de $\dfrac{3}{10}$ $=$ $0,3$.
  3. On effectue $500$ tirages successifs (en remettant la boule tirée à l'intérieur de l'urne et mélangeant entre chaque tirage). Donner l'intervalle de fluctuation de la fréquence de boules blanches associé à ces $500$ tirages.
  4. La taille de l'échantillon considéré est de $n=500$, la probabilité d'obtenir une boule blanche est de $p=0,3$, ainsi l'intervalle de fluctuation cherché est :
    $I_f = \left[ p - \dfrac{1}{\sqrt{n}} \, ; \, p + \dfrac{1}{\sqrt{n}} \right]$ $=$ $[0,255 \, ; \, 0,345]$
  5. Une personne affirme posséder la même urne et après avoir effectué $500$ tirages elle dit avoir obtenu $205$ boules blanches. Que peut-on en conclure ?
  6. Cette personne a obtenu une fréquence de boules blanches de $\dfrac{205}{500}$ $=$ $0,41$.
    Or, la taille de l'échantillon peut être considérée comme suffisamment grande ($500$ tirages), et cette fréquence n'est pas dans l'intervalle de fluctuation. On peut donc affirmer, avec un risque d'erreur de $5$ % que l'urne de cette personne n'est pas exactement identitique à celle présentée dans l'énoncé.
  7. Recopier et compléter l'algorithme ci-dessous pour qu'il simule le tirage de $1\,000$ boules de cette urne, et qu'il affiche la fréquence de boules blanches obtenue.
  8. from random import* s = 0 for i in range(0,......): boule = randint(1,10) if boule <= ...: s = s+1 print(......) from random import* s = 0 for i in range(0,1000): boule = randint(1,10) if boule <= 3: s = s+1 print(s/1000)
Question de cours : Énoncer la loi des grands nombres. On considère une expérience aléatoire et un évènement $E$ de cette expérience aléatoire. Lorsque $n$ est grand, sauf exception, la fréquence observée de $E$ sur un échantillon de taille $n$ est proche de la probabilité de $E$. Sur un échantillon de $350$ personnes, constitué de façon aléatoire, un candidat aux élections municipales d'une certaine ville a obtenu $54$ % des intentions de vote.
  1. Déterminer un intervalle de confiance associé à la proportion de personnes voulant voter pour ce candidat.
  2. La taille de l'échantillon est de $n=350$ et la fréquence vaut $f=0,54$.
    L'intervalle de confiance cherché est :
    $I_c =\left[ f - \dfrac{1}{\sqrt{n}} \, ; \, f + \dfrac{1}{\sqrt{n}} \right] $ $=$ $[ 0,486 \,;\, 0,594 ]$.
  3. Peut-on accorder un niveau de confiance de $0,95$ à cet intervalle de confiance ?
  4. On a $n=350 > 50$, $n\times f = 350\times 0,54 = 189$ $>5$ et $n\times (1-f) = 350\times 0,46 = 161 >5$, donc on peut accorder un niveau de confiance de $0,95$ à cet intervalle de confiance.
  5. Pourquoi cet intervalle de confiance ne permet-il pas de conclure, avec un niveau de confiance de $0,95$ que ce candidat sera élu.
    En imaginant un autre échantillon où toujours $54$ % des personnes comptent voter pour ce candidat, déterminer la taille qu'il aurait dû posséder pour que l'intervalle de confiance associé permette de conclure avec un niveau de confiance de $0,95$ sur l'élection du candidat.
  6. La borne inférieure de l'intervalle de confiance est de $0,486$. Ainsi il ne contient pas que des valeurs supérieures $0,50$ (ce qui correspond au score pour remporter l'élection).
    On ne peut donc pas affirmer (au seuil de confiance de $95$ %) que le candidat va pouvoir emporter l'élection.

    Pour que l'intervalle nous permette une telle affirmation, on cherche une valeur de $n$ (taille de l'échantillon) telle que la borne inférieure, $f-\dfrac{1}{\sqrt{n}}$, soit strictement supérieure à $,50$ :
    $0,54-\dfrac{1}{\sqrt{n}}$ $>$ $0,5$
    $-\dfrac{1}{\sqrt{n}}$ $>$ $0,5-0,54$
    $-\dfrac{1}{\sqrt{n}}$ $>$ $-0,04$
    $\dfrac{1}{\sqrt{n}}$ $<$ $0,04$ en multipliant par $-1 < 0$.
    $1$ $<$ $0,04\sqrt{n}$ en multipliant par $\sqrt{n} > 0$.
    $\dfrac{1}{0,04}$ $<$ $\sqrt{n}$ en divisant par $0,04 > 0$.
    $25$ $<$ $\sqrt{n}$
    $25^2$ $<$ $\left(\sqrt{n}\right)^2$ car la fonction carrée est strictement croissante sur $[0\,;+\infty[$
    $625$ $<$ $n$.
    Ainsi, il aurait fallu que la taille de l'échantillon soit d'au moins $626$ personnes pour qu'avec une fréquence de $0,54$ on puisse avoir un intervalle de confiance nous permettant d'affirmer que le candidat sera élu avec un niveau de confiance de $95$ %.
Une usine d'embouteillage de lait utilise une chaîne de production qui doit remplir chaque bouteille avec exactement $1\, 030$ grammes de lait.
Le protocole de maintenance demande de vérifier régulièrement cette chaîne en mesurant la masse des bouteilles d'un échantillon en contenant $150$.
Les résultats du dernier contrôle sont donnés dans le tableau ci-dessous.
Masse en grammes $1\,026$ $1\,027$ $1\,028$ $1\,029$ $1\,030$ $1\,031$ $1\,032$ $1\,033$ $1\,034$
Effectifs $4$ $10$ $21$ $28$ $42$ $25$ $12$ $5$ $3$
On note $m$ la moyenne de cette série statistique et $s$ son écart-type.
  1. Déterminer les valeurs de $m$ et $s$. Les résultats seront arrondis à $10^{-2}$.
  2. À la calculatrice on obtient $m \approx 1\,029,73 $ et $s\approx 1,68$.
  3. La chaîne de production a besoin d'une maintenance si l'écart, en valeur absolue, entre la moyenne et $1\,030$ est supérieur à $0,5$ gramme ou si l'intervalle $[m-2s\,;\,m+2s]$ contient moins de $95$ % des masse de l'échantillon.
    Déterminer si la chaîne a besoin d'une révision ou non.
  4. L'écart, en valeur absolue, entre la moyenne est $1\,030$ est de $|1\,029,73 - 1\,030|$ $=$ $0,27 < 0,5$.
    Cette première condition est donc respectée.

    Pour la deuxième condition déterminons tout d'abord l'intervalle $[m-2s\,;\,m+2s]$ :
    $[m-2s\,;\,m+2s]$ $=$ $[1\,029,73 - 2\times 1,68 \,;\, 1\,029,73 + 2\times 1,68]$ $=$ $[1\,026,37 \,;\, 1\,033,09]$.

    D'après le tableau nous voyons que $143$ bouteilles parmi les $150$ de l'échantillon ont une masse comprise dans cet intervalle, ce qui représente une fréquence de $\dfrac{143}{150}$ $\approx$ $0,953$ $>0,95$.

    La deuxième condition est également respectée. La chaîne de production n'a donc pas besoin d'une maintenance.