Terminale ∼ Spécialité mathématique Concentration / loi des grands nombresIntroduction
Soient $n$ un entier naturel non nul, $p\in[0\,;1]$ et $X$ une variable aléatoire suivant la loi binomiale de paramètres $n$ et $p$.
On s'intéresse à la probabilité que $X$ soit éloigné de son espérance.
On remarque ici que plus $a$ est grand, plus la probabilité que $X$ soit à une distance supérieure à $a$ de $E(X)$ est petite.
On considère une pièce de monnaie équilibrée. On veut savoir combien de fois au maximum il faut la lancer pour que la probabilité d'être à plus ou moins 10 réalisations de l'espérance soit de moins de $0,01$.
À l'aide du graphique précédent, en fixant $p$ à $0,5$, $a$ à $10$ et en faisant varier $n$ jusqu'à obtenir $P(|X-E(X)|\geq a)$ $\leq$$0,01$, on trouve $n$ $=$ $76$.
Inégalité de Bienaymé-Tchebychev-- Inégalité de Bienaymé-Tchebychev
Soit $X$ une variable aléatoire dont on note respectivement $E(X)$ et $V(X)$ son espérance et sa variance.
Pour tout réel $a > 0$,$P(|X - E(X)|\geq a)$$\leq$$\dfrac{V(X)}{a^2}$.
La moyenne du QI standard est de $100$ est l'écart-type est de $15$. Certaines personnes estiment qu'un individu donné est d'intelligence moyenne si son QI est situé à plus ou moins deux écart-types du score moyen.
On considère $X$ la variable aléatoire qui pour une personne donnée associe son QI.
D'après l'inégalité de Bienaymé-Tchebychev on a :
La probabilité qu'une personne ne soit pas d'intelligence moyenne est donc d'au-plus$0,25$.
À noter que $0,25$ est un majorant de la probabilité considérée. Celle-ci peut d'ailleurs être bien plus petite.
Loi des grands nombres-- Inégalité de concentration
Soit $X$ une variable aléatoire dont on note respectivement $E(X)$ et $V(X)$ son espérance et sa variance.
On considère $M_n$ la variable aléatoire moyenne d'un échantillon de taille $n$ de loi de $X$.
Pour tout réel $a>0$, $P(| M_n - E(X) | \geq a)$$\leq$$\dfrac{V(X)}{na^2}$.
On lance une pièce de monnaie équilibrée et on note $X$ la variable aléatoire qui vaut $0$ lorsqu'on obtient face et $1$ pour pile.
On s'intéresse à un échantillon de taille $1\,000$ de la loi de $X$ et on note $M_n$ la variable moyenne associée. On veut connaître une majoration pour la probabilité que la moyenne
de l'échantillon soit à plus de $10^{-1}$ de $0,5$.
D'après l'inégalité de concentration on a :
$P( | M_n-E(X) | \geq 0,1 )$$\leq$$0,025$.
Ce que l'on peut traduire en disant que pour $1\,000$ lancers d'un pièce de monnaie équilibrée, la probabilité que la fréquence de piles obtenue soit entre $0,4$ et $0,6$ est d'au moins $0,975$.
-- Loi faible des grands nombres
Soit $X$ une variable aléatoire et $(X_1\,;X_2\,;\cdots\,;X_n)$ un échantillon de taille de $n$ de loi de $X$.
On note $M_n$ la variable aléatoire moyenne associée à cet échantillon.
Pour tout réel $a > 0$, $\displaystyle{\lim_{n\rightarrow+\infty}P( | M_n - E(X) | \geq a )}$$=$$0$.
On peut interpréter la loi faible des grands nombres en disant que plus la taille d'un échantillon est importante, plus la probabilité que la valeur moyenne de l'échantillon s'écarte
de l'espérance est petite.
Annexe - Inégalité de Markov et démonstration de l'inégalité de Bienaymé-Tchebychev
Soient $n$ un entier naturel non nul, $p\in[0\,;1]$ et $X$ une variable aléatoire suivant la loi binomiale de paramètres $n$ et $p$.
On observe sur le graphique que plus $a$ est grand, plus la probabilité que $X$ soit supérieur à $a$ est petite.
L'algorithme ci-dessous permet d'afficher la $P(X\geq a)$ pour $X\sim\mathcal{B}(n\,;p)$.
def facto(n):
f = 1
for i in range(1,n+1):
f = f*i
return f
def binom(n,p,k):
return (1.0*facto(n))/(facto(k)*facto(n-k))*(p**k)*((1-p)**(n-k))
def proba(n,p,a):
r = 0
for i in range(a,n+1):
r = r+binom(n,p,i)
return r
print( proba(100,0.5,60) )
-- Inégalité de Markov
Soit $X$ une variable aléatoire à valeurs positives et d'espérance $E(X)$.
Pour tout réel $a>0$, $P(X \geq a)$ $\leq$ $\dfrac{E(X)}{a}$.
Preuve
Notons $x_1$, $x_2$, $\dots$, $x_n$ les $n$ valeurs de $X$. Par définition de l'espérance on a :
$E(X)$ $=$ $\displaystyle{\sum_{i=1}^n x_iP(X=x_i)}$.
On peut alors séparer le sigma en deux, en considérant les valeurs de $x_i$ telles que $x_i < a$ ou $x_i \geq a$. Ainsi :
$E(X)$ $=$ $\displaystyle{\sum_{x_i < a} x_iP(X=x_i)+\sum_{x_i \geq a} x_iP(X=x_i)}$.
La variable aléatoire $X$ étant à valeurs positives on a que $x_i \geq 0$ et puisque une probabilité est également positive on a : $\displaystyle{\sum_{x_i < a} x_iP(X=x_i)}$ $\geq$ $0$ et :
$E(X)$ $\geq$ $\displaystyle{\sum_{x_i \geq a} x_iP(X=x_i)}$.
On peut alors minorer chacun des $x_i$ par $a$, ce qui donne :
$E(X)$ $\geq$ $\displaystyle{\sum_{x_i \geq a} aP(X=x_i)}$,
Or, $\displaystyle{\sum_{x_i \geq a} aP(X=x_i)}$ $=$ $\displaystyle{a\sum_{x_i \geq a} P(X=x_i)}$ $=$ $aP(X\geq a)$.
Ainsi on a bien :
$E(X)$ $\geq$ $aP(X\geq a)$, c'est-à-dire, puisque $a > 0$, $P(X\geq a)\leq\dfrac{E(X)}{a}$.
En France, la taille moyenne d'une femme adulte est de $165$ cm. On note $X$ la variable aléatoire qui pour une adulte donnée associe sa taille.
Déterminer, à l'aide de l'inégalité de Markov, un majorant de la probabilité que cette femme mesure plus de $180$ cm (taille moyenne des mannequins)
On cherche ici $P(X \geq 180)$. L'énoncé nous donne $E(X)=165$. Ainsi d'après l'inégalité de Markow on a :
$P(X \geq 180)$ $\leq$ $\dfrac{E(X)}{180}$ soit $P(X \geq 180)$ $\leq$ $\dfrac{165}{180}$ $\simeq$ $0,917$.
Ce qui nous permet de conclure que la probabilité qu'une femme ait une taille supérieure à $180$ cm est inférieure à $0,917$.
Résultat à ne pas confondre avec une approximation de cette probabilité.
-- Inégalité de Bienaymé-Tchebychev
Soit $X$ une variable aléatoire dont on note respectivement $E(X)$ et $V(X)$ son espérance et sa variance.
Pour tout réel $a > 0$, $P(|X - E(X)|\geq a)$ $\leq$ $\dfrac{V(X)}{a^2}$.
Preuve
Comme $a>0,$ les inégalités $|X-E(X)| \geq a$ et $(X-E(X))^{2} \geq a^{2}$ sont équivalentes.
De plus, la variable $(X-E(X))^{2}$ est positive ou nulle On peut donc lui appliquer l'inégalité de Markov. Ainsi :