Statistiques (1)
Statistiques descriptives
Proportions
Le cardinal d'un ensemble fini $E$ désigne le nombre d'éléments de $E$.

Soit $E$ un ensemble non vide dont on note $n_E$ le cardinal.
Soit $A$ une partie de l'ensemble $E$ dont on note $n_A$ le cardinal.
La proportion $p$ de $A$ dans $E$ est le nombre réel défini par $p$ $=$ $\dfrac{n_A}{n_E}$.
Déterminer une proportion
Dans un groupe de 40 personnes, 12 sont mineures. Quelle est la proportion de personnes mineures dans ce groupe ? $\text{proportion}$ $=$ $\dfrac{ \text{Partie} }{ \text{Tout} } $ $=$ $\dfrac{12}{40}$ $=$ $0,3$ soit $30$ %. Déterminer la partie
Dans une entreprise de 360 personnes les fumeurs représentent 15 % de l'effectif total. Combien dénombre-t-on de fumeurs dans cette entreprise ? $\text{proportion}$ $=$ $\dfrac{ \text{Partie} }{ \text{Tout} } $ donc $\text{Partie}$ $=$ $\text{Tout} \times \text{Proportion}$.

C'est-à-dire : $360\times0,15$ $=$ $54$ fumeurs.
Déterminer le tout
Dans un village on dénombre $1\, 608$ électrices qui représentent $75$ % du corps électoral. Déterminer le nombre total d'électeurs de ce village. $\text{proportion}$ $=$ $\dfrac{ \text{Partie} }{ \text{Tout} } $ donc $\text{Tout}$ $=$ $\dfrac{ \text{Partie} }{ \text{Fréquence} } $.

C'est-à-dire : $\dfrac{1\,608}{0,75}$ $=$ $2\,144$ électeurs.
On peut récapituler les trois formules liant proportion, effectif total et effectif de la partie :
$\text{Proportion} =$ $\dfrac{ \text{Partie} }{ \text{Tout} } $
$\text{Partie} =$ $\text{Tout} \times \text{Proportion}$
$\text{Tout} =$ $\dfrac{ \text{Partie} }{ \text{Proportion} } $

Une proportion $p$ d'une partie d'un ensemble vérifie : $0 \leq p \leq 1$.
Preuve
Dans la formule $p$ $=$ $\text{Proportion} =$ $\dfrac{ \text{Partie} }{ \text{Tout} } $ les nombres du quotient sont tous deux positifs, ainsi $p \geq 0$ et puisque le numérateur est inférieur au dénominateur alors on a bien $p \geq $ $1$.
Soient $A$ une partie d'un ensemble $E$ et $B$ une partie de $A$.
En notant $p_1$ la proportion de $A$ dans $E$ et $p_2$ la proportion de $B$ dans $A$ alors la proportion $p$ de $B$ dans $E$ vaut : $p$ $=$ $p_1\times p_2$.
Dans une commune $22$ % de la population est âgé de $18$ à $30$ ans. Dans cette tranche d'âge $75$ % des personnes possèdent un permis de conduire.
Quelle proportion de la population totale de cette commune représentent les personnes âgées de $18$ à $30$ ans qui possèdent un permis de conduire ? La proportion cherchée vaut : $0,22\times 0,75$ $=$ $0,165$ soit $16,5$ %. Évolutions
On considère une donnée numérique qui a évolué d'une valeur $V_D$ en une valeur $V_A$.
Si une quantité augmente ces variations sont positives, et si elle diminue elles sont négatives. La population d'un village est passée de $813$ à $651$ habitants en $10$ ans.
Déterminer le taux de diminution sur la période. Le taux cherché vaut $\dfrac{V_A-V_D}{V_D}$ $=$ $\dfrac{651-813}{813}$ $=$ $\dfrac{-162}{813}$ $\approx$ $-0,199$ soit une baisse de $19,9$ %.
Soit $t$ le taux d'évolution qui permet à une quantité de passer d'une valeur $V_D$ non nulle à une valeur $V_A$. On a alors : $V_A$ $=$ $(1+t)V_D.$
Preuve
Par définition de $t$ on a :
$t$ $=$ $\dfrac{V_A-V_D}{V_D}$
$t$ $=$ $\dfrac{V_A}{V_D}-\dfrac{V_D}{V_D}$
$t$ $=$ $\dfrac{V_A}{V_D}-1$
$t+1$ $=$ $\dfrac{V_A}{V_D}$
$(t+1) \textcolor{red}{\times V_D}$ $=$ $\dfrac{V_A}{V_D}\textcolor{red}{\times V_D}$
$(t+1) \times V_D$ $=$ $V_A$.
Ce nombre $1+t$ est appelé coefficient multiplicateur. On peut le noter $CM$ et on a alors les formules suivantes :
$CM$ $=$ $1+t$
$CM$ $=$ $\dfrac{V_A}{V_D}$
$V_A$ $=$ $V_D\times CM$
$V_D$ $=$ $\dfrac{V_A}{CM}$
$t$ $=$ $CM-1$

Soit une quantité évoluant d'une valeur $V_D$ à une valeur $V_A$ et $CM$ le coefficient multiplicateur associé.
Le coefficient multiplicateur $CM_R$ associée à l'évolution réciproque d'une quantité qui évolue de $V_A$ à $V_D$ vaut : $CM_R$ $=$ $\dfrac{1}{CM}$.
Le taux d'évolution réciproque associé vaut : $t_R$ $=$ $CM_R-1$.
Compléter le tableau de correspondance entre taux d'évolution et coefficients multiplicateurs suivant :
Taux d'évolution $CM$
$+25$ % $1,25$
$+8$ % $1,08$
$+7,5$ % $1,075$
$-35$ % $0,65$
$-6$ % $0,94$
$-4,3$ % $0,957$
$+4$ % 1,04
$+13$ % 1,13
$+6,4$ % 1,064
$-20$ % 0,80
$-1$ % 0,99
$-26,6$ % 0,734
Une quantité qui baisse deux fois à la suite de $30$ % a-t-elle globalement diminué de $60$ % ? Imaginons par exemple que cette quantité valait initialement $100$.
Puisqu'à une diminution de $30$ % correspond un coefficient multiplicateur de $0,70$, après la première diminution la quantité vaut : $100\times 0,70$ $=$ $70$.
Après la deuxième baisse de $30$ % elle vaut : $70\times 0,70$ $=$ $49$.
Si elle avait baissé de $60$ %, elle aurait une valeur finale de : $100\times$ $0,40$ $=$ $40$.
Donc, non la quantité n'a pas globalement diminué de $60$ % mais de $51$ %.

Soit une quantité qui subit deux évolutions. Une première évolution où elle passe d'une valeur $V_1$ à une valeur $V_2$, puis une deuxième où elle passe de $V_2$ à une valeur $V_3$.
On note $CM_1$ et $CM_2$ les deux coefficients multiplicateurs associés à ces évolutions.
Le coefficient multiplicateur global de l'évolution de $V_1$ à $V_3$ vaut alors : $CM_g$ $=$ $CM_1\times CM_2$. Le taux d'évolution global vaut : $t_g$ $=$ $CM_g-1$.
Le prix d'achat d'une voiture achetée neuve diminue lors de sa première année de $25$ %, puis de $15$ % la deuxième année.
De combien sa valeur aura-t-elle diminuée après ces deux premières années ? Le coefficient multiplicateur associé à la première diminution vaut : $1-0,25$ $=$ $0,75$.
Le coefficient multiplicateur associé à la deuxième diminution vaut : $1-0,15$ $=$ $0,85$.
Le coefficient multiplicateur global vaut donc : $CM_g$ $=$ $0,75\times0,75$ $=$ $0,637\,5$.
Ce nombre correspond à un taux d'évolution global de $0,637\,5-1$ $=$ $-0,362\,5$ soit une baisse de $36,25$ %.
On peut généraliser cette propriété à un nombre quelconque d'évolutions. Tendances centrales et dispersion sur les séries statistiques Soit $p$ un entier naturel non nul.
On considère dans ce paragraphe une série statistique $X$ comportant un nombre fini $p$ de valeurs $x_1$, $x_2$, $\dots$, $x_p$, pour lesquels les effectifs correspondants sont notés $n_1$, $n_2$, $\dots$, $n_p$.
L'effectif total de cette série est noté $N$ et vaut : $N = n_1+n_2+\cdots+n_p$.
On peut représenter cette série à l'aide du tableau ci-dessous :
Valeurs $x_1$ $x_2$ $\dots$ $x_p$
Effectifs $n_1$ $n_2$ $\dots$ $n_p$
Moyenne et écart-type
Soit $m$ un entier naturel non nul.
Soit une série statistique composée de $m$ valeurs $y_1$, $y_2$, $\dots$, $y_m$, dont on note $\overline{y}$ la moyenne.
Soient $a$ et $b$ deux nombres réels.
La série statistique composée des valeurs $ay_1+b$, $ay_2+b$, $\dots$, $ay_m+b$ a pour moyenne $a\overline{y}+b$.
Voici les notes obtenues par un groupe d'élèves à une évaluation notée sur $10$ points : $8$ ; $3$ ; $6$ ; $5$ ; $4$.
La note moyenne est de $m=$ $5,2$.
La propriété précédente nous dit que si on convertit les notes sur $20$, il n'est pas nécessaire de calculer la nouvelle moyenne à partir des notes sur $20$ mais simplement de multiplier par $2$ la moyenne $m$. On obtient alors $M=$ $10,4$.
Si on décide d'ajouter un point à toutes les notes sur $20$, là aussi il n'est pas nécessaire de refaire un calcul de moyenne mais de simplement ajouter un point à $M$ pour obtenir la moyenne finale.
La moyenne pondérée de la série statistique $X$, notée $\overline{x}$, est définie par : $\overline{x}$ $=$ $\dfrac{n_1\times x_1+ n_2\times x_2 + \cdots+n_p \times x_p}{N}.$
Voici les notes obtenues à une évaluation sur 5 par une certaine classe de 2nde.
Notes $0$ $1$ $2$ $3$ $4$ $5$
Effectifs $6$ $6$ $2$ $4$ $4$ $6$
  1. Combien compte-t-on d'élèves dans cette classe ?
  2. Déterminer à l'aide de votre calculatrice la moyenne de ces notes.
  1. En effectuant la somme des effectifs on obtient $28$ élèves dans cette classe.
  2. À l'aide du menu statistiques de la calculatrice, on saisit la série et on obtient que la moyenne des notes est d'environ $2,43$ sur $5$.

L'écart-type $\sigma$ de la série statistique $X$, dont la moyenne est notée $\overline{x}$, est défini par : $\sigma$ $=$ $\sqrt{\dfrac{n_1(x_1-\overline{x})^2+n_2(x_2-\overline{x})^2+\cdots+n_p(x_p-\overline{x})^2}{N}}.$
Concernant la série statistique des notes de l'exercice précédent, la calculatrice nous donne un écart-type de $1,88$.
On peut l'interpréter en disant, qu'en moyenne, les élèves ont une note qui est à $\pm 1,88$ points de la note moyenne $2,43$. L'écart-type d'une série statistique est une mesure de dispersion autour de la moyenne. Il donne une certaine information sur l'écart moyen par rapport à la moyenne. Médiane et écart interquartile
On range les éléments de la série statistique $X$ par ordre croissant.
On appelle médiane toute valeur qui sépare la série statistique en deux sous-séries de même effectif.
En considérant à nouveau la série statistique de l'exercice précédent, la calculatrice nous donne une médiane de $2,5$.
Ce que l'on peut interpréter en disant que la moitié des élèves ont eu moins de $2,5$ et l'autre moitié plus.
On considère une série statistique finie.
Toujours dans la série statistique des notes sur 5, la calculatrice nous donne $Q_1=$ $1$. Ce qui peut être interpréter en disant qu'au moins $25$ % des élèves ont eu une note inférieure ou égale à $1$.
On obtient que $Q_3=$ $4$, ce qui nous dit qu'au moins $75$ % des élèves ont eu une note inférieure ou égale à $4$.
Soit une série statistique dont on note $Q_1$ et $Q_3$ le premier et troisième quartile.
Nous reviendrons sur la notion d'intervalle dans le chapitre n°6. Toujours dans la série statistique précédente, l'écart interquartile vaut $Q_3-Q_1$ $=$ $4-1$ $=$ $3$.
L'intervalle interquartile est $[1\,;\,4]$.
Au moins $50$ % des valeurs d'une série statistique finie sont comprises dans son intervalle interquartile.
Dans la série statistique précédente $16$ élèves ont eu une note comprise entre $1$ et $4$, soit une proportion de $\dfrac{16}{28}$ $=$ $\dfrac{4}{7}$ $\approx$ $0,571$, c'est-à-dire à peu près $57,1$ %.
Ainsi, on a bien qu'au moins $50$ % des élèves ont eu une note comprise dans l'intervalle interquartile $[1\,;\,4]$. L'écart interquartile est une mesure de dispersion autour de la médiane d'une série statistique. Il donne la longueur de l'intervalle interquartile qui regroupe au moins $50$ % de la population de la série autour de sa médiane.
Un diagramme en boîte, appelé aussi boîte à moustaches, permet de représenter les cinq paramètres suivant d'une série statistique :
le minimum, le premier quartile, la médiane, le troisième quartile et le maximum.

Il est constitué d'un axe des abscisses qui permet de placer précisément les paramètres précédents.
On construit au-dessus de celui-ci un rectangle dont les bords verticaux sont aux abscisses $Q_1$ et $Q_3$. À partir des milieux des côtés verticaux de ce rectangle on trace deux segments horizontaux, l'un vers la valeur minimale de la série, l'autre vers sa valeur maximale. On termine en traçant un segment vertical au sein du rectangle à l'abscisse de la médiane.
On a recensé les salaires mensuels net d'une entreprise et on a pu en extraire les données suivantes :
salaire minimal $1\,340$ €, premier quartile $1\,800$ €, médiane $2\,100$ €, troisième quartile $2\,700$ €, salaire maximale $8\,500$ €.
Construire le diagramme en boite de cette série.
Quizz Pour chacune des questions suivantes, une seule des propositions énoncées est correcte. Trouver la bonne réponse en justifiant votre choix.
  1. Un coefficient multiplicateur de 1,54 correspond à :
    1. une diminution de 1,54%
    2. une augmentation de 0,54%
    3. une diminution de 98,46%
    4. une augmentation de 54%

  2. Pour calculer une diminution de 7,1% il faut ;
    1. multiplier par $\dfrac{7,1}{100}$
    2. diviser par 7,1
    3. multiplier par 0,929
    4. soustraire 0,071


  3. Le prix TTC d'un ordinateur est de 699€. Sachant que la TVA est de $20$ %, le prix hors taxe de l'ordinateur est :
    1. 679 €
    2. 559,20 €
    3. 582,5 €
    4. 838,80 €

  4. Le nombre annuel de naissances dans un village est passé de 15 à 54. Ce nombre a augmenté de :
    1. 3,6 %
    2. 39 %
    3. 260 %
    4. 360 %

  5. Pam a eu deux notes en mathématiques, toutes de même coefficient : $7,5$ et $13,5$.
    L'écart-type de ses notes est de :
    1. $1$
    2. $3$
    3. $6$
    4. $7,5$

  6. Des amis comparent leur pointure de pied : $35$, $36$, $36$, $39$, $42$, $43$, $44$, $49$.
    Le premier quartile de cette série vaut :
    1. $36$
    2. $38$
    3. $39$
    4. $40,5$