Statistiques (1)
Statistiques descriptives
1Proportions Definition 1
Le
cardinal
d'un ensemble
fini
EE désigne le
nombre d'éléments de EE.
Definition 2
Soit EE un ensemble
non vide
dont on note
nEn_E
le
cardinal.

Soit AA une partie de l'ensemble EE dont on note
nAn_A
le
cardinal.

La
proportion
pp de AA dans EE est le nombre
réel
défini par
pp
==
nAnE\dfrac{n_A}{n_E}.
Remark 1 Exemple 1 Déterminer une proportion
Dans un groupe de 40 personnes, 12 sont mineures. Quelle est la proportion de personnes mineures dans ce groupe ?
Correction
proportion\text{proportion} ==
PartieTout\dfrac{ \text{Partie} }{ \text{Tout} }
==
1240\dfrac{12}{40}
==
0,30,3
soit
3030 %.
Exemple 2 Déterminer la partie
Dans une entreprise de 360 personnes les fumeurs représentent 15 % de l'effectif total. Combien dénombre-t-on de fumeurs dans cette entreprise ?
Correction
proportion\text{proportion} ==
PartieTout\dfrac{ \text{Partie} }{ \text{Tout} }
donc Partie\text{Partie} ==
Tout×Proportion\text{Tout} \times \text{Proportion}.


C'est-à-dire :
360×0,15360\times0,15
==
5454
fumeurs.
Exemple 3 Déterminer le tout
Dans un village on dénombre 16081\, 608 électrices qui représentent 7575 % du corps électoral. Déterminer le nombre total d'électeurs de ce village.
Correction
proportion\text{proportion} ==
PartieTout\dfrac{ \text{Partie} }{ \text{Tout} }
donc Tout\text{Tout} ==
PartieFrquenceeˊ\dfrac{ \text{Partie} }{ \text{Fréquence} } .


C'est-à-dire :
16080,75\dfrac{1\,608}{0,75}
==
21442\,144 électeurs.
Remark 2 On peut récapituler les trois formules liant proportion, effectif total et effectif de la partie :
Proportion=\text{Proportion} =
PartieTout\dfrac{ \text{Partie} }{ \text{Tout} }
Partie=\text{Partie} =
Tout×Proportion\text{Tout} \times \text{Proportion}
Tout=\text{Tout} =
PartieProportion\dfrac{ \text{Partie} }{ \text{Proportion} }
Property 1
Une proportion pp d'une partie d'un ensemble vérifie :
0p10 \leq p \leq 1.
Preuve
Dans la formule pp == Proportion=\text{Proportion} =
PartieTout\dfrac{ \text{Partie} }{ \text{Tout} }
les nombres du quotient sont tous deux
positifs
, ainsi
p0p \geq 0
et puisque le numérateur est
inférieur
au
dénominateur
alors on a bien
pp \geq
11.
Property 2
Soient AA une partie d'un ensemble EE et BB une partie de AA.
En notant
p1p_1
la proportion de AA dans EE et
p2p_2
la proportion de BB dans AA alors la proportion pp de
BB dans EE
vaut :
pp
==
p1×p2p_1\times p_2.
AA
EE
BB
Exemple 4 Dans une commune 2222 % de la population est âgé de 1818 à 3030 ans. Dans cette tranche d'âge 7575 % des personnes possèdent un permis de conduire.
Quelle proportion de la population totale de cette commune représentent les personnes âgées de 1818 à 3030 ans qui possèdent un permis de conduire ?
Correction
La proportion cherchée vaut :
0,22×0,750,22\times 0,75
==
0,1650,165
soit
16,516,5 %.
2Évolutions Definition 3
On considère une donnée numérique qui a évolué d'une valeur
VDV_D
en une valeur
VAV_A
.
Remark 3 Si une quantité
augmente
ces variations sont
positives,
et si elle
diminue
elles sont
négatives.
Exemple 5 La population d'un village est passée de 813813 à 651651 habitants en 1010 ans.
Déterminer le taux de diminution sur la période.
Correction
Le taux cherché vaut
VAVDVD\dfrac{V_A-V_D}{V_D}
==
651813813\dfrac{651-813}{813}
==
162813\dfrac{-162}{813}
\approx 0,199-0,199
soit une baisse de
19,919,9 %.
Property 3
Soit tt le taux d'évolution qui permet à une quantité de passer d'une valeur VDV_D non nulle à une valeur VAV_A. On a alors :
VAV_A
==
(1+t)VD.(1+t)V_D.
Preuve
Par définition de tt on a :
tt
==
VAVDVD\dfrac{V_A-V_D}{V_D}
tt
==
VAVDVDVD\dfrac{V_A}{V_D}-\dfrac{V_D}{V_D}
tt
==
VAVD1\dfrac{V_A}{V_D}-1
t+1t+1
==
VAVD\dfrac{V_A}{V_D}
(t+1)×VD(t+1) \textcolor{red}{\times V_D}
==
VAVD×VD\dfrac{V_A}{V_D}\textcolor{red}{\times V_D}
(t+1)×VD(t+1) \times V_D
==
VAV_A.
Remark 4 Ce nombre 1+t1+t est appelé
coefficient multiplicateur
. On peut le noter
CMCM
et on a alors les formules suivantes :
CMCM ==
1+t1+t
CMCM ==
VAVD\dfrac{V_A}{V_D}
VAV_A ==
VD×CMV_D\times CM
VDV_D ==
VACM\dfrac{V_A}{CM}
tt ==
CM1CM-1
VDV_D
VAV_A
×CM\times CM
×1CM\times \dfrac{1}{CM}
Property 4
Soit une quantité évoluant d'une valeur VDV_D à une valeur VAV_A et CMCM le coefficient multiplicateur associé.
Le coefficient multiplicateur
CMRCM_R
associée à l'évolution
réciproque
d'une quantité qui évolue de
VAV_A
à
VDV_D
vaut :
CMRCM_R
==
1CM\dfrac{1}{CM}.

Le taux d'évolution
réciproque
associé vaut :
tRt_R
==
CMR1CM_R-1.
Exemple 6 Compléter le tableau de correspondance entre taux d'évolution et coefficients multiplicateurs suivant :
Taux d'évolution CMCM
+25+25 %
1,251,25
+8+8 %
1,081,08
+7,5+7,5 %
1,0751,075
35-35 %
0,650,65
6-6 %
0,940,94
4,3-4,3 %
0,9570,957
+4+4 %
1,04
+13+13 %
1,13
+6,4+6,4 %
1,064
20-20 %
0,80
1-1 %
0,99
26,6-26,6 %
0,734
Remark 5 Exercice 1 Une quantité qui baisse deux fois à la suite de 3030 % a-t-elle globalement diminué de 6060 % ?
Correction
Imaginons par exemple que cette quantité valait initialement
100100.

Puisqu'à une diminution de 3030 % correspond un coefficient multiplicateur de
0,700,70,
après la première diminution la quantité vaut :
100×0,70100\times 0,70
==
7070.

Après la deuxième baisse de
3030 %
elle vaut :
70×0,7070\times 0,70
==
4949.

Si elle avait baissé de 6060 %, elle aurait une valeur finale de :
100×100\times
0,400,40
==
4040.

Donc, non la quantité n'a pas globalement diminué de 6060 %
mais de
5151 %.
Property 5
Soit une quantité qui subit
deux
évolutions. Une première évolution où elle passe d'une valeur
V1V_1
à une valeur
V2V_2,
puis une deuxième où elle passe de
V2V_2
à une valeur
V3V_3.

On note
CM1CM_1
et
CM2CM_2
les deux coefficients
multiplicateurs
associés à ces évolutions.
Le coefficient multiplicateur
global
de l'évolution de
V1V_1
à
V3V_3
vaut alors :
CMgCM_g
==
CM1×CM2CM_1\times CM_2.
Le taux d'évolution
global
vaut :
tgt_g
==
CMg1CM_g-1.
Exemple 7 Le prix d'achat d'une voiture achetée neuve diminue lors de sa première année de 2525 %, puis de 1515 % la deuxième année.
De combien sa valeur aura-t-elle diminuée après ces deux premières années ?
Correction
Le coefficient
multiplicateur
associé à la première diminution vaut :
10,251-0,25
==
0,750,75.

Le coefficient
multiplicateur
associé à la deuxième diminution vaut :
10,151-0,15
==
0,850,85.

Le coefficient multiplicateur
global
vaut donc :
CMgCM_g
==
0,75×0,750,75\times0,75
==
0,63750,637\,5.

Ce nombre correspond à un taux d'évolution
global
de
0,637510,637\,5-1
==
0,3625-0,362\,5
soit une baisse de
36,2536,25 %.
Remark 6 On peut généraliser cette propriété à un nombre
quelconque d'évolutions.
3Tendances centrales et dispersion sur les séries statistiques Soit pp un entier naturel non nul.
On considère dans ce paragraphe une série statistique XX comportant un nombre fini pp de valeurs
x1x_1,
x2x_2,
\dots,
xpx_p,
pour lesquels les effectifs correspondants sont notés
n1n_1,
n2n_2,
\dots,
npn_p.

L'effectif total de cette série est noté
NN
et vaut :
N=n1+n2++npN = n_1+n_2+\cdots+n_p.

On peut représenter cette série à l'aide du tableau ci-dessous :
Valeurs x1x_1 x2x_2 \dots xpx_p
Effectifs
n1n_1
n2n_2
\dots
npn_p
3.1Moyenne et écart-type Property 6
Soit mm un entier naturel non nul.
Soit une série statistique composée de mm valeurs
y1y_1,
y2y_2,
\dots,
ymy_m,
dont on note
y\overline{y}
la moyenne.
Soient aa et bb deux nombres réels.
La série statistique composée des valeurs
ay1+bay_1+b,
ay2+bay_2+b,
\dots,
aym+bay_m+b
a pour moyenne
ay+ba\overline{y}+b.
Exemple 8 Voici les notes obtenues par un groupe d'élèves à une évaluation notée sur 1010 points : 88 ; 33 ; 66 ; 55 ; 44.
La note moyenne est de m=m=
5,25,2.

La propriété précédente nous dit que si on convertit les notes sur 2020, il n'est pas nécessaire de calculer la nouvelle moyenne à partir des notes sur 2020 mais simplement de
multiplier par 22
la moyenne mm. On obtient alors M=M=
10,410,4.

Si on décide d'ajouter un point à toutes les notes sur 2020, là aussi il n'est pas nécessaire de refaire un calcul de moyenne mais de simplement
ajouter
un point à
MM
pour obtenir la moyenne finale. Definition 4
La
moyenne pondérée
de la série statistique XX, notée
x\overline{x},
est définie par :
x\overline{x}
==
n1×x1+n2×x2++np×xpN.\dfrac{n_1\times x_1+ n_2\times x_2 + \cdots+n_p \times x_p}{N}.
Exercice 2 Voici les notes obtenues à une évaluation sur 5 par une certaine classe de 2nde.
Notes 00 11 22 33 44 55
Effectifs 66 66 22 44 44 66
  1. Combien compte-t-on d'élèves dans cette classe ?
  2. Déterminer à l'aide de votre calculatrice la moyenne de ces notes.
Correction
  1. En effectuant la
    somme
    des effectifs on obtient
    2828
    élèves dans cette classe.
  2. À l'aide du menu
    statistiques
    de la calculatrice, on saisit la série et on obtient que la moyenne des notes est d'environ
    2,432,43
    sur 55.
Definition 5
L'écart-type
σ\sigma
de la série statistique XX, dont la moyenne est notée
x\overline{x},
est défini par :
σ\sigma
==
n1(x1x)2+n2(x2x)2++np(xpx)2N.\sqrt{\dfrac{n_1(x_1-\overline{x})^2+n_2(x_2-\overline{x})^2+\cdots+n_p(x_p-\overline{x})^2}{N}}.
Exemple 9 Concernant la série statistique des notes de l'exercice précédent, la calculatrice nous donne un écart-type de
1,881,88.

On peut l'interpréter en disant,
qu'en moyenne,
les élèves ont une note qui est à
±1,88\pm 1,88 points de la note moyenne 2,432,43.
Remark 7 L'écart-type d'une série statistique est une mesure de dispersion autour de la moyenne. Il donne une certaine information sur l'écart moyen par rapport à la moyenne. 3.2Médiane et écart interquartile Definition 6
On range les éléments de la série statistique XX par ordre
croissant
.
On appelle
médiane
toute valeur qui
sépare
la série statistique en deux sous-séries de
même effectif.
Exemple 10 En considérant à nouveau la série statistique de l'exercice précédent, la calculatrice nous donne une médiane de
2,52,5.

Ce que l'on peut interpréter en disant que
la moitié des élèves ont eu moins de 2,52,5 et l'autre moitié plus.
Definition 7
On considère une série statistique finie.
Exemple 11 Toujours dans la série statistique des notes sur 5, la calculatrice nous donne Q1=Q_1=
11.
Ce qui peut être interpréter en disant qu'au moins
2525 %
des élèves ont eu une note
inférieure
ou égale à 11.
On obtient que Q3=Q_3=
44,
ce qui nous dit qu'au moins
7575 %
des élèves ont eu une note
inférieure
ou égale à 44. Definition 8
Soit une série statistique dont on note Q1Q_1 et Q3Q_3 le premier et troisième
quartile.
Remark 8 Nous reviendrons sur la notion d'intervalle dans le chapitre n°6. Exemple 12 Toujours dans la série statistique précédente, l'écart interquartile vaut
Q3Q1Q_3-Q_1
==
414-1
==
33.

L'intervalle interquartile est
[1;4][1\,;\,4].
Property 7
Au moins
5050 %
des valeurs d'une série statistique finie sont comprises dans son
intervalle interquartile.
Exemple 13 Dans la série statistique précédente
1616
élèves ont eu une note comprise entre 11 et 44, soit une proportion de
1628\dfrac{16}{28}
==
47\dfrac{4}{7}
\approx
0,5710,571,
c'est-à-dire à peu près
57,157,1 %.

Ainsi, on a bien qu'au moins
5050 %
des élèves ont eu une note comprise dans l'intervalle
interquartile
[1;4][1\,;\,4].
Remark 9 L'écart interquartile est une mesure de
dispersion
autour de la médiane d'une série statistique. Il donne la longueur de l'intervalle interquartile qui regroupe au moins 5050 % de la population de la série autour de sa médiane. Definition 9
Un diagramme
en boîte,
appelé aussi
boîte à moustaches,
permet de représenter les cinq paramètres suivant d'une série statistique :
le minimum,
le premier quartile,
la médiane,
le troisième quartile
et le maximum.


Il est constitué d'un axe des abscisses qui permet de placer précisément les paramètres précédents.
On construit au-dessus de celui-ci un rectangle dont les bords verticaux sont aux abscisses Q1Q_1 et Q3Q_3. À partir des milieux des côtés verticaux de ce rectangle on trace deux segments horizontaux, l'un vers la valeur minimale de la série, l'autre vers sa valeur maximale. On termine en traçant un segment vertical au sein du rectangle à l'abscisse de la médiane.
Exercice 3 On a recensé les salaires mensuels net d'une entreprise et on a pu en extraire les données suivantes :
salaire minimal 13401\,340 €, premier quartile 18001\,800 €, médiane 21002\,100 €, troisième quartile 27002\,700 €, salaire maximale 85008\,500 €.
Construire le diagramme en boite de cette série.
10002000300040005000600070008000
Correction
10002000300040005000600070008000
4Quizz Exercice 4 Pour chacune des questions suivantes, une seule des propositions énoncées est correcte. Trouver la bonne réponse en justifiant votre choix.
  1. Un coefficient multiplicateur de 1,54 correspond à :
    1. une diminution de 1,54%
    2. une augmentation de 0,54%
    3. une diminution de 98,46%
    4. une augmentation de 54%

  2. Pour calculer une diminution de 7,1% il faut ;
    1. multiplier par 7,1100\dfrac{7,1}{100}
    2. diviser par 7,1
    3. multiplier par 0,929
    4. soustraire 0,071


  3. Le prix TTC d'un ordinateur est de 699€. Sachant que la TVA est de 2020 %, le prix hors taxe de l'ordinateur est :
    1. 679 €
    2. 559,20 €
    3. 582,5 €
    4. 838,80 €

  4. Le nombre annuel de naissances dans un village est passé de 15 à 54. Ce nombre a augmenté de :
    1. 3,6 %
    2. 39 %
    3. 260 %
    4. 360 %

  5. Pam a eu deux notes en mathématiques, toutes de même coefficient : 7,57,5 et 13,513,5.
    L'écart-type de ses notes est de :
    1. 11
    2. 33
    3. 66
    4. 7,57,5

  6. Des amis comparent leur pointure de pied : 3535, 3636, 3636, 3939, 4242, 4343, 4444, 4949.
    Le premier quartile de cette série vaut :
    1. 3636
    2. 3838
    3. 3939
    4. 40,540,5