Statistiques (1)
Statistiques descriptives
Définition n°1
Le cardinal d'un ensemble fini EE désigne le nombre d'éléments de EE.
Définition n°2
Soit EE un ensemble non vide dont on note nEn_E le cardinal.
Soit AA une partie de l'ensemble EE dont on note nAn_A le cardinal.
La proportion pp de AA dans EE est le nombre réel défini par pp == nAnE\dfrac{n_A}{n_E}.
Proportion=\text{Proportion} = PartieTout\dfrac{ \text{Partie} }{ \text{Tout} }
Partie=\text{Partie} = Tout×Proportion\text{Tout} \times \text{Proportion}
Tout=\text{Tout} = PartieProportion\dfrac{ \text{Partie} }{ \text{Proportion} }
Propriété n°1
Une proportion pp d'une partie d'un ensemble vérifie : 0p10 \leq p \leq 1.
Propriété n°2
Soient AA une partie d'un ensemble EE et BB une partie de AA.
En notant p1p_1 la proportion de AA dans EE et p2p_2 la proportion de BB dans AA alors la proportion pp de BB dans EE vaut : pp == p1×p2p_1\times p_2.
Définition n°3
On considère une donnée numérique qui a évolué d'une valeur VDV_D en une valeur VAV_A.
  • La variation absolue vaut alors ΔV\Delta V == VAVDV_A-V_D.
  • La variation relative, ou taux d'évolution, vaut tt == VAVDVD\dfrac{V_A-V_D}{V_D}.
Propriété n°3
Soit tt le taux d'évolution qui permet à une quantité de passer d'une valeur VDV_D non nulle à une valeur VAV_A. On a alors : VAV_A == (1+t)VD.(1+t)V_D.
CMCM == 1+t1+t
CMCM == VAVD\dfrac{V_A}{V_D}
VAV_A == VD×CMV_D\times CM
VDV_D == VACM\dfrac{V_A}{CM}
tt == CM1CM-1
VDV_D
VAV_A
×CM\times CM
×1CM\times \dfrac{1}{CM}
Propriété n°4
Soit une quantité évoluant d'une valeur VDV_D à une valeur VAV_A et CMCM le coefficient multiplicateur associé.
Le coefficient multiplicateur CMRCM_R associée à l'évolution réciproque d'une quantité qui évolue de VAV_A à VDV_D vaut : CMRCM_R == 1CM\dfrac{1}{CM}.
Le taux d'évolution réciproque associé vaut : tRt_R == CMR1CM_R-1.
Propriété n°5
Soit une quantité qui subit deux évolutions. Une première évolution où elle passe d'une valeur V1V_1 à une valeur V2V_2, puis une deuxième où elle passe de V2V_2 à une valeur V3V_3.
On note CM1CM_1 et CM2CM_2 les deux coefficients multiplicateurs associés à ces évolutions.
Le coefficient multiplicateur global de l'évolution de V1V_1 à V3V_3 vaut alors : CMgCM_g == CM1×CM2CM_1\times CM_2. Le taux d'évolution global vaut : tgt_g == CMg1CM_g-1.
Propriété n°6
Soit mm un entier naturel non nul.
Soit une série statistique composée de mm valeurs y1y_1, y2y_2, \dots, ymy_m, dont on note y\overline{y} la moyenne.
Soient aa et bb deux nombres réels.
La série statistique composée des valeurs ay1+bay_1+b, ay2+bay_2+b, \dots, aym+bay_m+b a pour moyenne ay+ba\overline{y}+b.
Définition n°4
Valeurs x1x_1 x2x_2 \dots xpx_p
Effectifs n1n_1 n2n_2 \dots npn_p
La moyenne pondérée de la série statistique XX, notée x\overline{x}, est définie par :
x\overline{x} == n1×x1+n2×x2++np×xpN.\dfrac{n_1\times x_1+ n_2\times x_2 + \cdots+n_p \times x_p}{N}.
L'écart-type σ\sigma de la série statistique XX, dont la moyenne est notée x\overline{x}, est défini par :
σ\sigma == n1(x1x)2+n2(x2x)2++np(xpx)2N.\sqrt{\dfrac{n_1(x_1-\overline{x})^2+n_2(x_2-\overline{x})^2+\cdots+n_p(x_p-\overline{x})^2}{N}}.
Définition n°5
On range les éléments de la série statistique XX par ordre croissant.
On appelle médiane toute valeur qui sépare la série statistique en deux sous-séries de même effectif.
Définition n°6
On considère une série statistique finie.
  • Le premier quartile, noté Q1Q_1, est la plus petite valeur de la série telle qu'au moins 2525 % des valeurs soient inférieures ou égales à Q1Q_1.
  • Le troisième quartile, noté Q3Q_3, est la plus petite valeur de la série telle qu'au moins 7575 % des valeurs soient inférieures ou égales à Q3Q_3.
Définition n°7
Soit une série statistique dont on note Q1Q_1 et Q3Q_3 le premier et troisième quartile.
  • L'écart interquartile est la différence Q3Q1Q_3-Q_1.
  • L'intervalle interquartile, noté [Q1;Q3][Q_1\,;\, Q_3] est l'ensemble des nombres réels compris entre Q1Q_1 et Q3Q_3 inclus.
Propriété n°7
Au moins 5050 % des valeurs d'une série statistique finie sont comprises dans son intervalle interquartile.
Définition n°8
Un diagramme en boîte, appelé aussi boîte à moustaches, permet de représenter les cinq paramètres suivant d'une série statistique :
le minimum, le premier quartile, la médiane, le troisième quartile et le maximum.

Il est constitué d'un axe des abscisses qui permet de placer précisément les paramètres précédents.
On construit au-dessus de celui-ci un rectangle dont les bords verticaux sont aux abscisses Q1Q_1 et Q3Q_3. À partir des milieux des côtés verticaux de ce rectangle on trace deux segments horizontaux, l'un vers la valeur minimale de la série, l'autre vers sa valeur maximale. On termine en traçant un segment vertical au sein du rectangle à l'abscisse de la médiane.