Enseignement scientifique ∼ Ajustement affineRappels -- Fonction affine
Une fonction $f$ définie sur $\mathbb{R}$ est dite affine lorsqu'il existe deux réels $a$ et $b$ tels que, pour tout $x \in \mathbb{R}$, $f(x)$$=$$ax+b$.
Les nombres $a$ et $b$ sont respectivement appelés le coefficient directeuretl'ordonnée à l'originede $f$.
• Si le coefficient directeur $a$ est strictement positif la fonction affine est strictement croissante.
• Si le coefficient directeur $a$ est strictement négatif la fonction affine est strictement décroissante.
• Si le coefficient directeur $a$ est nul la fonction affine est constante.
Représenter dans un repère du plan la droite d'équation $y=2x-1$.
On détermine les coordonnées de deux points :
Pour $x=0$, on a $y=2\times0-1$$=$$-1$.
Pour $x=3$, on a $y=2\times3-1$$=$$5$.
Représenter dans un repère du plan la droite d'équation $y=2$.
La droite est ici horizontale.
Dans le repère ci-dessous déterminer une équation pour chacune des droites tracées.
$d_1$ : $y=\dfrac{1}{2}x-3$
$d_2$ : $y=-x+4$
$d_3$ : $y=2$
$d_4$ : $x=-5$Ajustement affineIntroduction
Voici une série statistique représentant l'évolution du chiffre d'affaire d'une entreprise au cours du temps (l'année de rang 0 étant 2010).
Rang de l'année
$0$
$1$
$2$
$3$
$4$
$5$
$6$
$7$
$8$
CA en milliers d'euros
$45,3$
$42,2$
$49,8$
$52,1$
$58,8$
$\dots$
$60,5$
$64,1$
$66,4$
Construire dans le repère ci-dessous le nuage de points associé à cette série, puis donner une estimation des valeurs manquantes du tableau.
Lorsque le nuage de points a une forme allongée on peut l'approcher par une droite, et ainsi avoir une idée des valeurs manquantes ou de futures valeurs. Les droites sont des objets dont on sait trouver assez facilement des équations.
Séries statistiques à deux variables
Sur une même population, on peut étudier plusieurs caractères quantitatifs : le chiffre d'affaire d'une entreprise en fonction des années, ou la distance de freinage d'un véhicule en fonction de la vitesse initiale, ou encore le nombre de bactéries dans une solution en fonction de la température du milieu, ou bien la charge de rupture de tiges en acier en fonction de leur teneur en carbone etc.
Le but est de déterminer si il existe un lien ou non entre les deux caractères étudiés.
-- Séries statistiques à deux variables
Soient $x$ et $y$ deux caractères quantitatifs d'une population.
À chaque individu de la population, on associe un couple $(x_i\,;y_i)$ où $x_i$ et $y_i$ sont des valeurs prises par les caractères $x$ et $y$.
Une série statistique à deux variables est l'ensemble de tous ces couples.
Le tableau donné en introduction représente une série statistique.
-- Nuage de points
Soit une série statistique à deux variables $x$ et $y$ prenant respectivement les valeurs $x_1$, $x_2$, $\dots$, $x_n$ et $y_1$, $y_2$, $\dots$, $y_n$. Le plan étant muni d'un repère, on associe au couple $(x_i\,;y_i)$le point$M_i(x_i\,;y_i)$.
Le nuage de points associé à la série statistique est l'ensemble des points $M_i$ ainsi obtenus.
Le graphique construit en introduction est un nuage de points associé à la série statistique étudiée.
-- Point moyen
Soit une série statistique à deux variables $x$ et $y$ prenant respectivement les valeurs $x_1$, $x_2$, $\dots$, $x_n$ et $y_1$, $y_2$, $\dots$, $y_n$.
Le point moyen du nuage statistique est le point $G(\overline{x}\,;\overline{y})$où $\overline{x}$est la moyenne arithmétique des $x_i$et$\overline{y}$ celle des $y_i$.
Dans la série statistique associée au chiffre d'affaire de l'entreprise au cours du temps, le point moyen est : $(3,875\,;55,025)$.Ajustement affine -- Ajustement affine
Étant donné une série statistique double et son nuage de points, on peut chercher une fonction $f$ dont la courbe représentative $\mathcal{C}$ passe "le plus près possible" des points du nuage.
Le problème de l'ajustement consiste à déterminer cette fonction $f$.
L'ajustement est dit affine lorsque le graphe $\mathcal{C}$ de cette fonction est une droite. -- Ajustement au jugé
Si les points du nuage statistique d'une série double semblent alignés, on peut tracer une droite d'ajustement affineau jugé, c'est-à-dire, visuellement au plus proche des points du nuage.
C'est la méthode que nous avons employée en introduction.
Lorsqu'on effectue un ajustement au jugé il y a une infinité de possiblités et le choix de la droite d'ajustement n'est donc pas unique. -- Méthode des moindres carrés
On considère une série statistique double et son nuage de points $M_i(x_i\,;y_i)$ avec $i$ compris entre $1$ et $n$.
Soit une droite $d$ d'équation $y=ax+b$. À chaque point $M_i(x_i\,;y_i)$ du nuage de points, on associe le point $P_i(x_i\,;ax_i+b)$ de la droite $d$.
Pour chaque $i$, on calcule les carrés des distances $P_iM_i$, et on les ajoute pour obtenir $E$ :
$E$$=$$\displaystyle{\sum_{i=1}^n (P_iM_i)^2 }$$=$$\displaystyle{\sum_{i=1}^n (y_i-(ax_i+b))^2 }$.La méthode des moindres carrés consiste à déterminer les valeurs de $a$ et de $b$ pour que la somme $E$ soit la plus petite possible.
En reprenant la série statistique représentant l'évolution du chiffre d'affaire, on a le graphique suivant :
Évolution du chiffre d'affaire d'une entreprise
Soit une série statistique à deux variables $x$ et $y$ prenant respectivement les valeurs $x_1$, $x_2$, $\dots$, $x_n$ et $y_1$, $y_2$, $\dots$, $y_n$.
La droite obtenue par la méthode des moindres a pour équation $y=ax+b$ avec :
$a$ $=$ $\displaystyle{\dfrac{ \displaystyle{\sum_{i=1}^n(x_i-\overline{x})(y_i-\overline{y})} }{ \displaystyle{\sum_{i=1}^n (x_i-\overline{x})^2}}}$et$b=\overline{y}-a\overline{x}$.
Cette formule n'est pas à apprendre, les valeurs de $a$ et $b$ seront obtenues en manipulant la calculatrice. On peut d'ailleurs l'obtenir également à l'aide d'un tableur.
La droite des moindres carrés passe par le point moyen$G( \overline{x}\,;\overline{y} )$ du nuage de points.
Dans l'exemple de l'évolution du chiffre d'affaire, on obtient pour équation de la droite d'ajustement affine (en appliquant la méthode des moindres carrées à la calculatrice) : $y=2,91x+43,74$.
Ainsi, pour l'année de rang $5$ (soit en 2015), avec cet ajustement on obtient un chiffre d'affaire de : $2,91\times5+43,74$$\approx$$58,3$milliers d'euros.Exercice
On mesure l’allongement $X$ de la tige d’une tomate, exprimé en mm/j, en fonction de la température diurne $T$, exprimée en °C.
Le tableau suivant fournit le relevé des valeurs du couple de variables statistiques $(T, X)$.
$t_i$
$5$
$7$
$10$
$13$
$15$
$18$
$20$
$22$
$25$
$28$
$30$
$x_i$
$1$
$2$
$3$
$6$
$8$
$10$
$11$
$15$
$17$
$20$
$23$
Construire le nuage de points représentant cette série statistique double. Que suggère l’examen du nuage ?
Donner à l'aide de votre calculatrice la droite d'ajustement de $X$ en $T$, obtenue par la méthode des moindres carrés.
Construire la droite dans le repère précédent.
Déterminer l'allongement pour une température diurne de 16 °C.
Déterminer l'allongement pour une température diurne de -5 °C et de 100 °C. Que peut-on en déduire ?