Statistique à deux variables (Programme 2020) .

Auteur: Daniel GENELLE                              (Optimisé pour Mozilla Firefox.)  

Pour pouvoir lire les mots de vocabulaire cachés (fond jaune), il suffit de passer la souris sur le mot.

Sommaire

I) Activité: prévoir la consommation d'électricité :
II) Série statistique à deux variables et ajustement affine :
Activité : Prévoir la consommation en fioul
1) Utilisation de la calculatrice:
2) Calculer les valeurs de et de
3) Utiliser la fonction graphique pour représenter la série statistique à 2 variables
4) Equation de la droite d'ajustement :
5) Méthode des moindres carré et coefficient de détermination r2 :
6) Utilisation de la droite de régression :
III) Activité : Évolution de la masse salariale
IV) Exercices :
Exercice N°1:
Exercice N°2 :
Exercice N°3 :

I) Activité: prévoir la consommation d'électricité :

Dans une journée, le pic de consommation d’électricité est atteint vers 19 h. Au niveau national on a enregistré un pic de consommation de 96 350 mégawatts le mercredi 15 décembre 2010 à 19 h 02. Vous travaillez à la centrale hydroélectrique locale et vous désirez prévoir les pics de consommation du prochain week-end pour la zone directement raccordée à votre centrale.
Pour établir cette prévision, vous disposez de dix relevés de consommations réalisés à 19h et présentés dans le tableau ci-dessous.

Relevé Température
extérieure à
19 h (en °C)
Consommation
à 19 h
(en MW)
Relevé Température
extérieure à
19 h (en °C)
Consommation
à 19 h
(en MW)
A 11 3 F 14 2,7
B -5 5,7 H 4 4
C -8 6,6 I -1 5,1
D -6 6,3 J -12 7,1
E 9 3,4 K 3 4,6


Conseil: regarde la vidéo ci-dessous de la série m@ths et ticques.
Vidéo : Représenter un nuage de points et déterminer le point moyen : ( 4 min 39 )

Point moyen et tracé de courbe:

Soit G( ; ) le point moyen de cette série statistique à deux variables. représente la moyenne des températures en °C et représente la moyenne de la consommation en MW, puis répondre aux questions..


Déterminer les cordonnées de G( ; ) et placer le point G sur le graphique ci-dessous (arrondir au dixième). Répondre aux questions.
( et seront arrondis au dixième.)               Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

a) Les coordonnées du point moyen sont = et = .

b) Placer le point moyen ainsi que les points (xi ; yi) sur le repère ci-dessous. (Cliquer sur les points et sans lacher le clic, les déplacer verticalement.)

c) De quel type de courbe se rapproche le nuage de points ?

Le nuage de points se rapproche .

d) Tracer une droite d’ajustement qui passe par le point moyen G. Cette droite passe le plus prés possible de la plupart des points du nuage.Cette droite est de la forme y = ax + b. Déplacer les curseurs correspondants à a et b de sorte que la droite passe par le point moyen et soit le plus près possible des autres points.




e) La météorologie nationale prévoit 0°C et –3°C respectivement pour samedi et dimanche. En utilisant la droite d’ajustement que vous venez de tracer, prévoyez les pics de consommation du week-end prochain.
(Les valeurs seront arrondies au dixième si nécessaire.)               Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

Pour 0°C le pic de consommation sera de MW.

Pour –3°C le pic de consommation sera de MW.

Une série statistique qui possède deux caractères quantitatifs est dite à deux variables. Ces valeurs sont de la forme (xi ; yi).
Pour représenter graphiquement une série statistique à deux variables, on place les point M(xi ; yi) dans un repère orthogonal.
L’ensemble des points est appelé nuage de points. On peut déterminer un point moyen G( ; ).
Lorsque les points d’un nuage de points paraissent presque alignés, il existe une relation (corrélation) entre les deux variables. On peut réaliser un ajustement affine, c'est-à-dire tracer une droite qui passe par le point moyen et qui passe au plus près de l’ensemble des points.

Retour au sommaire

II) Série statistique à deux variables et ajustement affine :

Activité : Prévoir la consommation en fioul :

Pendant 6 semaines d’hiver, chaque semaine, on a enregistré la température moyenne relevée à 7 heures du matin et la consommation hebdomadaire de fioul d’un établissement scolaire. Les résultats sont les suivants :

Températures relevées en °C (xi) Consommation de fioul en L (yi)
-7 570
-4 435
0 390
-5 520
2 370
8 185


Conseil: regarde la vidéo ci-dessous de la série m@ths et ticques.
Vidéo : Déterminer et tracer la droite d’ajustement (moindres carrés) : ( 10 min 10 )

Retour au sommaire

1) Utilisation de la calculatrice :

Entrer les données de ce tableau dans la calculatrice en mettant en liste 1 les valeurs des températures et en liste 2 les consommations en fioul.

Calcu_1.JPG

Retour au sommaire

2) Calculer les valeurs de et de :

Calcu_2.JPG

Calculer les valeurs de et de :
(Les valeurs seront arrondies au dixième si nécessaire.)               Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

= et = .

Retour au sommaire

3) Utiliser la fonction graphique pour représenter la série statistique à 2 variables:

Calcu_3.JPG
Calcu_4.JPG

Retour au sommaire

4) Le mode statistique de la calculatrice permet de connaître l’équation y = ax + b de la droite d’ajustement affine.

Calcu_5.JPG


Conseil: regarde la vidéo ci-dessous de la série m@ths et ticques.
Vidéo : Afficher la droite d’ajustement avec la Casio 35+ : ( 4 min 06 )

Conseil: regarde la vidéo ci-dessous de la série m@ths et ticques.
Vidéo : Afficher la droite d’ajustement avec une T.I. 83 : ( 5 min 15 )

Conseil: regarde la vidéo ci-dessous de la série m@ths et ticques.
Vidéo : Afficher la droite d’ajustement avec une Numworks : ( 1 min 13 )

Indiquer les valeurs de a et de b et donner l'équation de la droite de régression :
(Les valeurs seront arrondies à l'unité.)               Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

a = et b = .

L'équation de la droite sera alors y = x + .

Retour au sommaire

5) Méthode des moindres carrés et coefficient de détermination r2:

En utilisant les TIC (techniques informatique de calculs), on peut juger de la qualité d’une corrélation en calculant le coefficient de détermination r2.
Une corrélation est forte quand r2 se rapproche de   1  .

En principe cette valeur apparait lorsque l’on calcule les coefficients a et b de la droite de régression. Il arrive parfois que sur les anciennes T.I. celui-ci ne s’affiche pas, comment l’afficher.

Calcu_6.JPG
Calcu_7.JPG
Calcu_8.JPG


Retour au sommaire

6) Utilisation de la droite de régression :

L’ajustement affine donnant une tendance, on peut l’utiliser pour faire des prévisions, des estimations sur d’autres valeurs que celles observées.
On dit qu’on extrapole quand on cherche une valeur au delà de l’intervalle des valeurs étudiées et qu’on interpole quand on cherche une valeur dans l’intervalle des valeurs étudiées.

Utiliser l’équation de la droite d’ajustement pour répondre aux questions.
(Les valeurs seront arrondies à l'unité si nécessaire.)               Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

Utiliser l’équation de la droite d’ajustement pour déterminer la consommation hebdomadaire de fioul lorsque la température est de 6°C. Dire s’il s’agit d’une interpolation ou d’une extrapolation.

La consommation en fioul pour une température de 6°C est de L. Il s'agit d'une .


La consommation en fioul était de 436 L. Quelle température faisait-il alors ? Dire s’il s’agit d’une interpolation ou d’une extrapolation.

La température pour une consommation de 436 L de fioul était de °C. Il s'agit d'une .


Retour au sommaire

III) Activité : Évolution de la masse salariale: geogebra.JPG

Afin d’établir la masse salariale jusqu’en 2030, une entreprise a relevé, sur le site de l’INSEE, l’évolution du SMIC depuis 2010.

Année 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020
Rang 0 1 2 3 4 5 6 7 8 9 10
SMIC horaire
brut en €.
8,86 9,00 9,22 9,43 9,53 9,61 9,67 9,76 9,88 10,03 10,15


Lorsque l’un des caractères est une mesure de temps, la série est dite chronologique.

Pour la suite de ce cours, il faut que geogebra soit installé sur votre ordinateur.On prendra GeoGebra Classique 5 qui me parait plus simple dans sa présentation. Téléchargement de GeoGebra Classique 5.

1) Ouvrir le logiciel Geogebra 5 Dans affichage, afficher le tableur.
geogebra_1.JPG


2) Dans la colonne A, noter le rang des années. Dans la colonne B, noter la valeur du SMIC horaire correspondante.

3) Avec la souris, sélectionner le tableau créé, puis, avec un clic droit, créer une liste de points.

geogebra_2.JPG


4) Cliquer sur la fenêtre graphique afin de pouvoir déplacer l’origine des axes pour faire apparaître les points créés. (Faites tourner la molette de la souris dans un sens ou dans l’autre pour activer le zoom). Si vous souhaitez centrer votre représentation graphique, cliquer d’abord sur
geogebra_3.JPG

puis cliquer sur la figure et sans lâcher le clic, déplacer celle-ci.

geogebra_4.JPG


5) Après avoir sélectionné les valeurs dans le tableau , cliquer sur la petite flèche en bas à droite de l’icône “Statistique à une variable” et sélectionner “Statistique à deux variables”

geogebra_5.JPG


On remarque que lorsque l’on clic sur le tableur, les icônes sont différentes que lorsque l’on clic sur la partie graphique.

geogebra_6.JPG


Dans “source des données”, cliquer sur “Analyse”
geogebra_7.JPG


En fonction de l’aspect de la courbe, il faut choisir un modèle d’ajustement, ici on prendra ajustement linéaire.

geogebra_8.JPG


On arrondira les valeurs à deux décimales.

geogebra_21.JPG


En cliquant sur l’icône geogebra_14.JPG, on obtient un certain nombre d’informations supplémentaires dont le point moyen et la valeur de r2.

6) Après avoir fermé la fenêtre « Analyse des données », on veut afficher le point moyen M (la lettre G est déjà prise) sur le repère.
Nota : Si vous souhaitez faire réapparaître la fenêtre d’analyse des données, il suffit de resélectionner les valeurs dans le tableau pour à nouveau avoir accès à l’icône

geogebra_5.JPG


Pour faire apparaître le point moyen, cliquer dans la zone la zone de saisie et taper :
geogebra_9.JPG , la valeur a apparaît puis geogebra_10.JPG, ce qui donne geogebra_11.JPG


Attention: le nom de la liste doit être écrit de la même façon que dans la fenêtre Algèbre.

Ensuite pour faire apparaître le point M, taper: geogebra_15.JPG. On veut également afficher la droite de régression y = 0,12x + 8,95. Il suffit de taper l’équation de cette droite dans la zone de saisie geogebra_12.JPG.

Pour distinguer le point M sur le graphique, on l’affiche en rouge. Pour se faire, on effectue un clic droit sur M (ou dans la fenêtre algèbre, ou dans la fenêtre graphique) et on affiche propriété. Il suffit alors de cliquer sur l’onglet couleur et de choisir la couleur.

7) Exploitation de cette courbe.

a) Créer un curseur nommé « d » allant de 0 à 20 avec une incrémentation de 1.

geogebra_16.JPG


Il suffit de cliquer sur l’emplacement ou l’on souhaite déposer ce curseur. La fenêtre suivante apparaît. On complète le minimum, le maximum et l’incrémentation du curseur.

geogebra_13.JPG


b) Dans la zone de saisie, saisir « x=d » geogebra_17.JPG

La droite d’équation x = d apparaît (droite verticale).

c) Créer un point d’intersection entre cette droite et la droite de régression linéaire. Vous pouvez déplacer cette droite en x = 12 afin de ne pas être gêné par les précédents points. Pour déplacer le curseur, il faut d’abord cliquer sur l’icône geogebra_18.JPG puis cliquer sur geogebra_19.JPG. Le logiciel appelle ce point le point L .

d) Déplacer le curseur et compléter le tableau suivant :

Déplacer le curseur et compléter le tableau suivant :
(Les valeurs seront arrondies au centième.)               Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

Il suffit à chaque fois de lire l’ordonnée du point L.
Année 2021 2022 2023 2024 2025 2026 2027 2028 2029
Rang 11 12 13 14 15 16 17 18 19
SMIC horaire
brut en €.

(Attention les valeurs obtenues dans ce tableau tiennent compte de l’arrondi au centième proposé, si on utilise la fonction « Evaluer de l’onglet Analyse des données », l’arrondi se fait à la fin ne tenant pas compte de l’arrondi initial de l’équation de la droite.)

geogebra_20.JPG


8) L’entreprise compte 26 employés à temps plein (151,67 h mensuelles).

Calculer la masse salariale annuelle en 2021, puis en 2029.
(Les valeurs seront arrondies au centième.)               Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

En 2021, la masse salariale sera de €.

En 2029, la masse salariale sera de €.

9) Quelle sera le taux d’augmentation prévisible entre ces deux dates ?

Quel sera le taux d’augmentation prévisible entre ces deux dates ?
(Arrondir au centième.)               Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

t =
-
━━━━━━━━━━━━
x = %.

Retour au sommaire

IV) Exercices :

Exercice N°1:

Les données d’une série statistique à deux variables ont été enregistrées dans le tableau ci-dessous.

  Valeurs de xi     Valeurs de yi  
0,054 0,919
0,061 0,908
0,074 0,882
0,057 0,915
0,085 0,873
0,092 0,857
0,114 0,835
0,125 0,814

Entrer ces données dans la calculatrice et répondre aux questions.
              Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

a) Pour déterminer qu’un ajustement affine est possible, on représente le graphique associé à cette série statistique. Quel type de représentation doit-on choisir ?

La série de point alignée, il est de faire un ajustement affine.


b) Donner les valeurs du point moyen M(arrondir les valeurs au millième).

M( ; )


c) Écrire l’équation y = ax + b de la droite d’ajustement affine. On prendra les valeurs de a et de b à 10-3 prés. Donner la valeur de r2 avec la même précision.

y = x + .       r2 = .


d) A l’aide de l’équation de la droite d’ajustement affine, calculer la valeur de x à 10-3 prés si y = 0,85. Dire s’il s’agit d’une extrapolation ou d’une interpolation.

Si y = 0,85, x = . Il s'agit d'une .


e) Calculer la valeur de y à 10-3 prés si x = 0,15. Dire s’il s’agit d’une extrapolation ou d’une interpolation.

Si x = 0,85, y = . Il s'agit d'une .


Retour au sommaire

Exercice N°2:

Lorsque l’on a une série chronologique.

L’étude durant les six derniers mois du nombre de passagers transportés sur une ligne intérieure d’une compagnie « low cost » a donné les résultats suivants :

  Mois     Nombre de passagers  
Février 1 220
Mars 1 400
Avril 1 610
Mai 1 815
Juin 2 040
Juillet 2 385


On souhaite répondre à la question: Quelle prévision peut-on faire en termes de passager pour le mois de novembre ?

Aide : les deux variables doivent être quantitatives, il faut donc attribuer x = 1 pour le mois de février etc…

Entrer ces données dans la calculatrice et répondre aux questions.
              Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

a) Ecrire l’équation de la droite de régression, ainsi que la valeur de r2. (a sera arrondi au centième, b à la l’unité et r2 au millième.)

La droite de régression est y = x + .       r2 = .


b) Calculer la prévision de passagers pour novembre.

Pour novembre, x = .

Le nombre de passagers sera de passagers.

Retour au sommaire

Exercice N°3:

On a mesuré la résistance thermique d’un isolant appliqué sur le mur d’une habitation. Des mesures ont été effectuées pour différentes épaisseurs d’isolant.
Les résultats suivants ont été obtenus.

  Epaisseur de l'isolant
en mm  
  Résistance thermique
en m2.°C/W  
25 1,80
30 2,05
40 2,30
50 2,96
60 3,45
70 3,70
90 4,48


Entrer ces données dans la calculatrice et répondre aux questions.
              Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

a) Donner les coordonnées du point moyen du nuage de points. (arrondir à l’unité et au centième)

M( ; )


b) Écrire l’équation de la droite d’ajustement affine et du coefficient r2 en donnant les valeurs à 10-3 prés.

y = x + .       r2 = .


c) Estimer la résistance thermique obtenue si on prend un isolant de 80 mm d’épaisseur. On prendra comme équation de la droite d’ajustement y = 0,04x + 0,77.

Résistance = m2.°C/W.


d) Estimer l’épaisseur d’isolant nécessaire pour une obtenir une résistance thermique d’environ 4,8 m2.°C/W. (Donner le résultat au cm prés)

L'épaisseur d'isolant sera de mm.

Retour au sommaire