CH IV Statistique II Les indicateurs de position et de dispersion .

Auteur: Daniel GENELLE                              (Optimisé pour Mozilla Firefox.)  

Pour pouvoir lire les mots de vocabulaire cachés (fond jaune), il suffit de passer la souris sur le mot.

Sommaire

I) Les indicateurs de position:
1) Le mode, la classe modale.
2) La moyenne d'une série statistique.
3) La médiane d'une série statistique.
4) Comparer la moyenne et la médiane pour une série statistique donnée.
5) Le 1er et le 3ème quartile :
II) Les indicateurs de dispersion :
1) L'étendue.
2) Evaluer la dispersion d'une série avec l'écart type.
3) Evaluer la dispersion d'une série avec l'écart interquartile.
4) Interprétation des indicateurs de dispersion :
III) Exercices :
IV) Comment comparer et interpréter les indicateurs de tendance centrale :
V) Comparer deux séries statistiques à l’aide d’indicateurs de dispersion :
VI) La boîte à moustaches :
VI) Quelques fonctions d'OpenOffice utilisables en statistique.

I) Les indicateurs de position :

1) Le mode, la classe modale.

Le mode est la valeur du caractère ayant le plus grand effectif. Une distribution avec un seul mode est dite unimodale, avec deux modes, elle est dite bimodale.
Dans le cas de répartition en classes d’égales amplitudes, la classe modale désigne celle qui a le plus grand effectif. Le mode est le centre de cette classe.

Exemple: On dispose de deux séries de distances entre le domicile et le lycée (en km) rangées en classes. Compléter.
Ecrire les classes modales et les modes dans l'ordre d'apparition, les valeurs sont séparées par « ; ».               Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

exemple3.jpg La classe modale est: [  [.

Le mode est .
exemple4.jpg Les classes modales sont: [  [ et [  [ .

Les modes sont et .
Retour au sommaire

2) La moyenne d'une série statistique.

Conseil: regarde la vidéo ci-dessous de la série m@ths et ticques.
Vidéo : Calculer une moyenne (1) : ( 4 min 44 )

Conseil: regarde la vidéo ci-dessous de la série m@ths et ticques.
Vidéo : Calculer une moyenne (2) : ( 4 min 23 )

On a relevé les âges des participants à une manifestation sportive :

Âges xi 14 17 19 20 25 38 43 50
Effectifs ni 2 3 1 5 3 1 1 1

La moyenne de cette série est obtenue en divisant la somme des valeurs ni . xi par l’effectif total N.

Calculer la moyenne de cette série statistique. Donner le résultat au centième près.               Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

=  
━━━
 = 

Lorsque les valeurs sont regroupées en classes, la somme des valeurs est obtenue en multipliant chaque valeur centrale par l’effectif de la classe.

On peut obtenir la moyenne directement à l’aide de la calculatrice : Voir CH IV Statistique II Utilisation de la calculatrice.

On peut également utiliser un tableur pour obtenir cette moyenne. Voir 2nd Fiche Calcul des paramètres statistiques à l’aide du tableur.

L’interprétation de la moyenne est la suivante : L’âge moyen des participants à cette manifestation est de 23,76 ans.

Retour au sommaire

3) La médiane d'une série statistique.

Conseil: regarde la vidéo ci-dessous de la série m@ths et ticques.
Vidéo : Calculer une médiane (une seule liste) : ( 6 min 17 )

Conseil: regarde la vidéo ci-dessous de la série m@ths et ticques.
Vidéo : Calculer une médiane (deux listes) : ( 5 min 48 )

La médiane Me de la série est un nombre qui découpe la liste des âges, rangée dans l’ordre croissant, en deux listes. Si l’effectif total est impair, on obtient la médiane en prenant la valeur correspondant à l’effectif + 1 divisé par 2.
La médiane correspond ici à la     17 + 1
━━━
   = 9ième valeur.
2

On place les âges des 17 participants à la manifestation sportive dans l’ordre croissant :

mediane1.jpg

Lorsque l’effectif est pair, la médiane sera la moyenne des deux valeurs correspondantes aux rangs
 effectif
━━━
  et    effectif
━━━
 + 1.
2 2

On peut obtenir la médiane directement à l’aide de la calculatrice : Voir CH IV Statistique II Utilisation de la calculatrice.

On peut également utiliser un tableur pour obtenir cette médiane: Voir 2nd Fiche Calcul des paramètres statistiques à l’aide du tableur.

L’interprétation de la médiane est la suivante : « La moitié des participants a 20 ans et moins de 20 ans et l’autre moitié a 20 ans et plus de 20 ans. »

Retour au sommaire

4) Comparer la moyenne et la médiane pour une série statistique donnée.

Conseil: regarde la vidéo ci-dessous de la série m@ths et ticques.
Vidéo : Afficher les caractéristiques statistiques (une seule liste) avec une T.I. : ( 3 min 40 )

Conseil: regarde la vidéo ci-dessous de la série m@ths et ticques.
Vidéo : Afficher les caractéristiques statistiques (deux listes) avec une T.I. : ( 4 min 09 )

Conseil: regarde la vidéo ci-dessous de la série m@ths et ticques.
Vidéo : Afficher les caractéristiques statistiques (une seule liste) avec une Casio : ( 4 min 14 )

Conseil: regarde la vidéo ci-dessous de la série m@ths et ticques.
Vidéo : Afficher les caractéristiques statistiques (deux listes) avec une Casio : ( 5 min 55 )

Conseil: regarde la vidéo ci-dessous de la série m@ths chez vous.
Vidéo : Paramètres statistiques d'une série avec la NumWorks : ( 2 min 39 )

Les diagrammes en bâtons suivants donnent la répartition des notes au dernier contrôle sur 10 de deux groupes de 8 élèves.

moimed1.jpg moimed2.jpg

A l’aide de la calculatrice, déterminer la moyenne et la médiane pour chacun des groupes. Donner le résultat au millième près pour la moyenne et au dixième pour la médiane.               Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

Groupe 1 Groupe 2
= =
Me = Me =

Faites une conclusion pour chacun des groupes.

Pour le groupe 1, la moyenne des notes est 6,125 sur 10 alors que la moitié des élèves a 8,5 sur 10 et plus.

Pour le groupe 2, la moyenne des notes est 4,875 sur 10 alors que la moitié des élèves a 2,5 sur 10 et moins.

Retour au sommaire

5) Le 1er et le 3ème quartile :

Conseil: regarde la vidéo ci-dessous de la série m@ths et ticques.
Vidéo : Calculer les quartiles (1) sans calculatrice : ( 8 min 38 )

Conseil: regarde la vidéo ci-dessous de la série m@ths et ticques.
Vidéo : Calculer les quartiles (2) sans calculatrice : ( 6 min 24 )

Voici la liste des notes en mathématiques, sur 20, de 28 élèves de 2nd Bac Pro. Les notes sont rangées dans l’ordre croissant.

3 8 8 8 9 9 9 10 10 10 11 11 11 11
12 12 12 13 13 13 13 14 14 14 15 16 16 16


Les quartiles Q1 et Q3 sont deux nombres qui découpent chacun la liste des notes, rangées en ordre croissant, sur 2 lignes.
Le premier quartile Q1 est la plus petite valeur de la série telle qu’au moins 25 % des valeurs lui soient inférieures ou égales et donc 75 % supérieures ou égales.
Le troisième quartile Q3 est la plus petite valeur de la série telle qu’au moins 75 % des valeurs lui soient inférieures ou égales et donc 25 % supérieures ou égales.
On peut obtenir les quartiles directement à l’aide de la calculatrice : Voir CH IV Statistique II Utilisation de la calculatrice.

On peut également utiliser un tableur pour obtenir les quartiles. Voir Fiche Calcul des paramètres statistiques à l’aide du tableur.

Dans l’exemple précédent concernant les 28 élèves de 2nd Bac Pro, quels sont les quartiles Q1 et Q3 ?         
       Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

Q1 = et Q3 =


Retour au sommaire

II) Les indicateurs de dispersion :

On reprend la liste des notes en mathématiques, sur 20, de 28 élèves de 2nd Bac Pro. Les notes sont rangées dans l’ordre croissant.
3 8 8 8 9 9 9 10 10 10 11 11 11 11
12 12 12 13 13 13 13 14 14 14 15 16 16 16

Retour au sommaire

1) L’étendue :

Conseil: regarde la vidéo ci-dessous de la série m@ths et ticques.
Vidéo : Calculer l’étendue d’une série : ( 1 min 36 )

Répondre aux question:               Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

Quelle est la note la plus grande ?
Quelle est la note la plus petite ?
Calculer la différence entre ces deux notes ? =

L’étendue d’une série statistique est la différence entre la plus grande et la plus petite des valeurs de la série.

Retour au sommaire

2) Évaluer la dispersion d’une série avec l’écart type :

L’écart type σ indique la dispersion des valeurs de la série autour de leur moyenne.
- Sur la calculatrice Casio, l’écart type correspond à la valeur xσn ou σx.
- Sur la calculatrice TI, l’écart type correspond à la valeur σx.

Voici le relevé de 3 notes de mathématiques de Théa, Hector et Basile.
Calculer à l’aide de la calculatrice pour chaque élève la moyenne et l’écart type σ.
On arrondira la moyenne à l’unité et l’écart type au centième.               Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

Théa   11     9     10   = σ =
Hector   7     15     8   = σ =
Basile   11     3   16 = σ =

Dans ce cas les moyennes sont les mêmes, les écarts types indiquent une plus grande régularité des notes pour Théa que pour Basile.
Le couple (moyenne ; écart type) rend compte d’un certain point de vue de la série.
Plus l’écart type est grand plus la dispersion sera grande.

Retour au sommaire

3) Évaluer la dispersion d’une série avec l’écart interquartile :

Le premier quartile Q1 partage les valeurs du caractère, rangées en ordre croissant, en deux groupes : le 1er groupe représente à peu prés 25 % de l’effectif total et le 2ème groupe à peu près 75 %.
Le troisième quartile Q3 partage les valeurs du caractère, rangées en ordre croissant, en deux groupes : le 1er groupe représente à peu prés 75 % de l’effectif total et le 2ème groupe à peu près 25 %.
L’écart interquartile Q3 – Q1 représente 50 % de l’effectif total.
Le couple (médiane ; écart interquartile) rend compte d’un certain point de vue de la série.

La répartition des années d’ancienneté de 24 employés d’une entreprise est donnée par le tableau suivant :
1) Déterminer l’étendue de cette série. Interpréter ce résultat.
2) Déterminer, à l’aide de la calculatrice, la moyenne et l’écart type On arrondira au dixième.
3) Déterminer, à l’aide de la calculatrice, le premier et le troisième quartile. Interpréter ces résultats.
4) Calculer l’écart interquartile Q3 – Q1. Interpréter ce résultat.               Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

Années d’ancienneté xi   1     2     3     4     5  
Nombre d’employés ni   5     5     7     4     3  
1) Déterminer l’étendue de cette série. Interpréter ce résultat.
L'étendue = - = .
ans séparent les employés dont l’ancienneté est la plus petite de ceux dont l’ancienneté est la plus grande.

2) Déterminer, à l’aide de la calculatrice, la moyenne et l’écart type arrondis à 0,1.
et σ = .

3) Déterminer, à l’aide de la calculatrice, le premier et le troisième quartile. Interpréter ces résultats.
Q1 = .
des employés ont et des employés ont .
Q3 = .
des employés ont et des employés ont .

4) Calculer l’écart interquartile Q3 – Q1. Interpréter ce résultat.
Q3 – Q1 = - = .
des employés ont entre et ans d'ancienneté.

Retour au sommaire

4) Interprétation des indicateurs de dispersion :

Ces indicateurs vont nous renseigner sur la dispersion des valeurs.
Plus l’étendue est importante plus la dispersion sera grande.
Plus l’écart entre Q1 et Q3 est important, plus la dispersion est grande.
Plus l’écart type est important, plus la dispersion est grande.
On utilise l’étendue, l’écart interquartile et l’écart type comme indicateurs de dispersions.

Retour au sommaire

III) Exercices :

1) Exercice N°1:

La répartition de près de 1 500 articles scolaires vendus ce jour dans une grande surface est illustrée par l’histogramme suivant :

Ex1.jpg

1) Établir le tableau statistique correspondant à l’histogramme et ajouter le centre des classes.
                Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

     Centres de classes Effectifs
[ ;  [
[ ;  [
[ ;  [
[ ;  [
[ ;  [
[ ;  [

2) Déterminer à l’aide de la calculatrice, la moyenne de cette série. Conclure par une phrase.
                Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

= . La moyenne des prix des articles scolaires vendus ce jour dans une grande surface est €.

Exercice N°2 :

Les tableaux ci-dessous présentent les mesures de la concentration horaire moyenne en ozone (mesurée en microgrammes par m3 d’air) durant une journée d’été, pour 2 stations, l’une située dans le Cantal, l’autre à Nimes.

Heures 1 2 3 4 5 6 7 8 9 10 11 12
Cantal 110 120 120 117 108 106 109 120 131 138 137 135
Nimes 23 21 15 12 17 21 36 87 119 142 161 179

Heures 13 14 15 16 17 18 19 20 21 22 23 24
Cantal 128 138 140 126 112 94 95 98 110 129 130 115
Nimes 184 190 190 198 215 212 183 160 134 109 89 68


1) Pendant combien d’heures consécutives a-t-on dépassé à Nîmes le seuil d’information, fixé à 180 γg/m3 .                 Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

Le seuil d'information a été dépassé pendant heures, de h à h.

2) Pour chacune des deux stations, déterminer à l’aide du tableau ordonné ci-dessous la médiane, l’étendue, le premier et le troisième quartile. On arrondira au dixième si nécessaire. (On utilisera suivant les possibilités, le tableur ou la calculatrice).                 Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

Cantal 94 95 98 106 108 109 110 110 112 115 117 120
   120 120 126 128 129 130 131 135 137 138 138 140

Nîmes 12 15 17 21 21 23 36 68 87 89 109 119
   134 142 160 161 179 183 184 190 190 198 212 215

Cantal Nîmes
Me = Me =
Etendue = Etendue =
Q1 = Q1 =
Q3 = Q3 =

3) Indiquer, en précisant les indicateurs statistiques utilisés, sur quelle(s) station(s), ce jour-là :         

a) La dispersion des mesures a été la plus importante ?                 Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

Si on prend , on trouve avec = .

b) La moitié des mesures au moins ont été inférieures ou égales à 127 γg/m3 ?                 Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

Il faut prendre On trouve Nîmes avec γg/m3 et le Cantal avec γg/m3. La réponse correspond .

c) 75 % des mesures au moins ont été inférieures ou égales à 132 γg/m3 ?                 Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

Il faut prendre On trouve Nîmes avec γg/m3 et le Cantal avec γg/m3. La réponse correspond .

Retour au sommaire

IV) Comment comparer et interpréter les indicateurs de tendance centrale :

Reprenons la liste des notes en mathématiques, sur 20, des 28 élèves de 2nd Bac Pro. Les notes sont rangées dans l’ordre croissant.

3 8 8 8 9 9 9 10 10 10 11 11 11 11
12 12 12 13 13 13 13 14 14 14 15 16 16 16

Contrôle n°1: Calculer la moyenne et la médiane (en arrondissant au dixième) :                 Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

La moyenne = et la médiane Me = .


Voici les notes d’un deuxième contrôle, puis d’un troisième.

3 3 8 9 10 10 10 11 12 13 13 13 13 14
14 14 14 14 15 15 15 15 15 16 16 16 16 16

Contrôle n°2: Calculer la moyenne et la médiane (en arrondissant au dixième) :                 Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

La moyenne = et la médiane Me = .


3 8 9 9 10 11 11 11 11 12 12 12 13 13
13 13 14 14 15 15 16 16 16 16 19 19 19 19

Contrôle n°3: Calculer la moyenne et la médiane (en arrondissant au dixième) :                 Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

La moyenne = et la médiane Me = .


Conclusion :

La moyenne ne cesse d’augmenter, ce qui n’est pas le cas de la médiane.

La moyenne est influencée par les valeurs extrêmes. Ce n’est pas le cas de la médiane.

Retour au sommaire

V) Comparer deux séries statistiques à l’aide d’indicateurs de dispersion :

Voici les températures mensuelles moyennes relevées à Brest et à Moscou durant une année.
Mois J F M A M J J A S O N D
Brest (°C) 9,1 9,4 11 12,5 15,6 18,1 20,4 20,6 18,7 15,3 11,9 10
Moscou (°C) -6,3 -4,2 1,5 10,4 18,4 21,7 23,1 21,5 15,4 8,2 1,1 -3,5

a) Déterminer pour chaque ville la température médiane annuelle (arrondir au dixième). Comparer.
                Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

Brest: Me = et Moscou: Me = .


des température à est à des températures à .


b) Calculer l’étendue des températures de chaque ville (arrondir au dixième).                 Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

Brest: Etendue = et Moscou: Etendue = .


c) Pour chaque ville, déterminer l’écart inter quartile Q3 – Q1. (arrondir au dixième).                 Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

Brest: Q3 – Q1 = et Moscou: Q3 – Q1 = .


d) Analyser la dispersion à l’aide des résultats précédents.
                Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

La température est homogène à qu'à .


Retour au sommaire

VI) La boîte à moustaches :

On représente sur un graphique que l’on appelle « boîte à moustaches » un certain nombre d’indicateurs statistiques. Chaque « boîte » est délimitée par les premiers et troisièmes quartiles, et les « moustaches » par les valeurs minimales et maximales de la série associée. La médiane est marquée par le segment vertical à l’intérieur de la boîte.

Min Q 1 Me Q 3 Max


Conseil: regarde la vidéo ci-dessous de la série m@ths et ticques.
Vidéo : Construire un diagramme en boite : ( 4 min 56 )

Exercice 1a: Compléter le tableau en y reportant la valeur des indicateurs statistiques donnés par le diagramme en boîte à moustaches.               Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

exercicea.jpg

Minimum Premier quartile Médiane Troisième quartile Maximum

Exercice 1b: Compléter le tableau en y reportant la valeur des indicateurs statistiques donnés par le diagramme en boîte à moustaches.               Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

exerciceb.jpg

Minimum Premier quartile Médiane Troisième quartile Maximum

Exercice 1c: Compléter le tableau en y reportant la valeur des indicateurs statistiques donnés par le diagramme en boîte à moustaches.               Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

exercicec.jpg

Minimum Premier quartile Médiane Troisième quartile Maximum

Exercice 1d: Compléter le tableau en y reportant la valeur des indicateurs statistiques donnés par le diagramme en boîte à moustaches.               Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

exerciced.jpg

Minimum Premier quartile Médiane Troisième quartile Maximum

Exercice 2: La glycémie à jeun est un test sanguin effectué lorsque le patient a passé 12 heures sans s’alimenter ni boire (sauf de l’eau). Pour une personne non diabétique, le taux normal de glycémie est compris entre 0,70 mg/L et 1,10 mg/L. Un laboratoire a réalisé des analyses de glycémie à jeun sur 50 personnes.
Les résultats sont regroupés dans le tableau suivant :
a) Quel est le taux de glycémie le plus fréquent de ces personnes ?
b) Quel est l’écart maximal des taux de glycémie de ces personnes ?
c) Quelle est la glycémie moyenne de ces personnes ?(Arrondir au millième)
d) Quel le taux médian de glycémie de ces personnes ?
e) Quel est le pourcentage de personnes dont le taux de glycémie est normal ?
              Les erreurs sont mises en évidence par la couleur rouge donnée à celles-ci...

Glycémié xi en mg/L Nombre de personnes ni
  0,65     1  
  0,68     1  
  0,74     3  
  0,81     5  
  0,83     10  
  0,87     11  
  0,92     8  
  0,96     6  
  1,00     1  
  1,02     1  
  1,11     2  
  1,13     1  

a) Le taux de glycémie le plus fréquent est mg/L.

b) L’écart maximal est = .

c) Moyenne (arrondie au millième) = mg/L.

d) Me = mg/ L.

e) Pourcentage = %.

f) Représenter le diagramme à moustache de cette série.



      


Retour au sommaire

VII) Quelques fonctions d’OpenOffice utilisables en Statistique :

On suppose une série de valeurs contenues dans le tableau (A1;H3). Cette série correspond aux relevés des prix du pain (en €) dans 24 boulangeries.

tableur.jpg


Organisation des données.
  =SOMME(A1;H13)     21,90 €     Somme des valeurs  
  =SI(A1=1,1;1;0)   1   1 si la cellule A1 contient 1,1 et 0 dans le cas contraire.  
  =NB.SI(A1:H3;0,9)   8   Nombre de cellule où 0,9 apparaît.  
  =NB.SI(A1:H3;">0,9")   9   Nombre de cellules où la valeur est supérieure à 0,9.
Attention >0,9 est mis entre guillemets " " sans espace.  
  = NB.SI(A1:H3;"<1,1")-NB.SI(A1:H3;"<0,9")   14   Nombre de cellules où la valeur appartient à [0,9 ; 1,1[.  
Calculer des indicateurs de tendance centrale.
  =MODE(A1:H3)     0,9     Mode Mo  
  =MOYENNE(A1:H3)   0,91 €   Moyenne   
  =MEDIANE(A1:H3)   0,9   Médiane Me  
Calculer des indicateurs de dispersion.
  =MIN(A1:H3)     0,70 €     Valeur minimale xmin  
  =MAX(A1:H3)   1,20 €   Valeur maximale xmax  
  =MAX(A1:H3)-MIN(A1:H3)   0,50 €   Étendue e  
  =QUARTILE(A1:H3;1)     0,8     Premier quartile Q1  
  =QUARTILE(A1:H3;2)     0,9     Deuxième quartile Q2
correspond à la médiane.  
  =QUARTILE(A1:H3;3)     1     Troisième quartile Q3  
  =ECARTYPEP(A1:H3)     0,12     Écart type σ. Attention il faut écrire écart type
avec un P au bout ECARTYPEP.  

Retour au sommaire