Dans cette fiche explicative, nous allons apprendre comment déterminer et interpréter l'écart-type d'une série statistique donnée.
Avant de d’explorer la notion d’écart-type, un rappel de la définition de la moyenne d’une série statistique s’impose.
Définition : La moyenne d’une série statistique
La moyenne d’une série statistique, ou espérance, est utilisée comme indicateur de tendance centrale. Soit une série statistique , comprenant valeurs ; on calcule sa moyenne, notée (prononcé « mu ») ou , en divisant la somme de toutes les valeurs de la série par le nombre de valeurs qu’elle contient ; on a donc la formule suivante :
L’écart-type d’une série statistique nous renseigne sur la dispersion autour de la moyenne des valeurs de cette série. Plus l’écart-type est grand, plus les valeurs sont dispersées autour de la moyenne ; plus l’écart-type est petit, plus les valeurs sont concentrées autour de la moyenne.
Le carré de l’écart-type est la variance ; la variance est aussi un indicateur de dispersion. Un autre indicateur de dispersion est l’écart interquartile, il s’agit de la différence entre le troisième et le premier quartile, c’est-à-dire la valeur du 75e centile moins celle du 25e centile. Dans cette fiche explicative, nous nous concentrerons uniquement sur l’écart-type comme indicateur de dispersion.
Nous donnons une définition plus formelle de l’écart-type ci-dessous.
Définition : L’écart-type d’une série statistique
On utilise l’écart-type d’une série statistique pour mesurer la dispersion des valeurs de la série autour de sa moyenne. Soit une série statistique , comprenant valeurs, on calcule son écart-type, (prononcé « sigma »), en prenant la racine carrée du quotient de la somme des carrés des différences de chaque valeurs de la série statistique et de la moyenne par le nombre de valeurs de cette série, comme indiqué dans la formule ci-dessous :
On peut aussi considérer l’écart-type comme la distance moyenne entre la moyenne de la série statistique et chacun des points correspondants aux valeurs de cette série. Ainsi, plus l’écart-type est grand, plus la distance moyenne entre la moyenne et chacun des points correspondants aux valeurs de cette série est importante, ce qui signifie que les points sont très dispersés. De même, plus l’écart-type est petit, moins la distance moyenne entre la moyenne et chacun des points correspondants aux valeurs de cette série est importante, ce qui signifie qu’ils sont moins dispersés.
Pour traiter le premier exemple, nous utiliserons la définition de l’écart-type d’une série statistique.
Exemple 1: Comprendre l’écart-type
Comment appelle-t-on une quantité permettant d’exprimer à quel point les valeurs d’un groupe diffèrent de la valeur moyenne du groupe ?
Réponse
On sait que l’écart-type d’une série statistique mesure la dispersion de la série autour de sa moyenne. On peut reformuler en disant que l’écart-type mesure à quel point les valeurs d’une série statistique diffèrent de la moyenne de la série.
Par conséquent, la quantité permettant d’exprimer à quel point les valeurs d’un groupe diffèrent de la valeur moyenne du groupe est l’écart-type. Un écart-type faible nous indique qu’en moyenne, les points de données sont proches de la moyenne et un écart-type élevé nous indique qu’en moyenne, les points de données sont éloignés de la moyenne.
Après avoir utilisé la définition de l’écart-type, nous examinerons ensuite le cas où la mesure de la dispersion est nulle, comme indiqué dans l’exemple suivant.
Exemple 2: Identifier un ensemble de valeurs dont la dispersion est nulle
Si la dispersion d’une série statistique est nulle, laquelle des affirmations suivantes est vraie ?
- L’écart entre les différentes valeurs est important.
- L’écart entre les différentes valeurs est faible.
- Toutes les valeurs sont égales.
- La moyenne arithmétique des valeurs est égale à zéro.
- Toutes les valeurs sont négatives.
Réponse
Pour mesurer la dispersion d’une série statistique, on peut utiliser l’écart-type, noté . On calcule l’écart-type d’une série statistique , comprenant valeurs et dont la moyenne est , à l’aide de la formule suivante :
Si la dispersion d’une série statistique est nulle, son écart-type est lui aussi nul. En considérant la formule de l’écart-type égale à zéro, on a alors
On élève ensuite au carré les deux membres et on obtient
Puis on multiplie chacun des membres par , on a alors
On sait que le carré d’un nombre positif est un nombre positif. Par ailleurs, le carré d’un nombre négatif est lui aussi un nombre positif. Par conséquent, pour que notre somme soit nulle, chacun de ses termes doit être nul :
Ainsi, chaque terme entre parenthèses est égal à zéro, ce qui nous donne
On résout pour calculer chacune des valeurs et on obtient
On constate que tous les membres de la série statistique sont égaux à la moyenne et sont donc égaux entre eux, ce qui correspond à la proposition C.
Dans l’exemple suivant, nous utiliserons la formule de l’écart-type d’une série statistique pour déterminer son écart-type connaissant la somme des carrés des différences et le nombre de valeurs de cette série.
Exemple 3: Calculer l’écart-type
Si est égale à 25 pour un ensemble de 6 valeurs, déterminez l’écart-type de cet ensemble et arrondissez votre réponse au millième.
Réponse
Pour calculer l’écart-type d’une série statistique, on rappelle la formule où désigne l’écart-type de la série statistique , avec , est le nombre de valeurs de cette série et est la moyenne des valeurs de la série.
On a , ce qui revient à dire que . Il est aussi précisé que la série statistique comporte 6 valeurs, ce qui indique que .
En substituant et puis en résolvant pour calculer , on obtient
Par conséquent, notre réponse arrondie au millième près est 2,041.
Dans la suite, nous verrons comment déterminer l’écart-type d’une série statistique. Nous examinerons cela en détail ci-dessous.
Lors du calcul de l’écart-type d’une série statistique, nous devons suivre un certain nombre d’étapes lorsque nous travaillons avec la formule. Commençons par rappeler la formule, où désigne l’écart-type de la série statistique , avec , est le nombre de valeurs de cette série et est la moyenne de cette série.
Pour vous montrer comment utiliser la formule, nous utiliserons la série statistique suivante :
Nous allons ensuite suivre les étapes suivantes en utilisant cette série statistique pour illustrer le fonctionnement de chaque étape.
Étape 1 : Calculer la moyenne
Comme nous devons calculer la différence entre la moyenne et les valeurs de la série située dans les parenthèses de la formule, nous devons commencer par calculer la moyenne. On la calcule en utilisant la formule où désigne la moyenne, est la série statistique et est le nombre de valeurs de cette série.
Pour la série statistique, cela nous donne
Étape 2 : Calculer les différences entre chaque valeur et la moyenne
Pour calculer dans la formule, nous devons calculer pour toutes les valeurs de , ou, en d’autres termes, la différence entre la moyenne et chacun des points de données. Pour cette étape et les étapes suivantes, il est utile de ranger cela dans un tableau.
1 | |
---|---|
1 | |
3 | |
5 | |
7 |
Étape 3 : Calculer la somme des carrés des différences entre chaque valeur et la moyenne
Pour faire suite à l’étape 2, afin de calculer dans la formule de l’écart-type, nous devons ensuite calculer pour toutes les valeurs de et en calculer la somme. Autrement dit, on doit élever au carré les différences entre chaque valeur de la série et la moyenne, puis en faire la somme. On va reprendre notre tableau de l’étape 2 et on va lui ajouter une nouvelle colonne.
1 | ||
---|---|---|
1 | ||
3 | ||
5 | ||
7 |
En additionnant les valeurs de la dernière colonne, on obtient
Étape 4 : Substituer dans la formule et déterminer l’écart-type
Pour la dernière étape, nous substituons la somme des carrés et dans la formule, puis on calcule la valeur de l’écart-type.
À partir de l’étape 3, nous avons trouvé et on sait que . Par conséquent, en substituant dans la formule de on obtient qui est l’écart-type de la série statistique .
Nous pouvons résumer ces étapes comme suit.
Comment : Déterminer l’écart-type d’une série statistique
Étape 1 : Calculer la moyenne de la série
Étape 2 : Calculer les différences entre chaque valeur de la série et la moyenne
Étape 3 : Calculer la somme des carrés des différences entre chaque valeur et la moyenne
Étape 4 : Substituer la somme des carrés et dans la formule puis prendre la racine carrée pour calculer l’écart-type (ce résultat doit toujours être positif).
Dans l’exemple suivant, nous utiliserons cette méthode pour calculer l’écart-type d’une série statistique.
Exemple 4: Calculer l’écart-type d’une série statistique
Calculez l’écart-type des valeurs 45, 35, 42, 49, 39 et 34. Donnez votre réponse au millième près.
Réponse
Pour calculer l’écart-type d’une série statistique, on utilise la formule où désigne l’écart-type de la série statistique , avec , est le nombre de valeurs dans cette série et est la moyenne de cette série.
On commence par calculer la moyenne de la série statistique, . On rappelle que la formule de la moyenne est
Dans notre cas, la série statistique est et elle comprend un total de 6 valeurs. On peut donc substituer à et 6 à , on obtient alors
Puis on calcule pour chacune des valeurs de notre série statistique. Pour nous aider, nous allons ranger les données dans un tableau comme suit :
45 | |
---|---|
35 | |
42 | |
49 | |
39 | |
34 |
Nous pouvons à présent calculer . Pour cela, on élève au carré pour chacune des valeurs de la série, puis on additionne toutes les données. Nous ajouterons une autre colonne au tableau ci-dessus pour faciliter le calcul.
45 | ||
---|---|---|
35 | ||
42 | ||
49 | ||
39 | ||
34 |
Quand on additionne pour chaque membre de la série statistique, on obtient
On peut à présent substituer et dans la formule initiale de l’écart-type, puis calculer :
Arrondi au millième, notre résultat est 5,312.
Par conséquent, l’écart-type de notre série statistique est 5,312 arrondi au millième.
Dans l’exemple suivant, nous chercherons en utilisant l’écart-type, laquelle des séries statistiques parmi les trois proposées a la plus grande dispersion.
Exemple 5: Identifier la série statistique possédant le plus grand écart-type
En calculant l’écart-type, déterminez laquelle des séries , et a la plus grande dispersion.
Réponse
Pour calculer l’écart-type de chacune de ces séries statistiques, on utilise la formule où désigne l’écart-type de la série statistique où , est le nombre de valeurs de cette série et est la moyenne de cette série.
On observe que chacune de nos séries est constituée de quatre valeurs, donc vaut 4 dans chaque cas.
Nous allons d’abord déterminer l’écart-type de chaque série statistique, puis les comparer pour déterminer lequel a la plus grande dispersion.
Pour , nous devons tout d’abord calculer la moyenne de la série statistique. On rappelle que la formule de la moyenne est
On peut donc substituer à et 4 à , on obtient alors
On va ensuite calculer pour chacune des valeurs de la série statistique. Nous nous aiderons pour cela d’un tableau dans lequel nous rangerons nos résultats :
20 | |
---|---|
6 | |
Nous pouvons à présent calculer . Pour cela, on élève au carré pour chacune des valeurs de la série statistique, puis on additionne toutes les données. Nous ajouterons une autre colonne au tableau ci-dessus pour faciliter le calcul.
20 | ||
---|---|---|
6 | ||
Quand on additionne pour chaque membre de la série statistique, on obtient
On peut à présent substituer et dans la formule initiale de l’écart-type, puis calculer :
Nous allons maintenant réitérer ces étapes pour les deux autres séries statistiques.
La moyenne de la série est
Pour calculer , on calcule et pour chaque valeur de la série statistique. Comme précédemment, nous nous aiderons d’un tableau dans lequel nous rangerons nos résultats :
5 | ||
---|---|---|
9 |
On additionne chaque valeur de la série statistique et on obtient
En substituant et dans la formule initiale de l’écart-type, on calcule , on obtient
La moyenne de la dernière série statistique, , est
Pour calculer , on calcule d’abord et pour chaque valeur de la série statistique. Comme précédemment, nous nous aidons d’un tableau dans lequel nous rangerons nos résultats :
20 | ||
---|---|---|
En faisant la somme des pour chaque valeur de la série statistique, on obtient
En substituant et dans la formule initiale de l’écart-type, on peut calculer , on obtient
Nous avons à présent trouvé l’écart-type de chacune de nos trois séries statistiques. Résumons ceci ci-dessous :
- Pour , arrondi au centième.
- Pour , arrondi au centième.
- Pour , arrondi au centième.
En comparant ces trois valeurs, on constate que la première série statistique, , a le plus grand écart-type.
L’écart-type étant un indicateur de dispersion, on peut conclure que a la dispersion la plus grande des trois séries.
Jusqu’ici, les séries statistiques dont nous avons déterminé les écart-types nous étaient données sous forme de liste de valeurs. Nous allons maintenant apprendre à calculer l’écart-type de séries données sous forme de tableau des effectifs.
Pour calculer l’écart-type d’une série statistique donnée sous forme de tableau des effectifs, on doit prendre en compte les valeurs et leur effectif. Pour cela, on pourrait choisir de lister toutes les valeurs de la série. Prenons par exemple la série statistique suivante :
3 | 1 |
---|---|
4 | 7 |
5 | 3 |
On pourrait dire qu’elle se compose d’un 3, de sept 4 et de trois 5 ou l’écrire de manière à calculer son écart type, comme évoqué précédemment. Cette approche n’est cependant pas adaptée si certaines valeurs ont un grand effectif (par exemple 100, ou même 1 000) ; en effet, dans de tels cas, on devrait écrire une très longue liste. De ce fait, il est plus efficace de calculer les carrés des différences avec la moyenne dans chaque série statistique, puis de la multiplier par l’effectif correspondant (à peu près de la même manière que nous calculerions la moyenne pondérée d’une série statistique dans un tableau des effectifs).
Avant de nous pencher sur la formule et la méthode à appliquer pour calculer l’écart-type d’une série statistique donnée sous la forme d’un tableau des effectifs, commençons par rappeler comment calculer sa moyenne.
Définition : La moyenne pondérée d’une série statistique présentée dans un tableau des effectifs
Soit une série statistique dont les effectifs sont et le nombre de valeurs distinctes est , on calcule sa moyenne en utilisant la formule suivante :
Une autre façon de représenter cela est dans un tableau avec les valeurs de la série statistique dans la première colonne, les effectifs correspondants dans la deuxième colonne, le produit de la valeur par son effectif dans la troisième colonne et les sommes dans la dernière ligne du tableau. On obtient alors la moyenne pondérée en divisant la somme de la troisième colonne par la somme de la deuxième colonne.
Après avoir rappelé la moyenne pondérée d’une série statistique dans un tableau des effectifs, nous allons maintenant nous intéresser à l’écart-type. On donne sa formule ci-dessous.
Définition : L’écart-type d’une série statistique présentée dans un tableau des effectifs
Soit une série statistique dont les effectifs correspondants sont , avec le nombre de valeurs distinctes et la moyenne, on calcule son écart-type en utilisant la formule suivante :
L’approche utilisée pour calculer l’écart-type d’une série statistique donnée sous la forme d’un tableau des effectifs est en général similaire à celle employée dans le cas d’une série dont on nous donne la liste des valeurs, il existe cependant quelques différences notables. Comme on travaille avec des effectifs, on doit multiplier chacune des valeurs distinctes de la série par son effectif pour calculer la moyenne. De même, lorsqu’on calcule la somme des carrés des différences entre chaque valeur distincte et la moyenne, on doit multiplier par l’effectif correspondant.
Dans le prochain exemple, nous verrons comment calculer l’écart-type d’une série statistique présentée dans un tableau des effectifs.
Exemple 6: Déterminer l’écart-type d’une série statistique
Le tableau ci-dessous présente la répartition des buts marqués lors de la première moitié d’une saison de football.
Nombre de buts | 0 | 1 | 3 | 4 | 6 |
---|---|---|---|---|---|
Nombre de matchs | 5 | 2 | 7 | 7 | 4 |
Calculez l’écart-type du nombre de buts marqués. Donnez votre réponse au millième près.
Réponse
Comme les données présentées dans cette question sont sous la forme d’un tableau des effectifs, pour calculer l’écart-type , on utilise la formule où représente les valeurs de la série avec leur effectif correspondant dans , il y a valeurs distinctes pour cette série et représente la moyenne.
Dans cet exemple, les valeurs de la série sont le nombre de buts marqués lors de la première moitié d’une saison de football. Le nombre de matchs correspond à l’effectif pour lequel chacun de ces buts a été marqué. Réécrivons cela en utilisant et en tant qu’étiquettes du tableau et en transposant le tableau, comme suit :
0 | 5 |
---|---|
1 | 2 |
3 | 7 |
4 | 7 |
6 | 4 |
Pour calculer l’écart-type, on doit d’abord calculer la moyenne pondérée . Pour calculer la moyenne pondérée d’une série statistique dont les effectifs sont et le nombre de valeurs distinctes est , on utilise la formule suivante :
En utilisant le tableau ci-dessus, nous pouvons ajouter une nouvelle colonne pour calculer pour chaque valeur de puis l’utiliser pour calculer la moyenne.
0 | 5 | |
---|---|---|
1 | 2 | |
3 | 7 | |
4 | 7 | |
6 | 4 |
En additionnant les valeurs et en divisant par la somme des effectifs on obtient
On va maintenant calculer la différence entre chaque valeur de la série statistique et la moyenne, puis les carrés de ces différences afin de calculer la somme des carrés. Pour cela, on ajoute deux nouvelles colonnes au tableau.
0 | 5 | |||
---|---|---|---|---|
1 | 2 | |||
3 | 7 | |||
4 | 7 | |||
6 | 4 |
Nous devons maintenant calculer le produit des carrés des différences entre la moyenne et les valeurs de la série par les effectifs correspondants aux valeurs de la série statistique. Nous allons ajouter une autre colonne au tableau pour ce faire.
0 | 5 | ||||
---|---|---|---|---|---|
1 | 2 | ||||
3 | 7 | ||||
4 | 7 | ||||
6 | 4 |
Nous avons à présent tout ce qu’il nous faut pour calculer l’écart-type. On substitue les valeurs du tableau dans la formule de l’écart-type et on calcule : soit 1,960 au millième près.
Par conséquent, l’écart-type du nombre de buts marqués est 1,960 au millième près.
Voyons maintenant comment calculer l’écart-type de données regroupées par classes en utilisant les centres de ces classes. Cette approche entraine les mêmes étapes que pour les tableaux des effectifs, mais nous avons à faire à des intervalles pour notre série statistique au lieu d’avoir un ensemble de valeurs ; ainsi, nous devons utiliser le centre pour donner une approximation des valeurs de la série. Nous donnons les détails dans le prochain et dernier exemple.
Exemple 7: Calculer l’écart-type d’une série statistique regroupée par classes
Un groupe de 92 étudiants a passé un examen ; les notes obtenues à cet examen sont présentées dans le tableau des effectifs ci-dessous. Calculez l’écart-type au centième près.
Note | |||||
---|---|---|---|---|---|
Effectif | 26 | 10 | 24 | 5 | 27 |
Réponse
Comme les données présentées dans cette question sont sous la forme d’un tableau des effectifs, afin de calculer l’écart-type , on utilise la formule où représente les valeurs de la série statistique avec les effectifs correspondants , il y a valeurs distinctes dans cette série statistique et la moyenne est représentée par .
Dans ce type de problème, on ne nous donne pas des valeurs exactes, mais différentes « classes » de valeurs représentées par des intervalles. Cela signifie que nous ne pouvons pas appliquer directement la formule ci-dessus, car nous ne pouvons pas substituer ces intervalles aux valeurs de dans notre formule.
Au lieu de cela, l’approche que nous devons adopter est de déterminer le « centre » de chaque intervalle afin de l’utiliser pour représenter la valeur correspondante de . Après cela, nous pourrons traiter le problème comme avec n’importe quelle autre tableau des effectifs.
Pour trouver le centre d’une classe, on additionne ses bornes inférieure et supérieure et on divise par 2. On pourra ainsi déduire une valeur approchée de l’écart-type de notre série statistique.
Ainsi, les valeurs de la série statistique sont le centre de chacune des classes de notes obtenues lors du questionnaire et les effectifs correspondants sont les effectifs de chaque valeur. On commence donc par trouver le centre de chaque intervalle ; pour cela, on trace un tableau dans lequel les sont nos centres et les nos effectifs :
Intervalle | Centre | Effectif |
---|---|---|
26 | ||
10 | ||
24 | ||
5 | ||
27 |
Pour calculer l’écart-type, on doit dans un premier temps calculer la moyenne, . Pour une série statistique avec comme effectifs correspondants et valeurs distinctes de la série statistique, nous utilisons la formule suivante :
On rappelle à nouveau qu’on utilise les centres de chaque classe pour représenter les valeurs de . On reprend notre tableau et on lui ajoute une nouvelle colonne dans laquelle on calcule pour chaque valeur de , afin de calculer la moyenne.
Intervalle | Centre | Effectif | |
---|---|---|---|
26 | |||
10 | |||
24 | |||
5 | |||
27 |
On fait la somme des et on divise par la somme des effectifs, on obtient
Ensuite, nous allons calculer la différence entre les centres de chaque classe de notre série statistique et la moyenne, puis le carré de celle-ci afin de calculer la somme des carrés. Pour cela, on ajoute deux nouvelles colonnes à notre tableau. On notera que toutes les valeurs sont arrondies à 4 chiffres après la virgule.
Intervalle | Centre | Effectif | |||
---|---|---|---|---|---|
26 | 1 548,2 494 | ||||
10 | 374,3 375 | ||||
24 | 0,4 254 | ||||
5 | 426,5 134 | ||||
27 | 1 652,6 014 |
On doit à présent, pour chaque ligne, multiplier le carré de la différence entre le centre de la classe et la moyenne par l’effectif correspondant. On note ces résultats dans une nouvelle colonne que l’on ajoute au tableau. On arrondit à nouveau toutes les valeurs à 4 chiffres après la virgule.
Intervalle | Centre | Effectif | ||||
---|---|---|---|---|---|---|
26 | 1 548,24 936 | 40 254,4 818 | ||||
10 | 374,337 365 | 3 743,3 736 | ||||
24 | 0,42 536 484 | 10,2 088 | ||||
5 | 426,513 365 | 2 132,5 668 | ||||
27 | 1 652,60 136 | 44 620,2 351 |
Nous avons à présent tout ce qu’il nous faut pour calculer l’écart-type. Nous allons substituer les valeurs du tableau dans la formule de l’écart-type et calculer : soit 31,41 au centième près.
Par conséquent, l’écart-type est 31,41 au centième près.
Dans cette fiche explicative, nous avons découvert la notion d’écart-type et nous avons appris à calculer l’écart-type d’une série statistique présentée sous les deux formes, une liste de valeurs et un tableau des effectifs. Nous avons également appris à comparer des séries statistiques et à tirer des conclusions en utilisant l’écart-type.
Points clés
- On utilise l’écart-type d’une série statistique pour mesurer la dispersion des données autour de la moyenne.
- Pour les données présentées dans une liste, la formule pour l’écart-type d’une série statistique à valeurs et dont la moyenne est est
- Pour les données présentées dans un tableau des effectifs, la formule de l’écart-type d’une série statistique , dont les effectifs correspondants sont , est le nombre de valeurs distinctes dans la série de données et la moyenne est , est
- Pour les tableaux des effectifs regroupés en classes, avec les données sous forme d’intervalles, on utilise le centre de chaque intervalle pour représenter les valeurs de .