Vidéo question :: Calculer le coefficient de corrélation de Spearman pour une série statistique à deux variables | Nagwa Vidéo question :: Calculer le coefficient de corrélation de Spearman pour une série statistique à deux variables | Nagwa

Vidéo question :: Calculer le coefficient de corrélation de Spearman pour une série statistique à deux variables Mathématiques • Troisième secondaire

Le tableau suivant présente les données d'une étude visant à découvrir la relation entre l'âge de la mère et le nombre de ses enfants. Déterminez le coefficient de corrélation de Spearman. Arrondissez votre réponse au millième près.

05:47

Transcription de la vidéo

Dans une étude visant à découvrir la relation entre l’âge d’une mère et le nombre de ses enfants, les données suivantes ont été trouvées. Déterminez le coefficient de corrélation de Spearman. Arrondissez votre réponse au millième près.

Dans notre tableau, nous voyons deux lignes de données. Dans la première ligne, il y a l’âge de la mère en années et dans la deuxième ligne, le nombre de ses enfants. Chaque ligne représente une variable différente dans les données. Et comme il y a deux lignes, on peut dire qu’il s’agit d’une série statistique à deux variables. Pour une telle série statistique, le coefficient de corrélation de Spearman peut nous aider à mieux comprendre la série. Cela ne se fait pas en analysant directement les données elles-mêmes, mais plutôt en fonction du rang relatif des points de données respectifs.

Nous pouvons classer ces données en choisissant de laisser les nombres inférieurs correspondre aux rangs inférieurs. Par ailleurs, nous pourrions choisir la tendance inverse selon laquelle des nombres plus élevés représenteraient des rangs inférieurs. Et cela fonctionnerait parfaitement bien aussi pour calculer le coefficient de corrélation de Spearman. Quelle que soit la façon que nous choisissons, l’important est que nous appliquions la même méthode aux deux lignes de nos données.

Pour simplifier notre processus, nous allons laisser les nombres inférieurs dans notre tableau de données correspondre aux rangs inférieurs. Pour découvrir ces rangs, nous allons ajouter deux autres lignes à notre tableau. Nous allons poser 𝑅 𝐴 au rang de l’âge de la mère et 𝑅 𝐶 au nombre d’enfants. En ce qui concerne le rang de l’âge de la mère, nous voyons que ce processus est assez simple car l’âge de la mère augmente de gauche à droite. À l’âge de 19 ans, nous donnons un rang de un. À 22 ans, nous donnons un rang de deux, et ainsi de suite. Étant donné que chaque âge de la mère dans ce tableau est unique, il n’y a pas de doublons. Le rang d’âge de notre mère passera de un à huit, de gauche à droite.

Maintenant, classons le nombre d’enfants. Nous pouvons voir tout de suite que ce classement ne sera pas aussi simple. Par exemple, nous avons deux mères avec un enfant. Puisqu’il s’agit du plus petit nombre d’enfants, nous aimerions leur donner tous les deux un rang de un, ou comme il y en a deux, un rang de un et deux. Mais en réalité, aucune de ces deux méthodes n’a de sens.

Une meilleure méthode consiste à déterminer la moyenne des classements de ces deux nombres distincts d’enfants. Ils occupent le premier et le deuxième rangs. Et nous savons que la moyenne de un et deux est de 1,5. Voilà donc le résultat que nous allons compléter pour leur classement.

Nous cherchons ensuite le prochain nombre d’enfants le plus bas. Et nous voyons qu’il y a encore une fois un doublon. Deux mères ont deux enfants. Ceux-ci auraient des classements de trois et quatre. Mais comme ils ont le même nombre d’enfants, nous utiliserons la moyenne de leur classement. La moyenne de trois et quatre est de trois et demi.

En passant au nombre d’enfants suivant, nous voyons qu’il y a deux mères avec trois enfants. Séparément, on aurait des classements de cinq et six. Et si nous prenons la moyenne de ces deux rangs, nous obtenons 5,5.

Le deuxième nombre d’enfants dans notre tableau est quatre. Et nous voyons qu’il n’y a qu’une seule occurrence de quatre enfants. Donc, cela correspond au septième rang. Et enfin, cinq enfants obtiennent le rang de huit.

Ce sont les nombres dans ces deux lignes, les classements de l’âge de la mère et de l’âge des enfants, qui sont comparés en utilisant le coefficient de corrélation de Spearman. En effet, le coefficient mesure la correspondance de ces classements entre les deux variables différentes.

Nous pouvons créer une mesure de cette différence, 𝑑 𝑖. Elle est égale à la différence entre le rang de l’âge de la mère et le nombre d’enfants. Pour calculer 𝑑 𝑖 pour un point de donnée, nous soustrayons 𝑅 𝐶 de 𝑅 𝐴. Un moins 3,5 est moins 2,5. Ensuite, deux moins 1,5 est 0,5. Trois moins 1,5 est 1,5, et ainsi de suite.

Par ailleurs, il est à noter qu’il n’y a qu’un seul point de données pour lequel le classement de l’âge de la mère correspond parfaitement au classement du nombre d’enfants. En général, plus cela se produit le plus souvent pour une série statistique, plus il y a une correspondance entre le classement des deux différentes variables impliquées, plus le coefficient de corrélation de Spearman est positif.

En ce qui concerne ce coefficient, libérons un peu d’espace en haut de notre écran et écrivons l’équation mathématique de ce coefficient. Souvent symbolisé par 𝑟 𝑠, il est égal à un moins six fois la somme, voilà ce que signifie cette lettre grecque Σ, des différences entre les classements de nos deux variables au carré toutes divisées par 𝑛, où 𝑛 est le nombre de points de données fois 𝑛 au carré moins un.

On voit alors que pour calculer 𝑟 𝑠, il faut connaître la somme de 𝑑 𝑖 au carré et 𝑛. 𝑛 est le nombre de points de données. Donc, dans notre cas, nous avons un, deux, trois, quatre, cinq, six, sept, huit. Donc 𝑛 est égal à huit. Et pour calculer la somme de 𝑑 𝑖 au carré, ajoutons une dernière ligne à notre tableau. Dans cette ligne, nous allons calculer 𝑑 𝑖 au carré pour chaque valeur 𝑑 𝑖. À titre d’exemple, pour notre première donnée, le moins 2,5 au carré nous donne 6,25. Ensuite, 0,5 au carré nous donne 0,25, et ainsi de suite.

Notez que puisque nous mettons au carré nos valeurs 𝑑 𝑖 pour obtenir cette ligne, toutes ces valeurs sont non négatives. Pour calculer la somme de 𝑑 𝑖 au carré, nous prenons toutes les valeurs de cette ligne et nous les additionnons. Cela nous donne 12,5. En sachant cela, nous pouvons écrire une expression pour notre coefficient de corrélation en utilisant la somme de 𝑑 𝑖 au carré et des valeurs 𝑛. En tapant cette expression sur notre calculatrice, nous trouvons un résultat de 0,85119 et ainsi de suite.

Nous rappelons cependant que nous voulons donner notre réponse au millième près. Si nous regardons le nombre à la quatrième décimale, nous voyons que c’est un, ce qui est inférieur à cinq, ce qui signifie que l’arrondir au millième près revient à le garder tel quel. Donc, le coefficient de corrélation de Spearman arrondi au millième près est de 0,851.

Rejoindre Nagwa Classes

Assistez à des séances en direct sur Nagwa Classes pour stimuler votre apprentissage avec l’aide et les conseils d’un enseignant expert !

  • Séances interactives
  • Chat et messagerie électronique
  • Questions d’examen réalistes

Nagwa utilise des cookies pour vous garantir la meilleure expérience sur notre site web. Apprenez-en plus à propos de notre Politique de confidentialité