Transcription de la vidéo
Calculez le coefficient de corrélation des rangs de Spearman entre 𝑥 et 𝑦. Arrondissez votre réponse au millième près.
En observant cette série statistique, nous voyons que les valeurs de 𝑥 sont dans la première ligne et que les valeurs de 𝑦 sont dans la seconde. Ces données sont donc décrites par deux variables. Pour calculer le coefficient de corrélation des rangs de Spearman entre 𝑥 et 𝑦, nous n’allons pas utiliser directement ces valeurs. Mais nous allons plutôt utiliser ce que l’on appelle le rang de ces valeurs. Le coefficient de corrélation des rangs de Spearman mesure en effet la correspondance entre les rangs relatifs de données à deux variables.
Pour voir ce que cela signifie, créons deux nouvelles lignes dans notre tableau de données. La première ligne représente le rang des valeurs de 𝑥 et la deuxième ligne représente le rang des valeurs de 𝑦. En considérant d’abord les valeurs de 𝑥 dans le tableau, nous allons les classer de la plus petite à la plus grande en utilisant les nombres un, deux, trois, et ainsi de suite. Cela signifie que la plus petite valeur de 𝑥 aura le rang un.
Et la plus petite valeur est ici quatre. Donc le 𝑅 𝑥 de cette valeur est un. La prochaine valeur de 𝑥 la plus petit est cinq, donc on lui attribue le rang deux. Puis vient la valeur sept, qui a alors le rang trois. Et on a ensuite deux valeurs de 𝑥 égales à huit. On peut dire que ce sont les quatrième et cinquième plus petites valeurs de 𝑥. Mais comme elles ont la même valeur, on prend ces deux rangs, quatre et cinq, et on calcule leur moyenne, soit 4,5 ; on leur assigne ensuite à chacune ce rang moyen. Enfin, la valeur la plus élevée du tableau est 12. Donc, elle a pour rang six car c’est la sixième plus petite valeur. Voici donc ce que cela signifie de classer les données.
Et nous allons maintenant faire la même chose pour les valeurs de 𝑦. La plus petite valeur de 𝑦 du tableau est quatre, ce qui lui donne le rang un. Vient ensuite six, qui est présent trois fois. Ces valeurs occupent donc les deuxième, troisième et quatrième places des valeurs de 𝑦. Et comme elles sont toutes identiques, on leur assigne le même rang égal à la moyenne de ces trois nombres, soit trois. La prochaine valeur de 𝑦 la plus petite est sept. C’est la cinquième plus petite valeur de 𝑦. Donc, son 𝑅 𝑦 est égal à cinq. Et enfin, la valeur de 𝑦 la plus élevée est 10, et son rang est six.
Les résultats dans ces deux lignes de notre tableau sont celles que le coefficient de corrélation des rangs de Spearman va en réalité décrire. Ce coefficient donne une indication quantitative du niveau de correspondance entre les rangs de ces données. En résumé, plus 𝑅 𝑥 et 𝑅 𝑦 sont proches pour chaque observation de la série statistique, plus le coefficient de corrélation sera proche de plus un.
Créons à présent une ligne dans notre tableau représentant la différence entre les valeurs respectives de 𝑅 𝑥 et 𝑅 𝑦. On suppose que cette valeur 𝑑 𝑖 est égale à 𝑅 𝑥 moins 𝑅 𝑦 pour chaque observation. Pour la première observation, on a un moins cinq. Ce qui fait moins quatre. On a ensuite trois moins trois, soit zéro, puis 4,5 moins trois, qui est égal à 1,5, suivi de deux moins un, soit un, 4,5 moins trois, soit 1,5, et enfin, six moins six, ce qui fait zéro.
Afin de standardiser ces résultats, nous allons créer une dernière ligne dans notre tableau représentant ces différences au carré. De cette façon, aucune de ces différences ne sera négative. Moins quatre fois moins quatre égale plus 16. Zéro au carré égale zéro. 1,5 au carré égale 2,25. Un au carré égale un. 1,5 au carré est à nouveau égal à 2,25. Et zéro au carré égale zéro.
Nous sommes maintenant prêts à rappeler la formule du coefficient de corrélation des rangs de Spearman. On représente souvent ce coefficient par un petit 𝑟 indice 𝑠. Il est égal à un moins six fois la somme de toutes les valeurs de 𝑑 𝑖 au carré divisé par le nombre d’observations de la série statistique, 𝑛, fois 𝑛 au carré moins un. Pour calculer le coefficient de corrélation des rangs de Spearman pour une série statistique, les deux valeurs que nous devons donc connaître sont la somme des 𝑑 𝑖 au carré ainsi que le nombre total d’observations.
Concernant la somme des 𝑑 𝑖 au carré, nous pouvons la calculer en additionnant tous les résultats de la dernière ligne de notre tableau. 16 plus zéro plus 2,25 plus un plus 2,25 plus zéro donne 21,5. Et pour le nombre d’observations de la série statistique, nous voyons que nous avons un, deux, trois, quatre, cinq, et six points. Cela signifie que 𝑛 est ici égal à six.
Maintenant que nous avons déterminé ces deux informations de la série statistique, nous pouvons faire un peu de place et commencer à calculer 𝑟 𝑠, le coefficient de corrélation des rangs de Spearman. On remplace la somme des 𝑑 𝑖 au carré et 𝑛 par leurs valeurs. Et remarquez que comme 𝑛 est égal à six, un facteur six s’annule au numérateur et au dénominateur. De plus, six au carré égale 36. On a donc 𝑟 𝑠 égale un moins 21,5 sur 36 moins un, soit 35. Et en calculant cela, on obtient une valeur de 0,38571.
Mais rappelez vous que nous devons donner notre réponse arrondie au millième. On obtient alors un résultat de 0,386. Au millième près, il s’agit de la valeur du coefficient de corrélation des rangs de Spearman entre 𝑥 et 𝑦.