Le portail a été désactivé. Veuillez contacter l'administrateur de votre portail.

Vidéo de question : Déterminer le coefficient de corrélation de Spearman entre deux variables Mathématiques

En utilisant les informations données dans le tableau, déterminez le coefficient de corrélation de Spearman entre les variables 𝑥 et 𝑦. Donnez votre réponse au dix-millième près.

07:49

Transcription de vidéo

En utilisant les informations données dans le tableau, déterminez le coefficient de corrélation de Spearman entre les variables 𝑥 et 𝑦. Donnez votre réponse au dix-millième près.

On nous donne un ensemble de données bivariées, c’est-à-dire des données appariées, pour les variables 𝑥 et 𝑦. Les variables sont qualitatives, ou catégoriques. Autrement dit, les valeurs qu’elles prennent ne sont pas numériques. Et nous voyons que les valeurs possibles de 𝑥 et 𝑦 sont «Excellent», «Très bien», «Bien» et «Faible». Nous pouvons dire alors que nos données suivent un système de notation avec des valeurs dans l’ordre catégorique défini allant de «Excellent» à «Faible». Et comme il y a un ordre dans nos données, nous pouvons attribuer des rangs aux valeurs des variables de notre ensemble de données. Nous pouvons ensuite utiliser ces rangs pour calculer le coefficient de corrélation de Spearman.

Pour ce faire, nous ajoutons d’abord deux nouvelles lignes à notre tableau pour les rangs. C’est 𝑅 𝑥 et 𝑅 𝑦. Pour classer d’abord nos données 𝑥, pour voir comment fonctionne le classement, nous devons d’abord classer nos six valeurs dans l’ordre. Et comme nous avons quatre occurrences de «Excellent», elles occupent les quatre premières places de notre classement. Et nos deux occurrences de «Bien» occuperont les places cinq et six. Et lorsque nous avons des valeurs répétées comme celle-ci, nous devons calculer leurs rangs liés afin que les valeurs répétées aient toutes le même rang. Et nous le faisons en calculant la moyenne de leurs places ou positions dans la liste ordonnée.

Pour les quatre occurrences de «Excellent», alors dans nos données 𝑥, chaque occurrence a un rang de un plus deux plus trois plus quatre divisé par quatre. C’est la somme des positions prises par les quatre occurrences divisée par le nombre d’éléments de valeur égale. Et ceci équivaut à 10 sur quatre, soit 2,5. Ceci signifie que chacune de nos occurrences de «Excellent» pour la variable 𝑥 a un rang de 2,5, que nous pouvons mettre dans notre tableau dans la ligne pour les rangs des valeurs 𝑥. Et nous savons que l’attribution des rangs liés garantit que la somme des rangs soit la même pour chacune des deux variables 𝑥 et 𝑦. Et nous verrons que c’est bien le cas lorsque nous aurons fini de classer nos données.

Alors maintenant pour la variable 𝑥, il nous reste deux valeurs, qui sont toutes les deux «Bon». Celles-ci se trouvent aux positions cinq et six de notre liste. Et comme elles ont toutes les deux la même valeur, c’est-à-dire «Bien», nous devrons déterminer leurs rangs liés. C’est donné par la moyenne de leurs positions cinq et six, soit cinq plus six sur deux. C’est 11 sur deux, soit 5,5. Celles-ci se voient toutes les deux attribuer le rang de 5,5, que nous mettons dans notre tableau sous les occurrences de «Bien» pour la variable 𝑥.

Maintenant, attribuons les rangs de la même manière à nos données 𝑦. Et en listant nos données 𝑦 dans l’ordre, nous voyons à nouveau que nous avons des valeurs répétées. En étiquetant à nouveau nos positions de un à six, il est très important que le positionnement soit le même que pour les valeurs 𝑥 ; c’est-à-dire, que nous avons un petit nombre associé à un niveau élevé, nous commençons donc par un pour «Excellent». Puisque nous n’avons qu’un seul exemple de «Excellent», cet élément est classé premier, ou un. Et nous pouvons mettre cela dans notre tableau sous «Excellent» pour les données 𝑦. De même, nous n’avons qu’une seule instance de «Très bien» dans la donnée 𝑦, nous pouvons donc la classer deuxième. Dans notre tableau, le rang deux passe sous l’occurrence de «Très bien» pour la donnée 𝑦.

Nous avons deux occurrences de «Bien». Donc en travaillant sur les rangs liés pour ces deux, leurs positions sont les troisième et quatrième. Donc leurs rangs liés sont trois plus quatre sur deux, c’est-à-dire sept sur deux, soit 3,5. Et c’est leur rang, que nous mettons dans notre tableau sous les deux occurrences de «Bien» dans la donnée 𝑦. Et maintenant il nous reste deux occurrences de «Faible». Leurs rangs liés sont la moyenne de leurs positions, c’est-à-dire, cinq plus six sur deux soit 11 sur deux, soit 5,5. Donc ils sont tous les deux classés 5,5. Et nous pouvons les mettre dans notre tableau dans le classement pour 𝑦. Alors maintenant si nous calculons les sommes des rangs pour chaque variable, nous trouvons, comme prévu, ceux-ci sont égaux avec une valeur de 21.

Maintenant, pour calculer le coefficient de corrélation de Spearman entre les deux variables, nous utilisons la formule du coefficient 𝑟 est égal à un moins six fois la somme des différences au carré sur 𝑛 fois 𝑛 au carré moins un, où 𝑛 est le nombre de paires de données, qui dans notre cas, est six, et 𝑑 𝑖 est la différence de rangs de chaque paire de données pour 𝑖 est un à 𝑛. Nous allons donc devoir déterminer les différences de rangs et de carrés de ces différences. Nous ajoutons donc deux autres lignes à notre tableau.

Nous commençons donc par déterminer notre différence. Si nous attribuons le nombre 𝑛 égal à un, deux, trois, quatre, cinq et six à nos paires de données, nous avons notre première différence 𝑑 un égale 5,5 moins 5,5, et c’est égal à zéro. Notre deuxième différence 𝑑 deux est 2,5 moins 3,5, ce qui est moins un. 𝑑 trois est 5,5 moins 5,5, ce qui est zéro. 𝑑 quatre est 2,5 moins un, qui est 1,5. Et de même, 𝑑 cinq est 0,5, et 𝑑 six est moins un.

Une bonne vérification que nous sommes sur la bonne voie à ce stade est que la somme des différences est égale à zéro. Et en fait, c’est le cas pour nos différences. Alors maintenant nous travaillons sur les différences au carré puisque c’est ce dont nous avons besoin pour notre formule. Nous avons zéro au carré, ce qui est égal à zéro ; moins un au carré, ce qui est égal à un ; encore zéro au carré, ce qui est zéro ; 1,5 au carré, soit 2,25 ; 0,5 au carré, soit 0,25 ; et encore moins un au carré, qui est un. Et donc si nous additionnons maintenant les différences carrées, nous avons une somme de 4,5.

Alors maintenant nous pouvons utiliser ceci et le fait que 𝑛 est égal à six dans notre formule de sorte que le coefficient de corrélation de Spearman 𝑟 𝑠 est un moins six fois 4,5 sur six fois six au carré moins un. Notre fraction vaut 27 sur 210 de sorte que le coefficient de corrélation de Spearman est approximativement égal à un moins 0,128571. C’est-à-dire au millionième près, ce qui équivaut au dix-millième près à 0,8714. Par conséquent, le coefficient de corrélation de Spearman entre les variables 𝑥 et 𝑦 est de 0,8714 au dix-millième près.

Nous pouvons noter à ce stade que le coefficient de corrélation de rang de Spearman peut prendre des valeurs de moins un à plus un et que notre coefficient se situe dans cet intervalle. En fait, comme notre coefficient est proche de plus un, nous pouvons dire que les classements pour 𝑥 et 𝑦 sont fortement corrélés. Donc nous pourrions associer de meilleurs niveaux ou classements pour 𝑥 à de meilleurs niveaux ou classements pour 𝑦 et vice versa. Et c’est ainsi que nous interprétons le coefficient de corrélation de Spearman avec une valeur de 0,8714.

Nagwa utilise des cookies pour vous garantir la meilleure expérience sur notre site. En savoir plus sur notre Politique de Confidentialité.