Fiche explicative de la leçon: Coefficient de corrélation des rangs de Spearman | Nagwa Fiche explicative de la leçon: Coefficient de corrélation des rangs de Spearman | Nagwa

Fiche explicative de la leçon: Coefficient de corrélation des rangs de Spearman Mathématiques • Troisième année secondaire

Dans ce document explicatif, nous allons apprendre comment déterminer le coefficient de corrélation des rangs de Spearman.

Nous allons déterminer sa valeur pour des ensembles de données bivariées quantitatives et qualitatives. Les données décrites par le coefficient de corrélation des rangs de Spearman peuvent être discrètes ou continues si elles sont quantitatives.

Définition : Données bivariées

Les données bivariées sont des données sur chacune de deux variables, chaque valeur d’une des variables étant associée à une valeur de l’autre variable.

Définition : Données quantitatives et qualitatives

Les données quantitatives sont numériques. Un exemple de série de données bivariées quantitatives est {(11;130),(13;129),(9;124),(15;138),(7;121)}. Elle pourrait décrire l’âge d’une personne en ans et sa taille en centimètres. L’âge d’une personne est discret s’il ne peut être donné que sous la forme d’un nombre entier d’ ans, alors que la taille de la personne est continue si elle peut être donnée comme une fraction de centimètre.

Les données qualitatives (également appelées données descriptives ou catégorielles) ne sont pas numériques. Un exemple de série de données bivariées qualitatives est {( grand, grand), (moyen, grand), (petit, petit), (moyen, moyen), (grand, moyen)}. Cela pourrait décrire la taille de chemise d’une personne dans deux marques différentes. Pour calculer le coefficient de corrélation des rangs de Spearman pour des données qualitatives, les données doivent pouvoir être ordonnées (par exemple:petit, moyen, grand).

Le coefficient de corrélation des rangs de Spearman, noté 𝑟, est une mesure de la tendance d’une variable à augmenter ou diminuer quand l’autre variable le fait dans une relation monotone (entièrement croissante ou entièrement décroissante), tel que 1𝑟1.

Si une variable augmente toujours quand l’autre variable augmente également, on peut dire que la valeur de 𝑟 est positive et il y a une corrélation positive entre les variables. D’un autre côté, si une variable diminue toujours quand l’autre augmente, alors on peut dire que la valeur de 𝑟 est négative, ce qui indique une corrélation négative. Les valeurs de coefficients de corrélation de 1 ou 1 décrivent une corrélation monotone parfaite. Cela signifie que les rangs correspondent totalement (𝑟=1) ou sont directement opposés (𝑟=1). Contrairement au coefficient de corrélation de Pearson, une valeur parfaite de 𝑟 de 1 ou 1 peut se produire, que les couples de données quantitatives d’une série soient linéairement liés ou non.

Non seulement 𝑟 peut être égal à 1 ou 1, mais il peut aussi avoir n’importe quelle valeur entre 1 et 1. Une valeur de 0 de 𝑟 indique qu’il n’y a pas de relation entre les variables. Plus la valeur de 𝑟 est proche de 1 ou 1, plus la corrélation est forte;et plus elle est proche de 0, plus la corrélation est faible.

Définition : Coefficient de corrélation des rangs de Spearman

Le coefficient de corrélation des rangs de Spearman, noté 𝑟, est une valeur numérique tel que 1𝑟1. Il donne une mesure de la probabilité qu’une variable augmente quand l’autre augmente (corrélation positive) ou qu’une variable diminue quand l’autre augmente (corrélation négative). Les corrélations positives sont indiquées par des valeurs positives, et les corrélations négatives par des valeurs négatives. La valeur 0 indique l’absence de relation. Plus la corrélation est forte, plus 𝑟 est proche de 1 ou 1, et plus la corrélation est faible, plus il est proche de 0. Les valeurs de coefficients de corrélation de 1 ou 1 signifient que les rangs correspondent totalement (𝑟=1) ou qu’ils sont directement opposés (𝑟=1).

La première étape pour déterminer la valeur de 𝑟 pour une série de 𝑛 couples de données bivariées consiste à ordonner les valeurs de chaque variable. Dans une série de données quantitatives, le plus petit rang peut être affecté à la valeur la plus petite ou la plus grande, mais chaque variable doit être ordonnée de la même manière. C’est-à-dire que les deux doivent être ordonnées de la plus petite valeur à la plus grande ou de la plus grande à la plus petite. En outre, si deux valeurs de données sont identiques, alors leurs rangs doivent également être identiques. Ainsi, les rangs de deux ou plusieurs valeurs de données identiques sont égaux à la moyenne de leurs positions dans une liste ordonnée. Les valeurs de données identiques sont dites avoir des rangs liés.

On suppose que l’on a une série de données constituée des points (2,3),(5,4),(6,1).et

Les deux variables sont appelées 𝑋 avec des valeurs d’échantillon 𝑥,𝑥,,𝑥, et 𝑌 avec des valeurs d’échantillon 𝑦,𝑦,,𝑦, telles qu’un élément général bivarié est noté (𝑥;𝑦). Dans cette série de données, 𝑖=1;2;3 puisqu’il y a 3 paires de données. Les valeurs de 𝑥 sont 2, 5 et 6, et les valeurs de 𝑦 sont 3, 4 et 1. Ordonner les valeurs de 𝑥 de la plus petite à la plus grande donne 6,2,5.

En faisant de même pour les valeurs de 𝑦, on obtient 3,1,4.

Cela signifie que pour les valeurs de 𝑥, si le rang de 6 est 1, alors le rang de 2 est 2, et le rang de 5 est 3. Les valeurs de 𝑦 doivent être classées de la même manière, donc le rang de 3 est 1, le rang de 1 est 2, et le rang de 4 est 3. Pour chaque point (𝑥;𝑦), la différence de rang des coordonnées peut être notée 𝑑 et les carrés des différences 𝑑. Cela est indiqué dans le tableau ci-dessous, où les rangs des valeurs de 𝑥 sont représentés par R, et les rangs des valeurs de 𝑦 sont représentés par R.

𝑥256
R231
𝑦341
R132
RR(𝑑)101
𝑑101

Une fois que l’on a les valeurs de 𝑑, on peut les utiliser avec la valeur de 𝑛, le nombre de couples de données, dans une formule générale du coefficient de corrélation des rangs de Spearman. Dans notre premier exemple, nous allons apprendre à reconnaître cette formule.

Exemple 1: Reconnaître la formule du coefficient de corrélation des rangs de Spearman

Laquelle des formules suivantes est celle du coefficient de corrélation des rangs de Spearman?

  1. 𝑟=16𝑑(𝑛1)
  2. 𝑟=16𝑑𝑛(𝑛1)
  3. 𝑟=6𝑑𝑛(𝑛1)
  4. 𝑟=16𝑑𝑛(𝑛1)
  5. 𝑟=1𝑑𝑛(𝑛1)

Réponse

La formule du coefficient de corrélation des rangs de Spearman (parfois simplement appelée corrélation de Spearman) est la suivante:𝑟=16𝑑𝑛(𝑛1) Dans celle-ci, 𝑟 représente le coefficient, et 𝑛 représente le nombre de points de la série de données. Le carré de la différence des rangs des deux coordonnées de chaque point (𝑥;𝑦) est représenté par 𝑑, et l’expression 𝑑 indique que l’on doit calculer la somme de chacun de ces carrés. La formule a été développée par Charles Spearman, un psychologue anglais connu pour son travail en statistiques. Le calcul de la corrélation des rangs équivaut à déterminer la corrélation de Pearson sur une nouvelle série de variables:les valeurs des rangs des données.

Formule : Coefficient de corrélation des rangs de Spearman

La formule du coefficient de corrélation des rangs de Spearman est 𝑟=16𝑑𝑛(𝑛1), 𝑟 est le coefficient et 𝑛 est le nombre de points de la série de données. Pour chaque point (𝑥;𝑦), le carré de la différence des rangs des deux coordonnées est représenté par 𝑑, et la somme de chacun de ces carrés est représentée par l’expression 𝑑.

Maintenant que nous avons une formule générale, nous pouvons l’utiliser pour résoudre des problèmes. Commençons par considérer quelle est la valeur du coefficient de corrélation des rangs de Spearman lorsque les éléments correspondants dans deux groupes de données ont les mêmes rangs.

Exemple 2: Déterminer quand le coefficient de corrélation de rang de Spearman est égal à 1

Vrai ou faux:Lorsque les rangs de chacun des deux éléments correspondants dans deux groupes de données 𝑋 et 𝑌 sont identiques, le coefficient de corrélation des rangs de Spearman est égal à 1.

Réponse

Pour répondre à la question, on étudie un exemple de la vie courante. Dans le tableau ci-dessous, on suppose que R et R représentent les rangs donnés à cinq chiens lors d’un concours canin par les juges 𝑋 et 𝑌, avec 1 étant le chien le mieux classé et 5 étant le chien le moins bien classé. Les rangs des deux juges sont identiques, on peut donc voir que la différence des rangs de chaque chien, qui est représentée par RR, ou 𝑑, est égale à 0. Comme 0=0, on peut également voir que 𝑑 est égal à 0 pour chaque chien.

ChienRang du
juge 𝑋()R
Rang du
juge 𝑌()R
RR(𝑑)𝑑
Teckel2222=00
Saint-Bernard4444=00
Beagle1111=00
Setter Irlandais5555=00
Caniche3333=00

On rappelle que la formule du coefficient de corrélation des rangs de Spearman est 𝑟=16𝑑𝑛(𝑛1), 𝑟 représente le coefficient, 𝑛 est le nombre de couples de données, et 𝑑 est le carré de la différence des rangs des deux variables pour chaque couple de données.

Ici, on sait que la valeur de 𝑛 est 5, car il y a 5 couples de données, et la valeur de 𝑑 est 0+0+0+0+0=0.

Donc, la valeur du coefficient de corrélation des rangs de Spearman est 𝑟=16(0)5(51)=16(0)5(251)=16(0)5(24)=10120=10=1.

Non seulement la valeur du coefficient de corrélation des rangs de Spearman est égale à 1 dans cet exemple, mais elle sera également égale à 1 dans tout exemple où les rangs des deux variables sont identiques. En effet, dans la formule, la valeur de 𝑑, donc la valeur de la fraction 6𝑑𝑛(𝑛1) sera toujours égale à 0, et 10=1. Donc, on peut dire qu’il est vrai que lorsque les rangs de chacun des deux éléments correspondants dans deux groupes de données 𝑋 et 𝑌 sont identiques, le coefficient de corrélation des rangs de Spearman est égal à 1.

Étudions maintenant quelques problèmes supplémentaires dans lesquels nous devons trouver le coefficient de corrélation des rangs de Spearman pour une série de données bivariées qualitatives ou quantitatives. Dans ces problèmes, les rangs ne seront pas donnés. Nous commençons par étudier des données quantitatives.

Exemple 3: Calculer le coefficient de corrélation des rangs de Spearman pour des données quantitatives

Déterminez le coefficient de corrélation des rangs de Spearman entre le prix du produit et sa durée de vie à partir des données fournies. Arrondissez votre réponse à quatre décimales près.

Durée de vie ( a)154263
Prix ( $)79160125105214103

Réponse

On rappelle que la formule du coefficient de corrélation des rangs de Spearman est 𝑟=16𝑑𝑛(𝑛1), 𝑟 représente le coefficient, 𝑛 est le nombre de couples de données, et 𝑑 est le carré de la différence des rangs des deux coordonnées pour chaque couple de données.

On voit que les durées de vie des produits et leurs prix forment une série de données bivariées quantitatives. On commence par attribuer les rangs aux durées de vie des produits. La mise en ordre des durées de vie des plus courtes aux plus longues donne 1,2,3,4,5,6.

La durée de vie la plus courte est 1 an, donc on peut lui attribuer le rang le plus bas (1) ou le rang le plus élevé (6). On devrait arriver à la même valeur du coefficient de corrélation de rang de Spearman dans les deux cas, tant que l’on ordonne les durées de vie et les prix des produits de manière similaire. On utilise ici le rang 1 pour une durée de vie de 1 an, donc une durée de vie de 2 ans a le rang 2, une durée de vie de 3 ans a le rang 3, et ainsi de suite, avec une durée de vie de 6 ans qui a le rang 6.

On répète maintenant ce processus avec les prix. Les ordonner du plus bas au plus élevé donne 79,103,105,125,160,214.

Ici, 79 $ obtient le rang 1, donc 103 $ obtient le rang 2, 105 $ obtient le rang 3, et ainsi de suite, avec le prix de 214 $ obtenant le rang 6. Les durées de vie, les prix et leurs rangs sont indiqués ci-dessous, ainsi que les différences des rangs et les carrés des différences. Les rangs des durées de vie sont représentés par RL, et les rangs des prix sont représentés par RP. Remarquez que la somme des différences (𝑑) est 0+0+0+(1)+0+1=0.

En fait, il est toujours vrai que la somme des différences de rangs est égale à zéro. Ainsi, déterminer la somme des différences est un bon moyen de vérifier le travail effectué.

Durée de vie ( a)154263
RL154263
Prix ( $ )79160125105214103
RP154362
RRLP(𝑑)000101
𝑑000101

On doit substituer les valeurs de 𝑛 et 𝑑 dans la formule 𝑟=16𝑑𝑛(𝑛1) pour déterminer le coefficient de corrélation des rangs de Spearman. Ici, on sait que la valeur de 𝑛 est 6, car il y a 6 couples de données, et la valeur de 𝑑 est 0+0+0+1+0+1=2.

Donc, la valeur du coefficient de corrélation des rangs de Spearman est 𝑟=16(2)6(61)=16(2)6(35)=112210=10,057142=0,942858.

Arrondie à quatre décimales près, la valeur du coefficient est 0,9‎ ‎429. Elle est assez proche de 1, donc on peut dire que les rangs sont fortement corrélés. On peut donc conclure que des durées de vie plus longues ont tendance à être liées à des prix plus élevés et inversement.

Nous allons à nouveau déterminer le coefficient de corrélation des rangs de Spearman pour une série de données quantitatives dans l’exemple qui suit. Cette fois, nous allons calculer des rangs moyens. C’est-à-dire les rangs associés aux points des données ayant la même valeur.

Exemple 4: Calculer le coefficient de corrélation des rangs de Spearman pour des données quantitatives

Déterminez le coefficient de corrélation des rangs de Spearman entre 𝑥 et 𝑦. Arrondissez votre réponse au millième près.

𝑥4785812
𝑦7664610

Réponse

Pour déterminer le coefficient de corrélation des rangs de Spearman, on utilise la formule 𝑟=16𝑑𝑛(𝑛1), 𝑟 représente le coefficient, 𝑛 est le nombre de couples de données, et 𝑑 est le carré de la différence des rangs des deux coordonnées pour chaque couple de données.

On voit que le tableau montre une série de données bivariées quantitatives. On commence par attribuer les rangs aux valeurs de 𝑥. Les ordonner de la plus petite à la plus grande donne 4,5,7,8,8,12.

La plus petite valeur des données est 4, on peut donc choisir de lui attribuer le rang le plus bas (1) ou le rang le plus élevé (6). Tant que l’on reste cohérent dans la méthode que l’on choisit pour attribuer les rangs pour les valeurs de 𝑥 et 𝑦, on arrivera à la même valeur du coefficient de corrélation des rangs de Spearman. On attribue ici au nombre 4 le rang le plus bas:1. Cela signifie que 5 obtient le rang 2 et 7 le rang 3.

Sachant que 8 apparaît à la fois en quatrième et cinquième position dans la liste ordonnée, on attribue à chaque instance de 8 un rang équivalent à la moyenne de leurs positions, c’est-à-dire le rang 4+52=92=4,5.

On sait aussi que le rang 6 doit être utilisé pour 12, car 12 est en sixième position dans la liste.

On répète maintenant ce processus avec les valeurs de 𝑦. Les ordonner de la plus petite à la plus grande donne 4,6,6,6,7,10.

Ici, 4 obtient le rang 1. Un 6 apparaît en deuxième, troisième et quatrième position sur la liste ordonnée. Une fois encore, on leur attribue un rang équivalent à la moyenne de leurs positions, soit le rang 2+3+43=93=3.

On sait également que le rang 5 doit être utilisé pour 7, car 7 est en cinquième position dans la liste, et le rang 6 doit être utilisé pour 10, car il est en sixième position. Les valeurs de 𝑥 et 𝑦 et leurs rangs sont indiqués ci-dessous, avec les différences des rangs et les carrés des différences. Les rangs des valeurs de 𝑥 sont représentés par R , et les rangs des valeurs de 𝑦 sont représentés par R.

𝑥4785812
R134,524,56
𝑦7664610
R533136
RR(𝑑)401,511,50
𝑑1602,2512,250

On doit substituer les valeurs de 𝑛 et 𝑑 dans la formule 𝑟=16𝑑𝑛(𝑛1) pour déterminer le coefficient de corrélation des rangs de Spearman. Ici, on sait que la valeur de 𝑛 est 6, car il y a 6 couples de données, et la valeur de 𝑑 est 16+0+2,25+1+2,25+0=21,5.

Donc, la valeur du coefficient de corrélation des rangs de Spearman est 𝑟=16(21,5)6(61)=16(21,5)6(35)=1129210=10,614285=0,385714.

Arrondie au millième près, la valeur du coefficient est 0,386. Elle est loin de 1, on peut donc dire que les rangs ne sont pas fortement corrélés. On peut donc conclure que des valeurs plus élevées de la variable 𝑥 n’ont pas tendance à être liées à des valeurs plus élevées de la variable 𝑦 et inversement.

Dans nos deux exemples précédents, nous avons appris à calculer le coefficient de corrélation des rangs de Spearman pour une série de données quantitatives. Nous pouvons appliquer les mêmes techniques aux données qualitatives en affectant d’abord des rangs aux valeurs des données. Comme précédemment, nous allons calculer des rangs moyens dans cet exemple.

Exemple 5: Calculer le coefficient de corrélation des rangs de Spearman pour des données qualitatives

Dans une étude de la relation entre les notes des élèves en mathématiques et en physique, les résultats suivants ont été trouvés pour six élèves.

MathématiquesDBABDD
PhysiqueCCBACF

Déterminez le coefficient de corrélation des rangs de Spearman. Arrondissez votre réponse au millième près.

Réponse

On rappelle que la formule du coefficient de corrélation des rangs de Spearman est 𝑟=16𝑑𝑛(𝑛1), 𝑟 représente le coefficient, 𝑛 est le nombre de couples de données, et 𝑑 est le carré de la différence des rangs des deux variables pour chaque couple de données.

On voit que les notes des six élèves forment une série de données bivariées qualitatives qui peuvent être ordonnées. Même si les valeurs des données ne sont pas numériques, on peut quand même leur attribuer un rang, qui permettra de déterminer les différences entre leurs rangs. On commence par attribuer les rangs aux notes de mathématiques. La mise en ordre des notes de la plus élevée à la plus basse donne ABBDDD,,,,,.

La note la plus élevée est A, on peut donc attribuer à A le rang le plus bas ou le plus haut. On devrait arriver à la même valeur du coefficient de corrélation des rangs de Spearman dans les deux cas, tant que l’on classe les notes en mathématiques et en physique de la même manière. On utilise ici le rang 1 pour A.

Comme on trouve B en deuxième et troisième position dans la liste ordonnée des notes, on sait que chacun des B doit avoir un rang égal à la moyenne de 2 et 3, soit le rang 2+32=52=2,5.

Comme les rangs 2 et 3 sont maintenant pris, le rang suivant est 4, et comme il y a des D en quatrième, cinquième et sixième position dans la liste, on peut attribuer à chacun un rang équivalent à la moyenne de leurs positions, soit le rang 4+5+63=153=5.

On attribue maintenant les rangs aux notes de physique. La mise en ordre des notes de la plus élevée à la plus basse donne ABCCCF,,,,,.

Ici, le A obtient le rang 1 et le B obtient le rang 2. Puisqu’il y a 3 des C en troisième, quatrième et cinquième position dans la liste ordonnée des notes, on sait que chacun des C doit avoir le rang 3+4+53=123=4, c’est-à-dire le rang égal à la moyenne de 3, 4 et 5. La note F est la dernière de la liste, on peut donc lui attribuer le rang 6.

Les notes et leurs rangs sont indiqués ci-dessous, ainsi que les différences des rangs et les carrés des différences. Les rangs des élèves en mathématiques sont représentés par RM, et les rangs des notes en physique sont représentés par RP.

MathématiquesDBABDD
RM52,512,555
PhysiqueCCBACF
RP442146
RRMP(𝑑)11,511,511
𝑑12,2512,2511

Pour déterminer le coefficient de corrélation des rangs de Spearman, on doit substituer les valeurs de 𝑛 et 𝑑 dans la formule 𝑟=16𝑑𝑛(𝑛1). Ici, on sait que la valeur de 𝑛 est 6, car il y a 6 couples de données, et la valeur de 𝑑 est 1+2,25+1+2,25+1+1=8,5.

Donc, la valeur du coefficient de corrélation des rangs de Spearman est 𝑟=16(8,5)6(61)=16(8,5)6(35)=151210=10,242857=0,757142.

Arrondie au millième près, la valeur du coefficient est 0,757. Elle est proche de 1, on peut donc dire que les rangs sont fortement corrélés. On peut donc conclure que les élèves ayant de bonnes notes en mathématiques ont aussi tendance à avoir de bonnes notes en physique et inversement.

Étudions maintenant un autre exemple impliquant des données qualitatives avec des rangs liés.

Exemple 6: Calculer le coefficient de corrélation des rangs de Spearman pour des données qualitatives

En utilisant les informations données dans le tableau, déterminez le coefficient de corrélation des rangs de Spearman entre les variables 𝑥 et 𝑦. Donnez votre réponse à quatre décimales près.

𝑥BienExcellentBienExcellentExcellentExcellent
𝑦MédiocreBienMédiocreExcellentTrès bonBien

Réponse

Pour déterminer le coefficient de corrélation des rangs de Spearman entre les variables, on utilise la formule 𝑟=16𝑑𝑛(𝑛1), 𝑟 représente le coefficient de corrélation des rangs de Spearman, 𝑛 est le nombre de couples de données, et 𝑑 est le carré de la différence des rangs des deux variables pour chaque couple de données.

On voit que les évaluations constituent une série de données bivariées qualitatives qui peuvent être ordonnées. On commence par attribuer un rang à chacune des données, en commençant par les valeurs de 𝑥. Ordonner les évaluations de la meilleure à la plus mauvaise donne ExcellentExcellentExcellentExcellentBienBien,,,,,.

Comme « Excellent » occupe les positions 1, 2, 3 et 4, on lui attribue le rang équivalent à la moyenne de ses positions, soit le rang 1+2+3+44=104=2,5.

De plus, comme « Bien » est en cinquième et sixième position, on peut lui attribuer le rang 5+62=112=5,5.

On attribue maintenant les rangs aux valeurs de 𝑦. Ordonner les valeurs de la meilleure à la plus mauvaise donne ExcellentTrèsbienBienBienMédiocreMédiocre,,,,,.

Ici, « Excellent » obtient le rang 1 et « Très bien » obtient le rang 2. Comme « Bien » est en troisième et quatrième position dans la liste ordonnée, on sait que chacun obtient le rang 3+42=72=3,5.

De plus, comme « Médiocre » se situe en cinquième et sixième position, on peut lui attribuer le rang 5+62=112=5,5.

Les évaluations et leurs rangs sont indiqués ci-dessous, avec les différences des rangs et les carrés des différences. Les rangs des évaluations de la variable 𝑥 sont représentés par R, et les rangs des évaluations de la variable 𝑦 sont représentés par R.

𝑥BienExcellentBienExcellentExcellentExcellent
R5,52,55,52,52,52,5
𝑦MédiocreBienMédiocreExcellentTrès bienBien
R5,53,55,5123,5
RR(𝑑)0101,50,51
𝑑0102,250,251

On doit maintenant substituer les valeurs de 𝑛 et 𝑑 dans la formule 𝑟=16𝑑𝑛(𝑛1) pour déterminer le coefficient de corrélation des rangs de Spearman. Puisqu’il y a 𝑛 paires de données, on définit 𝑛=6. En outre, comme 𝑑 est la somme des carrés des différences dans le tableau, 𝑑=0+1+0+2,25+0,25+1=4,5.

Donc, la valeur du coefficient de corrélation des rangs de Spearman est 𝑟=16(4,5)6(61)=16(4,5)6(35)=127210=10,128571=0,871428.

Arrondie à quatre décimales près, la valeur du coefficient est 0,8‎ ‎714. Elle est assez proche de 1, on peut donc dire que les rangs sont fortement corrélés. On peut donc conclure que de meilleures évaluations de la variable 𝑥 ont tendance à être associées à de meilleures évaluations de la variable 𝑦 et inversement.

L’exemple qui suit implique également des données qualitatives avec des rangs liés. Nous allons à nouveau calculer le coefficient de corrélation des rangs de Spearman pour déterminer le niveau de corrélation entre les variables.

Exemple 7: Calculer le coefficient de corrélation des rangs de Spearman pour des données qualitatives

Le tableau suivant représente la relation entre les résultats des évaluations des salariés cette an et l’ an dernière.

Année dernièreAtteint les objectifsÀ améliorerExceptionnelAtteint les objectifsDépasse les objectifs
Cette annéeDépasse les objectifsAtteint les objectifsExceptionnelÀ améliorerDépasse les objectifs

Déterminez le coefficient de corrélation des rangs de Spearman entre les résultats de l’ an dernière et de cette an.

Réponse

On rappelle que la formule du coefficient de corrélation des rangs de Spearman est 𝑟=16𝑑𝑛(𝑛1), 𝑟 représente le coefficient, 𝑛 est le nombre de couples de données, et 𝑑 est le carré de la différence des rangs des deux variables pour chaque couple de données.

On voit que les résultats constituent une série de données bivariées qualitatives qui peuvent être ordonnées. On peut attribuer un rang à chacune des valeurs des données, en commençant par les résultats de l’année dernière. Ordonner les résultats du moins bon au meilleur donne ÀaméliorerAtteintlesobjectifsAtteintlesobjectifsDépasselesobjectifsExceptionnel,,,,.

On peut attribuer à « À améliorer » le rang 1. Comme « Atteint les objectifs » se situe en deuxième et troisième position dans la liste ordonnée, on sait que chaque instance se voit attribuer un rang équivalent à la moyenne de leurs positions, soit le rang 2+32=52=2,5. « Dépasse les objectifs » obtient alors le rang 4 et « Exceptionnel » le rang 5.

On attribue maintenant les rangs aux résultats de cette année. Ordonner les résultats du moins bon au meilleur donne ÀaméliorerAtteintlesobjectifsDépasselesobjectifsDépasselesobjectifsExceptionnel,,,,.

On peut attribuer à « À améliorer » le rang 1 et « Atteint les objectifs » le rang 2. Comme « Dépasse les objectifs » se situe en troisième et quatrième position dans la liste ordonnée, on peut leur attribuer un rang équivalent à la moyenne de leurs positions, soit le rang 3+42=72=3,5. « Exceptionnel » obtient alors le rang 5. Les résultats et leurs rangs sont indiqués ci-dessous, avec les différences des rangs et les carrés des différences. Les rangs des évaluations de l’année dernière sont représentés par RL, et les rangs des évaluations de cette année sont représentés par RT.

Année dernièreAtteint les objectifsÀ améliorerExceptionnelAtteint les objectifsDépasse les objectifs
RL2,5152,55
Cette annéeDépasse les objectifsAtteint les objectifsExceptionnelÀ améliorerDépasse les objectifs
RT3,52513,5
RRLT(𝑑)1101,50,5
𝑑1102,250,25

Ensuite, on substitue les valeurs de 𝑛 et 𝑑 dans la formule 𝑟=16𝑑𝑛(𝑛1) pour déterminer le coefficient de corrélation des rangs de Spearman. Ici, on sait que la valeur de 𝑛 est 5, car il y a 5 couples de données, et la valeur de 𝑑 est la somme des valeurs dans la dernière ligne du tableau, soit 1+1+0+2,25+0,25=4,5.

Donc, la valeur du coefficient de corrélation des rangs de Spearman est 𝑟=16(4,5)5(51)=16(4,5)5(24)=127120=10,225=0,775.

Un coefficient de Spearman de 0,775 est proche de 1, on peut donc dire que les rangs sont assez fortement corrélés. On peut donc conclure que les employés avec de bonnes évaluations l’ an dernière ont tendance à avoir de bonnes évaluations cette an et inversement.

Terminons maintenant par récapituler quelques points clés.

Points clés

  • Les données bivariées sont des données sur chacune de deux variables, chaque valeur d’une des variables étant associée à une valeur de l’autre variable.
  • Le coefficient de corrélation des rangs de Spearman est une mesure de la relation entre des données bivariées. Un coefficient de corrélation des rangs de Spearman positif indique une corrélation positive, et un coefficient négatif indique une corrélation négative.
  • La formule du coefficient de corrélation des rangs de Spearman est 𝑟=16𝑑𝑛(𝑛1), 𝑟 est le coefficient, 𝑛 est le nombre de points des données, et 𝑑 est le carré de la différence des rangs des deux coordonnées pour chaque point (𝑥;𝑦).
  • Les rangs de deux ou plusieurs valeurs identiques d’une variable sont égaux à la moyenne de leurs positions dans une liste ordonnée. On dit que les valeurs des données ont des rangs liés.
  • Lors du calcul du coefficient de corrélation des rangs de Spearman, la somme des différences (𝑑) est toujours égale à 0.

Rejoindre Nagwa Classes

Assistez à des séances en direct sur Nagwa Classes pour stimuler votre apprentissage avec l’aide et les conseils d’un enseignant expert !

  • Séances interactives
  • Chat et messagerie électronique
  • Questions d’examen réalistes

Nagwa utilise des cookies pour vous garantir la meilleure expérience sur notre site web. Apprenez-en plus à propos de notre Politique de confidentialité