Dans ce document explicatif, nous allons apprendre comment déterminer le coefficient de corrélation des rangs de Spearman.
Nous allons déterminer sa valeur pour des ensembles de données bivariées quantitatives et qualitatives. Les données décrites par le coefficient de corrélation des rangs de Spearman peuvent être discrètes ou continues si elles sont quantitatives.
Définition : Données bivariées
Les données bivariées sont des données sur chacune de deux variables, chaque valeur d’une des variables étant associée à une valeur de l’autre variable.
Définition : Données quantitatives et qualitatives
Les données quantitatives sont numériques. Un exemple de série de données bivariées quantitatives est . Elle pourrait décrire l’âge d’une personne en ans et sa taille en centimètres. L’âge d’une personne est discret s’il ne peut être donné que sous la forme d’un nombre entier d’ ans, alors que la taille de la personne est continue si elle peut être donnée comme une fraction de centimètre.
Les données qualitatives (également appelées données descriptives ou catégorielles) ne sont pas numériques. Un exemple de série de données bivariées qualitatives est {( grand, grand), (moyen, grand), (petit, petit), (moyen, moyen), (grand, moyen)}. Cela pourrait décrire la taille de chemise d’une personne dans deux marques différentes. Pour calculer le coefficient de corrélation des rangs de Spearman pour des données qualitatives, les données doivent pouvoir être ordonnées (par exemple : petit, moyen, grand).
Le coefficient de corrélation des rangs de Spearman, noté , est une mesure de la tendance d’une variable à augmenter ou diminuer quand l’autre variable le fait dans une relation monotone (entièrement croissante ou entièrement décroissante), tel que
Si une variable augmente toujours quand l’autre variable augmente également, on peut dire que la valeur de est positive et il y a une corrélation positive entre les variables. D’un autre côté, si une variable diminue toujours quand l’autre augmente, alors on peut dire que la valeur de est négative, ce qui indique une corrélation négative. Les valeurs de coefficients de corrélation de 1 ou décrivent une corrélation monotone parfaite. Cela signifie que les rangs correspondent totalement ou sont directement opposés . Contrairement au coefficient de corrélation de Pearson, une valeur parfaite de de ou 1 peut se produire, que les couples de données quantitatives d’une série soient linéairement liés ou non.
Non seulement peut être égal à 1 ou , mais il peut aussi avoir n’importe quelle valeur entre et 1. Une valeur de 0 de indique qu’il n’y a pas de relation entre les variables. Plus la valeur de est proche de ou 1, plus la corrélation est forte ; et plus elle est proche de 0, plus la corrélation est faible.
Définition : Coefficient de corrélation des rangs de Spearman
Le coefficient de corrélation des rangs de Spearman, noté , est une valeur numérique tel que . Il donne une mesure de la probabilité qu’une variable augmente quand l’autre augmente (corrélation positive) ou qu’une variable diminue quand l’autre augmente (corrélation négative). Les corrélations positives sont indiquées par des valeurs positives, et les corrélations négatives par des valeurs négatives. La valeur 0 indique l’absence de relation. Plus la corrélation est forte, plus est proche de ou 1, et plus la corrélation est faible, plus il est proche de 0. Les valeurs de coefficients de corrélation de 1 ou signifient que les rangs correspondent totalement ou qu’ils sont directement opposés .
La première étape pour déterminer la valeur de pour une série de couples de données bivariées consiste à ordonner les valeurs de chaque variable. Dans une série de données quantitatives, le plus petit rang peut être affecté à la valeur la plus petite ou la plus grande, mais chaque variable doit être ordonnée de la même manière. C’est-à-dire que les deux doivent être ordonnées de la plus petite valeur à la plus grande ou de la plus grande à la plus petite. En outre, si deux valeurs de données sont identiques, alors leurs rangs doivent également être identiques. Ainsi, les rangs de deux ou plusieurs valeurs de données identiques sont égaux à la moyenne de leurs positions dans une liste ordonnée. Les valeurs de données identiques sont dites avoir des rangs liés.
On suppose que l’on a une série de données constituée des points
Les deux variables sont appelées avec des valeurs d’échantillon , et avec des valeurs d’échantillon , telles qu’un élément général bivarié est noté . Dans cette série de données, puisqu’il y a 3 paires de données. Les valeurs de sont 2, 5 et , et les valeurs de sont , 4 et 1. Ordonner les valeurs de de la plus petite à la plus grande donne
En faisant de même pour les valeurs de , on obtient
Cela signifie que pour les valeurs de , si le rang de est 1, alors le rang de 2 est 2, et le rang de 5 est 3. Les valeurs de doivent être classées de la même manière, donc le rang de est 1, le rang de 1 est 2, et le rang de 4 est 3. Pour chaque point , la différence de rang des coordonnées peut être notée et les carrés des différences . Cela est indiqué dans le tableau ci-dessous, où les rangs des valeurs de sont représentés par , et les rangs des valeurs de sont représentés par .
2 | 5 | ||
2 | 3 | 1 | |
4 | 1 | ||
1 | 3 | 2 | |
1 | 0 | ||
1 | 0 | 1 |
Une fois que l’on a les valeurs de , on peut les utiliser avec la valeur de , le nombre de couples de données, dans une formule générale du coefficient de corrélation des rangs de Spearman. Dans notre premier exemple, nous allons apprendre à reconnaître cette formule.
Exemple 1: Reconnaître la formule du coefficient de corrélation des rangs de Spearman
Laquelle des formules suivantes est celle du coefficient de corrélation des rangs de Spearman ?
Réponse
La formule du coefficient de corrélation des rangs de Spearman (parfois simplement appelée corrélation de Spearman) est la suivante : Dans celle-ci, représente le coefficient, et représente le nombre de points de la série de données. Le carré de la différence des rangs des deux coordonnées de chaque point est représenté par , et l’expression indique que l’on doit calculer la somme de chacun de ces carrés. La formule a été développée par Charles Spearman, un psychologue anglais connu pour son travail en statistiques. Le calcul de la corrélation des rangs équivaut à déterminer la corrélation de Pearson sur une nouvelle série de variables : les valeurs des rangs des données.
Formule : Coefficient de corrélation des rangs de Spearman
La formule du coefficient de corrélation des rangs de Spearman est , où est le coefficient et est le nombre de points de la série de données. Pour chaque point , le carré de la différence des rangs des deux coordonnées est représenté par , et la somme de chacun de ces carrés est représentée par l’expression .
Maintenant que nous avons une formule générale, nous pouvons l’utiliser pour résoudre des problèmes. Commençons par considérer quelle est la valeur du coefficient de corrélation des rangs de Spearman lorsque les éléments correspondants dans deux groupes de données ont les mêmes rangs.
Exemple 2: Déterminer quand le coefficient de corrélation de rang de Spearman est égal à 1
Vrai ou faux : Lorsque les rangs de chacun des deux éléments correspondants dans deux groupes de données et sont identiques, le coefficient de corrélation des rangs de Spearman est égal à 1.
Réponse
Pour répondre à la question, on étudie un exemple de la vie courante. Dans le tableau ci-dessous, on suppose que et représentent les rangs donnés à cinq chiens lors d’un concours canin par les juges et , avec 1 étant le chien le mieux classé et 5 étant le chien le moins bien classé. Les rangs des deux juges sont identiques, on peut donc voir que la différence des rangs de chaque chien, qui est représentée par , ou , est égale à 0. Comme , on peut également voir que est égal à 0 pour chaque chien.
Chien | Rang du juge | Rang du juge | ||
---|---|---|---|---|
Teckel | 2 | 2 | 0 | |
Saint-Bernard | 4 | 4 | 0 | |
Beagle | 1 | 1 | 0 | |
Setter Irlandais | 5 | 5 | 0 | |
Caniche | 3 | 3 | 0 |
On rappelle que la formule du coefficient de corrélation des rangs de Spearman est , où représente le coefficient, est le nombre de couples de données, et est le carré de la différence des rangs des deux variables pour chaque couple de données.
Ici, on sait que la valeur de est 5, car il y a 5 couples de données, et la valeur de est
Donc, la valeur du coefficient de corrélation des rangs de Spearman est
Non seulement la valeur du coefficient de corrélation des rangs de Spearman est égale à 1 dans cet exemple, mais elle sera également égale à 1 dans tout exemple où les rangs des deux variables sont identiques. En effet, dans la formule, la valeur de , donc la valeur de la fraction sera toujours égale à 0, et . Donc, on peut dire qu’il est vrai que lorsque les rangs de chacun des deux éléments correspondants dans deux groupes de données et sont identiques, le coefficient de corrélation des rangs de Spearman est égal à 1.
Étudions maintenant quelques problèmes supplémentaires dans lesquels nous devons trouver le coefficient de corrélation des rangs de Spearman pour une série de données bivariées qualitatives ou quantitatives. Dans ces problèmes, les rangs ne seront pas donnés. Nous commençons par étudier des données quantitatives.
Exemple 3: Calculer le coefficient de corrélation des rangs de Spearman pour des données quantitatives
Déterminez le coefficient de corrélation des rangs de Spearman entre le prix du produit et sa durée de vie à partir des données fournies. Arrondissez votre réponse à quatre décimales près.
Durée de vie ( a) | 1 | 5 | 4 | 2 | 6 | 3 |
---|---|---|---|---|---|---|
Prix ( $) | 79 | 160 | 125 | 105 | 214 | 103 |
Réponse
On rappelle que la formule du coefficient de corrélation des rangs de Spearman est , où représente le coefficient, est le nombre de couples de données, et est le carré de la différence des rangs des deux coordonnées pour chaque couple de données.
On voit que les durées de vie des produits et leurs prix forment une série de données bivariées quantitatives. On commence par attribuer les rangs aux durées de vie des produits. La mise en ordre des durées de vie des plus courtes aux plus longues donne
La durée de vie la plus courte est 1 an, donc on peut lui attribuer le rang le plus bas (1) ou le rang le plus élevé (6). On devrait arriver à la même valeur du coefficient de corrélation de rang de Spearman dans les deux cas, tant que l’on ordonne les durées de vie et les prix des produits de manière similaire. On utilise ici le rang 1 pour une durée de vie de 1 an, donc une durée de vie de 2 ans a le rang 2, une durée de vie de 3 ans a le rang 3, et ainsi de suite, avec une durée de vie de 6 ans qui a le rang 6.
On répète maintenant ce processus avec les prix. Les ordonner du plus bas au plus élevé donne
Ici, 79 $ obtient le rang 1, donc 103 $ obtient le rang 2, 105 $ obtient le rang 3, et ainsi de suite, avec le prix de 214 $ obtenant le rang 6. Les durées de vie, les prix et leurs rangs sont indiqués ci-dessous, ainsi que les différences des rangs et les carrés des différences. Les rangs des durées de vie sont représentés par , et les rangs des prix sont représentés par . Remarquez que la somme des différences est
En fait, il est toujours vrai que la somme des différences de rangs est égale à zéro. Ainsi, déterminer la somme des différences est un bon moyen de vérifier le travail effectué.
Durée de vie ( a) | 1 | 5 | 4 | 2 | 6 | 3 |
---|---|---|---|---|---|---|
1 | 5 | 4 | 2 | 6 | 3 | |
Prix ( $ ) | 79 | 160 | 125 | 105 | 214 | 103 |
1 | 5 | 4 | 3 | 6 | 2 | |
0 | 0 | 0 | 0 | 1 | ||
0 | 0 | 0 | 1 | 0 | 1 |
On doit substituer les valeurs de et dans la formule pour déterminer le coefficient de corrélation des rangs de Spearman. Ici, on sait que la valeur de est 6, car il y a 6 couples de données, et la valeur de est
Donc, la valeur du coefficient de corrélation des rangs de Spearman est
Arrondie à quatre décimales près, la valeur du coefficient est 0,9 429. Elle est assez proche de 1, donc on peut dire que les rangs sont fortement corrélés. On peut donc conclure que des durées de vie plus longues ont tendance à être liées à des prix plus élevés et inversement.
Nous allons à nouveau déterminer le coefficient de corrélation des rangs de Spearman pour une série de données quantitatives dans l’exemple qui suit. Cette fois, nous allons calculer des rangs moyens. C’est-à-dire les rangs associés aux points des données ayant la même valeur.
Exemple 4: Calculer le coefficient de corrélation des rangs de Spearman pour des données quantitatives
Déterminez le coefficient de corrélation des rangs de Spearman entre et . Arrondissez votre réponse au millième près.
4 | 7 | 8 | 5 | 8 | 12 | |
7 | 6 | 6 | 4 | 6 | 10 |
Réponse
Pour déterminer le coefficient de corrélation des rangs de Spearman, on utilise la formule , où représente le coefficient, est le nombre de couples de données, et est le carré de la différence des rangs des deux coordonnées pour chaque couple de données.
On voit que le tableau montre une série de données bivariées quantitatives. On commence par attribuer les rangs aux valeurs de . Les ordonner de la plus petite à la plus grande donne
La plus petite valeur des données est 4, on peut donc choisir de lui attribuer le rang le plus bas (1) ou le rang le plus élevé (6). Tant que l’on reste cohérent dans la méthode que l’on choisit pour attribuer les rangs pour les valeurs de et , on arrivera à la même valeur du coefficient de corrélation des rangs de Spearman. On attribue ici au nombre 4 le rang le plus bas : 1. Cela signifie que 5 obtient le rang 2 et 7 le rang 3.
Sachant que 8 apparaît à la fois en quatrième et cinquième position dans la liste ordonnée, on attribue à chaque instance de 8 un rang équivalent à la moyenne de leurs positions, c’est-à-dire le rang
On sait aussi que le rang 6 doit être utilisé pour 12, car 12 est en sixième position dans la liste.
On répète maintenant ce processus avec les valeurs de . Les ordonner de la plus petite à la plus grande donne
Ici, 4 obtient le rang 1. Un 6 apparaît en deuxième, troisième et quatrième position sur la liste ordonnée. Une fois encore, on leur attribue un rang équivalent à la moyenne de leurs positions, soit le rang
On sait également que le rang 5 doit être utilisé pour 7, car 7 est en cinquième position dans la liste, et le rang 6 doit être utilisé pour 10, car il est en sixième position. Les valeurs de et et leurs rangs sont indiqués ci-dessous, avec les différences des rangs et les carrés des différences. Les rangs des valeurs de sont représentés par , et les rangs des valeurs de sont représentés par .
4 | 7 | 8 | 5 | 8 | 12 | |
1 | 3 | 4,5 | 2 | 4,5 | 6 | |
7 | 6 | 6 | 4 | 6 | 10 | |
5 | 3 | 3 | 1 | 3 | 6 | |
0 | 1,5 | 1 | 1,5 | 0 | ||
16 | 0 | 2,25 | 1 | 2,25 | 0 |
On doit substituer les valeurs de et dans la formule pour déterminer le coefficient de corrélation des rangs de Spearman. Ici, on sait que la valeur de est 6, car il y a 6 couples de données, et la valeur de est
Donc, la valeur du coefficient de corrélation des rangs de Spearman est
Arrondie au millième près, la valeur du coefficient est 0,386. Elle est loin de 1, on peut donc dire que les rangs ne sont pas fortement corrélés. On peut donc conclure que des valeurs plus élevées de la variable n’ont pas tendance à être liées à des valeurs plus élevées de la variable et inversement.
Dans nos deux exemples précédents, nous avons appris à calculer le coefficient de corrélation des rangs de Spearman pour une série de données quantitatives. Nous pouvons appliquer les mêmes techniques aux données qualitatives en affectant d’abord des rangs aux valeurs des données. Comme précédemment, nous allons calculer des rangs moyens dans cet exemple.
Exemple 5: Calculer le coefficient de corrélation des rangs de Spearman pour des données qualitatives
Dans une étude de la relation entre les notes des élèves en mathématiques et en physique, les résultats suivants ont été trouvés pour six élèves.
Mathématiques | D | B | A | B | D | D |
---|---|---|---|---|---|---|
Physique | C | C | B | A | C | F |
Déterminez le coefficient de corrélation des rangs de Spearman. Arrondissez votre réponse au millième près.
Réponse
On rappelle que la formule du coefficient de corrélation des rangs de Spearman est , où représente le coefficient, est le nombre de couples de données, et est le carré de la différence des rangs des deux variables pour chaque couple de données.
On voit que les notes des six élèves forment une série de données bivariées qualitatives qui peuvent être ordonnées. Même si les valeurs des données ne sont pas numériques, on peut quand même leur attribuer un rang, qui permettra de déterminer les différences entre leurs rangs. On commence par attribuer les rangs aux notes de mathématiques. La mise en ordre des notes de la plus élevée à la plus basse donne
La note la plus élevée est A, on peut donc attribuer à A le rang le plus bas ou le plus haut. On devrait arriver à la même valeur du coefficient de corrélation des rangs de Spearman dans les deux cas, tant que l’on classe les notes en mathématiques et en physique de la même manière. On utilise ici le rang 1 pour A.
Comme on trouve B en deuxième et troisième position dans la liste ordonnée des notes, on sait que chacun des B doit avoir un rang égal à la moyenne de 2 et 3, soit le rang
Comme les rangs 2 et 3 sont maintenant pris, le rang suivant est 4, et comme il y a des D en quatrième, cinquième et sixième position dans la liste, on peut attribuer à chacun un rang équivalent à la moyenne de leurs positions, soit le rang
On attribue maintenant les rangs aux notes de physique. La mise en ordre des notes de la plus élevée à la plus basse donne
Ici, le A obtient le rang 1 et le B obtient le rang 2. Puisqu’il y a 3 des C en troisième, quatrième et cinquième position dans la liste ordonnée des notes, on sait que chacun des C doit avoir le rang c’est-à-dire le rang égal à la moyenne de 3, 4 et 5. La note F est la dernière de la liste, on peut donc lui attribuer le rang 6.
Les notes et leurs rangs sont indiqués ci-dessous, ainsi que les différences des rangs et les carrés des différences. Les rangs des élèves en mathématiques sont représentés par , et les rangs des notes en physique sont représentés par .
Mathématiques | D | B | A | B | D | D |
---|---|---|---|---|---|---|
5 | 2,5 | 1 | 2,5 | 5 | 5 | |
Physique | C | C | B | A | C | F |
4 | 4 | 2 | 1 | 4 | 6 | |
1 | 1,5 | 1 | ||||
1 | 2,25 | 1 | 2,25 | 1 | 1 |
Pour déterminer le coefficient de corrélation des rangs de Spearman, on doit substituer les valeurs de et dans la formule . Ici, on sait que la valeur de est 6, car il y a 6 couples de données, et la valeur de est
Donc, la valeur du coefficient de corrélation des rangs de Spearman est
Arrondie au millième près, la valeur du coefficient est 0,757. Elle est proche de 1, on peut donc dire que les rangs sont fortement corrélés. On peut donc conclure que les élèves ayant de bonnes notes en mathématiques ont aussi tendance à avoir de bonnes notes en physique et inversement.
Étudions maintenant un autre exemple impliquant des données qualitatives avec des rangs liés.
Exemple 6: Calculer le coefficient de corrélation des rangs de Spearman pour des données qualitatives
En utilisant les informations données dans le tableau, déterminez le coefficient de corrélation des rangs de Spearman entre les variables et . Donnez votre réponse à quatre décimales près.
Bien | Excellent | Bien | Excellent | Excellent | Excellent | |
Médiocre | Bien | Médiocre | Excellent | Très bon | Bien |
Réponse
Pour déterminer le coefficient de corrélation des rangs de Spearman entre les variables, on utilise la formule , où représente le coefficient de corrélation des rangs de Spearman, est le nombre de couples de données, et est le carré de la différence des rangs des deux variables pour chaque couple de données.
On voit que les évaluations constituent une série de données bivariées qualitatives qui peuvent être ordonnées. On commence par attribuer un rang à chacune des données, en commençant par les valeurs de . Ordonner les évaluations de la meilleure à la plus mauvaise donne
Comme « Excellent » occupe les positions 1, 2, 3 et 4, on lui attribue le rang équivalent à la moyenne de ses positions, soit le rang
De plus, comme « Bien » est en cinquième et sixième position, on peut lui attribuer le rang
On attribue maintenant les rangs aux valeurs de . Ordonner les valeurs de la meilleure à la plus mauvaise donne
Ici, « Excellent » obtient le rang 1 et « Très bien » obtient le rang 2. Comme « Bien » est en troisième et quatrième position dans la liste ordonnée, on sait que chacun obtient le rang
De plus, comme « Médiocre » se situe en cinquième et sixième position, on peut lui attribuer le rang
Les évaluations et leurs rangs sont indiqués ci-dessous, avec les différences des rangs et les carrés des différences. Les rangs des évaluations de la variable sont représentés par , et les rangs des évaluations de la variable sont représentés par .
Bien | Excellent | Bien | Excellent | Excellent | Excellent | |
5,5 | 2,5 | 5,5 | 2,5 | 2,5 | 2,5 | |
Médiocre | Bien | Médiocre | Excellent | Très bien | Bien | |
5,5 | 3,5 | 5,5 | 1 | 2 | 3,5 | |
0 | 0 | 1,5 | 0,5 | |||
0 | 1 | 0 | 2,25 | 0,25 | 1 |
On doit maintenant substituer les valeurs de et dans la formule pour déterminer le coefficient de corrélation des rangs de Spearman. Puisqu’il y a paires de données, on définit . En outre, comme est la somme des carrés des différences dans le tableau,
Donc, la valeur du coefficient de corrélation des rangs de Spearman est
Arrondie à quatre décimales près, la valeur du coefficient est 0,8 714. Elle est assez proche de 1, on peut donc dire que les rangs sont fortement corrélés. On peut donc conclure que de meilleures évaluations de la variable ont tendance à être associées à de meilleures évaluations de la variable et inversement.
L’exemple qui suit implique également des données qualitatives avec des rangs liés. Nous allons à nouveau calculer le coefficient de corrélation des rangs de Spearman pour déterminer le niveau de corrélation entre les variables.
Exemple 7: Calculer le coefficient de corrélation des rangs de Spearman pour des données qualitatives
Le tableau suivant représente la relation entre les résultats des évaluations des salariés cette an et l’ an dernière.
Année dernière | Atteint les objectifs | À améliorer | Exceptionnel | Atteint les objectifs | Dépasse les objectifs |
---|---|---|---|---|---|
Cette année | Dépasse les objectifs | Atteint les objectifs | Exceptionnel | À améliorer | Dépasse les objectifs |
Déterminez le coefficient de corrélation des rangs de Spearman entre les résultats de l’ an dernière et de cette an.
Réponse
On rappelle que la formule du coefficient de corrélation des rangs de Spearman est , où représente le coefficient, est le nombre de couples de données, et est le carré de la différence des rangs des deux variables pour chaque couple de données.
On voit que les résultats constituent une série de données bivariées qualitatives qui peuvent être ordonnées. On peut attribuer un rang à chacune des valeurs des données, en commençant par les résultats de l’année dernière. Ordonner les résultats du moins bon au meilleur donne
On peut attribuer à « À améliorer » le rang 1. Comme « Atteint les objectifs » se situe en deuxième et troisième position dans la liste ordonnée, on sait que chaque instance se voit attribuer un rang équivalent à la moyenne de leurs positions, soit le rang « Dépasse les objectifs » obtient alors le rang 4 et « Exceptionnel » le rang 5.
On attribue maintenant les rangs aux résultats de cette année. Ordonner les résultats du moins bon au meilleur donne
On peut attribuer à « À améliorer » le rang 1 et « Atteint les objectifs » le rang 2. Comme « Dépasse les objectifs » se situe en troisième et quatrième position dans la liste ordonnée, on peut leur attribuer un rang équivalent à la moyenne de leurs positions, soit le rang « Exceptionnel » obtient alors le rang 5. Les résultats et leurs rangs sont indiqués ci-dessous, avec les différences des rangs et les carrés des différences. Les rangs des évaluations de l’année dernière sont représentés par , et les rangs des évaluations de cette année sont représentés par .
Année dernière | Atteint les objectifs | À améliorer | Exceptionnel | Atteint les objectifs | Dépasse les objectifs |
---|---|---|---|---|---|
2,5 | 1 | 5 | 2,5 | 5 | |
Cette année | Dépasse les objectifs | Atteint les objectifs | Exceptionnel | À améliorer | Dépasse les objectifs |
3,5 | 2 | 5 | 1 | 3,5 | |
0 | 1,5 | 0,5 | |||
1 | 1 | 0 | 2,25 | 0,25 |
Ensuite, on substitue les valeurs de et dans la formule pour déterminer le coefficient de corrélation des rangs de Spearman. Ici, on sait que la valeur de est 5, car il y a 5 couples de données, et la valeur de est la somme des valeurs dans la dernière ligne du tableau, soit
Donc, la valeur du coefficient de corrélation des rangs de Spearman est
Un coefficient de Spearman de 0,775 est proche de 1, on peut donc dire que les rangs sont assez fortement corrélés. On peut donc conclure que les employés avec de bonnes évaluations l’ an dernière ont tendance à avoir de bonnes évaluations cette an et inversement.
Terminons maintenant par récapituler quelques points clés.
Points clés
- Les données bivariées sont des données sur chacune de deux variables, chaque valeur d’une des variables étant associée à une valeur de l’autre variable.
- Le coefficient de corrélation des rangs de Spearman est une mesure de la relation entre des données bivariées. Un coefficient de corrélation des rangs de Spearman positif indique une corrélation positive, et un coefficient négatif indique une corrélation négative.
- La formule du coefficient de corrélation des rangs de Spearman est , où est le coefficient, est le nombre de points des données, et est le carré de la différence des rangs des deux coordonnées pour chaque point .
- Les rangs de deux ou plusieurs valeurs identiques d’une variable sont égaux à la moyenne de leurs positions dans une liste ordonnée. On dit que les valeurs des données ont des rangs liés.
- Lors du calcul du coefficient de corrélation des rangs de Spearman, la somme des différences est toujours égale à 0.