Le portail a été désactivé. Veuillez contacter l'administrateur de votre portail.

Vidéo de question : Choisir le coefficient de corrélation le plus probable à partir d’un nuage de points Mathématiques

Quelle est la valeur la plus susceptible d'être le coefficient de corrélation de Pearson de la série statistique représentée par le graphique suivant ?

03:36

Transcription de vidéo

Quelle est la valeur la plus susceptible d'être le coefficient de corrélation de Pearson de la série statistique représentée par le graphique suivant ? (A) zéro, (B) moins 0,94, (C) moins 0,58, (D) 0,37, (E) 0,78.

En observant le graphique, nous voyons qu’il représente des données où chaque point de données a une valeur 𝑥 et une valeur 𝑦. Les ensembles de données constitués de deux variables peuvent être décrits quantitativement par ce que l’on appelle un coefficient de corrélation. Un de ces coefficients est le coefficient de corrélation de Pearson. Et le principe est d’utiliser un seul nombre, ce coefficient, pour décrire dans quelle mesure les variables d’un ensemble de données sont corrélées. Le coefficient de corrélation est toujours compris entre moins un et un.

Et dans ces deux cas extrêmes, un ou moins un, cette valeur décrit une corrélation parfaite. Un coefficient de moins un décrit une série de données décroissantes qui suit parfaitement la droite de régression. Autrement dit, tous les points de la série statistique se trouvent sur la même droite. Et un coefficient de corrélation de plus un décrit la même chose, mais pour une série de données suivant une droite de de régression de coefficient directeur positif. Entre ces valeurs, il existe un coefficient de corrélation nul qui suggère qu’il n’y a aucune corrélation entre les deux variables, ainsi que toutes les valeurs possibles entre ces trois valeurs.

Pour les données sur ce graphique, si nous devions tracer une droite de régression, nous pourrions la tracer à la main comme ceci. Il existe visiblement une corrélation inverse, ou négative, entre les valeurs de 𝑥 et les valeurs de 𝑦 car lorsque 𝑥 augmente, 𝑦 diminue. Cela nous indique que le coefficient de corrélation de cet ensemble de données est situé quelque part en dessous de zéro. Si la droite de régression avait un coefficient directeur positif, alors le coefficient de corrélation serait supérieur à zéro. Mais dans ce cas, nous constatons qu’il existe une corrélation négative ou inverse entre 𝑥 et 𝑦.

En regardant alors les cinq réponses, nous pouvons d’ores-et-déjà en éliminer quelques unes sur la base de cette déduction. Tous les coefficients de corrélation positifs doivent être écartés. Cela signifie que (D) et (E) ne peuvent pas être la bonne réponse. Et nous savons également que l’option (A), qui suggère qu’il n’y a pas de corrélation entre les variables 𝑥 et 𝑦 dans cet ensemble de données, n’est pas non plus une réponse valide. Cela nous laisse avec les réponses (B) et (C). Ce sont deux valeurs négatives, et une d’entre elles est plus proche de la valeur extrême moins un que l’autre. Lorsque l’on étudie des coefficients de corrélation de Pearson inférieurs à zéro, la distinction entre eux se résume à la proximité entre les points de données et la droite de régression.

Par exemple, des ensembles de données correspondant à des coefficients de corrélation de moins 0,9 et de moins 0,2 pourraient ressembler à ceci. Les points de l’ensemble de données correspondant à un coefficient de corrélation de moins 0,9 sont beaucoup plus proches de la droite de régression que ceux de l’autre ensemble de données. En observant les données représentées sur notre graphique, nous pouvons voir qu’elles ne sont ni extrêmement éloignées, ni extrêmement proche de la droite de régression. Cela suggère que le coefficient de corrélation n’est ni très proche de moins un, ni très proche de zéro. Pour cette raison, parmi les deux réponses (B) et (C), nous devons choisir celle qui est la plus proche d’un coefficient de corrélation de Pearson de moins 0,5. Et il s’agit de la réponse (C).

Nous pouvons donc conclure que parmi les valeurs proposées, moins 0,58 est la valeur la plus probable du coefficient de corrélation de Pearson de cet ensemble de données.

Nagwa utilise des cookies pour vous garantir la meilleure expérience sur notre site. En savoir plus sur notre Politique de Confidentialité.