Le portail a été désactivé. Veuillez contacter l'administrateur de votre portail.

Vidéo de question : Calculer un coefficient de corrélation à partir de statistiques sommaires Mathématiques

Une série statistique peut être représentée comme suit : 𝑛 = 8, ∑𝑥 = 78, ∑𝑦 = −73, ∑𝑥𝑦 = −752, ∑𝑥² = 792 et ∑𝑦² = 735. Calculez le coefficient de corrélation de Pearson pour cette série statistique, en donnant ta réponse au millième près.

03:34

Transcription de vidéo

Une série statistique peut être représentée comme suit : 𝑛 égal à huit, la somme des valeurs 𝑥 dans la suite statistique est égale à 78, la somme des valeurs 𝑦 est égale à moins 73, la somme du produit de la valeur 𝑥 et les valeurs 𝑦 est égale à moins 752, la somme des valeurs 𝑥 au carré est égale à 792 et la somme des valeurs 𝑦 au carré est égale à 735. Calculez le coefficient de corrélation de Pearson pour cette série statistique, en donnant ta réponse au millième près.

Bon, donc dans cet exemple, nous avons une série statistique avec huit points de données. C’est cela ce que 𝑛 est égal à huit signifie. Chacun de ces points a une valeur 𝑥 ainsi qu’une valeur 𝑦. Nous parlons donc d’une série statistique bivariée. Si nous additionnons les huit valeurs 𝑥 - c’est ce que cette lettre grecque ∑ indique, une somme - alors nous obtenons un total de 78. De même, nous pouvons additionner toutes les valeurs de 𝑦 et obtenir cette réponse, et ainsi de suite pour les sommes restantes. Il s’avère que toutes ces informations nous seront utiles pour calculer ce coefficient de corrélation de Pearson.

Un autre nom pour cela est le coefficient de corrélation produit-moment de Pearson. Ce coefficient est un nombre qui indique à quel point une variable de la série statistique est en corrélation avec l’autre. Le coefficient de corrélation en général peut être aussi bas que moins un et aussi grand que plus un. Ces valeurs du coefficient représentent respectivement une corrélation inverse parfaite ou une corrélation directe parfaite. Alors un coefficient de Pearson égal à zéro indique que les variables ne sont pas du tout corrélées.

Il est possible de calculer mathématiquement ce coefficient de corrélation, parfois appelé 𝑟 ou 𝑟 indice 𝑥𝑦. Il est donné par cette expression. Dans notre numérateur, nous avons la somme du produit des valeurs 𝑥 et 𝑦 de notre série statistique. Et de ce terme, nous soustrayons le nombre de points de la série statistique multiplié par la moyenne des valeurs 𝑥 et la moyenne des valeurs 𝑦. Ensuite, au dénominateur, nous avons la racine carrée de la somme des valeurs 𝑥 de notre série statistique au carré moins le nombre de points de la série statistique multiplié par la moyenne des valeurs 𝑥 au carré le tout multiplié par la racine carrée de la même chose pour les valeurs 𝑦.

En regardant cette équation globalement, on remarque qu’on peut échanger 𝑥 avec 𝑦 et 𝑦 avec 𝑥 et 𝑟 𝑥𝑦 restera inchangé. Autrement dit, étant donnée une série statistique bivariée — avec deux variables — si nous appelons une variable 𝑥 et l’autre 𝑦 ou 𝑦 ensuite 𝑥, cela ne fait aucune différence en ce qui concerne le coefficient de corrélation de Pearson. Quoi qu’il en soit, nous avons suffisamment d’informations pour calculer 𝑟 𝑥𝑦 pour cette série statistique donnée.

Avant de remplacer par ces valeurs, notons que la moyenne des valeurs 𝑥 d’une série statistique est égale à la somme de toutes les valeurs 𝑥 divisées par 𝑛, le nombre de points de données. Et de même, la moyenne des valeurs 𝑦 de la série statistique est donnée par cette expression. Nous pouvons alors écrire notre le coefficient de corrélation produit-moment de Pearson ou notre coefficient de Pearson de cette manière. Puis, nous remplaçons par les informations données.

Nous avons la somme du produit de 𝑥 et 𝑦, le nombre de points de données, la moyenne des valeurs de 𝑥, la moyenne des valeurs de 𝑦, ainsi que la somme des valeurs 𝑥 au carré et la somme des valeurs 𝑦 au carré. Lorsque nous entrons toute cette expression dans notre calculatrice, nous obtenons un résultat donné au millième près qui est moins 0,864. Nous voyons alors que ces points de données sont inversement corrélés et que cette corrélation n’est pas loin de la valeur extrême de la corrélation inverse parfaite. Le moins 0,864 est alors le coefficient de corrélation de Pearson de cette série statistique.

Nagwa utilise des cookies pour vous garantir la meilleure expérience sur notre site. En savoir plus sur notre Politique de Confidentialité.