نسخة الفيديو النصية
يمكن اختصار مجموعة بيانات كما يأتي: ﻥ يساوي ثمانية، ومجموع قيم ﺱ يساوي ٧٨، ومجموع قيم ﺹ يساوي سالب ٧٣، ومجموع حاصل ضرب قيم ﺱ في قيم ﺹ يساوي سالب ٧٥٢، ومجموع قيم ﺱ تربيع يساوي ٧٩٢، ومجموع قيم ﺹ تربيع يساوي ٧٣٥. احسب معامل ارتباط عزم حاصل الضرب لبيرسون لمجموعة البيانات هذه، مع تقريب إجابتك لأقرب ثلاث منازل عشرية.
في هذا المثال، لدينا مجموعة بيانات تحتوي على ثماني نقاط بيانات. وهذا ما يعنيه أن ﻥ يساوي ثمانية. لكل من هذه النقاط قيمة ﺱ وقيمة ﺹ. إذن، نتحدث عن مجموعة بيانات ثنائية المتغير. إذا جمعنا قيم ﺱ الثمانية كلها، وهذا ما يعنيه الحرف اليوناني ∑، أي المجموع، فسنحصل إجمالًا على ٧٨. وبالمثل، يمكننا جمع كل قيم ﺹ لنحصل على هذا الناتج، وينطبق الأمر نفسه على بقية هذه المجاميع. تتضح فائدة جميع هذه المعطيات عند حساب معامل ارتباط عزم حاصل الضرب لبيرسون.
ويطلق عليه أيضًا اسم معامل ارتباط بيرسون. هذا المعامل هو عدد يوضح فقط مدى ارتباط متغير في مجموعة البيانات بالمتغير الآخر. تكون أقل قيمة لمعامل الارتباط، بوجه عام، سالب واحد، وأعلى قيمة له موجب واحد. تمثل قيمتا المعامل هاتان ارتباطًا عكسيًّا تامًّا أو ارتباطًا طرديًّا تامًّا، على الترتيب. ومن ثم، فإن معامل ارتباط بيرسون الذي يساوي صفرًا يشير إلى عدم وجود ارتباط بين المتغيرين على الإطلاق.
يمكن حساب معامل الارتباط رياضيًّا، ويسمى أحيانًا ر أو رﺱﺹ. ويعطى بهذا التعبير. في البسط، يكون لدينا مجموع حاصل ضرب قيم ﺱ وقيم ﺹ في مجموعة البيانات هذه. ومن هذه القيم، نطرح عدد النقاط في مجموعة البيانات مضروبًا في الوسط الحسابي لقيم ﺱ والوسط الحسابي لقيم ﺹ. ثم في المقام، لدينا الجذر التربيعي لمجموع قيم ﺱ في مجموعة البيانات تربيع ناقص عدد النقاط في مجموعة البيانات مضروبًا في الوسط الحسابي لقيم ﺱ تربيع، الكل مضروبًا في الجذر التربيعي لمجموع قيم ﺹ التي تكرر معها العملية نفسها.
بالنظر إلى هذه المعادلة إجمالًا، لاحظ أنه يمكننا إبدال ﺱ إلى ﺹ، وﺹ إلى ﺱ، ومن ثم يمكننا الحصول على نفس قيمة رﺱﺹ من ذلك. يعني هذا أنه إذا كان لدينا مجموعة بيانات ثنائية المتغير، بيانات تضم متغيرين، فسواء أطلقنا على أحد المتغيرين اسم ﺱ والمتغير الآخر ﺹ أو بدأنا بـ ﺹ ثم ﺱ، فإن ذلك لن يشكل فارقًا فيما يتعلق بمعامل ارتباط بيرسون. على أي حال، لدينا معطيات كافية لحساب رﺱﺹ لمجموعة البيانات هذه.
لكن قبل أن نعوض بهذه القيم، لنشر إلى أن الوسط الحسابي لقيم ﺱ لمجموعة بيانات يساوي مجموع كل قيم ﺱ مقسومًا على ﻥ، وهو عدد نقاط البيانات. وبالمثل، يمكننا إيجاد الوسط الحسابي لقيم ﺹ لمجموعة البيانات من خلال هذا التعبير. ومن ثم يمكننا كتابة معامل ارتباط عزم حاصل الضرب لبيرسون بهذه الطريقة. ثم نعوض بجميع المعطيات المعلومة.
لدينا المجموع لحاصل ضرب ﺱ وﺹ، وعدد نقاط البيانات في المجموعة، والوسط الحسابي لقيم ﺱ، والوسط الحسابي لقيم ﺹ، ومجموع قيم ﺱ تربيع، ومجموع قيم ﺹ تربيع. عندما نكتب هذا التعبير بالكامل على آلتنا الحاسبة، نحصل على ناتج يساوي سالب ٠٫٨٦٤ لأقرب ثلاث منازل عشرية. ومن ثم، يمكننا أن نرى أن نقاط البيانات هذه ترتبط ارتباطًا عكسيًّا، وأن قيمة معامل الارتباط هذا ليست بعيدة عن القيمة القصوى للارتباط العكسي التام. إذن، سالب ٠٫٨٦٤ هو معامل ارتباط حاصل الضرب لبيرسون لمجموعة البيانات هذه.