في هذا الشارح، سوف نتعلَّم كيف نحسب ونستخدم معامل ارتباط بيرسون، ، لوصف قوة علاقة خطية واتجاهها.
لعلَّك تتذكَّر ما تعرفه عن الارتباط عندما تكون هناك علاقة إحصائية بين مجموعتين من البيانات. بالنسبة إلى الارتباط الخطي، يمكننا تحديد مدى قوة ارتباط مجموعتين من البيانات بعضهما ببعض من خلال مدى دقة تتبُّعها لخط أفضل مطابقة، كما هو موضَّح في الآتي.
ارتباط قوي: جميع النقاط قريبة من خط أفضل مطابقة.
ارتباط ضعيف: تتبع جميع النقاط خط أفضل مطابقة، لكن بعضها يكون أبعد عن الخط من النقاط الأخرى.
لا يوجد ارتباط: لا يوجد خط أفضل مطابقة واضح، وتكون النقاط منتشرة.
ومع ذلك، لا يتضح دائمًا من هذه الطريقة القوة الفعلية للارتباط؛ لذا، نحتاج إلى استخدام طريقة أخرى لإيجاد قوة الارتباط.
بالنسبة إلى الارتباط الخطي، يمكننا استخدام معامل ارتباط بيرسون (المعروف أيضًا بمعامل ارتباط عزم حاصل الضرب) لتحديد قوة الارتباط الخطي بين مجموعتين من البيانات. المعامل، الذي يُشار إليه بالرمز ، يمكن أن يأخذ القيم الموجودة في الفترة ، ويمكن أن يوضِّح لنا مدى قوة ارتباط متغيِّرَيْن بناءً على القيمة التي يأخذها .
كيفية تحديد قوة الارتباط الخطي باستخدام معامل ارتباط بيرسون
لتحديد قوة الارتباط الخطي بين مجموعتين من البيانات، يمكننا استخدام معامل ارتباط بيرسون، . وبشكل أكثر تحديدًا:
- إذا كان هناك ارتباط (طردي) موجب قوي بين متغيِّرَيْن، فإن يكون قريبًا من ١.
- وإذا كان هناك ارتباط (طردي) موجب ضعيف بين متغيِّرَيْن، فإن يكون موجبًا، لكن أقرب إلى ٠ من ١.
- وإذا كان هناك ارتباط (عكسي) سالب قوي بين متغيِّرَيْن، فإن يكون قريبًا من .
- وإذا كان هناك ارتباط (عكسي) سالب ضعيف، فإن يكون سالبًا، ولكن أقرب إلى ٠ من .
- وإذا لم يكن هناك ارتباط، فإن يكون قريبًا من ٠.
يمكننا ملاحظة ذلك أيضًا على خط الأعداد الموضَّح في الآتي.
يمكننا مقارنة معامل الارتباط بأشكال الانتشار لتساعدنا في تصوُّر الارتباطات المختلفة، كما هو موضَّح في الأشكال الآتية.
في المثال الآتي، نوضِّح كيفية استخدام تعريف معامل ارتباط بيرسون لتحديد قوة الارتباط واتجاهه.
مثال ١: تحديد نوع الارتباط بين متغيِّرَيْن باستخدام قيمة معامل الارتباط
أيٌّ ممَّا يلي يُمثِّل التفسير الأنسب لمعامل ارتباط بيرسون مقداره ٠٫٨؟
- ارتباط خطي موجب قوي
- لا يوجد ارتباط
- ارتباط خطي موجب متوسِّط
- ارتباط خطي سالب قوي
- ارتباط خطي سالب متوسِّط
الحل
بما أن معامل ارتباط بيرسون يوضِّح لنا قوة الارتباط الخطي بين متغيِّرَيْن، إذن يمكننا استخدام خط الأعداد الموضَّح بالأسفل ليساعدنا في تحديد تفسير معامل مقداره ٠٫٨.
بما أن ٠٫٨ عدد موجب، إذن نعرف من ذلك أن مجموعتَي البيانات ترتبطان ارتباطًا موجبًا. وبما أن ٠٫٨ يقترب نسبيًّا من ١، إذن بذلك نعرف أن هناك ارتباطًا قويًّا. ومن ثَمَّ، يوجد ارتباط خطي موجب قوي.
يمكننا أيضًا استخدام تعريف معامل ارتباط بيرسون ليساعدنا في مطابقة وصف الارتباط بين مجموعتَي بيانات بمعامل الارتباط الأنسب.
مثال ٢: تحديد معامل الارتباط الأنسب بمعلومية وصف الارتباط
أيٌّ من معاملات الارتباط التالية يوضِّح أضعف معامل ارتباط عكسي؟
الحل
نحن نعلم أنَّ لأيِّ ارتباط عكسي معاملَ ارتباط بيرسون سالبًا، وهو الحال في جميع الخيارات الموضَّحة في المثال. كما نعلم أنه كلما كان الارتباط أضعف، كانت قيمته أقرب إلى الصفر. يمكن أن يساعدنا استخدام خط الأعداد في تحديد القيمة الأنسب.
ومن ثَمَّ، بما أن القيمة هي الأقرب إلى الصفر، إذن فهي تُشير إلى أضعف معامل ارتباط عكسي.
في المثال التالي، نستخدم تعريف معامل ارتباط بيرسون لمطابقة معامل الارتباط الأنسب بشكل انتشار مجموعة من البيانات.
مثال ٣: تحديد معامل الارتباط الأنسب بناءً على شكل الانتشار
ما القيمة الأكثر ترجيحًا لمعامل بيرسون لارتباط عزم حاصل الضرب بالنسبة إلى البيانات الموضَّحة في الشكل؟
- ٠
- ٠٫٧٨
- ٠٫٣٧
الحل
يوضِّح لنا معامل بيرسون لارتباط عزم حاصل الضرب مدى دقة مطابقة مجموعة نقاط لخط أفضل مطابقة. ومن ثَمَّ، من خلال إضافة خط أفضل مطابقة، يمكننا تحديد قوة الارتباط واتجاهه بسهولة.
بذلك، نكون قد أضفنا خط أفضل مطابقة تقريبيًّا إلى البيانات. بما أن خط أفضل مطابقة ميله سالب، إذن نعرف من ذلك أن له ارتباطًا عكسيًّا؛ ومن ثَمَّ، يقع معامل الارتباط بين و٠. وبما أن بعض نقاط البيانات تقع بالقرب من خط أفضل مطابقة، وبعضها الآخر يقع على مسافة أبعد قليلًا، إذن لا بد أن يكون هناك ارتباط سالب متوسِّط. يمكننا أن نقدِّر ذلك بأنه يوجد في الفترة ؛ ومن ثَمَّ، يمكننا اختيار الإجابة .
لاحظ أنه، في هذا المثال، كان لدينا فقط إجابتان سالبتان للاختيار من بينهما. بما أن معامل الارتباط الذي قيمته يُشير إلى ارتباط عكسي قوي، إذن يمكننا استبعاد هذه الإجابة، ليتبقَّى لدينا .
لقد عرفنا أنه يمكن تقدير قيمة معامل ارتباط بيرسون وعلاقته بخط أفضل مطابقة وتفسيرهما. بعد ذلك، نُحدِّد كيفية حساب معامل ارتباط بيرسون.
تعريف: معامل ارتباط بيرسون
يُحدِّد معامل الارتباط قوة الارتباط بين متغيِّرَيْن ، ، ويمكن حسابه باستخدام الصيغة: حيث عدد أزواج القيم للمتغيِّرَيْن ، .
يُستخدَم معامل ارتباط بيرسون في البيانات المتصلة الثنائية المتغيِّرات لتحديد قوة الارتباط الخطي واتجاهه بين مجموعتين من البيانات.
إذا اطَّلعت على مصادر أخرى متعلِّقة بمعامل ارتباط بيرسون، فستتعرَّف على صورة أخرى من المعادلة، وهي: حيث ، ، معرَّفة كالآتي:
في المثال التالي، نحسب معامل ارتباط عزم حاصل الضرب لبيرسون عندما يكون لدينا ملخَّص الإحصائيات، مثل قيم المجموع لكلٍّ من ، ، ، ، ، بالإضافة إلى قيمة .
مثال ٤: حساب معامل ارتباط عزم حاصل الضرب لبيرسون بمعلومية ملخَّص الإحصائيات
يمكن اختصار مجموعة بيانات كالآتي:
احسب معامل ارتباط بيرسون لمجموعة البيانات هذه، مع إيجاد الإجابة الصحيحة لأقرب ثلاث منازل عشرية.
الحل
الطريقة الأولى:
لكي نحسب معامل ارتباط عزم حاصل الضرب لبيرسون، نستخدم المعادلة: حيث عدد أزواج القيم للمتغيِّرَيْن ، .
بالتعويض بكلٍّ من ، ، ، ، ، ، نحصل على:
وبما أن قيمة تقع في الفترة ، إذن الإجابة مناسبة:
الطريقة الثانية:
بدايةً، علينا حساب ملخَّص الإحصائيات ، ، :
من الأفضل عند حساب ، التأكُّد من أنهما موجبان؛ لأن هذين الملخَّصين من الإحصائيات يجب ألَّا يكونا سالبين. لكن يمكن أن يكون سالبًا، ويُحدِّد إذا ما كانت مجموعات البيانات مرتبطة ارتباطًا موجبًا أو سالبًا.
بعد ذلك، يمكننا حساب معامل الارتباط باستخدام الصيغة:
وبما أن قيمة تقع في الفترة ، إذن الإجابة مناسبة:
في المثال التالي، نحسب معامل الارتباط من مجموعة بيانات متصلة ثنائية المتغيِّرات، ونستخدمه لتحديد قوة الارتباط واتجاهه.
مثال ٥: حساب معامل ارتباط بيرسون من مجموعة بيانات متصلة ثنائية المتغيِّرات، واستخدامه لتحديد قوة الارتباط واتجاهه
يوضِّح الجدول التالي نتائج القفز العالي والقفز الطويل الذي حققته ١٥ متنافِسة في مسابقة السباعي (ألعاب القوى) للسيدات في أولمبياد ريو دي جانيرو ٢٠١٦.
القفز الطويل | ٥٫٥١ | ٥٫٧٢ | ٥٫٨١ | ٥٫٨٨ | ٥٫٩١ | ٦٫٠٥ | ٦٫٠٨ | ٦٫١٠ | ٦٫١٦ | ٦٫١٩ | ٦٫٣١ | ٦٫٣١ | ٦٫٣٤ | ٦٫٤٨ | ٦٫٥٨ |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
القفز العالي | ١٫٦٥ | ١٫٧٧ | ١٫٨٣ | ١٫٧٧ | ١٫٧٧ | ١٫٧٧ | ١٫٨ | ١٫٧٧ | ١٫٨ | ١٫٨٦ | ١٫٨٦ | ١٫٨٣ | ١٫٨٩ | ١٫٨٦ | ١٫٩٨ |
- احسب، لأقرب جزء من ألف، قيمة معامل ارتباط بيرسون بين نتائج القفز الطويل ونتائج القفز العالي.
- ما الذي يُبيِّنه معامل الارتباط عن العلاقة بين نتائج القفز الطويل ونتائج القفز العالي؟
- يُوجَد ارتباط خطي سالب متوسِّط بين نتائج القفز الطويل ونتائج القفز العالي.
- يُوجَد ارتباط خطي موجب قوي بين نتائج القفز الطويل ونتائج القفز العالي.
- يُوجَد ارتباط خطي موجب متوسِّط بين نتائج القفز الطويل ونتائج القفز العالي.
- يُوجَد ارتباط خطي سالب قوي بين نتائج القفز الطويل ونتائج القفز العالي.
- لا يُوجَد ارتباط حقيقي بين نتائج القفز الطويل ونتائج القفز العالي.
الحل
الجزء الأول
لحساب معامل ارتباط بيرسون، نحسب قيمة كلٍّ من ، ، ، ، ، ، ثم نعوِّض في المعادلة: حيث عدد أزواج القيم للمتغيِّرَيْن ، .
قد تفيدنا إضافة صفوف/أعمدة إضافية لحساب قيم ، ، ، ثم حساب مجموع كلٍّ منها.
القفز الطويل، | القفز العالي، | |||
---|---|---|---|---|
٥٫٥١ | ١٫٦٥ | ٣٠٫٣٦٠١ | ٢٫٧٢٢٥ | ٩٫٠٩١٥ |
٥٫٧٢ | ١٫٧٧ | ٣٢٫٧١٨٤ | ٣٫١٣٢٩ | ١٠٫١٢٤٤ |
٥٫٨١ | ١٫٨٣ | ٣٣٫٧٥٦١ | ٣٫٣٤٨٩ | ١٠٫٦٣٢٣ |
٥٫٨٨ | ١٫٧٧ | ٣٤٫٥٧٤٤ | ٣٫١٣٢٩ | ١٠٫٤٠٧٦ |
٥٫٩١ | ١٫٧٧ | ٣٤٫٩٢٨١ | ٣٫١٣٢٩ | ١٠٫٤٦٠٧ |
٦٫٠٥ | ١٫٧٧ | ٣٦٫٦٠٢٥ | ٣٫١٣٢٩ | ١٠٫٧٠٨٥ |
٦٫٠٨ | ١٫٨ | ٣٦٫٩٦٦٤ | ٣٫٢٤ | ١٠٫٩٤٤ |
٦٫١ | ١٫٧٧ | ٣٧٫٢١ | ٣٫١٣٢٩ | ١٠٫٧٩٧ |
٦٫١٦ | ١٫٨ | ٣٧٫٩٤٥٦ | ٣٫٢٤ | ١١٫٠٨٨ |
٦٫١٩ | ١٫٨٦ | ٣٨٫٣١٦١ | ٣٫٤٥٩٦ | ١١٫٥١٣٤ |
٦٫٣١ | ١٫٨٦ | ٣٩٫٨١٦١ | ٣٫٤٥٩٦ | ١١٫٧٣٦٦ |
٦٫٣١ | ١٫٨٣ | ٣٩٫٨١٦١ | ٣٫٣٤٨٩ | ١١٫٥٤٧٣ |
٦٫٣٤ | ١٫٨٩ | ٤٠٫١٩٥٦ | ٣٫٥٧٢١ | ١١٫٩٨٢٦ |
٦٫٤٨ | ١٫٨٦ | ٤١٫٩٩٠٤ | ٣٫٤٥٩٦ | ١٢٫٠٥٢٨ |
٦٫٥٨ | ١٫٩٨ | ٤٣٫٢٩٦٤ | ٣٫٩٢٠٤ | ١٣٫٠٢٨٤ |
باستخدام القيمة ، وهي عدد نقاط البيانات، وكذلك مجموع كلٍّ من ، ، ، ، من الجدول السابق، يمكننا التعويض في المعادلة لحساب قيمة :
بما أن قيمة تقع في الفترة ، إذن الإجابة ٠٫٨٥٩ مناسبة.
الجزء الثاني
بعد أن حسبنا قيمة ، يمكننا بعد ذلك استخدامها لتحديد قوة الارتباط واتجاهه. بما أن موجب، إذن ترتبط مجموعتا البيانات ارتباطًا موجبًا. وبما أن قريب نسبيًّا من ١، إذن ترتبط مجموعتا البيانات ارتباطًا قويًّا. إذن يُوجَد ارتباط خطي موجب قوي بين نتائج القفز الطويل ونتائج القفز العالي.
في المثال الأخير، نحسب معامل الارتباط عندما تكون قيم كلٍّ من ، ، مُعطاة باستخدام الصورة الأخرى لصيغة معامل الارتباط لبيرسون التي تناولناها.
مثال ٦: حساب معامل ارتباط بيرسون بمعلومية غس س، غص ص، غس ص.
تحتوي مجموعة البيانات على ملخَّص إحصائيات ، ، . احسب معامل ارتباط عزم حاصل الضرب لهذه المجموعة من البيانات، مقرِّبًا إجابتك لأقرب ثلاث منازل عشرية.
الحل
تنص صيغة معامل ارتباط بيرسون على أن:
ومن ثَمَّ، بالتعويض بالقيم ، ، ، نحصل على:
وبما أننا نعلم أن يقع في الفترة ، إذن يمكننا استنتاج أن ٠٫٦٢٠ هي القيمة المناسبة:
في هذا الشارح، تعلَّمنا كيف نحسب معامل ارتباط بيرسون وكيف نُفسِّر معناه. هيا نلخِّص الآن النقاط الرئيسية.
النقاط الرئيسية
- يوضِّح لنا معامل ارتباط بيرسون، ، مدى قوة الارتباط الخطي بين متغيِّرَيْن متصلَيْن:
- إذا كان يقع في الفترة ، فإنهما يرتبطان ارتباطًا طرديًّا قويًّا.
- وإذا كان يقع في الفترة ، فإنهما يرتبطان ارتباطًا طرديًّا ضعيفًا.
- وإذا كان يقع في الفترة ، فإنهما يرتبطان ارتباطًا عكسيًّا قويًّا.
- وإذا كان يقع في الفترة ، فإنهما يرتبطان ارتباطًا عكسيًّا ضعيفًا.
- وإذا كان يقع في الفترة ، فلا يُوجَد ارتباط بينهما.
- يمكننا حساب معامل ارتباط بيرسون باستخدام الصيغة: حيث يمثِّل قيم أحد المتغيِّرَيْن، ويمثِّل قيم المتغيِّر الآخر، ويمثِّل عدد نقاط البيانات.
- يمكننا أيضًا استخدام صورة مختلفة لمعامل ارتباط بيرسون باستخدام المعادلة: حيث ، ، قيم ملخَّص الإحصائيات، وتُعرَف على الصورة: ويُمثِّل قيم متغيِّر واحد، كما يُمثِّل قيم المتغيِّر الآخر، ويُمثِّل عدد نقاط البيانات.
- يمكننا استخدام معامل ارتباط بيرسون للبيانات المتصلة الثنائية المتغيِّرات عندما تكون لدينا مجموعة من البيانات أو ملخَّص إحصائيات.