نسخة الفيديو النصية
في دراسة لاستكشاف العلاقة بين عمر الأم وعدد الأبناء، وجدت البيانات الآتية. أوجد معامل ارتباط سبيرمان. قرب الإجابة لأقرب ثلاث منازل عشرية.
حسنًا، لدينا في الجدول صفان من البيانات. يوجد في الصف الأول عمر الأم بالسنوات، ويوجد في الصف الثاني عدد أبنائها. يمثل كل صف متغيرًا مختلفًا في البيانات. وبما أن هناك صفين، يمكننا قول إن هذه مجموعة بيانات ثنائية المتغير. بالنسبة إلى مجموعة البيانات هذه، يمكن أن يساعدنا معامل ارتباط سبيرمان في فهم المجموعة بشكل أفضل. ولا تكون الطريقة التي نستخدمها لفعل ذلك هي التحليل المباشر للبيانات نفسها، بل الرتبة النسبية المناظرة لكل نقطة من نقاط البيانات.
يمكننا ترتيب هذه البيانات بجعل الأعداد ذات القيم الأقل تناظر الرتب الأقل قيمة. ويمكننا أيضًا أن نختار النمط العكسي؛ حيث تمثل فيه الأعداد ذات القيم الأكبر بالرتب الأقل قيمة. سيساعدنا ذلك على نحو مثالي لحساب معامل ارتباط سبيرمان. وأيًّا كانت الطريقة التي نختارها، فمن المهم أن نتبع الطريقة نفسها في كلا صفي البيانات.
ولتبسيط هذه العملية، سنجعل الأعداد ذات القيم الأقل في جدول البيانات تناظر الرتب الأقل قيمة. ولاستكشاف هذه الرتب، سنضيف صفين آخرين إلى الجدول. سنفترض أن رﺃ يمثل رتبة عمر الأم، ورﺏ يمثل رتبة عدد الأبناء. عندما يتعلق الأمر برتبة عمر الأم، نجد أن هذه العملية واضحة إلى حد ما لأن عمر الأم يزيد من اليمين إلى اليسار. إذن، نحدد الرتبة واحد لعمر الأم الذي يساوي ١٩. ونحدد الرتبة اثنين لعمر الأم الذي يساوي ٢٢، وهكذا. وبما أن عمر كل أم في هذا الجدول مختلف، فهذا يعني أنه لا يوجد أي تكرارات. وستزيد رتبة عمر الأم من واحد إلى ثمانية، من اليمين إلى اليسار.
دعونا الآن نرتب عدد الأبناء. يمكننا على الفور ملاحظة أن هذا الترتيب لن يكون سهلًا. فعلى سبيل المثال، لدينا أمان كل واحدة منهما لديها ابن واحد. وبما أن العدد واحدًا هو أقل عدد من الأبناء، فسنعطي عددي الأبناء هنا الرتبة واحد، أو بما أن لدينا أمين لكل منهما ابن واحد، فستكون الرتبتان هنا واحدًا واثنين. لكن استخدام أي من هاتين الطريقتين غير منطقي تمامًا.
الطريقة الأفضل هي إيجاد قيمة متوسط رتبتي هذين العددين المنفصلين للأبناء. هذان العددان لهما الرتبتان الأولى والثانية. ونحن نعلم أن متوسط واحد واثنين يساوي ١٫٥. إذن، سنكتب هذه النتيجة رتبة لكليهما.
سنبحث بعد ذلك عن العدد الأدنى التالي من الأبناء. ونجد مرة أخرى أن هناك تكرارًا. يوجد أمان لدى كل منهما ابنان. وسيكون لهما الرتبتان ثلاثة وأربعة. لكن بما أن لدينا هنا نفس عدد الأبناء، فسنستخدم متوسط رتبتيهما. متوسط ثلاثة وأربعة هو ثلاثة ونصف.
بالانتقال إلى العدد الأدنى التالي من الأبناء، نجد أن هناك أمين لدى كل واحدة منهما ثلاثة أبناء. وبشكل منفصل، سيكون لدينا هنا الرتبتان خمسة وستة. وإذا حسبنا متوسط هذين الرتبتين، فسنحصل على ٥٫٥.
يكون العدد الأدنى التالي من الأبناء في الجدول هو أربعة. ونلاحظ أن هذه هي الحالة الوحيدة التي نجد فيها أربعة أبناء. إذن، ستكون الرتبة هنا سبعة. وأخيرًا، تكون الرتبة في الحالة التي يوجد بها خمسة أبناء هي ثمانية.
إن الأعداد الواردة في هذين الصفين، أي رتبتا عمر الأم وعدد الأبناء، هي التي تقارن باستخدام معامل ارتباط سبيرمان. عمليًّا، يقيس المعامل مدى الارتباط بين هذه الرتب لكلا المتغيرين.
يمكننا أن نحسب مقياسًا يمثل الفرق، وهو ﻑ. إنه يساوي الفرق بين رتبة عمر الأم ورتبة عدد الأبناء. لحساب قيمة ﻑ لنقطة بيانات محددة، نطرح رﺏ من رﺃ. واحد ناقص ٣٫٥ يساوي سالب ٢٫٥. وبعد ذلك، لدينا اثنان ناقص ١٫٥ يساوي ٠٫٥. ثلاثة ناقص ١٫٥ يساوي ١٫٥، وهكذا حتى نهاية الصف.
بالإضافة إلى ذلك، يمكننا ملاحظة أن هناك نقطة بيانات واحدة فقط تتوافق فيها رتبة عمر الأم تمامًا مع رتبة عدد الأبناء. بصفة عامة، كلما زاد حدوث هذا كثيرًا في مجموعة بيانات ما، زاد توافق رتبتي كلا المتغيرين المختلفين لدينا، وأصبحت قيمة معامل ارتباط سبيرمان أقرب إلى موجب واحد.
وفيما يتعلق بهذا المعامل، دعونا نفرغ بعض المساحة في الجزء العلوي من الشاشة ونكتب الصيغة الرياضية لهذا المعامل. يشار إلى المعامل عادة بـ ر، وهو يساوي واحدًا ناقص ستة في المجموع، وهذا ما يعنيه الحرف اليوناني Σ، لقيم الفروق بين رتب المتغيرين تربيع الكل مقسوم على ﻥ، حيث ﻥ هو عدد نقاط البيانات، مضروبًا في ﻥ تربيع ناقص واحد.
إذن، نلاحظ أنه لحساب ر، علينا معرفة مجموع قيم ﻑ تربيع وقيمة ﻥ. ﻥ هو عدد نقاط البيانات. ولدينا في هذه الحالة واحدة واثنتان وثلاث وأربع وخمس وست وسبع وثمان من نقاط البيانات. إذن، ﻥ يساوي ثمانية. ولحساب مجموع قيم ﻑ تربيع، دعونا نضف صفًّا أخيرًا إلى الجدول. في هذا الصف، سنحسب ﻑ تربيع لكل قيمة من قيم ﻑ. على سبيل المثال، عند نقطة البيانات الأولى، لدينا سالب ٢٫٥ تربيع يساوي ٦٫٢٥. وبعد ذلك، ٠٫٥ تربيع يساوي ٠٫٢٥، وهكذا حتى نهاية الصف.
نلاحظ أنه بما أننا قمنا بتربيع قيم ﻑ للحصول على قيم هذا الصف، فكل هذه القيم تكون غير سالبة. ولحساب مجموع قيم ﻑ تربيع، سنجمع كل القيم الموجودة بهذا الصف معًا. عندما نفعل ذلك، نحصل على ١٢٫٥. بمعرفة ذلك، يمكننا كتابة مقدار يعبر عن معامل الارتباط باستخدام مجموع قيم ﻑ تربيع وقيمة ﻥ. وعند حساب قيمة هذا المقدار باستخدام الآلة الحاسبة، نحصل على الناتج ٠٫٨٥١١٩ وهكذا مع توالي الأرقام.
لكننا نتذكر أننا نريد تقريب الناتج لأقرب ثلاث منازل عشرية. إذا نظرنا إلى الرقم الموجود في الخانة العشرية الرابعة، فسنجد أنه واحد، أي أقل من خمسة، ما يعني أننا لن نغير هذا الرقم عند التقريب لأقرب ثلاث منازل عشرية. إذن، معامل ارتباط سبيرمان لأقرب ثلاث منازل عشرية هو ٠٫٨٥١.