نسخة الفيديو النصية
أوجد معامل ارتباط الرتب لسبيرمان بين المبيعات والإعلانات من البيانات المعطاة.
نرى أن لدينا جدولًا، يتكون من أربعة أزواج من البيانات عن الإعلانات والمبيعات، يفترض أنه يتضمن مقدار المال الذي أنفق على الإعلانات، ثم مقدار المال المتربح من على المبيعات، أو ربما عدد الوحدات المبيعة. مطلوب منا إيجاد معامل ارتباط الرتب لسبيرمان بين هذين المتغيرين لهذه المجموعة من البيانات.
إن معامل ارتباط سبيرمان أو معامل ارتباط الرتب لسبيرمان كما يطلق عليه أيضًا هو طريقة لحساب درجة ارتباط الرتبة بين متغيرين. وهو يقيس نزعة أي من المتغيرين إلى الزيادة عندما يزيد المتغير الآخر، وإن لم يكن ذلك بطريقة خطية بالضرورة. على سبيل المثال، في مجموعة البيانات التخيلية هذه، نلاحظ أنه كلما حدثت زيادة في ﺱ، تحدث زيادة في ﺹ على الرغم من أن العلاقة بين المتغيرين ليست خطًّا مستقيمًا. وهذا يتفق مع قيمة معامل ارتباط الرتب لسبيرمان، والتي عادة ما نرمز إليها بالرمز ﺭ الذي يساوي واحدًا. وتلك هي القيمة العظمى التي يمكن أن تكون عليها.
في الواقع، قيمة معامل الارتباط هذا تتراوح ما بين سالب واحد وموجب واحد وتتضمن العددين؛ وتعني قيمة موجب واحد وجود ارتباط موجب تام للرتب بين أزواج البيانات وتعني قيمة سالب واحد عكس ذلك. أي إنه يوجد ارتباط سالب تام للرتب بين أزواج البيانات. وهو ما يعني أن أكبر قيمة في ﺱ تقرن بأصغر قيمة في ﺹ. وثاني أكبر قيمة في ﺱ تقرن مع ثاني أصغر قيمة في ﺹ، وهكذا.
معامل ارتباط الرتب الذي وضعه سبيرمان لا يستخدم البيانات الأولية الأصلية نفسها. بل يستخدم رتبها بدلًا من ذلك، وسننظر في كيفية تعيينها بعد قليل. لدينا صيغة لحسابها. وهي واحد ناقص ستة في مجموع فرق الرتب تربيع مقسومًا على ﻥ في ﻥ تربيع ناقص واحد. ووفرق الرتب يعني الفرق بين رتبتي كل زوج من البيانات. أي أزواج بيانات ﺱ، ﺹ. وﻥ هو عدد أزواج البيانات. إذن، في هذه الحالة، ﻥ يساوي أربعة. لذا، قبل أن نتمكن من حساب معامل الارتباط، علينا أولًا تحديد رتبة كل متغير من المتغيرات. لذا، نضيف صفين جديدين إلى الجدول؛ بحيث يمثلان رتبة الإعلانات ورتبة المبيعات. لا يهم ما إذا كنا سنختار تعيين الرتبة الأولى لأصغر أو أكبر قيمة من البيانات ما دمنا سنفعل الأمر نفسه باتساق مع المتغيرين. لنختر إذن تعيين الرتبة الأولى إلى أصغر قيمة من البيانات.
وبالنظر إلى صف البيانات الخاص بالإعلانات، يمكننا ملاحظة أن أصغر قيمة من البيانات هي هذه القيمة التي تساوي ٨٠٠. إذن، ستحصل على الرتبة الأولى. ونلاحظ بعد ذلك أن لدينا قيمتين متماثلتين. توجد قيمتان تساويان ١٠٠٠. ستحتل هاتان القيمتان الرتبة الثانية والثالثة في القائمة المرتبة لبيانات الإعلانات. وقمنا بتعيين متوسط هاتين الرتبتين لكل منهما. وهو متوسط اثنين وثلاثة، أي ٢٫٥. وبما أن هاتين القيمتين من البيانات متساويتان، فإنهما تحصلان على الرتبة نفسها. وأخيرًا، القيمة الأكبر من البيانات في الإعلانات هي ١٥٠٠. وستكون هذه هي القيمة الرابعة في القائمة المرتبة. لذا، تحصل على المرتبة الرابعة.
نطبق بعد ذلك الرتب على بيانات المبيعات بالطريقة نفسها. وبالطبع، نرى أن أصغر قيمتين متطابقتان. فكلتاهما تساويان ٤٥٠٠. ستكون هاتان القيمتان الأولى والثانية في القائمة المرتبة لبيانات المبيعات. لذا، تحصلان على متوسط رتبة يساوي ١٫٥. وهو متوسط واحد واثنين. بعد ذلك، سنعين الرتبة الثالثة لأصغر قيمة تالية من البيانات - وهي ٥٠٠٠ - وأخيرًا نعين الرتبة الرابعة لأكبر قيمة من البيانات - وهي ٦٥٠٠. بتعيين الرتب على قيم البيانات المحددة بهذه الطريقة، نضمن أن مجموع الرتب الممنوحة لكل متغير سيظل كما هو. في هذه الحالة، المجموع يساوي ١٠.
بعد ذلك، علينا حساب الفرق بين الرتب الممنوحة لكل زوج من البيانات. لا يهم الترتيب الذي نستخدمه لطرح الرتب، ولكن علينا أن نتبع الترتيب نفسه مع كل زوج. لذا، سنأخذ رتبة بيانات الإعلانات ونطرح منها رتبة بيانات المبيعات. وهذا سيعطينا قيم فرق الرتب. تذكر أن فرق الرتب هو الفرق بين الرتب الممنوحة لأزواج البيانات. إذن، لدينا أولًا ٢٫٥ ناقص ثلاثة، ما يعطينا سالب ٠٫٥، ثم واحد ناقص ١٫٥، وهو ما يعطينا أيضًا سالب ٠٫٥، و٢٫٥ ناقص ١٫٥، ما يساوي واحدًا، وأربعة ناقص أربعة، ما يساوي صفرًا.
في هذه المرحلة، يمكننا التحقق من الناتج. يجب دائمًا أن يساوي مجموع الفروق بين الرتب صفرًا. يمكننا ملاحظة أن لدينا بعض القيم الموجبة وبعض القيم السالبة. وإذا جمعنا القيم، فسنحصل على سالب ٠٫٥ زائد سالب ٠٫٥، ما يساوي سالب واحد زائد واحد، ما يساوي صفرًا. ثم بإضافة صفر، يصبح لدينا صفر. لذا، فمجموع هذا الصف في الجدول يساوي صفرًا، ما يعطينا مزيدًا من الثقة في صحة ما قمنا به حتى الآن.
وأخيرًا، بالنسبة للجدول، نحتاج إلى صف نحسب فيه مربع كل من هذه الفروق لأنه بالنظر إلى صيغة معامل ارتباط الرتب لسبيرمان، يمكننا أن نلاحظ أنها تستخدم مجموع فرق الرتب تربيع، وليس مجموع فرق الرتب فقط. وهذا مهم لأنه، كما رأينا، مجموع فرق الرتب سيساوي صفرًا دائمًا. إذن، بملء هذا الصف من الجدول، يصبح لدينا سالب ٠٫٥ تربيع لكل من القيمتين الأولى والثانية، ما يساوي ٠٫٢٥، وواحدًا تربيع، ما يساوي واحدًا، وصفرًا تربيع، ما يساوي صفرًا. لهذا السبب، لا يهم الترتيب الذي نتبعه لطرح الرتب لأننا سنقوم بتربيع الفروق على أي حال. وسواء قمنا بتربيع سالب ٠٫٥ أو ٠٫٥، فسنحصل على الناتج نفسه وهو٠٫٢٥.
بعد ذلك، علينا إيجاد مجموع الفروق المربعة هذه. إذن، لدينا ٠٫٢٥ زائد ٠٫٢٥ زائد واحد زائد صفر، ما يساوي ١٫٥. أصبحنا مستعدين للتعويض بهذه القيمة في صيغة حساب معامل ارتباط الرتب لسبيرمان. إذن، بالتعويض بمجموع فرق الرتب تربيع الذي يساوي ١٫٥ وﻥ الذي يساوي أربعة، يصبح لدينا ﺭ يساوي واحدًا ناقص ستة مضروبًا في ١٫٥ على أربعة في أربعة تربيع ناقص واحد. والآن، لاحظ في هذه المرحلة أن الواحد لا يدخل في بسط الكسر. إنه واحد ناقص ثم الكسر. من الأخطاء الشائعة الاعتقاد بأن خط هذا الكسر يمتد حتى النهاية وأن الواحد جزء من البسط. إنه ليس كذلك. إذن، بكتابة الواحد بحجم أكبر قليلًا، تجنبنا الوقوع في هذا الخطأ.
إذن، ستة في ١٫٥ يساوي تسعة. وفي المقام، أربعة تربيع يساوي ١٦ ناقص واحد يساوي ١٥. إذن، لدينا واحد ناقص تسعة على أربعة مضروبًا في ١٥. يمكننا حذف العامل ثلاثة من بسط الكسر ومقامه، لنحصل على واحد ناقص ثلاثة على أربعة في خمسة، أو واحد ناقص ثلاثة على ٢٠. وهذا يعطينا ١٧ على ٢٠. وإذا حولنا الكسر لعدد عشري، فسنجد أن قيمة معامل ارتباط الرتب لسبيرمان بين المبيعات والإعلانات تساوي ٠٫٨٥. ونفهم من ذلك أنه يوجد ارتباط قوي وموجب للرتب ما بين الإعلانات والمبيعات في مجموعة البيانات هذه. فمع زيادة قيمة الإعلانات، تزداد أيضًا قيمة المبيعات بوجه عام، ولكن ليس بطريقة خطية بالضرورة. يمكننا التأكد من ذلك عن طريق رسم شكل انتشار للمتغيرين.