نسخة الفيديو النصية
في هذا الدرس سوف نتعلم كيف نتعامل مع الارتباط الخطي ونفرق بين الأنواع المختلفة من الارتباط. دعونا نفكر فيما يحدث عندما نرسم أشكال الانتشار. يمكن استخدام أشكال الانتشار لتمثيل البيانات ذات المتغيرين، حيث تقترن مجموعة بيانات بمجموعة أخرى من البيانات. على سبيل المثال، يمكننا تمثيل العلاقة بين المعدل اليومي لهطول الأمطار في مدينة نيويورك ومبيعات الدجاج المقلي بالكيلو. بالنظر إلى شكل الانتشار، يبدو أنه يوجد اتجاه للنقاط. هذا الاتجاه يوضح أنه كلما ازداد المعدل اليومي لهطول الأمطار، تزداد مبيعات الدجاج المقلي. في هذه الحالة، يمكننا استنتاج أنه يوجد ارتباط بين مجموعتي البيانات هاتين، وهو ما يعني وجود علاقة بينهما.
يجدر بنا أن ندرك أن وجود ارتباط بين مجموعتي البيانات لا يعني بالضرورة وجود علاقة سببية بينهما. بعبارة أخرى، ليس من الضروري أن نفترض أن المعدل اليومي لهطول الأمطار يؤدي إلى ارتفاع مبيعات الدجاج المقلي.
بوضع ذلك في الاعتبار، دعونا نضع تعريفًا كاملًا لكلمة الارتباط. نقول إن مجموعتين من البيانات مرتبطتان عندما تظهر علاقة بينهما. يمكننا استخدام أشكال الانتشار لتحديد ما إن كان يوجد ارتباط أم لا. على وجه التحديد، إذا مثلنا الأزواج المرتبة لهذه النقاط بيانيًّا على شكل انتشار ووجدنا أنها تقع على خط مستقيم، فهذا يعني أن مجموعتي البيانات ترتبطان خطيًّا. وبالمثل، إذا كانت تتبع اتجاهًا غير خطي، على سبيل المثال منحنى أو اتجاهًا لوغاريتميًّا، فهذا يعني أن مجموعتي البيانات لا ترتبطان خطيًّا. وبالطبع، في حالة عدم وجود اتجاه معين على الإطلاق، فإن هذا يعني عدم وجود ارتباط بين مجموعتي البيانات.
دعونا نتناول الارتباط الخطي الذي تحدثنا عنه. شكل الانتشار الذي يوضح متغيرين يرتبطان خطيًّا قد يبدو بهذا الشكل. وبالمثل، قد يبدو بهذا الشكل قليلًا. في كلتا الحالتين، تبدو النقاط تقريبًا وكأنها تقع على خط مستقيم. في المثال الثاني، قد تبدو النقاط على هذا النحو قليلًا. في هذه الحالة، يكون خط الانحدار عبارة عن منحنى. وأخيرًا، في حالة عدم وجود ارتباط، فقد يبدو شكل الانتشار على هذا النحو. في كل من هذه الحالات، رأينا ما إذا كان يمكننا رسم خط انحدار لهذه النقاط أم لا. ومن ثم يخبرنا خط الانحدار عن نوع الارتباط، إن وجد.
إذن، بوضع هذا في الاعتبار، دعونا ننظر إلى كيفية الربط بين خط الانحدار ومجموعتي البيانات على شكل الانتشار. سيساعدنا هذا على تحديد ما إذا كانت مجموعتا البيانات مرتبطتين خطيًّا أم لا.
هل يمكننا استخدام خط الانحدار لوصف اتجاه انتشار البيانات؟ لماذا؟
لدينا شكل انتشار مرسوم عليه خط انحدار. دعونا نفترض أن هذا الخط لم يرسم على الشكل. كيف كنا سنرسم خط الانحدار؟ كيف كنا سنوجد الخط الذي يصف اتجاه انتشار البيانات الممثلة بالنقاط الزرقاء على نحو أكثر دقة. حسنًا، قد يبدو بهذا الشكل. أجل، كلما ازدادت قيم ﺱ، فإن قيم ﺹ تزداد أيضًا. لكننا نلاحظ أنه ليس من الضروري أن يمثل هذا بخط مستقيم. هذا يعني أنه من الواضح أن ﺱ وﺹ مرتبطان. لكنهما لا يرتبطان خطيًّا. فخط الانحدار ليس خطًّا مستقيمًا.
ومن ثم، ليس من المنطقي أن يكون هذا الخط هو خط انحدار يصف اتجاه انتشار البيانات. فنحن بالطبع لن نستخدم خط الانحدار هذا للتنبؤ أو التخمين بناء على البيانات المعطاة، والسبب في ذلك هو أن البيانات غير مترابطة خطيًّا. فهي لا تتبع خطًّا مستقيمًا.
على الرغم من أن هذا الخط ليس خط انحدار منطقي لوصف اتجاه انتشار البيانات، فإننا ذكرنا بالفعل أن خط الانحدار واتجاه انتشار البيانات كلاهما يوضح أنه كلما زادت قيم ﺱ، فإن قيم ﺹ تزداد أيضًا. توجد بعض العبارات التي يمكننا استخدامها لوصف ذلك. نقول إن مجموعتي البيانات ترتبطان ارتباطًا موجبًا أو طرديًّا، إذا زادت إحدى مجموعتي البيانات بزيادة المجموعة الأخرى. في حالة الارتباط الخطي الموجب، قد تبدو نقاط البيانات بهذا الشكل. في حالة ارتباط مجموعتي بيانات ارتباطًا سالبًا، أو عكسيًّا، فإن إحدى مجموعتي البيانات تتناقص بزيادة الأخرى، والعكس صحيح. وفي حالة ارتباط مجموعتي بيانات ارتباطًا خطيًّا عكسيًّا، فإن النقاط تتبع خطًّا يميل متجهًا لأسفل على النحو الموضح.
إذن، بوضع ذلك في الاعتبار، دعونا نحدد ما إذا كانت مجموعتا بيانات ترتبطان ارتباطًا موجبًا أو سالبًا أو لا ترتبطان على الإطلاق باستخدام خط انحدار.
ما نوع الارتباط الموجود بين المتغيرين في شكل الانتشار الموضح؟
عندما نفكر في الارتباط، فإننا نفكر في الارتباط الخطي — بعبارة أخرى هو الذي تتبع فيه النقاط تقريبًا خطًّا مستقيمًا — كما نفكر في الارتباط غير الخطي، وهو الذي تتبع فيها النقاط اتجاهًا آخر غير خطي، ومثال ذلك المنحنى. في حالة ارتباط مجموعتي بيانات خطيًّا، يمكننا القول إنهما إما ترتبطان ارتباطًا خطيًّا موجبًا أو ارتباطًا خطيًّا سالبًا، ويعتمد ذلك على اتجاه خط الانحدار. لذا، دعونا نتناول التمثيل البياني الموضح لدينا ونرى ما إذا كان يمكننا رسم خط انحدار.
ليس من الضروري أن يمر خط الانحدار بنقطة الأصل، أي النقطة صفر، صفر، مع أنه في هذا الشكل يبدو أنه من المحتمل أن يمر بها. ويجب أن يتبع خط الانحدار هذا اتجاه انتشار النقاط تقريبًا. قد نلاحظ أن خط الانحدار لدينا يميل متجهًا لأعلى. بعبارة أخرى، له ميل موجب. ومن ثم، فإننا نستنتج من ذلك أنه كلما ازدادت قيم ﺱ، فإن قيم ﺹ تزداد أيضًا. ومن ثم، فإن المتغيرين ﺱ وﺹ يرتبطان ارتباطًا موجبًا. على وجه التحديد، بما أن هذه النقاط تتبع خطًّا مستقيمًا تقريبًا، يمكننا القول إن الارتباط خطي. وبهذا نكون قد أجبنا عن السؤال بالكامل. نوع الارتباط الخطي الموجود هو ارتباط خطي موجب.
في هذا المثال، كان لدينا شكل انتشار لمجموعة بيانات. لكن هذا لا يحدث دائمًا. فقد يعطينا السؤال وصفًا لنوع المتغيرين بدلًا من ذلك. وكما سنرى، سيتعين علينا في هذه الحالة الاستعانة بفهمنا لكيفية ارتباط كل متغير بالآخر لتحديد ما إذا كانا يرتبطان ارتباطًا موجبًا أو سالبًا أو لا يرتبطان على الإطلاق.
افترض أن المتغير ﺱ يمثل عدد الساعات التي تعملها، والمتغير ﺹ يمثل راتبك. أنت تعتقد أنه كلما زاد عدد ساعات عملك، زاد راتبك. هل يمثل هذا ارتباطًا موجبًا، أم ارتباطًا سالبًا، أم لا يمثل ارتباطًا؟
يخبرنا السؤال أن المتغير ﺱ يمثل عدد ساعات العمل، والمتغير ﺹ يمثل الراتب. ونريد إيجاد العلاقة بين المتغيرين، إن كانت توجد علاقة. أنت تعتقد أنه كلما زاد عدد ساعات عملك، زاد راتبك. لذا، دعونا نحاول تمثيل هذا على شكل انتشار. المتغير ﺱ يمثل عدد ساعات العمل، والمتغير ﺹ يمثل الراتب؛ لذا يمكننا تسمية المحورين على النحو الآتي. دعونا نضع بعض القيم الافتراضية. لنفترض أنك إذا عملت لمدة ١٥ ساعة، فإنك تتقاضى ٢٠٠٠٠ جنيه. وعليه، إذا افترضت أنك تعمل لمدة ٣٠ ساعة في الأسبوع، فإنك تتقاضى راتبًا شهريًّا مقداره ٤٠٠٠٠ جنيه. وبفرض أنه كلما زاد عدد ساعات العمل، زاد راتبك، يمكننا إضافة مزيد من النقاط على شكل الانتشار لدينا كما هو موضح.
نلاحظ أن النقاط الممثلة تتبع تقريبًا خطًّا مستقيمًا، وأن هذا الخط المستقيم له ميل موجب. فهو يميل متجهًا لأعلى. ونظرًا لأن الخط يميل متجهًا لأعلى، يمكننا استنتاج أن المتغيرين ﺱ وﺹ يرتبطان ارتباطًا موجبًا. وقد افترضنا أيضًا أن هذا ارتباط خطي موجب، لكن قد يكون هذا غير صحيح. فكل ما أخبرنا به السؤال هو أنه كلما زاد عدد ساعات العمل، زاد الراتب، وهو ما يعني أنه مثال على الارتباط الموجب.
في هذا المثال، كانت نقاط البيانات التي مثلناها تقترب كثيرًا من اتباع خط مستقيم ما. مدى قرب نقاط البيانات من اتباع خط انحدار يحدد مدى قوة الارتباط. على سبيل المثال، لنفترض أننا نتناول الارتباط الخطي الموجب. إذا كانت جميع النقاط تقع بالقرب من خط الانحدار، كما في هذا المثال، يمكننا القول إن هذا مثال على ارتباط قوي. لكن، إذا كانت النقاط بعيدة عن خط الانحدار، كما في هذا المثال، يمكننا القول إن هذا ارتباط ضعيف. في النهاية يتحول هذا الارتباط الضعيف إلى عدم ارتباط كلما ابتعدت النقاط بعضها عن بعض أكثر فأكثر. بوضع ذلك في الاعتبار، دعونا نحدد مدى قوة الارتباط في المثال التالي.
أي أشكال الانتشار الآتية يمثل أقوى ارتباط بين متغيرين.
يوجد شكلان نختار من بينهما. تذكر أنه عندما نفكر في قوة الارتباط، فإن هذا يعتمد على تحديد مدى قرب النقاط من خط الانحدار. فكلما كانت النقاط أقرب، كان الارتباط أقوى. إذن، من المنطقي أن نبدأ برسم خط انحدار على كلا الشكلين. خط الانحدار على الشكل رقم واحد قد يبدو بهذا الشكل قليلًا. تتبع النقاط خطًّا مستقيمًا تقريبًا؛ لذا يوجد ارتباط خطي هنا. على وجه التحديد، كلما ازدادت قيم ﺱ، فإن قيم ﺹ تزداد أيضًا. إذن، يمكننا القول إن المتغيرين ﺱ وﺹ يرتبطان ارتباطًا خطيًّا موجبًا.
في الشكل رقم اثنين، يبدو خط الانحدار بهذا الشكل. نلاحظ أن جميع النقاط تبعد قليلًا عن خط الانحدار. وهذا يعني أن الارتباط في الشكل رقم اثنين أقل قوة. يمكننا القول إنه ضعيف. وبهذا تكون الإجابة هي الشكل رقم واحد. الشكل رقم واحد يمثل أقوى ارتباط بين المتغيرين.
وبهذا نكون قد تناولنا كيفية ارتباط متغيرين مختلفين ومعنى أن يرتبط المتغيران ارتباطًا خطيًّا أو غير خطي. ورأينا كيف نصف العلاقة بين متغيرين ونحدد ما إذا كان بينهما ارتباط موجب أو سالب أو لا يوجد ارتباط على الإطلاق. وعرفنا أيضًا أن مدى قوة العلاقة بين متغيرين تعتمد على قرب النقاط من خط انحدار. وبوضع كل هذا في اعتبارنا، دعونا نلخص النقاط الرئيسية في هذا الفيديو.
في هذا الفيديو، تعلمنا أنه إذا اتبع متغيران اتجاهًا له وصف محدد، فإنهما يكونان مرتبطين. إذا مثلنا هذه النقاط على شكل انتشار ورأينا أنها تتبع خطًّا مستقيمًا تقريبًا، فإن هذا يعني وجود ارتباط خطي. وإذا كان خط الانحدار يميل متجهًا لأعلى، أي إن ميله موجب، فإن المتغيرين يرتبطان ارتباطًا موجبًا. وإذا كان خط الانحدار يميل متجهًا لأسفل، أي ميله سالب، فإن المتغيرين يرتبطان ارتباطًا سالبًا. إذا لم تتحقق أي من الحالتين، أي إذا لم نتمكن من رسم خط انحدار، فإن هذا يعني أن المتغيرين لا يرتبطان على الإطلاق. وأخيرًا، رأينا أنه يمكننا تحديد قوة الارتباط من خلال تحديد قرب جميع النقاط من خط الانحدار.