شارح الدرس: الارتباط الرياضيات

في هذا الشارح، سوف نتعلَّم كيف نتعامل مع الارتباط الخطي ونفرِّق بين الأنواع المختلفة من الارتباط

ربَّما تتذكَّر أنك تعرَّفت على مجموعتَيْ بيانات عند رسم أشكال الانتشار. فيما يُعرَف باسم البيانات الثنائية المتغيِّر؛ حيث تقترن مجموعة بيانات بمجموعة أخرى من البيانات، ويُمكن تمثيلهما على شكل انتشار؛ حيث تُمثَّل المجموعة الأولى من البيانات على المحور 𞸎، وتمثَّل الثانية على المحور 𞸑.

تعريف: البيانات الثنائية المتغيِّر

تَنتُج البيانات الثنائية المتغيِّر عند اقتران مجموعة بيانات بمجموعة أخرى من البيانات.

على سبيل المثال، يُمكننا قياس طول الأشخاص ومحيط رأسهم، وتمثيل هذه القِيَم على شكل انتشار، كما هو موضَّح في الشكل الآتي.

وبالنظر إلى شكل الانتشار، نجد أن هناك نمطًا أو ميلًا معيَّنًا. في حالة الطول ومحيط الرأس، كلما ازداد الطول، يبدو أن محيط الرأس يزداد (وإن لم يكن هذا دائمًا). وفي هذه الحالة، نقول إن المجموعتين بينهما ارتباط؛ وهو ما يعني وجود علاقة بينهما.

تعريف: الارتباط

يكون بين مجموعتين من البيانات (بيانات ثنائية المتغيِّر) ارتباط عند وجود علاقة بينهما، أو عند اتِّباعهما نمطًا معيَّنًا.

ثمة طُرق مختلفة لوصْف كيفية ارتباط مجموعتَيْ بيانات، وذلك اعتمادًا على العلاقة بينهما.

أولًا، إذا كانت مجموعتا البيانات تتبَعان خطًّا مستقيمًا عند رسمهما على شكل انتشار، فسيكون بينهما ارتباط خطي. أمَّا إذا كانتا تتبَعان نمطًا مختلفًا غير الخط المستقيم، فسيكون بينهما ارتباط غير خطي. لكن إذا لم يَبْدُ أن نقاط البيانات تتبَع أيَّ نمط على الإطلاق، فهذا يعني عدم وجود ارتباط بينها.

تعريف: الارتباط الخطي وغير الخطي

  • ترتبط مجموعتان من البيانات ارتباطًا خطيًّا إذا كانتا تتبَعان خطًّا مستقيمًا.
  • ترتبط مجموعتان من البيانات ارتباطًا غير خطي، إذا كانتا تتبَعان نمطًا غير خطي مثل نمط أُسِّي أو لوغاريتمي.
  • تكون مجموعتا البيانات غير مرتبطتين، إذا لم يَبْدُ أنهما يتبَعان نمطًا معيَّنًا.

يُمكن ملاحظة الأنواع المختلفة من الارتباط الخطي وغير الخطي بسهولة أكبر بالنظر إلى أشكال الانتشار ومحاولة رسم خط أفضل مطابقة.

بمقارنة خط أفضل مطابقة بنقاط البيانات في شكل الانتشار الأول، نلاحِظ أن نقاط البيانات تتبَع نمطًا خطيًّا؛ ومن ثَمَّ، فإن بينها ارتباطًا خطيًّا. وبمقارنة خط أفضل مطابقة بنقاط البيانات في شكل الانتشار الثاني، نرى بوضوح أن نقاط البيانات لا تتبَع نمطًا خطيًّا، لكن يبدو أنها تتبع نمطًا أُسيًّا؛ ومن ثَمَّ، فإن بينها ارتباطًا غير خطي. بالنسبة إلى شكل الانتشار الثالث، لا يُوجَد نمطٌ واضح (خطي ولا غير خطي)، ويُمكن ملاحَظة ذلك من محاولة رسم خط أفضل مطابقة. فلأن النقاط متفرِّقة ولا تتبَع خط أفضل مطابقة، ولا أيَّ نمط آخَر، فلا يُوجَد بينها أيُّ ارتباط.

سنستخدم طريقة المقارنة بين خط أفضل مطابقة والبيانات الموجودة على شكل الانتشار باعتبارها طريقة لتحديد إذا ما كانت البيانات مرتبطة خطيًّا في المثال الآتي.

مثال ١: تحديد إذا ما كانت البيانات تُشير إلى نمط خطي

هل يُمكننا استخدام خط أفضل مطابقة لوصْف النمط في البيانات؟ لماذا؟

الحل

كما هو موضَّح في شكل الانتشار، لا تتبَع البيانات نمطًا خطيًّا؛ لأن النقاط لا تتبَع خط أفضل مطابقة. لكن بما أنه يبدو أن نقاط البيانات تتبَع نمطًا معيَّنًا (وهو في هذه الحالة نمط أُسِّي)، فإن بينها ارتباطًا غير خطي.

وثانيًا، تحدِّد الطريقة التي تتغيَّر بها إحدى مجموعتَيِ البيانات بالنسبة إلى المجموعة الأخرى إذا ما كان هناك ارتباطموجب، أو سالب. فإذا زادت إحدى مجموعتَيِ البيانات بزيادة المجموعة الأخرى، يكون ارتباط البيانات موجبًا، أو طرديًّا. لكن إذا زادت إحدى مجموعتَيِ البيانات بتناقُص المجموعة الأخرى، فيكون ارتباط البيانات سالبًا، أو عكسيًّا.

تعريف: الارتباط الموجب والسالب

  • ترتبط مجموعتا البيانات ارتباطًا موجبًا أو طرديًّا إذا زادت إحدى مجموعتَيِ البيانات بزيادة المجموعة الأخرى.
  • ترتبط مجموعتا البيانات ارتباطًا سالبًا أو عكسيًّا إذا زادت إحدى مجموعتَيِ البيانات بتناقُص المجموعة الأخرى.

ويُمكننا ملاحظة النوعين المختلفين من الارتباط الموجب والسالب بسهولة أكبر من خلال خط أفضل مطابقة؛ ففي حالة الارتباط الموجب، يكون ميل خط أفضل مطابقة موجبًا، وفي حالة الارتباط السالب، يكون الميل سالبًا.

سنتناول في المثال الآتي كيفية تحديد إذا ما كانت البيانات مرتبطة ارتباطًا موجبًا أو سالبًا (أو غير مرتبطة على الإطلاق) باستخدام خط أفضل مطابقة في شكل الانتشار.

مثال ٢: تحديد نوع ارتباط البيانات من شكل الانتشار

ما نوع الارتباط الموجود بين المتغيِّرين في شكل الانتشار الموضَّح؟

الحل

لتحديد نوع الارتباط، علينا أن نعرف الكيفية التي تتغيَّر بها إحدى مجموعتَيِ البيانات بالنسبة إلى المجموعة الأخرى. ولمساعدتنا في ذلك، يُمكننا رسم خط أفضل مطابقة على الشكل.

بينما تزداد قِيَم 𞸎، تزداد قِيَم 𞸑 كذلك؛ وهو ما يعني أن هناك ارتباطًا موجبًا. يُمكننا ملاحظة ذلك من خط أفضل مطابقة؛ لأن له ميلًا موجبًا (يرتفع الخط المستقيم بالانتقال من يساره إلى يمينه).

في بعض الأحيان، لا يكون لدينا شكل انتشار لمجموعة البيانات، بل وصْف لأنواع المتغيِّرات. وكما نلاحِظ في المثال الآتي، علينا الاستفادة من فهْمنا لعلاقة المتغيِّرات بعضها ببعض باعتباره طريقة لتحديد إذا ما كانت المتغيِّرات مرتبطة ارتباطًا موجبًا أو سالبًا، أو غير مرتبطة على الإطلاق.

مثال ٣: تحديد نوع الارتباط بين متغيِّرين من وصْف معيَّن

افترض أن المتغيِّر 𞸎 يمثِّل عدد الساعات التي تعملها، والمتغيِّر 𞸑 يمثِّل راتبك. أنت تعتقد أنه كلما زاد عدد ساعات عملك، زاد راتبك. هل يمثِّل هذا ارتباطًا موجبًا، أو ارتباطًا سالبًا، أو لا يمثِّل ارتباطًا؟

الحل

هنا، من المُهمِّ التفكير في كيفية تغيُّر المتغيِّرين. في هذه الحالة، كلما زاد عدد ساعات العمل، زاد المرتب. هذا يعني أن المتغيِّرين يرتبطان ارتباطًا موجبًا. قد يكون من المُفيد رسم شكل لتوضيح كيف يبدو ذلك.

بما أن الخط المستقيم يرتفع بالانتقال من يساره إلى يمينه، فإن له ميلًا موجبًا؛ ومن ثَمَّ يُظهِر ارتباطًا موجبًا.

ثالثًا، يُمكننا تحديد مدى قوة الارتباط الخطي لمجموعتَيْ بيانات بناء على مدى قُرب البيانات من اتِّباع خط مستقيم أو خط أفضل مطابقة. إذا كانت جميع نقاط البيانات تقع بالقُرب من خط أفضل مطابقة، فيكون بينها ارتباط قوي. وإذا كان العديد من نقاط البيانات بعيدًا عن خط أفضل مطابقة، فيكون بينها ارتباط ضعيف. أمَّا إذا لم تتبع البيانات خط أفضل مطابقة على الإطلاق، فهذا يعني عدم وجود ارتباط بينها.

يُمكننا ملاحَظة قوة الارتباط بشكل أوضح عند مقارنة نقاط البيانات الموجودة على شكل الانتشار بخط أفضل مطابقة. نلاحِظ ذلك في أشكال الانتشار الآتية.

يُمكننا استخدام أشكال الانتشار وخط أفضل مطابقة لمساعدتنا في تحديد قوة الارتباط، كما هو موضَّح في المثال الآتي.

مثال ٤: تحديد قوة ارتباط البيانات وفقًا لعلاقتها بخط أفضل مطابقة

حدِّد أيٌّ من شكلَيِ الانتشار الآتيين يمثِّل ارتباطًا أقوى بين البيانات الثنائية المتغيِّر.

الحل

للمُساعدة في تحديد الشكل الذي يمثِّل ارتباطًا أقوى بين البيانات الثنائية المتغيِّر، يُمكننا رسم خط أفضل مطابقة.

في الشكل ١، جميع نقاط البيانات قريبة من خط أفضل مطابقة؛ وهو ما يُشير إلى وجود ارتباط قوي بين مجموعتَيِ البيانات. في الشكل ٢، بعض النقاط قريبة من خط أفضل مطابقة، ولكن بعضها الآخَر بعيد؛ وهو ما يُشير إلى وجود ارتباط ضعيف. وهكذا، يمثِّل الشكل ١ ارتباطًا أقوى.

في المثال الآتي، يُمكننا استخدام وصْف ما ستبدو عليه البيانات على شكل الانتشار لتحديد نوع الارتباط.

مثال ٥: تحديد قوة ارتباط البيانات وفقًا لعلاقتها بخط أفضل مطابقة

إذا كانت نقاط البيانات جميعها متراصَّة على خط أفضل مطابقة، فماذا يعني ذلك بالنسبة إلى البيانات؟

الحل

إذا كانت النقاط قريبة من خط أفضل مطابقة، فإن للبيانات ارتباطًا قويًّا بين المتغيِّرين. وعليه، إذا كانت نقاط البيانات جميعها متراصَّة على خط أفضل مطابقة، فلا بدَّ أن هناك ارتباطًا قويًّا.

في هذا الشارح، تناولنا أنواع الارتباط المختلفة، وفي ذلك الارتباط الخطي وغير الخطي، وكذلك الارتباط الموجب والسالب، وقوة الارتباط. واستخدمنا خطوط أفضل مطابقة لمُساعدتنا في تحديد نوع الارتباط وقوة الارتباط الخطي بين البيانات الثنائية المتغيِّر.

النقاط الرئيسية

  • يَصِف الارتباط علاقةً بين متغيِّرين.
  • الارتباط الخطي يعني أن مجموعة البيانات الثنائية المتغيِّر تتبَع نمطًا خطيًّا (خط أفضل مطابقة).
  • الارتباط الموجب يعني أنه عندما يزداد أحد المتغيِّرين، يزداد المتغيِّر الآخَر.
  • الارتباط السالب يعني أنه عندما يزداد أحد المتغيِّرين، يتناقص المتغيِّر الآخَر.
  • الارتباط القوى يعني أن نقاط البيانات قريبة من خط أفضل مطابقة.
  • الارتباط الضعيف يعني أن نقاط البيانات بعيدة عن خط أفضل مطابقة.
  • عدم وجود ارتباط يعني أن نقاط البيانات لا تتبع خط أفضل مطابقة.

تستخدم نجوى ملفات تعريف الارتباط لضمان حصولك على أفضل تجربة على موقعنا. معرفة المزيد حول سياسة الخصوصية لدينا.