شارح الدرس: خط الانحدار باستخدام المربعات الصُّغرى الرياضيات

في هذا الشارح، سوف نتعلَّم كيف نُوجِد ونستخدم معادلة خط الانحدار باستخدام المربعات الصغرى.

استُخدِم مصطلح «الانحدار» لأول مرة من قِبَل السير فرانسيس جالتون، وهو عالم إحصاء في العصر الإنجليزي الفيكتوري، للإشارة إلى أطوال الأبناء وآبائهم. كان الآباء الطوال القامة يميلون إلى إنجاب أطفال أقصر منهم، والعكس صحيح بالنسبة إلى الآباء القصار القامة. أُطلِق على هذا التأثير «الانحدار نحو المتوسط»؛ حيث تنحدر الأطوال نحو القيمة المتوسطة. منذ ظهور هذه الاستنتاجات، استُخدِم تحليل الانحدار لتحديد العلاقات بين المتغيِّرات وتحليلها. على وجه التحديد، تسمح لنا طريقة المربعات الصغرى بتحديد خط أفضل مطابقة لمجموعة من البيانات ذات متغيِّرين.

نفترض أننا جمعنا عدد 𞸍 من القياسات لاثنين من المتغيِّرات الكمية، 𞹎، 𞹑، لكي نكوِّن مجموعة بيانات ذات متغيِّرين. أي إن لدينا عدد 𞸍 من أزواج البيانات، 󰁓𞸎،𞸑󰁒𞸤𞸤، 𞸤=١،،𞸍. نفترض أيضًا أن كلًّا من مخطط الانتشار ومعامل الارتباط للبيانات يشير إلى أن المتغيِّرين 𞹎، 𞹑 مرتبطان خطيًّا. بعبارة أخرى، عندما تزداد قيمة أحدهما، تزداد قيمة الآخر خطيًّا، أو تتناقص خطيًّا بتناقص الأولى.

الخطوة التالية في تحليل هذه البيانات هي أن نجرب تمثيل هذه العلاقة باستخدام خط أفضل مطابقة. هذا يعني أننا نبحث عن معادلة الخط المستقيم الذي يمثِّل مسار البيانات، والذي يمر بأقرب ما يمكن من كل نقطة من نقاط البيانات. قد نجرِّب رسم هذا الخط بمجرد النظر. مع ذلك، ثمة طريقة تمكِّننا من إيجاد معادلته بدقة.

تذكَّر أن معادلة الخط المستقيم بوجه عام هي: 𞸑=󰏡+𞸁𞸎، حيث يمثِّل 󰏡 الجزء المقطوع من المحور 𞸑، وتمثِّل 𞸁 ميل الخط. من غير المحتمل أن تقع مجموعة من البيانات ذات المتغيِّرين بالضبط على خط مستقيم، ولكي نُوجِد معادلة الخط المستقيم التي تُوافِق هذه البيانات أقرب ما يمكن، نُوجِد الخط؛ حيث يكون متوسط إجمالي المسافة منه إلى جميع نقاط البيانات أقل ما يمكن. هذه المسافة 𞸑󰂝𞸑 لكل نقطة (𞸎،𞸑)، تُسمَّى الخطأ أو الباقي. وهو الفرق بين القيمة الحقيقية لـ 𞸑 لنقطة بيانات والقيمة المتوقَّعة 󰂝𞸑، على الخط، لنفس قيمة 𞸎.

يقلِّل خط الانحدار باستخدام المربعات الصغرى، 󰂝𞸑=󰏡+𞸁𞸎، من مجموع مربع الفروق بين النقاط التي تقع على الخط المستقيم، ومن هنا جاء مصطلح «المربعات الصغرى». جدير بالذكر أننا لن نتناول استنتاج صيغ خط أفضل مطابقة في هذا الشارح، لكننا سنشرح كيف نستخدم الصيغ لإيجاد المعاملين 󰏡، 𞸁 للخط المستقيم.

تعريف: خط انحدار باستخدام المربعات الصغرى

إذا كان 󰂝𞸑=󰏡+𞸁𞸎 خط انحدار المربعات الصغرى لمجموعة من البيانات ذات المتغيِّرين 𞹎، 𞹑، إذن: ا𞸁=𞹛𞹛󰏡=𞸑𞸁𞸎،𞸎𞸑𞸎𞸎 حيث: 𞹛=󰌇𞸎𞸑󰌄𞸎󰌄𞸑𞸍،𞹛=󰌇𞸎󰁓󰌄𞸎󰁒𞸍،𞸎=󰌄𞸎𞸍󰁓𞸎󰁒،𞸑=󰌄𞸑𞸍󰁓𞸑󰁒.𞸎𞸑𞸎𞸎٢٢

يمكننا أيضًا كتابة الميل 𞸁 على الصورة 𞸁=𞸓𞹏𞹏𞸑𞸎؛ حيث 𞸓 معامل الارتباط، 𞹏𞸑، 𞹏𞸎 الانحرافان المعياريان لـ 𞸎، 𞸑 على الترتيب، أو بدلًا من ذلك يمكننا التعويض بمقادير 𞹛𞸎𞸑، 𞹛𞸎𞸎 في صيغة الميل: 𞸁=𞸍󰌄𞸎𞸑󰌄𞸎󰌄𞸑𞸍󰌄𞸎󰁓󰌄𞸎󰁒.٢٢

كما نلاحِظ أن 𞹛𞸎𞸑، 𞹛𞸎𞸎 تُكتَبان عادةً على الصورتين: 𞹛=󰌇󰁓𞸎𞸎󰁒(𞸑𞸑)،𞹛=󰌇󰁓𞸎𞸎󰁒،𞸎𞸑𞸎𞸎٢ اللتين تكافئان المقادير المُعطاة أعلاه. في هذه الصورة، يمكننا ملاحظة أن 𞹛𞸎𞸑 هو مجموع حاصل ضرب الفرق بين كل قيم 𞸎 والوسط الحسابي لقيم 𞸎، وكل قيم 𞸑 والوسط الحسابي لقيم 𞸑، 𞹛𞸎𞸎 يساوي مجموع مربعات الفروق بين كل قيم 𞸎 والوسط الحسابي لقيم 𞸎.

عمليًّا، نحسب الميل، 𞸁، أولًا؛ حيث 𞸁 ضروري لحساب 󰏡. نلقي نظرة على مثال حول كيفية إيجاد خط انحدار باستخدام المربعات الصغرى من جدول بيانات ذات متغيِّرين.

مثال ١: إيجاد خط انحدار باستخدام المربعات الصغرى بمعلومية جدول بيانات يلخِّص مجاميع القيم المرصودة

استخدم المعلومات الموضَّحة في الجدول لإيجاد معادلة خط انحدار 𞸑 على 𞸎 باستخدام المربعات الصغرى. اكتب المعادلة على الصورة 𞸑=󰏡𞸎+𞸁؛ حيث 󰏡، 𞸁 مقرَّبان لأقرب ثلاث منازل عشرية.

𞸎𞸑𞸎𞸑𞸎٢𞸑٢
١٢٢١٨٣٩٦٤٨٤٣٢٤
٢٢٢١٩٤١٨٤٨٤٣٦١
٣٢٣٢٠٤٦٠٥٢٩٤٠٠
٤٢٦١٨٤٦٨٦٧٦٣٢٤
٥٣١٢٣٧١٣٩٦١٥٢٩
٦٣٢٢٤٧٦٨١‎ ‎٠٢٤٥٧٦
٧٣٤٢٢٧٤٨١‎ ‎١٥٦٤٨٤
٨٣٧٢٥٩٢٥١‎ ‎٣٦٩٦٢٥
٩٤١٢٩١‎ ‎١٨٩١‎ ‎٦٨١٨٤١
١٠٤٢٢٧١‎ ‎١٣٤١‎ ‎٧٦٤٧٢٩
المجموع٣١٠٢٢٥٧‎ ‎٢١٩١٠‎ ‎١٢٨٥‎ ‎١٩٣

الحل

لإيجاد خط انحدار باستخدام المربعات الصغرى 𞸑=󰏡+𞸁𞸎، يجب أن نُوجِد الميل، 𞸁، والجزء المقطوع من المحور 𞸑؛ أي 󰏡. للقيام بذلك، نستخدم الصيغتين: 𞸁=𞹛𞹛=𞸍󰌄𞸎𞸑󰌄𞸎󰌄𞸑𞸍󰌄𞸎󰁓󰌄𞸎󰁒󰏡=𞸑𞸁𞸎،𞸎𞸑𞸎𞸎٢٢ حيث 𞸎=󰌄𞸎𞸍 الوسط الحسابي لقيم 𞸎، 𞸑=󰌄𞸑𞸍 الوسط الحسابي لقيم 𞸑.

عدد أزواج البيانات في مجموعة البيانات هو 𞸍=٠١، وفي الصف الأخير من الجدول، لدينا المجاميع التي نحتاج إليها. هذه المجاميع هي 󰌇𞸎𞸑=٩١٢٧، 󰌇𞸎=٠١٣، 󰌇𞸑=٥٢٢، 󰌇𞸎=٨٢١٠١٢. وبما أننا بحاجة إلى إيجاد الميل، وهو 𞸁، لحساب قيمة 󰏡، إذن نستخدم أولًا القيم المُعطاة لإيجاد 𞸁: 𞸁=𞸍󰌄𞸎𞸑󰌄𞸎󰌄𞸑𞸍󰌄𞸎󰁓󰌄𞸎󰁒=٠١×٩١٢٧٠١٣×٥٢٢٠١×٨٢١٠١(٠١٣)=٠٩١٢٧٠٥٧٩٦٠٨٢١٠١٠٠١٦٩=٠٤٤٢٠٨١٥=٢٢١٩٥٢=١٧٤٫٠.٢٢٢بثزل

لحساب قيمة الجزء المقطوع من المحور 𞸑؛ أي 󰏡، نحتاج إلى إيجاد الوسطين الحسابيين لقيم 𞸎، 𞸑. وهما: 𞸎=󰌄𞸎𞸍=٠١٣٠١=١٣،𞸑=󰌄𞸑𞸍=٥٢٢٠١=٥٫٢٢.

يمكننا الآن أن نستخدم هاتين القيمتين، في صورة كسر لضمان الدقة، مع قيمة الميل 𞸁=٢٢١٩٥٢ لإيجاد 󰏡: 󰏡=𞸑𞸁𞸎=٥٢٢٠١٢٢١٩٥٢×٠١٣٠١=٨٩٨٫٧.بثزل

ومن ثَمَّ، مع وضع حد المتغيِّر 𞸎 أولًا، فإن خط الانحدار باستخدام المربعات الصغرى هو 𞸑=١٧٤٫٠𞸎+٨٩٨٫٧.

خلال هذه العمليات الحسابية، استخدمنا تعبيرات مثل 𞸎، 𞸑، 󰌇𞸎𞸑، التي تُعرَف بالملخَّصات الإحصائية.

تعريف: الملخَّصات الإحصائية

الملخَّصات الإحصائية هي قيم إحصائية نحسبها من الملاحظات الواردة في عيِّنة تحتوي على مجموعة بيانات، وهي تلخِّص البيانات بطريقة تسمح لنا بإيجاد أكبر قدر ممكن من المعلومات؛ ومن ثَمَّ، تفسيرها.

في المثال التالي، نُوجِد خط انحدار باستخدام المربعات الصغرى مباشرةً من الملخَّصات الإحصائية.

مثال ٢: حساب معامل الانحدار لنموذج انحدار المربعات الصغرى باستخدام الملخَّصات الإحصائية

 في مجموعة البيانات المُعطاة: 󰌇𞸎=٧٤، 󰌇𞸑=٥٧٫٥٤، 󰌇𞸎=٩٢٣٢، 󰌇𞸑=٥٢١٣٫٩٨٣٢، 󰌇𞸎𞸑=٥٢٫٠١٣، 𞸍=٨، احسب قيمة معامل الانحدار 𞸁 في نموذج انحدار المربعات الصغرى 𞸑=󰏡+𞸁𞸎. قرِّب إجابتك لأقرب ثلاث منازل عشرية.

الحل

لحساب معامل الانحدار 𞸁 من الملخَّصات الإحصائية المُعطاة، يمكننا استخدام الصيغة: 𞸁=𞹛𞹛=𞸍󰌄𞸎𞸑󰌄𞸎󰌄𞸑𞸍󰌄𞸎󰁓󰌄𞸎󰁒.𞸎𞸑𞸎𞸎٢٢

بالتعويض عن قيم 󰌇𞸎، 󰌇𞸑، 󰌇𞸎٢، 󰌇𞸎𞸑=٥٢٫٠١٣، 𞸍=٨، نحصل على: 𞸁=٨×٥٢٫٠١٣٧٤×٥٧٫٥٤٨×٩٢٣(٧٤)=٢٨٤٢٥٢٫٠٥١٢٢٣٦٢٩٠٢٢=٥٧٫١٣٣٣٢٤٨٢٤٨٧٫٠.٢

ومن ثَمَّ، فإن معامل الانحدار 𞸁=٤٨٧٫٠ مُقرَّبًا لأقرب ثلاث منازل عشرية.

يوضِّح المثال الآتي كيف نُوجِد معادلة خط انحدار باستخدام المربعات الصغرى لمجموعة معيَّنة من البيانات ذات المتغيِّرين.

مثال ٣: حساب معادلة خط انحدار باستخدام المربعات الصغرى

يوضِّح شكل الانتشار الآتي مجموعة بيانات يبدو نموذج الانحدار الخطي مناسبًا لها.

البيانات المُستخدَمة في تكوين شكل الانتشار هذا مُعطاة في الجدول الآتي:

𞸎٠٫٥١١٫٥٢٢٫٥٣٣٫٥٤
𞸑٩٫٢٥٧٫٦٨٫٢٥٦٫٥٥٫٤٥٤٫٥١٫٧٥١٫٨

احسب باستخدام المربعات الصغرى معادلة خط انحدار 𞸑 على 𞸎، مقرِّبًا معامل الانحدار لأقرب جزء من ألف.

الحل

معادلة خط الانحدار باستخدام المربعات الصغرى هي 󰂝𞸑=󰏡+𞸁𞸎؛ حيث الميل أو معامل الانحدار هو: 𞸁=𞹛𞹛=𞸍󰌄𞸎𞸑󰌄𞸎󰌄𞸑𞸍󰌄𞸎󰁓󰌄𞸎󰁒.𞸎𞸑𞸎𞸎٢٢

الجزء المقطوع من المحور 𞸑 يُعطَى بالعلاقة 󰏡=𞸑𞸁𞸎؛ حيث 𞸎=󰌄𞸎𞸍 الوسط الحسابي لقيم 𞸎، 𞸑=󰌄𞸑𞸍 الوسط الحسابي لقيم 𞸑. لدينا ثمانية أزاوج من البيانات (𞸎،𞸑)؛ ومن ثَمَّ، 𞸍=٨. لإيجاد المعاملين 󰏡، 𞸁، نبدأ بكتابة البيانات في جدول يحتوي على أعمدة لحواصل ضرب 𞸎𞸑، 𞸎٢؛ حيث سنحتاج إلى استخدام مجاميع نواتجهما في حساباتنا. على سبيل المثال، في العمود الثالث، يكون العنصر الأول ٥٫٠×٥٢٫٩=٥٢٦٫٤، وهكذا لكل زوج (𞸎،𞸑).

𞸎𞸑𞸎𞸑𞸎٢
٠٫٥٩٫٢٥٤٫٦٢٥٠٫٢٥
١٧٫٦٧٫٦٠٠١٫٠٠
١٫٥٨٫٢٥١٢٫٣٧٥٢٫٢٥
٢٦٫٥١٣٫٠٠٠٤٫٠٠
٢٫٥٥٫٤٥١٣٫٦٢٥٦٫٢٥
٣٤٫٥١٣٫٥٠٠٩٫٠٠
٣٫٥١٫٧٥٦٫٢٢٥١٢٫٢٥
٤١٫٨٧٫٢٠٠١٦٫٠٠
المجموع

الخطوة التالية هي جمع القيم في كل عمود؛ بحيث نحصل على المجاميع في الصف الأخير.

𞸎𞸑𞸎𞸑𞸎٢
٠٫٥٩٫٢٥٤٫٦٢٥٠٫٢٥
١٧٫٦٧٫٦٠٠١٫٠٠
١٫٥٨٫٢٥١٢٫٣٧٥٢٫٢٥
٢٦٫٥١٣٫٠٠٠٤٫٠٠
٢٫٥٥٫٤٥١٣٫٦٢٥٦٫٢٥
٣٤٫٥١٣٫٥٠٠٩٫٠٠
٣٫٥١٫٧٥٦٫٢٢٥١٢٫٢٥
٤١٫٨٧٫٢٠٠١٦٫٠٠
المجموع󰌇𞸎=٠٠٫٨١󰌇𞸑=٠١٫٥٤󰌇𞸎𞸑=٥٠٫٨٧󰌇𞸎=٠٠٫١٥٢

يمكننا الآن استخدام هذه المجاميع في صيغة 𞸁 لحساب ميل خط الانحدار: 𞸁=٨×٥٠٫٨٧٠٫٨١×١٫٥٤٨×٠٫١٥(٠٫٨١)=٤٫٤٢٦٨٫١١٨٨٠٤٤٢٣=٤٫٧٨١٤٨=٧٣٩٠٢٤=١٣٢٫٢.٢بءأ

لاحظ أنه، من خلال شكل الانتشار، نجد أنه مع زيادة قيم 𞸎، تقل قيم 𞸑 بشكل عام، وهذا يرجع إلى حقيقة أن قيمة الميل، 𞸁، سالبة. لإيجاد قيمة الثابت 󰏡=𞸑𞸁𞸎، لا بد أن نحسب الوسطين الحسابيين 𞸎، 𞸑. وباستخدام المجاميع الموجودة في الجدول، نجد أن: 𞸎=󰌄𞸎𞸍=٨١٨=٥٢٫٢،𞸑=󰌄𞸑𞸍=١٫٥٤٨=١٥٤٠٨=٥٧٣٦٫٥.

ومن ثَمَّ، بوضع هذه القيم في الصورة الكسرية لضمان الدقة، إلى جانب قيمة 𞸁، التي تساوي ٧٣٩٠٢٤، فإن الجزء المقطوع من المحور 𞸑 هو: 󰏡=١٥٤٠٨󰂔٧٣٩٠٢٤󰂓٨١٨=٧٥٦٫٠١.بءأ

إذن، بالتقريب إلى أقرب جزء من ألف، فإن معادلة خط انحدار 𞸑 على 𞸎 باستخدام المربعات الصغرى لهذه البيانات هي 󰂝𞸑=٧٥٦٫٠١١٣٢٫٢𞸎.

في المثال التالي، نُطبِّق ما تعلَّمناه عن حساب خط الانحدار باستخدام المربعات الصغرى في مواقف حياتية. ولكن عند التفكير في متغيِّرات الحياة الواقعية في سياق الانحدار، إن أمكن، علينا أولًا أن نُحدِّد أيٌّ من هذه المتغيِّرات هو المتغيِّر التابع، وأيُّها المتغيِّر المستقل. يُعرَّف هذان النوعان كالآتي.

تعريف: المتغيِّرات المستقلة والتابعة

المتغيِّرات المستقلة هي متغيِّرات ربما يُمكننا التحكُّم فيها أو تغييرها، ونعتقد أن لها تأثيرًا مباشرًا على متغيِّر تابع. تُسمَّى المتغيِّرات المستقلة أحيانًا بالمتغيِّرات التوضيحية، ويُشار إليها عادةً بالرمز 𞸎، أو 𞸎𞸤=١،،𞸍𞸤 لعدد 𞸍 من المتغيِّرات التوضيحية.

المتغيِّرات التابعة هي المتغيِّرات التي يجري اختبارها وتعتمد على متغيِّرات مستقلة. عادةً ما تُسمَّى المتغيِّرات التابعة بمتغيِّرات الاستجابة؛ لأنها تستجيب للتغيُّرات في المتغيِّرات التوضيحية، ويُشار إليها عادةً بالرمز 𞸑.

مثال ٤: إيجاد معادلة خط الانحدار في نموذج الانحدار

باستخدام المعلومات في الجدول، أوجد خط انحدار 󰂝𞸑=󰏡+𞸁𞸎. قرِّب 󰏡، 𞸁 لأقرب ٣ منازل عشرية.

الأرض الزراعية بالفدان١٢٦ ١٣ ١٠٤ ١٨٠ ٣٨ ١٦١ ١٤ ٩٩ ٥٥ ١٧٧
إنتاج محصول الصيف بالكيلوجرام ١٦٠ ٤٠ ٨٠ ٣٤٠ ٢٦٠ ٢٠٠ ٢٨٠ ٢٨٠ ١٤٠ ١٠٠

الحل

نبدأ بتحديد أيٌّ من هذه المتغيِّرات هو المتغيِّر المستقل، وأيُّها المتغيِّر التابع. وبما أننا نتوقَّع أن تعتمد كمية المحصول الصيفي على مساحة الأرض التي يُزرَع فيها، إذن من المنطقي أن يكون المتغيِّر «الإنتاج» هو المتغيِّر التابع (𞸑)، والمتغيِّر «الأرض» هو المتغيِّر المستقل (𞸎).

لإيجاد معادلة خط الانحدار باستخدام المربعات الصغرى، 󰂝𞸑=󰏡+𞸁𞸎، لا بد أن نُوجِد قيمة الميل أو معامل الانحدار 𞸁، والجزء المقطوع من المحور 𞸑، وهو 󰏡. لدينا عشرة أزواج من البيانات؛ أيْ عشرة قياسات للمتغيِّر المستقل «الأرض الزراعية بالفدان»، و١٠ قياسات للمتغيِّر التابع «محصول الصيف بالكيلوجرام»؛ ومن ثَمَّ، 𞸍=٠١، ويمكننا إذن استخدام الصيغة الآتية لحساب قيمة 𞸁: 𞸁=𞹛𞹛=𞸍󰌄𞸎𞸑󰌄𞸎󰌄𞸑𞸍󰌄𞸎󰁓󰌄𞸎󰁒.𞸎𞸑𞸎𞸎٢٢

ومن ثَمَّ، علينا إيجاد المجاميع 󰌇𞸎𞸑، 󰌇𞸎، 󰌇𞸑، 󰌇𞸎٢. نضع البيانات في جدول يحتوي على أعمدة بها قيم حواصل الضرب 𞸎𞸑، وكذلك قيم 𞸎٢؛ بحيث يصبح بإمكاننا حساب المجاميع المطلوبة بسهولة أكثر.

الأرض الزراعية (فدان) 𞸎محصول الصيف (كجم) 𞸑𞸎𞸑𞸎٢
١٢٦١٦٠٢٠‎ ‎١٦٠١٥ ١٥٦
١٣٤٠٥٢٠١٦٩
١٠٤٨٠٨‎ ‎٣٢٠١٠‎ ‎٨١٦
١٨٠٣٤٠٦١‎ ‎٢٠٠٣٢ ٣٢
٣٨٢٦٠٩‎ ‎٨٨٠١‎ ‎٤٤٤
١٦١٢٠٠٣٢‎ ‎٢٠٠٢٥‎ ‎٩٢١
١٤٢٨٠٣‎ ‎٩٢٠١٩٦
٩٩٢٨٠٢٧‎ ‎٧٢٠٩‎ ‎٨٠١
٥٥١٤٠٧‎ ‎٧٠٠٣‎ ‎٠٢٥
١٧٧١٠٠١٧ ١٧٣١‎ ‎٣٢٩
المجموع󰌇𞸎=٧٦٩󰌇𞸑=٠٨٨١󰌇𞸎𞸑=٠٢٣٩٨١󰌇𞸎=٧٧٩٠٣١٢

إذن قمنا بحساب المجاميع، الموجودة في الصف الأخير، لكل عمود، ويمكننا الآن استخدامهما في الصيغة لإيجاد 𞸁: 𞸁=٠١×٠٢٣٩٨١٧٦٩×٠٨٨١٠١×٧٧٩٠٣١(٧٦٩)=٠٠٢٣٩٨١٠٦٩٧١٨١٠٧٧٩٠٣١٩٨٠٥٣٩=٠٤٢٥٧١٨٦٤٧٣١٨٠٠٢٫٠=١٠٢٫٠.٢بثزل

الجزء المقطوع من المحور 𞸑 يُعطَى من العلاقة 󰏡=𞸑𞸁𞸎؛ حيث 𞸎 الوسط الحسابي لقيم 𞸎، 𞸑 الوسط الحسابي لقيم 𞸑. وهما: 𞸎=󰌄𞸎𞸍=٧٦٩٠١=٧٫٦٩،𞸑=󰌄𞸑𞸍=٠٨٨١٠١=٨٨١.

بحساب قيمة 󰏡، نحصل على: 󰏡=٨٨١٧٫٦٩×١٠٢٫٠=٨٨١٧٦٣٤٫٩١=٣٦٥٫٨٦١.بثزل

بتقريب قيمتَي معامل الانحدار والجزء المقطوع من المحور 𞸑، لأقرب ثلاث منازل عشرية، فإن خط الانحدار باستخدام المربعات الصغرى هو 󰂝𞸑=١٠٢٫٠𞸎+٣٦٥٫٨٦١.

يمكننا تفسير ذلك على النحو الآتي: لكل وحدة إضافية من الأرض الزراعية بالفدان، نتوقَّع أن يزداد إنتاج محصول الصيف بمقدار ٠٫٢ كجم تقريبًا. يمكننا تفسير قيمة 󰏡 أيضًا؛ حيث تمثِّل الجزء المقطوع من المحور 𞸑. لكن يجب علينا مراعاة أن يكون تفسيرنا منطقيًّا في سياق البيانات. في هذه الحالة، لدينا 󰏡=٣٦٥٫٨٦١، إذن يمكننا استنتاج أنه إذا لم تُوجَد أرض زراعية؛ أي 𞸎=٠، فربما نتوقَّع أن نحصل على ١٦٨٫٥٦٣ كجم من المحصول الصيفي، وهو أمر غير منطقي من الناحية الفيزيائية. وربما نستنتج أننا بدأنا بكمية مقدارها ١٦٨٫٥٦٣ كجم من المحصول الصيفي من مصادر أخرى، لكن البيانات لا تعطينا هذه المعلومة. هذا يوضِّح ضرورة الانتباه عند التفكير في سلوك المتغيِّرات خارج نطاق البيانات المُعطاة.

بمجرد أن يصبح لدينا نموذج انحدار، وفي حالة البيانات الخطية يكون هو خط الانحدار باستخدام المربعات الصغرى، يمكننا استخدام هذا النموذج بحرص لتقدير قيم المتغيِّر التابع. نستعرض كيفية تطبيق ذلك في المثال الآتي.

مثال ٥: حساب القيمة التقديرية لمتغيِّر عند نقطة مُعطاة في نموذج انحدار

باستخدام بيانات الجدول، احسب قيمة 𞸑 عندما تكون 𞸎=٣١. قرِّب إجابتك لأقرب عدد صحيح.

𞸎 ٢٣ ٩ ٢٤ ١٥ ٧ ١٢
𞸑 ٢٢ ٢٤ ٢٥ ١٣ ٢١ ٩

الحل

لدينا مجموعة بيانات ذات متغيِّرين تحتوي على ستة أزواج من القيم لكلٍّ من المتغيِّرين 𞸎، 𞸑. لتقدير قيمة 𞸑 المناظرة لقيمة 𞸎 مُعطاة، بافتراض أن البيانات خطية تقريبًا، علينا أولًا إيجاد معادلة خط الانحدار، 󰂝𞸑=󰏡+𞸁𞸎. للقيام بذلك، علينا أولًا حساب الميل 𞸁 باستخدام الصيغة الآتية: 𞸁=𞹛𞹛=𞸍󰌄𞸎𞸑󰌄𞸎󰌄𞸑𞸍󰌄𞸎󰁓󰌄𞸎󰁒.𞸎𞸑𞸎𞸎٢٢

هذا يتطلَّب إيجاد المجاميع 󰌇𞸎𞸑، 󰌇𞸎، 󰌇𞸑، 󰌇𞸎٢، وبوضع البيانات في جدول يحتوي على أعمدة بها قيم حواصل الضرب 𞸎𞸑، وكذلك قيم 𞸎٢، يمكننا حساب ذلك بسهولة.

𞸎𞸑𞸎𞸑𞸎٢
٢٣٢٢٥٠٦٥٢٩
٩٢٤٢١٦٨١
٢٤٢٥٦٠٠٥٧٦
١٥١٣١٩٥٢٢٤
٧٢١١٤٧٤٩
١٢٩١٠٨١٤٤
المجموع󰌇𞸎=٠٩󰌇𞸑=٤١١󰌇𞸎𞸑=٢٧٧١󰌇𞸎=٤٠٦١٢

بالتعويض بالمجاميع اللازمة في صيغة 𞸁، نحصل على: 𞸁=٦×٢٧٧١٠٩×٤١١٦×٤٠٦١(٠٩)=٢٣٦٠١٠٦٢٠١٤٢٦٩٠٠١٨=٢٧٣٤٢٥١٥٤٩٠٤٤٢٫٠=٤٤٢٫٠.٢بثزل

الجزء المقطوع من المحور 𞸑 هو 󰏡=𞸑𞸁𞸎، وسنستخدم قيمة 𞸁 لحساب ذلك. لكن، في البداية يجب أن نتمكَّن من إيجاد الوسطين الحسابيين لكلٍّ من قيم 𞸎، 𞸑. وهما: 𞸎=󰌄𞸎𞸍=٠٩٦=٥١،𞸑=󰌄𞸑𞸍=٤١١٦=٩١.

بالتعويض بهذه القيم، نحصل على: 󰏡=٩١٥٤٩٠٤٤٢٫٠×٥١٦٨٣٣٫٥١.

إذن خط الانحدار هو 󰂝𞸑=٦٨٣٣٫٥١+٥٤٩٠٤٤٢٫٠𞸎. وبالتعويض عن قيمة 𞸎=٣١، نجد أن: 󰂝𞸑=٦٨٣٣٫٥١+٥٤٩٠٤٤٢٫٠٣١٢١٥٫٨١.

ومن ثَمَّ، عند 𞸎=٣١ نُقدِّر أن 𞸑=٩١ لأقرب عدد صحيح.

في هذا المثال، قدَّرنا قيمة المتغيِّر التابع 𞸑 لقيمة 𞸎 تقع داخل نطاق القيم المعلومة لدينا. هذا يُسمَّى الاستكمال الداخلي، والتعريف الآتي يوضِّح ذلك.

التعريف

الاستكمال الداخلي: تقدير أو توقُّع قيمة المتغيِّر التابع عند قيمة من داخل نطاق القيم المعلومة للمتغيِّر المستقل.

الاستكمال الخارجي: تقدير أو توقُّع قيمة المتغيِّر التابع عند قيمة من خارج نطاق القيم المعلومة للمتغيِّر المستقل.

يجب استخدام الاستكمال الخارجي بحذر شديد إذا دعت الحاجة؛ فقد يتغيَّر سلوك المتغيِّرات خارج نطاق البيانات المعلوم، ما يؤدِّي إلى حدوث أخطاء. ولذلك، يجب أن نتجنَّب الاستكمال الخارجي كلما أمكن.

نُنهي هذا الشارح بمراجعة بعض النقاط الرئيسية التي تناولناها.

النقاط الرئيسية

  • خط الانحدار باستخدام المربعات الصغرى هو نموذج خطي لمجموعات بيانات ذات متغيِّرين مكوَّنة من عدد 𞸍 من نقاط البيانات (𞸎،𞸑)؛ حيث 𞸎 المتغيِّر المستقل أو التوضيحي، 𞸑 المتغيِّر التابع أو متغيِّر الاستجابة.
  • خط الانحدار باستخدام المربعات الصغرى هو الخط الذي يكون مجموع مربع المسافات بينه وبين نقاط البيانات أقل ما يمكن. معادلة خط الانحدار هي: 󰂝𞸑=󰏡+𞸁𞸎، حيث: 𞸁=𞹛𞹛=𞸍󰌄𞸎𞸑󰌄𞸎󰌄𞸑𞸍󰌄𞸎󰁓󰌄𞸎󰁒󰏡=𞸑𞸁𞸎،𞸎𞸑𞸎𞸎٢٢ حيث 𞸎=󰌄𞸎𞸍 الوسط الحسابي لقيم 𞸎، 𞸑=󰌄𞸑𞸍 الوسط الحسابي لقيم 𞸑، 𞹛=󰌇𞸎𞸑󰌄𞸎󰌄𞸑𞸍،𞹛=󰌇𞸎󰁓󰌄𞸎󰁒𞸍.𞸎𞸑𞸎𞸎٢٢
  • يمكن كتابة الميل، 𞸁، على الصورة 𞸁=𞸓𞹏𞹏𞸑𞸎؛ حيث 𞸓 معامل الارتباط ، 𞹏𞸑، 𞹏𞸎 الانحرافان المعياريان لـ 𞸎، 𞸑.
  • يمكننا استخدام خط انحدار باستخدام المربعات الصغرى لتقدير أو توقُّع قيم المتغيِّر التابع أو باستخدام الاستكمال الداخلي؛ أيْ باستخدام قيم 𞸎 داخل النطاق المعلوم. أما الاستكمال الخارجي، فيعني استخدام قيم من خارج هذا النطاق في التقدير أو التوقُّع، ولا يُنصَح به؛ لأن النتائج قد يكون بها أخطاء.

تستخدم نجوى ملفات تعريف الارتباط لضمان حصولك على أفضل تجربة على موقعنا. معرفة المزيد حول سياسة الخصوصية لدينا.