نسخة الفيديو النصية
في هذا الفيديو، سوف نتعلم كيف نوجد ونستخدم معادلة خط الانحدار باستخدام طريقة المربعات الصغرى. استخدم مصطلح الانحدار لأول مرة من قبل عالم الإحصاء الإنجليزي السير فرانسيس جالتون في الحقبة الفيكتورية عندما كان يدرس العلاقة بين أطوال الآباء وأطوال أبنائهم. ووجد أن الأبناء من آباء أكثر طولًا يصبحون أقصر قليلًا من آبائهم عندما يكبرون، أما الأبناء من آباء أقل طولًا يصبحون أطول من آبائهم عندما يكبرون. وقد أطلق على هذا التأثير «الانحدار نحو المتوسط»؛ أي إن الأطوال كانت تئول، أو تنحدر، نحو القيمة المتوسطة.
في وقتنا الحالي، نستخدم تحليل الانحدار للتعرف على العلاقات بين المتغيرات وتحليلها. وتتيح لنا طريقة انحدار المربعات الصغرى تحديد خط أفضل مطابقة لمجموعة من البيانات الثنائية المتغير. وفي هذا الفيديو، سوف نتعلم كيف نوجد خط الانحدار باستخدام المربعات الصغرى باستخدام صيغ المعاملات في معادلة الخط. إننا نعلم أن البيانات الثنائية المتغير هي بيانات تجمع من متغيرين كميين، أي متغيرين عدديين، حيث توزع الملاحظات في أزواج لكل عنصر من عناصر البحث. على سبيل المثال، سنقول إن ﺱ يساوي الطول وﺹ يساوي الوزن. إذا كان لدينا عدد ﻥ من الأشخاص في العينة، فإن مجموعة البيانات لدينا ستتألف من عدد ﻥ من أزواج القياسات، وكل زوج يرتبط بشخص واحد. لذا، على سبيل المثال، سيكون ﺱ واحد هو طول الشخص رقم واحد، وﺹ واحد هو وزن الشخص رقم واحد.
والآن افترض أن شكل الانتشار ومعامل الارتباط هنا يشيران إلى أن متغيري الطول والوزن مرتبطان ارتباطًا خطيًّا. هذا يعني أنه كلما ازداد متغير، ازداد الآخر خطيًّا أو تناقص خطيًّا. ستكون خطوتنا التالية هي محاولة تمثيل هذه العلاقة بالخط الذي يلائم البيانات التي لدينا على أفضل نحو. أي إننا نريد إيجاد الخط المستقيم، ﺹ يساوي ﺃ زائد ﺏ ﺱ، الذي تكون المسافة بينه وبين نقاط البيانات التي لدينا أقل ما يمكن. المسافة الرأسية بين النقطة ﺱ، ﺹ والخط المستقيم تساوي ﺹ ناقص ﺹ هات؛ حيث ﺹ هات هي قيمة ﺹ على الخط المستقيم المرتبطة بتلك النقطة الواقعة فوق ﺱ مباشرة. يطلق على هذه المسافة لكل نقطة اسم المسافة المتبقية أو الخطأ. خط انحدار المربعات الصغرى، الذي سنراه عادة وعليه علامة هات فوق الحرف ﺹ، يقلل مجموع مربعات الأخطاء؛ ومن هنا أتت عبارة «المربعات الصغرى».
إذن، كيف نوجد خط الانحدار باستخدام المربعات الصغرى؟ إذا كان ﺹ هات يساوي ﺃ زائد ﺏ ﺱ هو خط انحدار المربعات الصغرى لمجموعة من البيانات الثنائية المتغير والتي متغيراها هما ﺱ وﺹ، فإن الميل ﺏ يعطى بالعلاقة ﻍﺱﺹ على ﻍﺱﺱ، حيث ﻍﺱﺹ هو مجموع حواصل ضرب ﺱﺹ ناقص مجموع قيم ﺱ مضروبًا في مجموع قيم ﺹ مقسومًا على ﻥ. وﻍﺱﺱ هو مجموع مربعات قيم ﺱ ناقص مجموع قيم ﺱ الكل تربيع مقسومًا على ﻥ. وﻥ هو عدد أزواج البيانات. إذن، إذا كانت لدينا مجموعة من البيانات الثنائية المتغير، فستكون هذه هي الطريقة التي نوجد بها ميل الخط المستقيم الذي لدينا؛ أي ﺏ. الجزء المقطوع من المحور ﺹ، أي ﺃ، يعطى بالعلاقة ﺹ بار، وهو الوسط الحسابي لقيم ﺹ، ناقص ﺏ في الوسط الحسابي لقيم ﺱ؛ حيث نعلم أن الوسط الحسابي لقيم ﺹ هو مجموع قيم ﺹ مقسومًا على ﻥ، وبالمثل مع ﺱ.
يمكننا أن نلاحظ من الصيغ التي لدينا أنه لإيجاد الجزء المقطوع من المحور ﺹ، أي ﺃ، علينا أولًا إيجاد الميل ﺏ والوسط الحسابي لقيم ﺱ والوسط الحسابي لقيم ﺹ. قد تلاحظ أن بعضًا من هذه التعبيرات مكتوب بصور مختلفة قليلًا، ولكنها مكافئة. لذا دعونا نذكر بعضًا منها. يمكننا أن نكتب الميل ﺏ أيضًا على الصورة ﺭ مضروبًا في ﻍﺹ على ﻍﺱ؛ حيث ﺭ هو معامل ارتباط بيرسون، وﻍﺹ هو الانحراف المعياري لـ ﺹ، وﻍﺱ هو الانحراف المعياري لـ ﺱ. إذا عوضنا بالتعبيرات التي لدينا عن ﻍﺱﺹ وﻍﺱﺱ في الصيغة لدينا لـ ﺏ، فسيكون التعبير الدال على ﺏ كما هو موضح. وفي الواقع، سنستخدم هذا في أمثلتنا. يمكنك أيضًا ملاحظة أن ﻍﺱﺹ وﻍﺱﺱ مكتوبان كما هو موضح.
والآن بعد أن أصبحت لدينا الصيغ الدالة على المعاملين ﺃ وﺏ، دعونا نتناول مثالًا نرى فيه كيف نوجد الميل ﺏ لخط الانحدار من ملخص إحصائي.
في مجموعة البيانات المعطاة، مجموع قيم ﺱ يساوي ٤٧، ومجموع قيم ﺹ يساوي ٤٥٫٧٥، ومجموع مربعات قيم ﺱ يساوي ٣٢٩، ومجموع مربعات قيم ﺹ يساوي ٣٨٩٫٣١٢٥، ومجموع حواصل ضرب ﺱﺹ يساوي ٣١٠٫٢٥، وﻥ يساوي ثمانية. احسب قيمة معامل الانحدار ﺏ في نموذج انحدار المربعات الصغرى ﺹ يساوي ﺃ زائد ﺏ ﺱ. قرب إجابتك لأقرب ثلاث منازل عشرية.
حسنًا، لدينا هنا ملخص إحصائي لمجموعة من البيانات. لدينا مجموع قيم ﺱ، ومجموع قيم ﺹ، ومجموع مربعات قيم ﺱ، ومجموع مربعات قيم ﺹ، ومجموع حواصل ضرب ﺱﺹ. ونعرف أن مجموعة البيانات التي لدينا تتألف من عدد ﻥ من أزواج البيانات الثنائية المتغير، وهذا العدد يساوي ثمانية. ومطلوب منا إيجاد المعامل ﺏ، أي ميل الخط المستقيم، في نموذج انحدار المربعات الصغرى ﺹ يساوي ﺃ زائد ﺏ ﺱ. إننا نستخدم الصيغة الموضحة لحساب ﺏ، وسنبدأ بكتابة الملخص الإحصائي الذي لدينا.
بما أنه معطى لدينا قيمة ﻥ، ومجموع حواصل ضرب ﺱﺹ، ومجموع قيم ﺱ، ومجموع قيم ﺹ، ومجموع مربعات قيم ﺱ، فالقيمة الوحيدة التي علينا إيجادها لنتمكن من استخدام الصيغة هي مجموع قيم ﺱ الكل تربيع. وبما أن مجموع قيم ﺱ يساوي ٤٧، فإن مجموع قيم ﺱ الكل تربيع يساوي ٤٧ تربيع؛ أي ٢٢٠٩. إذن، بالتعويض بالقيم التي لدينا في الصيغة، يصبح لدينا ثمانية، أي قيمة ﻥ، مضروبًا في ٣١٠٫٢٥، وهو مجموع حواصل الضرب، ناقص مجموع قيم ﺱ، أي ٤٧، مضروبًا في مجموع قيم ﺹ، أي ٤٥٫٧٥، الكل على ثمانية مضروبًا في ٣٢٩ ناقص ٢٢٠٩. بإيجاد قيم حواصل الضرب، نحصل على ٢٤٨٢ ناقص ٢١٥٠٫٢٥ مقسومًا على ٢٦٣٢ ناقص ٢٢٠٩. إذن، قيمة البسط تساوي ٣٣١٫٧٥ وقيمة المقام تساوي ٤٢٣؛ أي ٠٫٧٨٤٢٨ تقريبًا. وذلك لأقرب خمس منازل عشرية.
إذن، لأقرب ثلاث منازل عشرية، نجد أن معامل الانحدار ﺏ يساوي ٠٫٧٨٤.
وعلى الرغم من أنه ليس مطلوبًا منا هنا إيجاد معادلة خط الانحدار والجزء المقطوع من المحور ﺹ، أي ﺃ — الذي يعطى بالعلاقة ﺹ بار ناقص ﺏ في ﺱ بار؛ حيث ﺹ بار وﺱ بار هما الوسط الحسابي لقيم ﺹ وقيم ﺱ على الترتيب — يمكننا حساب ﺃ بسرعة؛ ومن ثم إيجاد معادلة خط الانحدار. الوسط الحسابي لقيم ﺹ هو مجموع قيم ﺹ مقسومًا على ﻥ؛ أي ٤٥٫٧٥ مقسومًا على ثمانية. وهذا يساوي ٥٫٧١٨٧٥. وبالمثل، الوسط الحسابي لقيم ﺱ هو مجموع قيم ﺱ على ﻥ. وهذا يساوي ٤٧ على ثمانية؛ ما يساوي ٥٫٨٧٥. بالتعويض بهذه القيم في الصيغة التي لدينا لإيجاد ﺃ، يصبح لدينا ﺃ يساوي ٥٫٧١٨٧٥، وهذا هو الوسط الحسابي لقيم ﺹ، ناقص ٠٫٧٨٤٢٨، أي قيمة ﺏ مقربة لأقرب خمس منازل عشرية لدواعي الدقة، مضروبًا في ٥٫٨٧٥، وهو الوسط الحسابي لقيم ﺱ. وعليه، فإن ﺃ، الجزء المقطوع من المحور ﺹ، يساوي ١٫١١١ إلى أقرب ثلاث منازل عشرية.
إذن، معادلة خط انحدار المربعات الصغرى لمجموعة البيانات هي ﺹ يساوي ١٫١١١ زائد ٠٫٧٨٤ﺱ؛ حيث حسبنا المعاملين لأقرب ثلاث منازل عشرية.
في هذا المثال، كان لدينا ملخص إحصائي لمجموعة من البيانات. وفي المثال التالي، سنرى كيف نوجد خط انحدار المربعات الصغرى من البيانات نفسها.
يوضح شكل الانتشار الآتي مجموعة بيانات يبدو نموذج الانحدار الخطي مناسبًا لها. البيانات المستخدمة في تكوين شكل الانتشار هذا معطاة في الجدول الآتي. احسب باستخدام المربعات الصغرى معادلة خط انحدار ﺹ على ﺱ، مقربًا معامل الانحدار لأقرب جزء من ألف.
معادلة خط انحدار المربعات الصغرى هي ﺹ هات يساوي ﺃ زائد ﺏ ﺱ؛ حيث ﺹ هات هو القيمة المتوقعة لـ ﺹ لكل قيمة من قيم ﺱ، وﺃ هو الجزء المقطوع من المحور ﺹ، وﺏ هو ميل الخط. لإيجاد معادلة خط الانحدار، فإننا نوجد أولًا الميل ﺏ، والذي يعطى بالصيغة الموضحة. بعد ذلك نستخدم قيمة ﺏ هذه لإيجاد الجزء المقطوع من المحور ﺹ، أي ﺃ، والذي يعطى بواسطة الوسط الحسابي لقيم ﺹ ناقص ﺏ مضروبًا في الوسط الحسابي لقيم ﺱ، حيث نعلم أن الوسط الحسابي لقيم ﺹ يعطى بواسطة مجموع قيم ﺹ مقسومًا على عدد أزواج البيانات ﻥ، وبالمثل مع الوسط الحسابي لقيم ﺱ. في الواقع، في هذا المثال، لدينا ثمانية أزواج من البيانات؛ لذا فإن ﻥ يساوي ثمانية. حسنًا، دعونا ندون هذا هنا.
والآن، لإيجاد المعاملين ﺃ وﺏ، سنحتاج إلى المجاميع المختلفة الموضحة في الصيغتين. ولكي نحسب هذه المجاميع، سنبدأ بتوسيع الجدول لإضافة صف لحواصل ضرب ﺱﺹ وصف آخر لقيم مربعات ﺱ. في الخانة الأولى من الصف الجديد الذي أضفناه لحواصل ضرب ﺱﺹ، لدينا حاصل ضرب القيمة الأولى لـ ﺱ وهي ٠٫٥ في القيمة الأولى لـ ﺹ وهي ٩٫٢٥، وهذا يساوي ٤٫٦٢٥. إذن، نكتب هذه القيمة في الخانة الأولى من الصف الجديد. المدخل الثاني الجديد سيكون القيمة الثانية لـ ﺱ، وهي واحد، مضروبة في القيمة الثانية لـ ﺹ، وهي ٧٫٦. وهذا يساوي ٧٫٦. ونكتب هذا في الخانة الثانية من الصف الجديد لحواصل الضرب. يمكننا إكمال بقية حواصل ضرب ﺱﺹ، كما هو موضح.
المدخل الأول في الصف الثاني الجديد هو مربع قيمة ﺱ الأولى. وهذا يساوي ٠٫٥ تربيع، ما يساوي ٠٫٢٥. ونكتب هذه القيمة في الخانة الأولى من الصف الثاني الجديد. مربع قيمة ﺱ الثانية هو واحد تربيع؛ ما يساوي واحدًا. ويمكننا إكمال بقية قيم ﺱ تربيع في الصف الثاني الجديد، كما هو موضح. والآن تذكر أننا نحاول إيجاد هذا المجموع، لذلك فإن خطوتنا التالية هي أن نجمع قيم كل صف من الصفوف. سنضيف عمودًا جديدًا للمجاميع التي لدينا، وسنجد، على سبيل المثال، أن مجموع قيم ﺱ لدينا هو ١٨. وهذا هو المدخل الأول في العمود الجديد. وبجمع قيم ﺹ التي لدينا نحصل على ٤٥٫١. مجموع حواصل الضرب يساوي ٧٨٫٠٥. ومجموع مربعات قيم ﺱ هو ٥١.
والآن يمكننا استخدام هذه القيم لحساب الميل، ﺏ، لخط الانحدار. إذن، بالتعويض في الصيغة هنا، يصبح لدينا ثمانية، أي قيمة ﻥ، مضروبًا في ٧٨٫٠٥، وهو مجموع حواصل الضرب، ناقص ١٨، أي مجموع قيم ﺱ، مضروبًا في ٤٥٫١، وهو مجموع قيم ﺹ، على ﻥ، أي ثمانية، في ٥١، وهو مجموع مربعات قيم ﺱ، ناقص ١٨ تربيع، أي مجموع قيم ﺱ الكل تربيع. بإيجاد قيم حواصل الضرب، يصبح لدينا ٦٢٤٫٤ ناقص ٨١١٫٨ الكل مقسومًا على ٤٠٨ ناقص ٣٢٤. وبإدخال هذا بحرص على الآلة الحاسبة، نجد أن ﺏ يساوي تقريبًا سالب ٢٫٢٣٠٩٥. وبالتقريب إلى أقرب ثلاث منازل عشرية، أي إلى أقرب جزء من ألف، نجد أن ذلك يساوي سالب ٢٫٢٣١.
يمكننا أن نلاحظ من نقاط البيانات على شكل الانتشار أنه عندما تتزايد قيم ﺱ لنقاط البيانات، تتناقص قيم ﺹ لنقاط البيانات. وهذا تؤكده حقيقة أن قيمة المعامل ﺏ سالبة؛ فهي تساوي سالب ٢٫٢٣١. سنفرغ بعض المساحة لنتمكن من حساب ﺃ، الجزء المقطوع من المحور ﺹ، ونلاحظ من الصيغة التي لدينا أنه سيكون علينا أولًا حساب الوسط الحسابي لقيم ﺱ والوسط الحسابي لقيم ﺹ. الوسط الحسابي لقيم ﺹ هو ٤٥٫١ مقسومًا على ثمانية. وهذا يساوي ٥٫٦٣٧٥. والوسط الحسابي لقيم ﺱ هو ١٨ مقسومًا على ثمانية، ما يساوي ٢٫٢٥.
سنفرغ بعض المساحة مجددًا لنتمكن من استخدام هاتين القيمتين لحساب المعامل ﺃ. لدينا ﺃ يساوي ٥٫٦٣٧٥ ناقص سالب ٢٫٢٣٠٩٥، وهي قيمة ﺏ مقربة لخمس منازل عشرية لدواعي الدقة، مضروبًا في ٢٫٢٥. ونجد أن قيمة هذا تساوي تقريبًا ١٠٫٦٥٧١٤؛ ما يساوي ١٠٫٦٥٧ لأقرب ثلاث منازل عشرية؛ أي لأقرب جزء من ألف. إذن، معادلة خط انحدار المربعات الصغرى لانحدار ﺹ على ﺱ لهذه البيانات هي ﺹ هات يساوي ١٠٫٦٥٧ ناقص ٢٫٢٣١ﺱ الكل إلى أقرب جزء من ألف. لاحظ أننا نكتب ﺹ وعليه علامة هات لنشير إلى أن هذه هي قيمة متوقعة لـ ﺹ من خط الانحدار الذي نحسبه بالبيانات المعطاة. ستلاحظ أن هذا عادة ما يكون مكتوبًا بطريقة مبسطة على الصورة ﺹ يساوي ﺃ زائد ﺏ ﺱ.
والآن، حتى هذه المرحلة، لم نحصل على أي تعريف لما يشير إليه المتغيران ﺱ وﺹ. لكن عندما نتناول متغيرات من الحياة الواقعية في سياق الانحدار، فإننا نحدد أولًا، إن أمكن، أي المتغيرين لدينا هو المتغير التابع وأيهما هو المتغير المستقل. تذكر أن المتغيرات المستقلة هي متغيرات يمكننا أن نتحكم فيها أو نغيرها. ونعتقد أن لها تأثيرًا مباشرًا على متغير تابع. ثمة اسم آخر للمتغيرات المستقلة، وهو «المتغيرات التفسيرية»، وعادة ما يشار إليها بـ ﺱ. أما المتغيرات التابعة فهي متغيرات يتم اختبارها وتعتمد على واحد أو أكثر من المتغيرات المستقلة. وبما أنها تستجيب للتغيرات في المتغير أو المتغيرات المستقلة، فعادة ما يطلق عليها اسم «متغيرات الاستجابة»، وعادة ما يشار إليها بـ ﺹ.
في المثال التالي، سنحسب معاملات خط انحدار المربعات الصغرى لبيانات من الحياة الواقعية. ولذلك، سيكون علينا أن نبدأ بتحديد أي من المتغيرين هو المتغير التابع وأيهما هو المتغير المستقل.
باستخدام المعلومات في الجدول، أوجد خط الانحدار ﺹ هات يساوي ﺃ زائد ﺏ ﺱ. قرب ﺃ وﺏ لأقرب ثلاث منازل عشرية.
حسنًا، بما أننا نريد إيجاد خط الانحدار، سنبدأ بتحديد أي من المتغيرين هو المتغير التابع وأيهما هو المتغير المستقل. يمكننا توقع أن كمية إنتاج المحصول الصيفي بالكيلوجرام تعتمد على مساحة الأرض التي يزرع فيها. ومن ثم نحدد أن الإنتاج بالكيلوجرام هو المتغير التابع ﺹ، بينما مساحة الأرض المزروعة المقيسة بالفدان هي المتغير المستقل ﺱ. ولاحظ أن الفدان الواحد هو وحدة قياس للمساحة تزيد قليلًا عن واحد هكتار.
لإيجاد خط الانحدار، يجب علينا أن نوجد الميل ﺏ والجزء المقطوع من المحور ﺹ؛ أي ﺃ. ولإيجاد هاتين القيمتين، نستخدم الصيغتين الموضحتين. سنحسب أولًا الميل ﺏ لأننا سنحتاج إليه لحساب ﺃ؛ أي الجزء المقطوع من المحور ﺹ. ونلاحظ من الصيغة التي لدينا لـ ﺏ أننا سنحتاج إلى إيجاد مجاميع متنوعة؛ وهي مجموع حواصل ضرب ﺱﺹ، ومجموع قيم ﺱ، ومجموع قيم ﺹ، ومجموع مربعات قيم ﺱ، وسنحتاج أيضًا إلى إيجاد مجموع قيم ﺱ الكل تربيع. ولإيجاد قيمة ﺃ، سيكون علينا إيجاد الوسط الحسابي لقيم ﺹ، أي مجموع قيم ﺹ مقسومًا على ﻥ، وهو عدد أزواج البيانات، وبالمثل مع الوسط الحسابي لقيم ﺱ.
في مجموعة البيانات هذه، لدينا ١٠ أزواج من البيانات؛ لذا ﻥ يساوي ١٠. وسنكتب ملاحظة بهذا قبل أن نبدأ في إجراء عملياتنا الحسابية. خطوتنا التالية هي إيجاد المجاميع. ولإيجاد مجموع حواصل ضرب ﺱﺹ ومجموع مربعات قيم ﺱ، علينا أولًا أن نضيف صفين جديدين إلى الجدول الذي لدينا. لحساب حواصل ضرب ﺱﺹ، نضرب قيمة ﺱ الأولى وقيمة ﺹ الأولى؛ حيث نضرب ١٢٦ في ١٦٠. وهذا يساوي ٢٠١٦٠. ونكتب هذه القيمة في الخانة الأولى من الصف الأول الجديد. حاصل الضرب الثاني هو القيمة الثانية لـ ﺱ، مضروبة في القيمة الثانية لـ ﺹ. أي ١٣ مضروبًا في ٤٠؛ ما يساوي ٥٢٠. ونكتب هذه القيمة في الخانة الثانية من الصف الأول الجديد. يمكننا بعد ذلك أن نكمل هذا الصف بحواصل الضرب كما هو موضح.
العنصر الأول في الصف الثاني الجديد هو مربع قيمة ﺱ الأولى، أي ١٢٦ تربيع، وهذا يساوي ١٥٨٧٦. ونكتب هذه القيمة في الصف الثاني الجديد. مربع قيمة ﺱ الثانية هو ١٣ تربيع؛ ما يساوي ١٦٩. ونكتب هذه القيمة في الخانة الثانية من الصف الثاني الجديد. ونتابع بهذه الطريقة لإكمال الصف. خطوتنا التالية هي إيجاد مجموع القيم في كل صف من الصفوف. ولذلك، سنضيف عمودًا جديدًا. مجموع قيم ﺱ يساوي ٩٦٧. مجموع قيم ﺹ يساوي ١٨٨٠. مجموع حواصل ضرب ﺱﺹ يساوي ١٨٩٣٢٠. ومجموع مربعات قيم ﺱ هو ١٣٠٩٧٧. وبعد أصبحت لدينا كل المجاميع، يمكننا الآن حساب ﺏ.
بالتعويض بالمجاميع التي لدينا في صيغة إيجاد ﺏ التي فيها قيمة ﻥ تساوي ١٠، يصبح لدينا ١٠ في ١٨٩٣٢٠، وهو مجموع حواصل ضرب ﺱﺹ، ناقص ٩٦٧، أي مجموع قيم ﺱ، مضروبًا في ١٨٨٠، أي مجموع قيم ﺹ، الكل مقسومًا على ١٠، وهو قيمة ﻥ، مضروبًا في مجموع مربعات قيم ﺱ، أي ١٣٠٩٧٧، ناقص ٩٦٧ تربيع. وهو مجموع قيم ﺱ الكل تربيع. وبحساب قيمة كل من البسط والمقام، نحصل على ٧٥٢٤٠ مقسومًا على ٣٧٤٦٨١. وقيمة هذا تساوي تقريبًا ٠٫٢٠٠٨١. إذن، نجد أن قيمة ﺏ، لأقرب ثلاث منازل عشرية، تساوي ٠٫٢٠١.
والآن، لإيجاد الجزء المقطوع من المحور ﺹ، أي ﺃ، علينا إيجاد الوسط الحسابي لكل من قيم ﺹ وقيم ﺱ. الوسط الحسابي لقيم ﺹ هو مجموع كل قيم ﺹ مقسومًا على ﻥ. أي ١٨٨٠ مقسومًا على ١٠، وهذا يساوي ١٨٨. وبالمثل، الوسط الحسابي لقيم ﺱ هو مجموع قيم ﺱ مقسومًا على ﻥ. أي ٩٦٧ مقسومًا على ١٠؛ ما يساوي ٩٦٫٧. إذن، يمكننا الآن استخدام هذه القيم إلى جانب قيمة الميل ﺏ — حيث سنستخدم قيمة ﺏ لأقرب خمس منازل عشرية لدواعي الدقة — لحساب ﺃ؛ أي الجزء المقطوع من المحور ﺹ. بحساب قيمة هذا نجد أن ﺃ يساوي ١٦٨٫٥٨١٦٧ وهكذا مع توالي الأرقام. وذلك يساوي ١٦٨٫٥٨٢، لأقرب ثلاث منازل عشرية. إذن، خط انحدار المربعات الصغرى لهذه البيانات مع تقريب القيم لأقرب ثلاث منازل عشرية هو ﺹ هات يساوي ١٦٨٫٥٨٢ زائد ٠٫٢٠١ﺱ.
يمكننا تفسير هذا بأنه لكل وحدة إضافية من مساحة الأرض، نتوقع أن يزداد إنتاج المحصول الصيفي بمقدار ٠٫٢ كيلوجرام تقريبًا.
ما إن يصبح لدينا خط الانحدار، يمكننا استخدامه لتقدير قيم المتغير التابع لقيم معينة للمتغير المستقل ﺱ. لكن إذا فعلنا هذا، يجب علينا أن نحرص على أن نقيد أنفسنا بقيم لـ ﺱ ضمن نطاق البيانات المعطاة. دعونا نتناول كيف يمكن أن ينجح هذا باستخدام المتغيرات المعطاة في هذا المثال. المتغير التابع ﺹ هو إنتاج المحصول بالكيلوجرام، والمتغير المستقل ﺱ هو مساحة الأرض المزروعة مقيسة بالفدان. خط انحدار المربعات الصغرى، الذي حسبناه للتو لأقرب ثلاث منازل عشرية من البيانات المعطاة، هو ﺹ يساوي ١٦٨٫٥٨٢ زائد ٠٫٢٠١ﺱ.
والآن، سنفترض أننا نريد معرفة عدد الكيلوجرامات من المحصول الصيفي التي نتوقع الحصول عليها من ١٠٠ فدان من الأرض المزروعة. بالتعويض عن ﺱبـ ١٠٠ في المعادلة التي لدينا، نحصل على ١٨٨٫٦٨٢ كيلوجرامًا. وذلك لأقرب ثلاث منازل عشرية. والآن من المقبول أن نستخدم قيمة ﺱ هذه بما أنها تقع ضمن نطاق بيانات ﺱ المعطاة؛ أي بين ١٣ و١٨٠. لذا يمكننا أن نعوض عن ﺱ في معادلة خط الانحدار لتقدير قيمة ﺹ؛ أي إنتاج المحصول.
دعونا الآن نتناول ما قد يحدث إذا حاولنا أن نتوقع باستخدام قيمة لـ ﺱ تقع خارج نطاق البيانات. لنفترض أن ﺱ يساوي صفرًا. هذا يعني أننا سنحصل على قيمة الجزء المقطوع من المحور ﺹ. إذا عوضنا عن ﺱ بصفر في المعادلة التي لدينا، فسنجد أن ﺹ هات يساوي ١٦٨٫٥٨٢. لكن هذا يخبرنا أنه بعدد صفر من وحدات الأرض المزروعة، يقدر إنتاج المحصول بـ ١٦٩ كيلوجرامًا تقريبًا، وهو أمر غير معقول لأنه إذا لم يكن لدينا أرض زراعية، فلن نتمكن من إنتاج أي محاصيل. هذا مثال على الاستكمال الخارجي؛ حيث نحاول أن نتوقع قيمة المتغير التابع خارج نطاق البيانات المعطاة. والاستكمال الداخلي، من الناحية الأخرى، هو عندما نحاول أن نقدر قيمة المتغير التابع ضمن نطاق البيانات المعطاة. يوضح هذا المثال أنه ينبغي استخدام الاستكمال الخارجي بأقصى درجة من الحذر.
دعونا نختتم هذا الفيديو باسترجاع بعض النقاط الرئيسية التي تناولناها. خط انحدار المربعات الصغرى ﺹ هات يساوي ﺃ زائد ﺏ ﺱ هو نموذج خطي للبيانات الثنائية المتغير. يمكن حساب المعامل ﺏ، أي ميل خط الانحدار، وﺃ، وهو الجزء المقطوع من المحور ﺹ، باستخدام الصيغتين الموضحتين؛ حيث ﺹ بار هو الوسط الحسابي لقيم ﺹ وﺱ بار هو الوسط الحسابي لقيم ﺱ وﻥ هو عدد أزواج البيانات. يمكننا استخدام نموذج الانحدار لتقدير قيم ﺹ باستخدام قيم لـ ﺱ ضمن نطاق البيانات المعطاة. وهذا يطلق عليه «الاستكمال الداخلي». أما استخدام قيم لـ ﺱ خارج نطاق البيانات المعروفة لتقدير أو توقع قيم ﺹ، أو ما يطلق عليه «الاستكمال الخارجي»، فلا ينصح به.