نسخة الفيديو النصية
في هذا الفيديو، سوف نتناول طريقة خط الانحدار باستخدام المربعات الصغرى لإيجاد معادلة خط أفضل مطابقة من خلال نقاط على مخطط الانتشار. كما سنتحدث قليلًا عن النظرية التي تعتمد عليها هذه الطريقة، وكيفية استخدام معادلة الانحدار وتفسيرها عند إيجادها. هيا نلق نظرة على مثال لمسألة قد تحتاج فيها إلى حساب معادلة خط الانحدار باستخدام المربعات الصغرى.
أجرى بعض الطلاب تجربة علقوا فيها أجسامًا بكتل مختلفة من زنبرك. وقاسوا طول الزنبرك في كل مرة. أوجد معادلة خط الانحدار باستخدام المربعات الصغرى. نرى هنا أنهم عندما علقوا، مثلًا، كتلة مقدارها ١٠ كيلوجرامات من الزنبرك، كان طوله ١٢ سنتيمترًا. وعندما علقوا كتلة مقدارها ٢٠ كيلوجرامًا، كان طول الزنبرك ١٦ سنتيمترًا، وهكذا. إذن، هذه البيانات ذات متغيرين. وهما الكتلة والطول. وكل نقطتين من نقاط البيانات تتعلق بحدث معين. وضع كتلة مقدارها ٢٠ كيلوجرامًا في الزنبرك يجعل طوله يمتد إلى ١٦ سنتيمترًا.
الآن، ما علينا التفكير فيه أولًا هو أي هذين المتغيرين هو المتغير التابع. وأيهما المتغير المستقل. المتغير المستقل هو المتغير الذي تتحكم فيه أو تغيره عادة. وهو المتغير الذي يحدث تغيرات في قيمة المتغير الآخر، أي المتغير التابع. إذن، المتغير التابع يعتمد على قيمة المتغير الآخر. ونحن هنا نختار الكتل التي سنضعها في الزنبرك. وتحدث هذه الكتل تغيرًا في طول الزنبرك. إذن الطول هو المتغير التابع. والكتلة هي المتغير المستقل. نطلق عادة على المتغير المستقل ﺱ، والمتغير التابع ﺹ. فلنضف إذن هذين الحرفين إلى الجدول.
الآن، يمكننا تمثيل هذه النقاط على مخطط الانتشار. يبدو أن لدينا ارتباطًا موجبًا قويًا جدًا بين المتغيرين. في الحقيقة، عندما نحسب معامل ارتباط بيرسون، يصبح الناتج ٠٫٩٩ لأقرب منزلتين عشريتين. وهذا يمثل ارتباطًا موجبًا قويًا جدًا. كيف يمكننا إذن رسم خط أفضل مطابقة مناسب؟ حسنًا، يمكننا محاولة وضع المسطرة في مواضع مختلفة حتى تبدو النقاط أقرب ما تكون للخط بشكل عام. بعد ذلك، يمكننا قراءة بعض الإحداثيات من الخط وإيجاد معادلته. لكن لحسن الحظ هناك طريقة أكثر منهجية واتساقًا لفعل ذلك. وهي أن نحسب معادلة خط الانحدار باستخدام المربعات الصغرى. وطريقة إجراء ذلك هي تحديد خط يقلل مجموع مربعات الباقي عند كل نقطة من النقاط.
على سبيل المثال، إذا أطلقنا على هذه النقطة رقم واحد، فإن هذه المسافة، وهي المسافة الرأسية بين النقطة والخط، تسمى الباقي. إذا كانت معادلة خط أفضل مطابقة هي ﺹ يساوي ﺃ زائد ﺏﺱ، فيمكننا التعويض بإحداثيات ﺱ فيها ووضع توقعات حول إحداثيات ﺹ المناظرة لها. إذن الباقي عند كل نقطة هو الفرق بين القيمة التقديرية المتوقعة والقيمة الفعلية التي لاحظناها عند إجراء التجربة. بالنسبة لهذه النقاط، كانت تقديراتنا أقل من القيم الفعلية. وبالنسبة لهاتين النقطتين هنا، كانت تقديراتنا أكبر من القيم الفعلية التي لاحظناها. لذا، يمكننا التفكير في بعض قيم الباقي على أنها موجبة، وبعضها على أنها سالبة.
لنفترض أننا جربنا الكثير من مختلف خطوط أفضل مطابقة، وفي كل خط جمعنا كل قيم الباقي. في هذه الحالة، قد نتوقع أن تكون الخطوط التي لها مجموع لقيم الباقي قريب من الصفر هي خطوط أفضل مطابقة أنسب من تلك الخطوط التي لها مجموع قيم باق أكبر. لكن يمكن رسم بعض خطوط أفضل مطابقة بصورة سيئة للغاية. وبذلك، قد تتوازن جميع قيم الباقي الموجبة تمامًا مع جميع قيم الباقي السالبة، وتعطينا المجموع صفرًا. إذن لحل هذه المشكلة المحتملة، يحسب نموذج خط الانحدار باستخدام المربعات الصغرى مربعات جميع قيم الباقي بحيث تكون كل النتائج موجبة. ونوجد من خلاله، بعد ذلك، الخط الذي يقلل مجموع مربعات كل هذه البواقي. ومن هنا جاءت تسميته بخط الانحدار باستخدام المربعات الصغرى.
لن نتناول هنا بالتفصيل كيفية استنتاج الصيغة الدقيقة. لكننا سنتحدث عن كيفية استخدامها. صيغة خط الانحدار باستخدام المربعات الصغرى هي ﺹ يساوي ﺃ زائد ﺏﺱ؛ حيث ﺏ يساوي ﻍﺱﺹ على ﻍﺱﺱ، وﻍﺱﺹ هو التباين المشترك بين ﺱ وﺹ مقسومًا على ﻥ. وﻍﺱﺱ هو تباين ﺱ مقسومًا على ﻥ. وقيمة ﺃ تساوي الوسط الحسابي لقيمة ﺹ ناقص ﺏ في الوسط الحسابي لقيمة ﺱ. تذكر أنه لإيجاد قيمة ﻍﺱﺹ، علينا أن نضرب كل إحداثيين من إحداثيات ﺱ وﺹ معًا، ثم نحسب مجموع كل النواتج. بعد ذلك، نحسب مجموع كل قيم ﺱ ونضربه في مجموع كل قيم ﺹ. ونقسم الناتج على عدد نقاط البيانات التي لدينا. ولإيجاد قيمة ﻍﺱﺱ، علينا تربيع جميع نقاط بيانات ﺱ. ثم نحسب مجموع كل هذه المربعات. ونطرح من ذلك مربع مجموع كل قيم ﺱ مقسومًا على عدد نقاط البيانات التي لدينا.
حسنًا، يبدو الأمر صعبًا للغاية بالشكل المكتوب به الآن. لكن عندما ننتقل إلى المثال، ستجده أسهل كثيرًا بالتأكيد. أولًا، نستعرض جدول القيم المعطاة لنا في السؤال. وبعد ذلك، سنحتاج إلى توسيعه قليلًا. فعلينا إنشاء عمودين إضافيين وصف إضافي بالأسفل. أولًا، نضيف عمودًا لقيم ﺱ تربيع يتضمن كل قيمة لـ ﺱ تربيع، ثم عمودًا لقيم ﺱﺹ. لكل زوج من البيانات، نأخذ قيمة ﺱ ونضربها في قيمة ﺹ. وبعد ذلك، نضيف صفًا بالأسفل لكل قيم المجموع. دعونا أولًا نجمع كل قيم ﺱ، ثم نجمع كل قيم ﺹ. ١٠ زائد ٢٠ زائد ٣٠ زائد ٤٠ زائد ٥٠ يساوي ١٥٠. وإذا جمعنا قيم ﺹ الخمس كلها، فسنحصل على ١٢٠. الآن، لدينا خمسة أزواج من البيانات. وبذلك، فإن ﻥ يساوي خمسة. وبتربيع كل قيمة من قيم ﺱ، ١٠ تربيع يساوي ١٠٠. و٢٠ تربيع يساوي ٤٠٠ وهكذا. وبحساب مجموع كل القيم، نحصل على ٥٥٠٠.
والآن سنضرب ﺱ في ﺹ. ١٠ في ١٢ يساوي ١٢٠. و٢٠ في ١٦ يساوي ٣٢٠ وهكذا. وبعد ذلك إذا جمعنا كل القيم معًا، فسنحصل على ٤٢٣٠. والآن يمكننا حساب القيم الفردية. تذكر أن ﻍﺱﺹ يساوي مجموع قيم ﺱ في ﺹ ناقص مجموع قيم ﺱ في مجموع قيم ﺹ مقسومًا على عدد نقاط البيانات. حسنًا، مجموع قيم ﺱﺹ يساوي ٤٢٣٠. ومجموع قيم ﺱ يساوي ١٥٠. ومجموع قيم ﺹ يساوي ١٢٠. ولدينا خمس نقاط بيانات. بحساب ذلك باستخدام الآلة الحاسبة، سنحصل على ٦٣٠. وبالنسبة إلى ﻍﺱﺱ، نحسب مجموع قيم العمود ﺱ تربيع. فعلينا حساب مجموع قيم العمود ﺱ، ثم تربيع هذه القيمة وقسمتها على عدد نقاط البيانات. مجموع كل قيم ﺱ تربيع يساوي ٥٥٠٠. ومجموع قيم ﺱ يساوي ١٥٠. بعد ذلك، علينا تربيع القيمة ١٥٠ وقسمتها على عدد نقاط البيانات، وهو خمسة. وعند حساب ذلك باستخدام الآلة الحاسبة، نحصل على ١٠٠٠. سنكتب ملاحظة بهاتين القيمتين على اليمين لإفساح بعض المساحة لإجراء مزيد من العمليات الحسابية على الجانب الأيسر. قيمة ﺏ في معادلة الخط المستقيم تساوي ﻍﺱﺹ على ﻍﺱﺱ. هذا يساوي ٦٣٠ مقسومًا على ١٠٠٠، وهو ما يساوي ٠٫٦٣.
نجد هنا أن حساب قيمة ﺃ أصعب قليلًا. فعلينا إيجاد الوسط الحسابي للإحداثي ﺹ والوسط الحسابي للإحداثي ﺱ، ثم نأخذ في الاعتبار أيضًا الناتج الذي حصلنا عليه لقيمة ﺏ في هذا الجزء الأول. لإيجاد الوسط الحسابي لقيمة ﺹ، علينا جمع كل قيم ﺹ وقسمتها على عددها. هذا يساوي ١٢٠ مقسومًا على خمسة، وهو ما يساوي ٢٤. نكرر العملية نفسها مع قيم ﺱ؛ فنجمع كل قيم ﺱ ثم نقسمها على عددها. هذا يعطينا ١٥٠ مقسومًا على خمسة، وهو ما يساوي ٣٠. إذن، الوسط الحسابي لقيمة ﺱ يساوي ٣٠. والوسط الحسابي لقيمة ﺹ يساوي ٢٤. ﺃ يساوي الوسط الحسابي لقيمة ﺹ ناقص ﺏ في الوسط الحسابي لقيمة ﺱ، وهو ما يساوي ٢٤ ناقص ٠٫٦٣ في ٣٠. وهذا يعطينا ٥٫١. مرة أخرى نكتب ملاحظة بهاتين القيمتين كي نتمكن من الاستمرار في الحل على الجانب الأيسر. معادلة خط أفضل مطابقة هي ﺹ يساوي ﺃ زائد ﺏﺱ. إذن، خط الانحدار باستخدام المربعات الصغرى هو ﺹ يساوي ٥٫١ زائد ٠٫٦٣ في الإحداثي ﺱ.
حسنًا، رائع. لدينا الآن معادلة تمكننا من وضع توقعات عن طول الزنبرك بمعلومية الكتل المختلفة المتدلية منه. على سبيل المثال، إذا كنا سنعلق كتلة مقدارها ٣٧ كيلوجرامًا من الزنبرك، فسنعوض عن قيمة ﺱ بـ ٣٧ في هذه المعادلة. ونتوقع أن ﺹ يساوي ٢٨٫٤١ سنتيمترًا. هذا هو طول الزنبرك الذي نتوقعه باستخدام هذه الكتلة المتدلية منه. ونظرًا لأن مخطط الانتشار أوضح أن لدينا ارتباطًا موجبًا قويًا جدًا، نتوقع أن تعطي هذه المعادلة تقديرات معقولة جدًا لقيم ﺹ المعطاة بمعلومية قيم محددة لـ ﺱ. بعبارة أخرى، نتوقع أن تكون هذه تقديرات جيدة، إذا استخدمنا قيم ﺱ التي تقع بين ١٠ و٥٠. أي إذا استخدمنا المعادلة لاستكمال قيم ﺹ داخليًا.
نحن الآن نجمع بيانات ﺱ داخل هذا المدى. ولا نعلم ما إذا كانت المعادلة نفسها ستتحقق خارج هذا المدى أم لا. على سبيل المثال، إذا وضعنا كتلة مقدارها ٦٠ أو ٧٠ أو ٨٠ كيلوجرامًا في الزنبرك، فقد يسقط كل شيء. ولن تتحقق هذه المعادلة. لذا، فإن استخدام المعادلة في وضع توقعات لقيم ﺹ بناء على قيم ﺱ داخل المدى الذي جمعنا فيه البيانات يسمى الاستكمال الداخلي. لكن التوسع خارج هذا المدى ووضع توقعات لقيم ﺱ أقل من ١٠ أو أكبر من ٥٠ يسمى الاستكمال الخارجي. وكما قلنا من قبل، عملية الاستكمال الخارجي فكرة سيئة بوجه عام. ذلك لأننا لن نكون واثقين من أن القواعد ستظل تنطبق على قيم هذه البيانات أيضًا. وقد لا تتحقق هذه المعادلة.
والآن يمكننا استخدام المعادلة لتوقع طول الزنبرك دون وجود أي وزن قائم عليه على الإطلاق. نجعل قيمة ﺱ صفرًا. وستصبح لدينا المعادلة ﺹ يساوي ٥٫١ زائد ٠٫٦٣ في صفر. إذن، طول الزنبرك بدون أي أوزان مضافة إليه يساوي ٥٫١ سنتيمترات. والآن سريعًا، سأعود لأعلى لمسح ذلك وتغييره إلى علامة زائد. من الواضح أنني ارتكبت خطأ هنا. لذا، أعتذر عن ذلك. بالعودة إلى السؤال هنا، نجد أنه عند استخدام كتلة مقدارها صفر كيلوجرام، يصبح طول الزنبرك ٥٫١ سنتيمترات. ويمكن أن يكون ذلك شرطًا لإحدى المسائل. عند عدم إضافة أي كتل، يساوي طول الزنبرك ٥٫١ سنتيمترات. والآن، أظن أنه يمكنك تحديد المشكلة المحتملة في ذلك. نظرًا لأننا نجمع البيانات التي تحتوي على قيم ﺱ من ١٠ إلى ٥٠ كيلوجرامًا فقط، نستكمل هذه المعادلة خارجيًا لتصل إلى صفر هنا. قد لا يكون هذا صحيحًا بالضرورة. قد يكون صحيحًا. لكننا لا نثق تمامًا في أن المعادلة ستظل تنطبق على قيم ﺱ هذه.
والآن يمكننا أيضًا تفسير المعطيات الموجودة في معادلة خط الانحدار. معامل ﺱ هذا، أي مضاعف ﺱ، الذي يساوي ٠٫٦٣، يعني أنه في كل مرة نضيف كيلوجرامًا واحدًا، أي إن قيمة ﺱ تزيد بمقدار واحد، يمتد الزنبرك بمقدار معين. وهو ٠٫٦٣ سنتيمتر. وهذا العدد هنا، ٥٫١، يعني أنه عندما تكون قيمة ﺱ صفرًا، فإن ﺹ يساوي ٥٫١. إذن عندما لا نضيف أي كتلة إلى الزنبرك، يكون طوله ٥٫١ سنتيمترات. حسنًا، هذه الطريقة المستخدمة في تحليل خط الانحدار باستخدام المربعات الصغرى تبدو سحرية. فكل ما عليك فعله هو معالجة البيانات. وستحصل على معادلة سهلة الاستخدام يمكنك من خلالها توقع إحدى القيم بناء على القيم الأخرى، هذا مذهل!
لكن تذكر أنه عليك أيضًا التفكير في قوة الارتباط قبل أن تستخدم خط الانحدار باستخدام المربعات الصغرى لوضع التوقعات. فإذا كان هناك ارتباط ضعيف أو لا يوجد ارتباط على الإطلاق، فستعطيك المعادلة توقعات أو تقديرات غير موثوق بها إلى حد كبير. عليك أيضًا أن تأخذ في اعتبارك كمية البيانات التي تستخدمها لإنشاء النموذج. فكلما زادت كمية البيانات بشكل عام، زادت موثوقية النموذج وواقعيته. وتذكر أيضًا ألا تلجأ إلى الاستكمال الخارجي. الاستكمال الداخلي مفيد جدًا. إذا كان الارتباط قويًا، فإن القيم المستكملة داخليًا ستمثل توقعات جيدة. أما في حالة القيم المستكملة خارجيًا، فلا يمكنك حقًا معرفة مدى موثوقيتها.
حسنًا، إليك مسألة أخرى يمكنك محاولة حلها.
أوجد معادلة خط الانحدار باستخدام المربعات الصغرى للبيانات التالية. واستخدمها لتقدير قيمة ﺹ عند ﺱ يساوي تسعة، ثم اكتب تعليقًا على الناتج.
لدينا بعض البيانات هنا عن ﺱ وﺹ. عند ﺱ يساوي واحدًا، ﺹ يساوي ١٢. وعند ﺱ يساوي اثنين، ﺹ يساوي سبعة، وهكذا. وقد كتبنا لك الصيغ بالأسفل لكي تستخدمها. يمكنك الآن إيقاف الفيديو مؤقتًا ثم العودة مرة أخرى عند الانتهاء من الإجابة عن السؤال. وسنستعرض الإجابات – حسنًا، علينا أولًا إضافة عمودين لقيم ﺱ تربيع وقيم ﺱﺹ. والآن سنكتب هذه القيم. واحد تربيع يساوي واحدًا. اثنان تربيع يساوي أربعة، وهكذا. والآن، ننتقل إلى قيم ﺱﺹ، واحد في ١٢ يساوي ١٢. واثنان في سبعة يساوي ١٤، وهكذا. سنضيف الآن صفًا بالأسفل لجميع قيم المجموع. والآن إذا جمعنا كل قيم ﺱ، فسنحصل على ١٥. وبجمع كل قيم ﺹ، نحصل على إجمالي يساوي ٣٧. وبجمع كل قيم ﺱ تربيع، نحصل على إجمالي يساوي ٥٥. وبجمع كل قيم حاصل ضرب ﺱ في ﺹ، نحصل على إجمالي يساوي ٩٣. ونظرًا لأن لدينا خمس مجموعات من البيانات، فإن ﻥ يساوي خمسة.
ومن ثم، فإن ﻍﺱﺹ هو مجموع قيم ﺱﺹ ناقص مجموع قيم ﺱ في مجموع قيم ﺹ الكل على ﻥ. هذا يعطينا ٩٣ ناقص ١٥ في ٣٧ الكل على خمسة، وهو ما يساوي سالب ١٨. وقيمة ﻍﺱﺱ هي مجموع قيم ﺱ تربيع ناقص مجموع قيم ﺱ الكل تربيع مقسومًا على ﻥ. مجموع قيم ﺱ تربيع يساوي ٥٥. ومجموع قيم ﺱ هو ١٥. وﻥ يساوي خمسة. إذن، يصبح لدينا ٥٥ ناقص ١٥ تربيع على خمسة، وهو ما يساوي ١٠. نوجد قيم الثوابت في معادلة هذا الخط المستقيم، ﺹ يساوي ﺃ زائد ﺏﺱ. قيمة ﺏ تساوي ﻍﺱﺹ مقسومًا على ﻍﺱﺱ. هذا يعطينا سالب ١٨ مقسومًا على ١٠، وهو ما يساوي سالب ١٫٨. الوسط الحسابي لقيمة ﺹ يساوي مجموع كل قيم ﺹ مقسومًا على عددها. وهو ٣٧ مقسومًا على خمسة، ما يساوي ٧٫٤. والوسط الحسابي لقيمة ﺱ هو مجموع كل قيم ﺱ مقسومًا على عددها. إذن يصبح لدينا ١٥ مقسومًا على خمسة، وهو ما يساوي ثلاثة. ومن ثم، قيمة ﺃ تساوي الوسط الحسابي لـ ﺹ ناقص ﺏ في الوسط الحسابي لـ ﺱ. وبما أن قيمة ﺏ تساوي سالب ١٫٨، علينا الانتباه للإشارات السالبة هنا. فلدينا ٧٫٤ ناقص سالب ١٫٨ في ثلاثة، وهو ما يساوي ١٢٫٨.
معادلة خط الانحدار باستخدام المربعات الصغرى هي ﺹ يساوي ﺃ زائد ﺏﺱ. وكل ما علينا فعله هو التعويض بقيمتي ﺃ وﺏ. إذن هذه هي المعادلة. ﺹ يساوي ١٢٫٨ ناقص ١٫٨ﺱ. والآن علينا التعويض عن ﺱ بتسعة لتوقع قيمة ﺹ المناظرة. ﺹ يساوي ١٢٫٨ ناقص ١٫٨ في تسعة، وهو ما يساوي سالب ٣٫٤. والآن يمكننا التعليق على الناتج؛ حيث يوجد أمران يمكننا التحدث عنهما. الأول هو أننا أجرينا استكمالًا خارجيًا. قيم ﺱ التي جمعناها بدلالة هذه البيانات كانت من واحد إلى خمسة. لكننا استخدمنا تسعة لتكون قيمة ﺱ. وبذلك نكون قد استخدمنا الاستكمال الخارجي. لذا، فإننا لا نعرف حتمًا مدى موثوقية هذه الإجابة. والأمر الآخر الذي يمكننا أن نذكره هو أننا لا نعرف مدى قوة الارتباط. نحن لا نعرف معامل ارتباط بيرسون أو أي معامل ارتباط آخر في هذه المسألة. لذا، حتى إذا استكملنا هذه القيمة داخليًا، فلن نعرف أيضًا مدى موثوقية الإجابة. لكن النقطة الأساسية التي يجب توضيحها هي أن الإجابة هي قيمة مستكملة خارجيًا. لذا علينا أن ننتبه.
تلخيصًا لما سبق، نقول إنه يمكننا إيجاد معادلة خط الانحدار باستخدام المربعات الصغرى، ﺹ يساوي ﺃ زائد ﺏﺱ، باستخدام ﺏ يساوي ﻍﺱﺹ على ﻍﺱﺱ. وﺃ يساوي الوسط الحسابي لقيمة ﺹ ناقص ﺏ في الوسط الحسابي لقيمة ﺱ. تذكر أن ﻍﺱﺹ يساوي مجموع قيم ﺱ في ﺹ ناقص مجموع قيم ﺱ في مجموع قيم ﺹ على عدد نقاط البيانات التي لدينا. وقيمة ﻍﺱﺱ تساوي مجموع قيم ﺱ تربيع ناقص مجموع قيم ﺱ الكل تربيع مقسومًا على عدد نقاط البيانات التي لدينا. وعرفنا أيضًا كيفية إيجاد الوسط الحسابي لقيمة ﺹ والوسط الحسابي لقيمة ﺱ. فما عليك إلا جمع قيم كل منهما ثم القسمة على عدد هذه القيم. وأخيرًا، انتبه بشأن الاستكمال الخارجي.