تم إلغاء تنشيط البوابة. يُرجَى الاتصال بمسؤول البوابة لديك.

فيديو الدرس: التوزيع الطبيعي الرياضيات

في هذا الفيديو، سوف نتعلم كيف نستخدم التوزيع الطبيعي لحساب الاحتمالات وإيجاد المتغيرات المجهولة والبارامترات.

٢٠:٤٦

‏نسخة الفيديو النصية

في هذا الفيديو، سوف نتعلم كيف نستخدم التوزيع الطبيعي لحساب الاحتمالات وإيجاد المتغيرات المجهولة والبارامترات. يعتبر التوزيع الطبيعي أحد أهم التوزيعات الاحتمالية لأنه يمكن استخدامه لتمثيل عدة أنواع من الظواهر التي تحدث على نحو طبيعي، مثل أطوال البالغين. وقد يمثل تقريبًا جيدًا للتوزيعات الأخرى عندما يكون عدد نقاط البيانات كبيرًا.

لننظر إلى هذا التوزيع الطبيعي عن قرب أكثر. المتغير العشوائي الطبيعي هو نوع من المتغيرات العشوائية المتصلة. وإذا نظرنا إلى منحنى دالة كثافة الاحتمال الخاصة به، فسيكون شكله مميزًا للغاية. يمكن تمثيل جميع التوزيعات الطبيعية باستخدام منحنى على شكل جرس، ونطلق عليه المنحنى الطبيعي أو أحيانًا منحنى جاوس تيمنًا باسم العالم الرياضي كارل فريدريك جاوس الذي لعب دورًا مهمًّا في وضع النظرية المرتبطة بالتوزيع الطبيعي. نستخدم ﺱ، لتمثيل المتغير العشوائي الذي يتبع توزيعًا طبيعيًّا. ويمكن وصف التوزيع وصفًا تامًّا باستخدام بارامترين، الأول هو المتوسط أو التوقع 𝜇، والثاني هو التباين 𝜎 تربيع. لنتناول الآن بعض الخصائص الأساسية لهذا التوزيع الاحتمالي.

أولًا، التوزيع الطبيعي متماثل تمامًا حول قيمته المتوسطة 𝜇. وكما هو الحال مع أي توزيع احتمالي، فإن المساحة أسفل المنحنى بالكامل تساوي واحدًا، وهو ما يعني أن المساحة على أي من جانبي محور التماثل الرأسي هذا تساوي ٠٫٥. تعطينا المساحة الموجودة على يسار أي قيمة ﺱ محددة على المحور الأفقي تناسبًا لنقاط التوزيع الاحتمالي الأقل من أو تساوي هذه القيمة. ونقول هنا إن احتمال أن يكون المتغير العشوائي ﺱ أقل من أو يساوي القيمة المرصودة ﺱ. الآن تجدر الإشارة إلى أنه بينما نتعامل مع توزيع متصل، فلن يحدث أي فرق عمليًّا إذا تحدثنا عن أصغر من فقط أو أصغر من أو يساوي لأن احتمال أن يكون المتغير العشوائي يساوي أي قيمة محددة هي صفر.

وبذلك نكون قد رأينا أن نصف المساحة يقع على كل من جانبي المحور الرأسي. لكن في الواقع، يمكن تقريبًا تقسيم المساحة أسفل المنحنى أكثر وفقًا لتناسب النقاط التي تقع في مناطق أساسية معينة. وهذا يسمى القاعدة التجريبية. إذا نظرنا أولًا إلى المنطقة التي تبعد بمقدار انحراف معياري واحد على كل من جانبي المتوسط، فسنجد أنها تمثل ٦٨٫٣ بالمائة تقريبًا من المساحة الكلية، وهو ما يعني أن هذا التناسب من قيم التوزيع يقع تقريبًا ضمن انحراف معياري واحد عن المتوسط.

وبالطريقة نفسها، تمثل المنطقة ضعف الانحراف المعياري على جانبي المتوسط ٩٥ بالمائة تقريبًا من المساحة الكلية. إذن ٩٥ في المائة من قيم هذا التوزيع تقع ضمن ضعف الانحراف المعياري عن المتوسط على كلا الجانبين. وإذا انتقلنا أبعد حتى ثلاثة أمثال الانحراف المعياري على كل من جانبي المتوسط، فستمثل ٩٩٫٧ بالمائة تقريبًا من المساحة الكلية.

لذا، من النادر جدًّا أن تبعد القيم المأخوذة من التوزيع الطبيعي أكثر من ثلاثة أمثال الانحراف المعياري عن المتوسط، وهو ما له تطبيق مهم في مراقبة العمليات الإحصائية. إذا افترض أن العملية تتبع توزيعًا طبيعيًّا، فإن أي قيم تزيد عن ثلاثة أمثال الانحراف المعياري عن المتوسط يفترض عادة أن لها قيمًا شاذة، وقد تشير إلى وقوع حدث غير معتاد، وهو ما يستلزم دراسته. من المفيد أن نتذكر النسب المئوية الأساسية الثلاث المصاحبة لهذه المسافات من المتوسط، كما سنرى في المثال الأول.

مجموعة بيانات ذات توزيع طبيعي ووسط حسابي مقداره ٣٢٫١ وانحراف معياري مقداره ٢٫٨، بين أي قيمتين يمكنك توقع وقوع ٩٥ بالمائة من مجموعة البيانات؟

نتذكر أولًا أنه للمتغير العشوائي الذي يتبع توزيعًا طبيعيًّا، تقع ٩٥ بالمائة تقريبًا من نقاط البيانات في نطاق ضعف الانحراف المعياري عن المتوسط على كلا الجانبين. علينا إذن حساب القيمتين اللتين تبعدان بمقدار ضعف الانحراف المعياري لأسفل، وضعف الانحراف المعياري فوق متوسط هذا التوزيع الطبيعي المحدد.

نعلم من السؤال أن المتوسط يساوي ٣٢٫١، والانحراف المعياري يساوي ٢٫٨، لذا يمكننا حساب هاتين القيمتين بسهولة إلى حد ما. القيمة السفلى 𝜇 ناقص اثنين 𝜎 تساوي ٣٢٫١ ناقص اثنين مضروبًا في ٢٫٨، وهو ما يساوي ٢٦٫٥. القيمة العليا 𝜇 زائد اثنين 𝜎 هي ٣٢٫١ زائد اثنين في ٢٫٨، وهو ما يساوي ٣٧٫٧. ومن ثم، بتذكر جزء من القاعدة التجريبية للمتغير العشوائي الطبيعي، الذي يخبرنا بأن ٩٥ بالمائة تقريبًا من مجموعة البيانات تقع ضمن ضعف الانحراف المعياري عن المتوسط على كلا الجانبين، نجد أنه لهذا التوزيع فإن ٩٥ بالمائة من مجموعة البيانات ستكون بين ٢٦٫٥ و٣٧٫٧.

وعلى نحو أكثر تعميمًا، قد نريد إيجاد تناسب النقاط التي تقع في مناطق أخرى أسفل المنحنى. لفعل ذلك، علينا التفكير في حالة خاصة واحدة من التوزيع الطبيعي، وهي ما نسميه التوزيع الطبيعي المعياري. عادة ما نشير إلى هذا باستخدام الحرف ﺹ. وهو يمثل التوزيع الطبيعي الذي متوسطه صفر، وانحرافه المعياري، ومن ثم تباينه، يساوي واحدًا.

تعرف القيم من هذا التوزيع بدرجات ﻱ المعيارية، وهي تمثل عدد الانحرافات المعيارية أعلى متوسط قيمة محددة. على سبيل المثال، درجة ﻱ المعيارية التي تساوي ١٫٤ تعني قيمة تساوي ١٫٤ انحراف معياري أعلى المتوسط، في حين أن درجة ﻱ المعيارية التي تساوي سالب ٢٫١ ستعني أن القيمة ٢٫١ انحراف معياري أقل من الوسط الحسابي. درجات ﻱ المعيارية هذه للتوزيع الطبيعي المعياري مفيدة للغاية؛ لأنها تتيح لنا أن نحدد القيم من التوزيع الطبيعي على مقياس معياري.

لدينا مجموعة من الجداول الإحصائية التي سنتناولها بالتفصيل لاحقًا، والتي يمكننا من خلالها البحث عن المساحات، ومن ثم الاحتمالات المرتبطة بدرجات ﻱ معيارية بعينها. نوع الجداول التي سنستخدمها هي جداول تعطي احتمالًا أن يقع المتغير العشوائي ﺹ بين صفر وبين القيمة المرصودة ﻱ. هذا هو تناسب النقاط أو المساحة بين صفر ودرجة ﻱ المعيارية الموجبة. إذا أردنا أن نحسب بعد ذلك تناسب النقاط التي تقع بالكامل على اليسار، أي التي أقل بالكامل من درجة ﻱ المعيارية الموجبة، فعلينا أن نضيف ٠٫٥ إلى القيمة الواردة في الجداول لحساب المساحة على يسار محور التماثل. وهي المساحة المظللة باللون الوردي.

هيا نتناول مثالًا مفصلًا حول كيفية استخدام الجداول لإيجاد هذا الاحتمال.

استخدم الجداول لإيجاد الاحتمال الطبيعي الذي يناظر درجة ﻱ المعيارية التي تساوي ٢٫١٣.

المطلوب منا هو إيجاد الاحتمال الطبيعي المناظر لدرجة ﻱ المعيارية التي تساوي ٢٫١٣، وهو ما يعني تناسب النقاط أو المساحة التي تقع على يسار هذه القيمة ٢٫١٣ أسفل منحنى التوزيع الطبيعي المعياري. ها هي الجداول الإحصائية للتوزيع الطبيعي المعياري. والآن، تعطي هذه الجداول تناسب النقاط أو المساحة التي تقع بين صفر ودرجة ﻱ المعيارية الموجبة. هذا فقط الجزء من المساحة المظللة باللون الوردي في الشكل الذي لدينا. ومع ذلك فهذا جيد لأننا نعلم أن التوزيع الطبيعي متماثل تمامًا حول المتوسط. وعليه، فإن الجزء البرتقالي من المساحة يساوي ٠٫٥ بالضبط. علينا إذن إضافة ٠٫٥ إلى أي قيمة نجدها في الجدول.

والآن، بالنظر إلى الجداول، نجد أن درجات ﻱ المعيارية فيها تتراوح من صفر إلى ثلاثة في العمود الأول. هذه القيم تزيد بمقدار ٠٫١ في كل مرة. وفي الصف العلوي من الجدول، لدينا خيارات للحصول على قيم المنزلة العشرية الثانية لدرجة ﻱ المعيارية. وعليه، فإن درجة ﻱ المعيارية التي نريد إيجادها هي ٢٫١٣، إذن نبحث عن ٢٫١ في العمود الأول ثم ٠٫٠٣؛ لأن ٢٫١ زائد ٠٫٠٣ يعطينا ٢٫١٣. ثم نوجد القيمة في خانة الجدول التي يتقاطع فيها هذا الصف وهذا العمود، والتي تساوي ٠٫٤٨٣٤. وهذا يخبرنا أن المساحة بين صفر و٢٫١٣ تساوي ٠٫٤٨٣٤. المساحة الكلية على يسار ٢٫١٣ هي ٠٫٥ زائد هذه القيمة، وهي تساوي ٠٫٩٨٣٤. وهذا هو الاحتمال الطبيعي المناظر لدرجة ﻱ المعيارية التي تساوي ٢٫١٣. وهو يمثل المساحة الكلية على يسار ٢٫١٣ أسفل المنحنى الطبيعي المعياري.

في المثال السابق، رأينا كيف نستخدم الجداول لإيجاد المساحة الواقعة بين صفر ودرجة ﻱ المعيارية الموجبة. يمكننا أيضًا استخدام هذه الجداول لإيجاد تناسب النقاط التي تقع في مناطق أخرى، ويلعب تماثل التوزيع الطبيعي دورًا مهمًّا. أولًا، بما أن المنحنى متماثل حول المتوسط، تكون المساحة بين صفر ودرجة ﻱ المعيارية الموجبة مساوية للمساحة بين درجة ﻱ المعيارية السالبة وصفر. يمكننا أيضًا إيجاد المساحة على يمين درجة ﻱ معيارية معينة باستخدام حقيقة أن المساحة الكلية أسفل المنحنى تساوي واحدًا. لذا، فإن احتمال أن يكون المتغير العشوائي ﺹ أكبر من أو يساوي قيمة ﻱ يساوي واحدًا ناقص احتمال أن يكون أقل من أو يساوي هذه القيمة.

يمكننا أيضًا إيجاد تناسب النقاط التي تقع بين درجتين محددتين من قيم ﻱ المعيارية عن طريق طرح مساحة من الأخرى. وسنرى بعض الأمثلة على أنواع المسائل المختلفة التي قد نواجهها في الأمثلة المتبقية. حسنًا، يكون هذا رائعًا إذا كان التوزيع الذي نستخدمه هو بالفعل التوزيع الطبيعي المعياري. لكن الأمر الأكثر فائدة هو أنه يمكننا استخدام درجات ﻱ المعيارية لتحويل القيم من أي توزيع طبيعي له أي متوسط وأي انحراف معياري إلى متغير طبيعي معياري، ومن ثم تحديدها على المقياس المعياري. يمكننا فعل ذلك باستخدام الصيغة ﻱ يساوي ﺱ ناقص 𝜇 على 𝜎. نأخذ قيمة ﺱ المرصودة، ونطرح منها متوسط التوزيع، ثم نقسم على الانحراف المعياري 𝜎. وبذلك، تكون درجة ﻱ المعيارية عبارة عن قيمة مرصودة من التوزيع الطبيعي المعياري.

إذن، احتمال أن يقع المتغير العشوائي الأصلي ﺱ بين صفر وﺱ هو نفسه احتمال وقوع المتغير العشوائي الجديد ﺹ بين صفر وﻱ، أي درجة ﻱ المعيارية. ومن ثم، يمكننا استخدام جداول التوزيع الطبيعي المعياري بحثًا عن هذا الاحتمال. لنر مثالًا على ذلك.

افترض أن ﺱ متغير عشوائي طبيعي متوسطه ٦٨ وانحرافه المعياري ثلاثة. أوجد احتمال ﺱ أكبر من أو يساوي ٦١٫٧.

إذن، لدينا المتغير العشوائي الطبيعي ﺱ، ونريد تحديد احتمال أن تكون قيمته أكبر من أو تساوي ٦١٫٧. نعرف أن ٦١٫٧ سيكون في النصف السفلي من التوزيع؛ لأنه أقل من المتوسط ٦٨. ولذلك، فالاحتمال الذي نبحث عنه يناظر المساحة المظللة باللون البرتقالي أسفل منحنى التوزيع الطبيعي. أولًا، علينا حساب درجة ﻱ المعيارية المرتبطة بهذه القيمة تحديدًا باستخدام الصيغة: ﻱ يساوي ﺱ ناقص 𝜇 على 𝜎. لدينا ﻱ يساوي ٦١٫٧ ناقص ٦٨ على ثلاثة، وهو ما يساوي سالب ٢٫١، ما يعني أن هذه القيمة ٦١٫٧ تساوي ٢٫١ انحراف معياري أقل من المتوسط ٦٨.

والآن، لا يمكننا النظر إلى درجة ﻱ المعيارية السالبة في جداول التوزيع الطبيعي المعياري، لذا علينا بدلًا من ذلك حساب تماثل منحنى التوزيع الطبيعي. على المقياس المعياري، المساحة الموجودة أعلى درجات ﻱ المعيارية لسالب ٢٫١ ستساوي المساحة الموجودة أسفل درجة ﻱ المعيارية لـ ٢٫١. يمكننا البحث عن الاحتمال المرتبط بدرجة ﻱ المعيارية لـ ٢٫١ في جداول التوزيع الطبيعي المعياري، وهو ما يعطينا المساحة على يمين المتوسط. ثم نضيف ٠٫٥ لإضافة المساحة على يسار المتوسط. باستخدام هذه الجداول، نجد أن الاحتمال المرتبط بدرجة ﻱ المعيارية لـ ٢٫١ يساوي ٠٫٤٨٢١. لذا، فإن احتمال أن يكون ص أصغر من أو يساوي ٢٫١، وهو ما يماثل احتمال أن يكون ص أكبر من أو يساوي سالب ٢٫١، الذي يمثل للمتغير العشوائي غير المعياري احتمال أن يكون ﺱ أكبر من أو يساوي ٦١٫٧، يساوي ٠٫٥ زائد ٠٫٤٨٢١، وهو ما يساوي ٠٫٩٨٢١.

لنتناول الآن مثالًا نحسب فيه الاحتمال بين قيمتين.

افترض أن ﺱ متغير عشوائي يتبع توزيعًا طبيعيًّا، ومتوسطه ٦٣ وتباينه ١٤٤. أوجد احتمال ﺱ أكبر من أو يساوي ٣٧٫٥٦ وأصغر من أو يساوي ٥٧٫٣٦.

إذن، لدينا متغير عشوائي طبيعي ﺱ متوسطه ٦٣ وتباينه ١٤٤، أي ١٢ تربيع. نريد تحديد احتمال وقوع ﺱ بين هاتين القيمتين، وهما في الجزء السفلي من التوزيع. نبدأ بحساب درجة ﻱ المعيارية لكل قيمة باستخدام الصيغة ﻱ يساوي ﺱ ناقص 𝜇 على 𝜎. في قيمة ﺱ الأولى، لدينا ٣٧٫٥٦ ناقص ٦٣ على ١٢، وهو ما يساوي سالب ٢٫١٢. وللقيمة الثانية، درجة ﻱ المعيارية تساوي سالب ٠٫٤٧.

لا يمكننا النظر الآن إلى أي من هاتين القيمتين في جداول التوزيع الطبيعي المعياري؛ لأن كلتيهما سالبة. لذا، بدلًا من ذلك، نستخدم تماثل منحنى التوزيع الطبيعي. في المقياس المعياري الآن، احتمال أن يكون ص أكبر من أو يساوي سالب ٢٫١٢ وأقل من أو يساوي سالب ٠٫٤٧ هو نفسه احتمال أن يكون ص أكبر من أو يساوي موجب ٠٫٤٧ وأقل من أو يساوي ٢٫١٢، وكلاهما يمكننا البحث عنه في جداول التوزيع الطبيعي المعياري.

تذكر أن الجداول تعطينا احتمال وقوع ص بين صفر ودرجة ﻱ المعيارية الموجبة. لذا، يمكننا طرح احتمال ٠٫٤٧ من احتمال ٢٫١٢. وفقًا للجداول، الاحتمالان هما ٠٫٤٨٣٠ و٠٫١٨٠٨. ثم نوجد الفرق، وهو ٠٫٣٠٢٢. إذن، باستخدام درجات ﻱ المعيارية وتماثل التوزيع الطبيعي، وجدنا أن احتمال أن يكون ﺱ أكبر من أو يساوي ٣٧٫٥٦ وأقل من أو يساوي ٥٧٫٣٦ هو ٠٫٣٠٢٢.

دعونا الآن نلخص النقاط الرئيسية في هذا الفيديو. أولًا، رأينا النسب المئوية المرتبطة بثلاث مناطق أساسية أسفل منحنى التوزيع الطبيعي باستخدام القاعدة التجريبية. لحساب درجة ﻱ المعيارية لقيمة مرصودة ﺱ، نطرح المتوسط 𝜇 ثم نقسم على الانحراف المعياري 𝜎. وهو ما سيحول القيمة المرصودة من توزيع طبيعي متوسطه 𝜇 وانحرافه المعياري 𝜎 إلى قيمة مرصودة من توزيع طبيعي معياري متوسطه صفر وانحرافه المعياري واحد. يمكننا استخدام جداول التوزيع الطبيعي المعياري للبحث عن المساحة بين صفر ودرجة ﻱ المعيارية الموجبة. يمكننا بعد ذلك استخدام هذه القيم من الجداول، بالإضافة إلى تماثل منحنى التوزيع الطبيعي، لحساب الاحتمالات بعدة أشكال مختلفة.

تستخدم نجوى ملفات تعريف الارتباط لضمان حصولك على أفضل تجربة على موقعنا. معرفة المزيد حول سياسة الخصوصية لدينا.