في هذا الشارح، سوف نتعلَّم كيف نستخدم التوزيع الطبيعي لحساب الاحتمالات وإيجاد المتغيِّرات المجهولة والبارامترات.
بالنسبة إلى المتغيرات الحياتية، مثل أوزان حديثي الولادة أو رواتب العاملين في إحدى الشركات الكبرى، نتوقع أن يكون لها توزيع متماثل ومُركَّز بالقرب من المتوسط. على سبيل المثال، يوضِّح المدرج التكراري أدناه مجموعة بيانات متماثلة ومُركَّزة بالقرب من المتوسط.
عندما تكون مجموعة البيانات متماثلة ومُركَّزة بالقرب من المتوسط، فإننا نقول إنها مُوّزعة توزيعًا طبيعيًّا. بالنسبة لمجموعات البيانات المُوزَّعة توزيعًا طبيعيًّا، تعطينا القاعدة التجريبية (التي تعرف أيضًا باسم قاعدة ) تقديرات مفيدة.
نظرية: القاعدة التجريبية
إذا وزِّعَت مجموعة بيانات توزيعًا طبيعيًّا بمتوسط وانحراف معياري ، فإن:
- من البيانات تقريبًا تقع ضمن المنطقة من ،
- من البيانات تقريبًا تقع ضمن المنطقة من ،
- البيانات تقريبًا تقع ضمن المنطقة من .
وكما هو الحال مع مجموعات البيانات، سيكون لأي متغير عشوائي متصل مُوزَّع توزيعًا طبيعيًّا منحنى توزيع احتمالي متماثل ومُركَّز بالقرب من المتوسط. إذا كان متغيرًا عشوائيًّا طبيعيًّا بمتوسط وانحراف معياري ، فإننا نشير إليه هكذا: . ونلاحظ أن البارامتر الثاني المُشار إليه بالرمز يُمثِّل التباين وليس الانحراف المعياري.
يُعرَف شكل منحنى التوزيع الاحتمالي لأي متغير عشوائي طبيعي باسم منحنى الجرس. والمساحة الكلية أسفل منحنى الجرس تساوي ١ أو ، وتنطبق قاعدة أيضًا على المساحة أسفل المنحنى كما هو موضح أدناه.
هيا نتناول الآن بعض الأمثلة على القاعدة التجريبية.
مثال ١: تقدير المساحات أسفل منحنى التوزيع الطبيعي
في التوزيع الطبيعي الموضح، ما النسبة المئوية التقريبية لنقاط البيانات التي تقع في الجزء المظلَّل؟
الحل
دعونا نتذكر من قاعدة أن:
- من البيانات تقريبًا تقع ضمن المنطقة من ،
- من البيانات تقريبًا تقع ضمن المنطقة من ،
- من البيانات تقريبًا تقع ضمن المنطقة من .
تقع المنطقة المظللة بين ، ، لذا فهي تُمثِّل نصف المساحة بالضبط الموجودة ضمن المنطقة من . وبما أننا نعرف أن من البيانات تقريبًا يجب أن تقع ضمن المنطقة من ، فإن نصف هذه البيانات تقريبًا يجب أن يقع بين ، .
إذن، من البيانات تقريبًا تقع في الجزء المظلل.
مثال ٢: تقدير المساحات أسفل منحنى التوزيع الطبيعي
مجموعة بيانات ذات توزيع طبيعي ووسط حسابي مقداره ٣٢٫١ وانحراف معياري مقداره ٢٫٨، بين أي قيمتين يمكنك توقُّع وقوع من مجموعة البيانات؟
الحل
تذكر من قاعدة أن:
- من البيانات تقريبًا تقع ضمن المنطقة من ،
- من البيانات تقريبًا تقع ضمن المنطقة من ،
- من البيانات تقريبًا تقع ضمن المنطقة من .
من البيانات في التوزيع الطبيعي تقع ضمن المنطقة من .
ومن ثم، النقطة الحدية السفلى التي تبعد عن تساوي:
والنقطة الحدية العليا التي تبعد عن تساوي:
إذن، نتوقع أن من البيانات تقع بين القيمتين ٢٦٫٥، و٣٧٫٧.
بالنسبة للمتغيرات العشوائية الطبيعية، يمكننا استخدام جدول التوزيع الطبيعي المعياري لحساب احتمال وقوع حدث معين. تمكننا هذه الطريقة من حساب احتمالات وقوع الأحداث الأعم مقارنةً بالقاعدة التجريبية.
يتضمن جدول التوزيع الطبيعي المعياري قيم احتمال المتغير العشوائي الطبيعي المعياري. المتغير الطبيعي المعياري هو متغير عشوائي متصل متوسطه وانحرافه المعياري . سنرمز إلى هذا المتغير بـالرمز . لذا، سنشير إلى ذلك هكذا: .
تُستخدم جداول التوزيع الطبيعي المعياري (تُسمى أيضًا جداول قيم ) للحصول على احتمالات تتضمن المتغير الطبيعي المعياري . وعلينا أولًا أن نعرف أي نوع من الاحتمالات يوفره جدول قيم المُعطى. قد يُعطينا الجدول قيم الاحتمالات على الصورة ، أو ربما يُعطينا قيم الاحتمالات على الصورة . إذا كانت قيمة احتمال ٠٫٠٠ تساوي ٠٫٥، فإن هذا هو النوع الأخير (أي ). وإذا كانت قيمة احتمال ٠٫٠٠ تساوي ٠، فإن هذا هو النوع الأول (أي ). يتضح الفرق بين هذين الجدولين في الصورتين التاليتين.
لنفترض أننا نريد حساب باستخدام جدول . علينا تحديد موضع النقطة الحدية اليمنى ٠٫٥٤ من خلال إيجاد ٠٫٥ في العمود الأيمن، و٠٫٠٤ في الصف العلوي.
هذا يعطينا القيمة ٠٫٧٠٥٤ التي تُمثِّل الاحتمال .
على الجانب الآخر، عند استخدام جدول ، علينا أولًا تقسيم المنطقة إلى المنطقتين و، كما هو موضح في الصور التالية.
بعد ذلك، نتذكر أن ، بينما يمكننا تحديد في الجدول كما هو موضح أدناه.
إذن، . وبجمع القيمتين معًا، سنحصل على: وهي القيمة نفسها التي حصلنا عليها باستخدام جدول قيم الآخر. بوجه عام، يمكننا استخدام أيٍّ من جدولَي قيم لتحديد الاحتمالات التي تتضمن المتغير الطبيعي المعياري . في بقية هذا الشارح، سنستخدم جدول قيم الذي يُمثِّل الاحتمالات على الصورة .
في بعض الأحيان، تحتوي النقطة الحدية العليا على مجهول، وفي هذه الحالة ستكون قيمة الاحتمال مُعطاة. على سبيل المثال، لإيجاد الذي يحقق ، سنبدأ بتحديد ٠٫٢٦٧٣ داخل جدول التوزيع الطبيعي المعياري ونستمر لتحديد القيمتين الحديتين لكي نحصل على القيمة .
نحن نستخدم هذه الطريقة لنجد أن . وهذا يعني أن ، حيث .
بما أن متغير عشوائي متصل، فإننا نتذكر أن لأي قيمة . وعليه، فإن المتباينتين الضعيفة والتامة يمكن التبديل بينهما. على سبيل المثال،
عند التعامل مع احتمالات التوزيع الطبيعي، فإننا عادةً ما نتجاهل رموز المتباينة الضعيفة. ويجب أن نضع في اعتبارنا أنها تكافئ المتباينات التامة.
لقد لاحظنا فيما سبق أن . ومن خلال التماثل حول منحنى الجرس، نعرف أيضًا أن .
يلعب تماثل التوزيع الطبيعي دورًا مهمًّا عند حساب الاحتمالات التي تتضمن قيمًا سالبة. إذا كان الحدث يتضمن قيمًا سالبة، فإننا نقسِّم الحدث أولًا إلى الجزأين الموجب والسالب. بعد ذلك، باستخدام منحنى الجرس، يمكننا تحديد الحدث الموجب الذي له نفس احتمال الجزء السالب. وتتمثل هذه العملية في التسلسل التالي.
توضح الصور السابقة المعادلات الآتية: حيث يمكن الحصول على الاحتمالين الموجودين في السطر الأخير باستخدام جدول التوزيع الطبيعي المعياري. ومن المفيد عادةً التفكير من خلال الصور قبل كتابة المعادلات المناظرة لها.
وقد تكون الفروق مفيدة عند حساب الاحتمالات. فلحساب ، نلاحظ الأشكال التالية.
ومن ثم، المساحة المحددة بالفترة يمكن الحصول عليها عن طريق طرح المساحة المحددة بالفترة من المساحة المحددة بالفترة . وهذا يعطينا:
نحن نعرف أنه يمكننا إيجاد ، من جدول التوزيع الطبيعي المعياري. إذن، نحصل على .
هيا نلقِ نظرة على مثال يتناول احتمالات التوزيع الطبيعي المعياري.
مثال ٣: حساب احتمال فترة طول محدد لمتغيرات عشوائية طبيعية معيارية
اعتبر متغيرًا عشوائيًّا طبيعيًّا معياريًّا. احسب .
الحل
نلاحظ من السؤال أن فترة المعطاة تتضمن قيمًا سالبة. لذا، دعونا نبدأ بالتفكير في هذه العملية باستخدام الصور التوضيحية.
باستخدام المعادلات، نحصل على:
والآن، يمكننا إيجاد كلا الاحتمالين الموضحين في السطر الأخير باستخدام جدول التوزيع الطبيعي المعياري.
من خلال الصورة الموضحة أعلاه، نحصل على ، . وبإيجاد مجموع هذين الاحتمالين، يصبح لدينا:
إذن، احتمال يساوي ٠٫٦٩٥٥.
لحساب احتمالات المتغيرات الطبيعية العامة (بعبارة أخرى، تلك التي ليست على الصورة بعد)، علينا أولًا ربطها بالمتغير الطبيعي المعياري . تُعرف هذه العملية باسم تحويل التوزيع الطبيعي إلى توزيع طبيعي معياري. إذا كان متغيرًا عشوائيًّا طبيعيًّا متوسطه وانحرافه المعياري ، فإن هو المتغير العشوائي الطبيعي المعياري الذي متوسطه ٠ وانحرافه المعياري ١.
خطوات: تحويل التوزيع الطبيعي إلى توزيع طبيعي معياري لحساب الاحتمال
افترض أن متغير عشوائي طبيعي متوسطه وانحرافه المعياري . لحساب الاحتمال المعطى بالعلاقة ، علينا أن:
- نطرح من كل الأطراف: ،
- نقسم كل الأطراف على : ،
- نعوض عن التعبير الأوسط بالمتغير ،
- نستخدم جدول التوزيع الطبيعي المعياري للحصول على الاحتمال الذي يتضمن .
فيما يلي، نقدم تفسيرًا وجيزًا لهذا التحويل.
إذا كان موزَّعًا توزيعًا طبيعيًّا بالمتوسط والانحراف المعياري ، فإن:
ومن ثم، باستخدام الخاصية الخطية للقيمة المتوقعة، فإن الطرف الأيسر يساوي: وهو ما يساوي صفرًا، حيث . إذن، كما ذكرنا من قبل، . هيا ننتقل الآن إلى الانحراف المعياري: وهو ما يساوي ١، حيث . إذن، الانحراف المعياري للمتغير يساوي . وأخيرًا، نلاحظ أن مُوزع توزيعًا طبيعيًّا وذلك يأتي من أن مُوزع توزيعًا طبيعيًّا، حيث إن التحويل تحويل خطي. ومن ذلك، نستنتج أن المتغير مُوزَّع توزيعًا طبيعيًّا بمتوسط مقداره ٠، وانحراف معياري مقداره ١.
هيا نتناول الآن بعض الأمثلة لكي نتعرف على سياقات مختلفة.
مثال ٤: إيجاد احتمالات التوزيع الطبيعي بمعلومية المتوسط والتباين
افترِض أن مُتغيِّر عشوائي يتبع توزيعًا طبيعيًا، ومُتوسِّطه ٦٣، وتباينه ١٤٤. أوجد .
الحل
نبدأ حل هذه المسألة بتحويل التوزيع الطبيعي إلى توزيع طبيعي معياري. ونتذكر أنه إذا كان ، فإن هو المتغير الطبيعي المعياري، حيث .
لدينا . ولعلنا نتذكر أن الانحراف المعياري يساوي الجذر التربيعي الموجب للتباين، إذن .
وبطرح من كلا طرفَي المتباينة، نحصل على:
بعد ذلك، نقسم كل طرف على ، ثم نعوض عن بالمتغير ، وهذا يعطينا:
بما أن يتضمن قيمًا سالبة، فسنستخدم تماثل منحنى الجرس لتحديد منطقة موجبة مكافئة.
لذا، علينا حساب . باستخدام منحنى الجرس، نلاحظ أن:
وباستخدام جدول التوزيع الطبيعي المعياري، سنحصل على ، . ومن ثم:
إذن، .
مثال ٥: إيجاد احتمالات التوزيع الطبيعي بمعلومية المتوسط والانحراف المعياري
افترض أن مُتغيِّر عشوائي طبيعي متوسطه ٦٨، وانحرافه المعياري ٣. أوجد .
الحل
نبدأ بتحويل التوزيع الطبيعي إلى توزيع طبيعي معياري. ونتذكر أنه إذا كان ، فإن هو المتغير الطبيعي المعياري. لدينا .
نطرح أولًا من طرفَي المتباينة، ثم نقسم كلا الطرفين على ، مما يعطينا:
ونتذكر أن المتغير العشوائي المعياري يمكن التعويض عنه بالمتغير العشوائي المعياري . إذن، الاحتمال المذكور أعلاه يصبح .
سنرسم الآن صورًا توضيحية لمنحنى الجرس لنفكر في هذا الاحتمال.
هذا يعطينا:
وباستخدام جدول التوزيع الطبيعي المعياري، سنحصل على ، ومن ثم، فإن:
إذن، يساوي ٠٫٩٨٢١.
في آخر مثالين، سنوضح كيف نستخدم الاحتمال لإيجاد القيم الناقصة.
مثال ٦: استخدام الاحتمالات من التوزيع الطبيعي لإيجاد قيمةِ مجهولٍ
افترِض أن مُتغيِّر عشوائي طبيعي متوسِّطه ، وانحرافه المعياري . إذا كان ، فأوجد قيمة .
الحل
لقد علمنا من السؤال أن ، وعلمنا أيضًا أن لدينا . إذا حولنا التوزيع الطبيعي إلى توزيع طبيعي معياري، فسنحصل على:
وإذا افترضنا أن ، فعلينا إيجاد القيمة التي تحقق . بما أن ٠٫٩٩٣٨ أكبر من ٠٫٥، ففي هذه الحالة لا بد أن يكون قيمة سالبة.
باستخدام الرسم التوضيحي السابق، نحصل على المعادلة التالية:
وبما أننا نعرف أن ، ، نحصل على:
ومن جدول التوزيع الطبيعي المعياري، نحصل على . وعليه، ، أو بالمثل .
ولقد ذكرنا أن ، إذن:
لذلك، بحل هذه المعادلة لإيجاد قيمة ، نجد أن .
مثال ٧: حساب المتوسط لمتغيرات عشوائية مُوزَّعة تَوْزِيعًا طبيعيًّا
افترض أن مُتغيِّر عشوائي توزيعه طبيعي، ومُتوسِّطه ، وتباينه ١٩٦. إذا كان ، فأوجد قيمة .
الحل
نلاحظ أن المتوسط بارامتر مجهول. وبما أننا نعلم أن يتبع توزيعًا طبيعيًّا متوسطه وتباينه ١٩٦، يمكننا كتابة . لعلنا نتذكر أن الانحراف المعياري هو الجذر التربيعي للتباين، لذا فإن . بتحويل التوزيع الطبيعي إلى توزيع طبيعي معياري باستخدام هذه القيم، نجد أن:
أولًا، نفترض أن . بعد ذلك، لا بد أن يحقق . وبما أن ٠٫٠٦٦٨ أصغر من ٠٫٥، فلا بد أن يكون قيمة سالبة. باستخدام تماثل منحنى الجرس، نستنتج المعادلة التالية:
نحن نعرف أن ، . لذا، فإن:
من جدول التوزيع الطبيعي المعياري، نجد أن ، إذن . وبما أننا ذكرنا أن ، فإن: إذن، بحل هذه المعادلة لإيجاد قيمة ، نجد أن .
النقاط الرئيسية
- تنص القاعدة التجريبية على أنه إذا كان ، فإن:
- من البيانات تقريبًا تقع ضمن المنطقة من ،
- من البيانات تقريبًا تقع ضمن المنطقة من ،
- من البيانات تقريبًا تقع ضمن المنطقة من .
- المتغير الطبيعي المعياري يُشار إليه هكذا: .
- باستخدام التماثل، نجد أن ، .
- قد يحتوي جدول التوزيع الطبيعي المعياري على احتمالات على الصورة أو على الصورة .
- إذا كان مدى قيم يتضمن قيمًا سالبة وموجبة، فإننا نُقسِّم الحدث أولًا إلى الجزأين السالب والموجب.
- يمكننا رسم منحنيات الجرس واستخدام تماثلها لحساب الاحتمالات التي ليست على الصورة .
- إذا كان ، فإننا نحول التوزيع أولًا إلى توزيع معياري من خلال تعريف .