Dans cette fiche explicative, nous allons apprendre à utiliser la loi normale pour calculer des probabilités et déterminer des variables et paramètres inconnus.
Pour des variables concrètes comme le poids des nouveau-nés ou le salaire des employés d’une grande entreprise, on s’attend à ce qu’elles aient une loi de probabilité symétrique et concentrée près de la moyenne. Par exemple, l’histogramme ci-dessous montre un ensemble de données symétriques et concentrées près de la moyenne.
Lorsqu’un ensemble de données est symétrique et concentré près de la moyenne, on dit qu’il suit une loi normale. Pour des séries de données suivant une loi normale, la règle des 3 sigmas (également appelée règle ) donne des estimations utiles.
Théorème : Règle des 3 sigmas
Si un ensemble de données suit une loi normale de moyenne et d’écart-type , alors
- environ des données se situent à de ;
- environ des données se situent à de ;
- environ des données se situent à de .
Comme les séries de données, la représentation graphique de la fonction de densité d’une variable aléatoire continue qui suit une loi normale est symétrique et concentrée près de la moyenne. Si est une variable aléatoire normale de moyenne et d’écart-type , on pose . On précise que le second paramètre noté représente la variance plutôt que l’écart-type.
La forme de la représentation graphique de la fonction de densité d’une variable aléatoire normale est appelée courbe en cloche. L’aire totale sous la courbe en cloche est égale à 1 ou et la règle s’applique également à l’aire sous la courbe comme illustré ci-dessous.
Étudions quelques exemples de la règle des 3 sigmas.
Exemple 1: Estimer l’aire sous la courbe de densité d’une loi normale
Pour la loi normale ci-dessous, quel est le pourcentage approximatif de points de données dans la région colorée ?
Réponse
On rappelle la règle :
- environ des données se situent à de ;
- environ des données se situent à de ;
- environ des données se situent à de .
La région colorée se situe entre et , elle est donc exactement égale à la moitié de l’aire à de . Comme on sait qu’environ des données devraient se situer à de , environ la moitié de ces données doivent se situer entre et .
Environ des données se situent dans la région colorée.
Exemple 2: Estimer l’aire sous la courbe de densité d’une loi normale
Pour un ensemble de données suivant une loi normale de moyenne 32,1 et d’écart-type 2,8, entre quelles valeurs estimez-vous que des données se situent ?
Réponse
On rappelle la règle
- environ des données se situent à de ;
- environ des données se situent à de ;
- environ des données se situent à de .
Environ des données suivant une loi normale se situent à de .
La borne inférieure de à partir de est
La borne supérieure de à partir de est
On s’attend donc à ce que des données se situent entre 26,5 et 37,7.
Pour des variables aléatoires normales, on peut utiliser la table de la loi normale centrée réduite pour calculer la probabilité d’un événement donné. Cette approche permet de calculer les probabilités d’événements plus généraux par rapport à l’approche par la règle des 3 sigmas.
La table de la loi normale centrée réduite donne les valeurs de la probabilité de la variable aléatoire normale centrée réduite. La variable normale centrée réduite est une variable aléatoire continue de moyenne et d’écart-type . On désigne cette variable par . On note donc .
Les tables de la loi normale centrée réduite (également appelées tables de ) sont utilisées pour obtenir des probabilités de la variable normale centrée réduite . On doit d’abord comprendre quel type de probabilités la table de fournit. La table peut donner des probabilités sous la forme ou sous la forme . Si la valeur de la probabilité pour z égal à 0,00 est égale à 0,5, alors la table est du deuxième type (c.à.d. ). Si la valeur de probabilité pour z égal à 0,00 est égale à 0, alors la table est du premier type (c.à.d ). La différence entre ces deux tables est indiquée dans les figures ci-dessous.
On suppose que l’on souhaite calculer en utilisant la table . On doit localiser la borne supérieure 0,54 en trouvant 0,5 sur la colonne de gauche et 0,04 sur la ligne du haut.
Cela donne la valeur 0,7054 qui est égale à la probabilité .
En revanche, lorsque l’on utilise la table , on doit d’abord diviser la région en et , comme indiqué sur les figures ci-dessous.
On rappelle ensuite que et que peut être localisé sur la table comme indiqué ci-dessous.
Donc, . En les additionnant, on obtient qui est la même valeur que l’on avait obtenue en utilisant l’autre table de . En général, on peut utiliser l’une ou l’autre table de pour déterminer des probabilités de la variable normale centrée réduite . Dans la suite de cette fiche explicative, on utilisera la table de représentant les probabilités sous la forme .
Parfois, la borne supérieure contient une inconnue, auquel cas, la probabilité est fournie. Par exemple, pour trouver qui satisfait , on commence par localiser 0,2673 dans la table de la loi normale centrée réduite et on recherche les valeurs sur les côtés donnant .
On utilise cette méthode pour identifier que . Cela signifie que , où .
Comme est une variable aléatoire continue, on se souvient que pour toute valeur de . L’inégalité large et l’inégalité stricte sont donc interchangeables. Par exemple,
Lorsque l’on travaille sur les probabilités d’une loi normale, on utilise généralement par défaut la notation d’inégalité large. On doit garder à l’esprit qu’elle est équivalente à l’inégalité stricte.
On a observé ci-dessus que . Par symétrie de la courbe en cloche, on a aussi .
La symétrie de la loi normale joue un rôle important lors du calcul des probabilités impliquant des valeurs négatives. Si un événement inclut des valeurs négatives, on le divise d’abord en deux parties, positive et négative. Ensuite, en utilisant la courbe en cloche, on peut identifier un événement positif qui a la même probabilité que la partie négative. Cette opération est représentée par les étapes ci-dessous.
Les figures ci-dessus donnent l’équation où les deux probabilités de la dernière ligne peuvent être obtenues en utilisant la table de la loi normale centrée réduite. Il est souvent utile de penser à ces étapes avant d’écrire les équations correspondantes.
Les opérations sur les ensembles sont un bon outil du calcul de probabilités. Pour calculer , on observe les graphiques suivants.
On peut donc obtenir l’aire sur l’intervalle en soustrayant l’aire sur l’intervalle à l’aire sur . Cela donne
On sait que et peut être trouvé dans la table de la loi normale centrée réduite. On obtient .
Étudions un exemple sur les probabilités de la loi normale centrée réduite.
Exemple 3: Calculer la probabilité d’un intervalle de longueur finie pour une variable aléatoire normale centrée réduite
Soit une variable aléatoire normale centrée réduite. Calculez .
Réponse
On remarque que l’intervalle donné pour inclut des valeurs négatives. On commence par se rappeler le processus en utilisant les figures ci-dessous.
En équation, cela donne
On peut maintenant trouver les deux probabilités de la dernière ligne en utilisant la table de la loi normale centrée réduite.
D’après la figure ci-dessus, on obtient et . En calculant la somme des probabilités, on obtient
Par conséquent, la probabilité est égale à 0,6955.
Pour calculer les probabilités de variables normales générales (c’est-à-dire celles qui ne sont pas encore sous la forme ), nous devons d’abord les transformer en variables normales centrées réduites . Ce processus est connu sous le nom de standardisation de la loi normale. Si est une variable aléatoire normale de moyenne et d’écart-type , alors est la variable aléatoire normale centrée réduite de moyenne 0 et d’écart-type 1.
Comment standardiser une loi normale pour calculer une probabilité
Soit une variable aléatoire normale de moyenne et d’écart-type . Pour calculer la probabilité , on doit
- soustraire à tous les termes : ;
- diviser tous les termes par : ;
- remplacer l’expression centrale par ;
- utiliser la table de la loi normale centrée réduite pour obtenir la probabilité impliquant .
On donne ci-dessous une brève justification de cette transformation.
Si suit une loi normale de moyenne et d’écart-type , alors
Par linéarité de l’espérance, le membre droit est donc égal à qui est égal à zéro car . Donc, comme indiqué plus tôt, . On se penche maintenant sur l’écart-type qui est égal à 1 car . L’écart-type de est donc égal à . Enfin, on remarque que la normalité de est héritée de la normalité de car la transformation est linéaire. En conclusion, la variable suit une loi normale de moyenne 0 et d’écart-type 1.
Étudions quelques exemples pour nous familiariser avec différents contextes.
Exemple 4: Déterminer la probabilité d’une loi normale à partir de sa moyenne et de sa variance
Soit une variable aléatoire suivant une loi normale de moyenne de 63 et de variance 144. Déterminez .
Réponse
On commence par standardiser la loi normale. On rappelle que si , alors est la variable normale centrée réduite .
On a . On rappelle que l’écart-type est égal à la racine carrée positive de la variance, donc .
En soustrayant à chaque terme de l’inégalité, on obtient
On divise ensuite chaque membre par et on remplace par , ce qui donne
Comme inclut des valeurs négatives, on utilise la symétrie de la courbe en cloche pour identifier une région positive équivalente.
On doit donc calculer . En utilisant la courbe en cloche, on remarque que
En utilisant la table de la loi normale centrée réduite, on obtient et . Puis
Donc, .
Exemple 5: Déterminer la probabilité d’une loi normale à partir de sa moyenne et de son écart-type
Soit une variable aléatoire suivant une loi normale de moyenne 68 et d’écart-type 3. Déterminez .
Réponse
On commence par standardiser la loi normale. On se souvient que si , alors est la variable normale centrée réduite. On a .
On soustrait d’abord à chaque terme de l’inégalité, puis on divise chaque terme par , ce qui donne
On rappelle que la variable aléatoire normale standardisée peut être remplacée par la variable aléatoire normale centrée réduite . La probabilité ci-dessus est donc égale à .
On trace la courbe en cloche pour déterminer cette probabilité.
Cela donne
En utilisant la table de la loi normale centrée réduite, on obtient , donc
Par conséquent, est égale à 0,9821.
Dans nos deux derniers exemples, nous allons montrer comment utiliser la probabilité pour calculer des valeurs inconnues.
Exemple 6: Utiliser la probabilité d’une loi normale pour évaluer une inconnue
Soit une variable aléatoire suivant une loi normale de moyenne et d’écart-type . Sachant que , déterminez .
Réponse
On sait que et que . Si on standardise la loi normale, on obtient
Si on définit , alors on doit trouver qui satisfait . Comme 0,9938 est supérieur à 0,5, doit être négatif.
En utilisant l’illustration ci-dessus, on obtient l’équation suivante :
Comme on sait que et , on obtient
D’après la table de la loi normale centrée réduite, on obtient . Donc, , ou, de manière équivalente, .
On rappelle que l’on a défini , donc
Résoudre cette équation pour déterminer donne .
Exemple 7: Calculer la moyenne d’une variable aléatoire normale
On suppose que suit une loi normale de moyenne et de variance 196. Sachant que , déterminez la valeur de .
Réponse
On note que la moyenne est un paramètre inconnu. Comme suit une loi normale de moyenne et de variance 196, on peut écrire . On rappelle que l’écart-type est la racine carrée de la variance, donc . En standardisant la loi normale avec ces valeurs, on trouve
On commence par définir . Donc, satisfait . Comme 0,0668 est inférieur à 0,5, doit être négatif. En utilisant la symétrie de la courbe en cloche, on en déduit l’équation suivante :
On sait que et . Donc,
À partir de la table de la loi normale centrée réduite, on trouve donc . Comme on a défini , on a Résoudre cette équation pour déterminer donne .
Points clés
- La règle des 3 sigmas stipule que si , alors
- environ des données se situent à de ;
- environ des données se situent à de ;
- environ des données se situent à de .
- La variable normale centrée réduite est notée .
- Par symétrie, et .
- Une table de la loi normale centrée réduite peut présenter des probabilités sous la forme ou sous la forme .
- Si l’intervalle des valeurs de inclut des valeurs négatives et positives, alors on divise l’événement en deux parties positive et négative.
- On trace la courbe en cloche et on utilise sa symétrie pour calculer les probabilités qui ne sont pas sous la forme .
- Si , alors on commence par standardiser la loi en définissant .