Vidéo de la leçon: Loi normale | Nagwa Vidéo de la leçon: Loi normale | Nagwa

Vidéo de la leçon: Loi normale Mathématiques

Dans cette vidéo, nous allons apprendre à utiliser la loi normale pour calculer des probabilités et déterminer des variables et paramètres inconnus.

15:32

Transcription de la vidéo

Dans cette vidéo, nous allons apprendre à utiliser la loi normale pour calculer des probabilités et déterminer des variables et paramètres inconnus. La loi normale est une des lois de probabilité les plus fondamentales car elle permet de modéliser plusieurs types de phénomènes naturels, tels que la taille des adultes. Elle peut aussi être une bonne approximation pour d’autres lois lorsque la quantité de données est grande.

Étudions donc de plus près cette loi normale. Une variable aléatoire suivant une loi normale est un type de variable aléatoire continue. Et en observant la représentation graphique de sa fonction de densité de probabilité, on voit qu’elle a une forme très distincte. Toutes les lois normales sont représentées par une courbe en forme de cloche, que l’on appelle parfois une courbe de Gauss après le mathématicien Carl Friedrich Gauss qui a contribué au développement de la théorie de la loi normale. On utilise une lettre majuscule, dans ce cas 𝑋, pour représenter une variable aléatoire suivant une loi normale. Et la loi peut être complètement décrite par deux paramètres, qui sont son espérance, ou sa moyenne, 𝜇 et sa variance, 𝜎 au carré. Voyons maintenant quelques caractéristiques clés de cette loi de probabilité.

Tout d’abord, la courbe de la loi normale est symétrique par rapport à son espérance 𝜇. Comme pour toute loi de probabilité, l’aire totale sous la courbe est égale à un, ce qui signifie que l’aire de chaque côté de cet axe de symétrie vertical est égale à 0,5. L’aire à gauche de toute valeur 𝑥 sur l’axe des abscisses donne la proportion de points de données qui sont inférieurs ou égaux à x. Cela représente la probabilité que la variable aléatoire grand 𝑋 soit inférieure ou égale à l’observation petit x. Il faut préciser ici que, comme il s’agit d’une loi continue, il n’y a aucune différence entre une inégalité stricte et une inégalité large car la probabilité que la variable aléatoire soit égale à une valeur particulière est nulle.

Nous avons donc vu que l’aire est divisée en deux parties égales de chaque côté de l’axe de symétrie vertical. Mais on peut en réalité diviser l’aire sous la courbe en davantage de régions représentant les proportions approximatives des points de données. C’est ce qu’on appelle la règle des trois sigmas ou la règle 68-95-99,7. Si on considère d’abord un écart-type de chaque côté de l’espérance, l’aire sous la courbe entre ces valeurs représente environ 68,3 pour cent de l’aire totale, ce qui signifie qu’environ cette proportion des points de données se situe à moins d’un écart-type de l’espérance.

De la même manière, si on considère deux écarts-types de de chaque côté de l’espérance, la région entre ces valeurs représente environ 95 pour cent de l’aire totale. Donc, 95 pour cent des points de données se situent à moins de deux écarts-types de l’espérance. Et si on va encore plus loin avec trois écarts-types de chaque côté de l’espérance, l’aire sous la courbe représente environ 99,7 pour cent de l’aire totale.

Il est donc très rare que les valeurs d’une variable suivant une loi normale se situent à plus de trois écarts-types de l’espérance, ce qui est un point important pour le contrôle des processus statistiques. Si on suppose qu’une variable suit une loi normale, toutes les valeurs situées à plus de trois écarts-types de l’espérance sont généralement considérées comme des valeurs aberrantes et peuvent indiquer qu’un événement inhabituel s’est produit et nécessite une analyse. Il est utile de mémoriser les trois pourcentages clés associés à ces distances par rapport à l’espérance, comme nous allons le voir avec le premier exemple.

On considère un jeu de données suivant une loi normale d’espérance 32,1 et d’écart-type 2,8. Dans quel intervalle peut-on s’attendre à ce que 95 pour cent des données se situent ?

On rappelle tout d’abord que pour une variable aléatoire suivant une loi normale, environ 95 pour cent des points de données se situent à moins de deux écarts-types de l’espérance. Nous devons donc calculer les valeurs inférieures et supérieures de deux écarts-types à l’espérance pour cette loi normale.

La question indique que l’espérance est 32,1 et que l’écart-type est 2,8, on peut donc calculer ces valeurs assez facilement. La valeur inférieure 𝜇 moins deux 𝜎 est égale à 32,1 moins deux fois 2,8, soit 26,5. La valeur supérieure 𝜇 plus deux 𝜎 est égale à 32,1 plus deux fois 2,8, soit 37,7. Donc d’après la règle des trois sigmas qui stipule qu’environ 95 pour cent des données d’une variable suivant une loi normale se situent à moins de deux écarts-types de l’espérance, on conclut que pour cette loi, environ 95 pour cent des données sont comprises entre 26,5 et 37,7.

Mais il peut également être intéressant de déterminer la proportion de points de données pour d’autres intervalles de valeurs. On doit pour cela considérer un cas particulier de la loi normale, qui est la loi normale centrée réduite. On la désigne souvent par la lettre Z. Et elle représente la loi normale qui a une espérance égale à zéro et un écart-type, et donc une variance, égal à un.

Les valeurs de cette variable représentent à combien d’écarts-types au-dessus ou en dessous de l’espérance une valeur particulière se situe sur l’axe des abscisses. Par exemple, une valeur de 1,4 est une valeur supérieure de 1,4 écart-type à l’espérance, alors qu’une valeur de moins 2,1 est une valeur inférieure de 2,1 écarts-types à l’espérance. Ces valeurs de la variable suivant la loi normale centrée réduite sont très utiles car elles nous permettent de visualiser les valeurs d’une variable suivant une loi normale générale sur une échelle centrée réduite.

On va voir qu’il existe des tables de probabilité permettant de déterminer les aires et donc les probabilités associées à des valeurs spécifiques de la variable centrée réduite. La table qu’on va utiliser dans cette vidéo donne la probabilité que la variable aléatoire grand 𝑍 soit comprise entre zéro et une observation petit z. Il s’agit donc de la proportion de points de données ou de l’aire sous la courbe entre zéro et une valeur z positive. Si on souhaite plutôt calculer la proportion de points de données qui se situent tout à gauche, c’est-à-dire qui sont inférieurs à une valeur z positive, il faut ajouter 0,5 à la valeur de la table pour tenir compte de l’aire à gauche de l’axe de symétrie. C’est-à-dire de la zone hachée en rose.

On va voir en détail dans le prochain exemple comment utiliser les tables pour calculer ces probabilités.

Utilisez les tables de probabilité pour déterminer la probabilité qu’une variable suivant une loi normale centrée réduite soit inférieure à 2,13.

On doit calculer la probabilité qu’une variable suivant une loi normale centrée réduite soit inférieure à 2,13, ce qui représente la proportion de points de données, ou l’aire sous la courbe, à gauche de cette valeur de 2,13. Voici donc la table de la loi normale centrée réduite. Elle donne la proportion de points de données ou l’aire sous la courbe entre zéro et une valeur 𝑧 positive. Elle ne correspond qu’à la partie maintenant hachée en rose sur notre figure. Mais cela ne pose pas de problème car on sait que la courbe d’une loi normale est symétrique par rapport à son espérance. Donc l’aire de la région haché en orange est exactement égale à 0,5. On devra donc ajouter 0,5 à la valeur que nous allons trouver dans la table.

En observant la table, on voit que les valeurs de la première colonne vont de 0 à 3. Ces valeurs augmentent de 0,1 à chaque fois. La première ligne du tableau donne ensuite les valeurs de la deuxième décimale de la valeur 𝑧. La valeur que nous recherchons est 2,13, on cherche donc 2,1 dans la première colonne puis 0,03 dans la première ligne car 2,1 plus 0,03 égale 2,13. On trouve ensuite la valeur dans la cellule du tableau correspondante à cette ligne et cette colonne, il s’agit de 0,4834. Cela nous indique que l’aire sous la courbe comprise entre zéro et 2,13 est égale à 0,4834. L’aire totale à gauche de 2,13 est donc égale à 0,5 plus cette valeur, soit 0,9834. Il s’agit de la probabilité qu’une variable suivant une loi normale centrée réduite soit inférieure à 2,13. Et cela représente l’aire sous la courbe de la loi normale centrée réduite à gauche de 2,13.

Dans l’exemple précédent, on a vu comment utiliser la table pour déterminer l’aire sous la courbe de la loi normale entre zéro et une valeur 𝑧 positive. On peut également utiliser cette table et la symétrie de la loi normale pour déterminer la proportion de points de données situés dans d’autres intervalles. Tout d’abord, comme la courbe est symétrique par rapport à son espérance, l’aire sous la courbe entre zéro et une valeur 𝑧 positive est la même que l’aire sous la courbe entre l’opposé de cette valeur et zéro. On peut également calculer l’aire à droite d’une valeur 𝑧 en utilisant le fait que l’aire totale sous la courbe est égale à un. Donc la probabilité que la variable aléatoire grand 𝑍 soit supérieure ou égale à une valeur petit z est égale à un moins la probabilité qu’elle soit inférieure ou égale à cette même valeur.

On peut de plus calculer la proportion de points de données qui se situent entre deux valeurs positives en soustrayant une aire à l’autre. On va par la suite voir quelques exemples des différents types de problèmes que l’on peut rencontrer. Tout cela fonctionne très bien si la loi que l’on étudie est déjà la loi normale centrée réduite. Mais on peut en fait également convertir les valeurs d’une variable suivant une loi normale d’espérance et d’écart-type quelconques en une variable suivant une loi normale centrée réduite pour la visualiser et l’utiliser à une échelle centrée réduite. On convertit les valeurs de la variable en utilisant la formule 𝑧 égale 𝑥 moins 𝜇 sur 𝜎. On prend une observation 𝑥, on soustrait l’espérance de la loi qu’elle suit, puis on divise par l’écart-type 𝜎. La valeur 𝑧 sera alors une observation de la loi normale centrée réduite.

La probabilité que la variable aléatoire initiale grand X soit comprise entre zéro et petit 𝑥 est alors égale à la probabilité que la nouvelle variable aléatoire grand 𝑍 soit comprise entre zéro et petit z. Et cela nous permet d’utiliser les tables de la loi normale centrée réduite pour déterminer cette probabilité. Voyons un exemple de cela.

Soit 𝑋 une variable aléatoire suivant une loi normale d’espérance 68 et d’écart-type 3. Déterminez la probabilité que 𝑋 soit supérieure ou égale à 61,7.

On a donc une variable aléatoire suivant une loi normale et on veut calculer la probabilité que sa valeur soit supérieure ou égale à 61,7. On sait que 61,7 est situé dans la moitié inférieure des valeurs de la variable car cette valeur est inférieure à l’espérance 68. Donc la probabilité que nous recherchons correspond à l’aire hachée en orange sous la courbe de la loi normale. On doit tout d’abord calculer la valeur 𝑧 centrée réduite associée à cette valeur en utilisant la formule 𝑧 égale 𝑥 moins 𝜇 sur 𝜎. On a donc 𝑧 égale 61,7 moins 68 sur trois, ce qui fait moins 2,1 ; cela signifie que la valeur 61,7 est inférieure de 2,1 écarts-types à l’espérance 68.

Comme on ne peut pas chercher une valeur 𝑧 négative dans la table de la loi normale centrée réduite, on doit utiliser la symétrie de la courbe de la loi normale. Sur notre échelle centrée réduite, l’aire à droite de la valeur moins 2,1 est égale à l’aire à gauche de la valeur plus 2,1. Et on peut trouver la probabilité associée à une valeur 𝑧 de 2,1 dans la table de la loi normale centré réduite, ce qui nous donnera l’aire à droite de l’espérance. À laquelle on devra ajouter 0,5 pour l’aire à gauche de l’espérance. En utilisant la table, on trouve que la probabilité associée à la valeur 2,1 est 0,4821. Par conséquent, la probabilité que Z soit inférieure ou égale à 2,1, qui est égale à la probabilité que Z soit supérieure ou égale à moins 2,1, qui est aussi la probabilité que la variable 𝑋, non centrée réduite, soit supérieure ou égale à 61,7, est de 0,5 plus 0,4821, soit 0,9821.

Étudions maintenant un exemple dans lequel on doit calculer la probabilité que la variable soit comprise entre deux valeurs.

Soit 𝑋 une variable aléatoire suivant une loi normale d’espérance 63 et de variance 144. Calculez la probabilité que 𝑋 soit supérieure ou égale à 37,56 et inférieure ou égale à 57,36.

On a donc une variable 𝑋 suivant une loi normale avec une espérance de 63 et une variance de 144 - soit 12 au carré. On cherche la probabilité que 𝑋 soit entre ces deux valeurs, qui sont toutes les deux situées dans la moitié inférieure des valeurs de la variable. On commence par calculer la valeur 𝑧 centrée réduite pour chaque valeur en utilisant la formule 𝑧 égale 𝑥 moins 𝜇 sur 𝜎. Pour la première valeur 𝑥, on obtient 37,56 moins 63 sur 12, ce qui est égal à moins 2,12. Et pour la deuxième valeur 𝑥, la valeur de 𝑧 est moins 0,47.

On ne peut pour le moment rechercher aucune de ces valeurs dans la table de la loi normale centrée réduite car elles sont négatives. On doit donc utiliser la symétrie de la courbe de la loi normale. Sur notre échelle centrée réduite, la probabilité que 𝑧 soit supérieur ou égal à moins 2,12 et inférieur ou égal à moins 0,47 est égale à la probabilité que 𝑧 soit supérieur ou égal à plus 0,47 et inférieur ou égal à plus 2,12, et on peut trouver ces deux valeurs dans la table de la loi normale centrée réduite.

On rappelle que cette table nous donne la probabilité que grand Z soit compris entre zéro et une valeur petit 𝑧 positive. On peut donc soustraire la probabilité associée à 0,47 à la probabilité associée à 2,12. D’après la table, ces probabilités sont égales à 0,4830 et 0,1808. Et leur différence donne 0,3022. Par conséquent, en réduisant en une loi normale centrée réduite et en utilisant sa symétrie, on a trouvé que la probabilité que 𝑋 soit supérieure ou égale à 37,56 et inférieure ou égale à 57,36 est de 0,3022.

Résumons maintenant les points clés de cette vidéo. On a tout d’abord vu les probabilités associées à trois régions clés sous la courbe de la loi normale avec la règle des trois sigmas. Pour calculer la valeur 𝑧 centrée réduite d’une observation 𝑥, on soustrait l’espérance 𝜇 puis on divise par l’écart-type 𝜎. Cela permet de convertir une observation d’une variable suivant une loi normale d’espérance 𝜇 et d’écart-type 𝜎 en une observation d’une variable suivant la loi normale d’espérance zéro et d’écart-type un. On peut alors utiliser les tables de la loi normale centrée réduite pour rechercher l’aire sous la courbe entre zéro et une valeur 𝑧 positive. On peut ensuite combiner ces valeurs avec la symétrie de la courbe de la loi normale pour calculer les probabilités de différents intervalles de valeurs.

Rejoindre Nagwa Classes

Assistez à des séances en direct sur Nagwa Classes pour stimuler votre apprentissage avec l’aide et les conseils d’un enseignant expert !

  • Séances interactives
  • Chat et messagerie électronique
  • Questions d’examen réalistes

Nagwa utilise des cookies pour vous garantir la meilleure expérience sur notre site web. Apprenez-en plus à propos de notre Politique de confidentialité