Transcription de la vidéo
Pour la distribution normale indiquée, quel est le pourcentage approximatif de points de données dans la région ombrée ?
N’oubliez pas que, l’aire totale sous la courbe représentant une loi normale est de 100 pour cent. Pour qu’une distribution de données soit normale, nous disons qu’environ 68 pour cent de données se situe à l’intérieur d’un écart-type de la moyenne. C’est ce groupe. Environ 95 pour cent se situent à moins de deux écarts-types de la moyenne. C’est ce groupe.
Nous avons tendance à dire que toute donnée en dehors de ce groupe est une valeur aberrante. Donc tout ce qui est en dehors de deux écarts-types de la moyenne, à savoir la moyenne moins deux écarts-types et la moyenne plus deux écarts-types, est une valeur aberrante. Maintenant environ 99,7 pour cent de données se situe à moins de trois écarts-types de la moyenne. C’est cette zone ombrée.
Rappelez-vous, nous avons dit que l’aire totale sous la courbe est de 100 cent pour cent. Donc pour calculer le pourcentage de l’ensemble de données qui se situe en dehors de trois écarts-types de la moyenne, nous soustrayons 99,7 pour cent de 100. 100 moins 99,7 est 0,3. Ainsi 0,3 pour cent de l’ensemble de données se situe en dehors de trois écarts-types de la moyenne.
Puisque nous ne sommes intéressés que par la moitié de ces données, nous diviserons 0,3 par deux. 0,3 divisé par deux est 0,15. Ainsi, 0,15 pour cent des points de données se trouvent dans la région ombrée.