Transcription de la vidéo
Dans cette leçon, nous allons apprendre à prélever un échantillon aléatoire stratifié. Gardez à l’esprit que lorsque nous collectons des données, notre objectif est de les utiliser pour déterminer ou en déduire des informations sur la population. Pour que nos résultats soient précis et représentatifs de la population, nous devons faire très attention à ce que notre collecte de données soit également précise et représentative.
Maintenant, en général, il n’est pas possible de recueillir des données sur une population entière. Par exemple, supposons que nous étudions les poissons d’un lac. Pour prendre des mesures de tous les poissons, c’est-à-dire de toute la population, il faudrait d’abord tous les attraper. Non seulement il y a peu de chances que cela soit réalisable mais ce n’est de plus certainement pas une bonne idée pour les poissons. Nous pouvons à la place sélectionner un échantillon de poissons. Nous prenons ensuite des mesures ou notons les caractéristiques des poissons dans l’échantillon et utilisons des méthodes statistiques pour obtenir des informations et en déduire des résultats sur la population à partir des données de l’échantillon.
L’échantillonnage aléatoire stratifié est une méthode de sélection d’un échantillon représentatif d’une population subdivisée en groupes, ou strates, distincts. Lorsque la population peut être subdivisée en groupes ou strates disjointes, on peut prélever un échantillon aléatoire dans chaque strate, que l’on combine ensuite en un échantillon de la population globale. La taille de l’échantillon aléatoire de chaque strate doit refléter la taille de cette strate dans la population. Cela signifie que les strates sont représentées dans l’échantillon final dans les mêmes proportions que dans la population. Donc si on définit la taille de la population par grand 𝑁, la taille de la strate par grand S, la taille requise de l’échantillon par petit 𝑛 et la taille de l’échantillon de la strate par petit 𝑠. Alors petit s est égal à la taille de la strate, grand 𝑆, sur la taille de la population, grand 𝑁, multiplié par la taille de l’échantillon requise petit 𝑛.
Sinon, si nous savons qu’une strate représente un certain pourcentage de la population – par exemple 𝜌 - alors la taille de l’échantillon de cette strate est égale à 𝜌 pour cent fois petit 𝑛, qui est la taille de l’échantillon requise. L’important est que les tailles des échantillons des strates soient dans les mêmes proportions que les strates dans la population. Appliquons cela dans un exemple.
48 joueurs hommes et 32 joueuses femmes sont inscrits à un club de tennis local. Dans un échantillon représentatif de 10 joueurs, combien seraient des hommes et combien seraient des femmes ?
Puisque la population de joueurs de tennis est divisée en deux strates, les hommes et les femmes, et qu’il y a 48 hommes et 32 femmes, la taille de la population grand 𝑁 est égale à 48 plus 32, soit 80. Nous allons ensuite utiliser un échantillonnage aléatoire stratifié, où petit 𝑛 est la taille de l’échantillon, qui dans notre cas est 10. La taille de la population, grand 𝑁, est de 80. Et la taille de l’échantillon de chaque strate, petit 𝑠, est égale à la taille de la strate, grand 𝑆, divisée par la taille de la population, grand 𝑁, multiplié par la taille de l’échantillon, petit n. Cela signifie que la taille de l’échantillon pour les hommes est de 48 sur 80 fois 10. En simplifiant le facteur commun 10, puis le facteur commun huit, nous obtenons six hommes dans l’échantillon.
Et en effectuant le même calcul pour les femmes, on a 32 femmes divisées par 80 dans toute la population multiplié par 10 dans l’échantillon. En simplifiant à nouveau le facteur commun 10 et le facteur commun huit, nous obtenons quatre femmes dans notre échantillon. Cela signifie que nous sélectionnons un échantillon aléatoire de six joueurs parmi un total de 48 hommes et un échantillon aléatoire de quatre joueuses parmi un total de 32 femmes. Et cela constitue notre échantillon aléatoire total de 10 joueurs de la population.
Voyons maintenant comment cela fonctionne si les proportions sont données sous forme de pourcentages.
On suppose que 60 pour cent des joueurs du clubs de tennis sont des hommes et que 40 pour cent sont des femmes. Dans un échantillon aléatoire de 10 joueurs, combien d’hommes et de femmes devons-nous choisir ?
La population des membres du club de tennis est divisée en strates. Les deux strates sont les femmes et les hommes. Nous savons que 60 pour cent de la population sont des hommes, que 40 pour cent de la population sont des femmes et que la taille de l’échantillon est 10. On l’appelle petit 𝑛. Pour déterminer combien d’entre eux doivent être des hommes et combien doivent être des femmes, nous utilisons la formule petit 𝑠, qui correspond à la taille de l’échantillon de chaque strate, égale 𝜌 fois petit 𝑛, où 𝜌 est le pourcentage de chaque strate.
En commençant par le nombre d’hommes dont nous avons besoin dans notre échantillon, on a 𝑠 H égale 60 pour cent de 10, c’est-à-dire 60 sur 100 fois 10. Et en simplifiant le facteur commun 10, ce que l’on peut faire une deuxième fois, nous trouvons que le nombre d’hommes dans notre échantillon 𝑠 H doit être égal à six.
Nous pouvons à présent faire le même calcul pour les femmes et il y a 40 pour cent de joueuses. Donc le nombre de femmes dans l’échantillon doit être égal à 40 sur 100 fois 10. Il y a donc quatre femmes dans l’échantillon de 10. Par conséquent, dans un échantillon stratifié de 10 membres du club de tennis, un échantillon représentatif est composé de six hommes et de quatre femmes.
Analysons maintenant la définition de l’échantillonnage aléatoire stratifié dans un nouvel exemple.
Dans un sondage concernant les universités auxquels certains élèves du lycée aimeraient s’inscrire, un échantillon de 2 000 élèves a été sélectionné au hasard parmi une population de 40 000 élèves. Cela est-il considéré comme un échantillonnage stratifié ?
Pour répondre à cette question, rappelons ce que nous entendons par échantillonnage aléatoire stratifié. Il s’agit d’une méthode d’échantillonnage utilisée lorsque la population peut être subdivisée en groupes ou strates disjointes. Pour sélectionner un échantillon aléatoire stratifié dans une population, on prélève des échantillons aléatoires dans chaque strate proportionnellement à la taille de cette strate dans la population. Dans cet exemple, il est indiqué que la taille de la population est 40 000 et qu’un échantillon de 2 000 élèves ont été choisis au hasard. Nous ne savons pas si la population a été subdivisée en strates à cette fin. Nous devons donc supposer que l’échantillon aléatoire de 2 000 élèves a été sélectionné directement dans la population sans définir de strates. Ce qui ne correspondrait pas à un échantillonnage stratifié. Nous concluons donc qu’il ne s’agit pas d’un échantillonnage stratifié.
Voyons maintenant un exemple où nous devons calculer la taille de l’échantillon d’une strate.
Dans une étude des ressources humaines sur les salaires dans une entreprise de 1 000 employés, les employés ont été divisés entre hommes et femmes. Sachant que le pourcentage total de femmes dans l’entreprise est de 60 pour cent et qu’un échantillon de 40 employés a été formé, quel est le nombre d’hommes dans l’échantillon ?
Étant donné que la population, c’est-à-dire les employés de l’entreprise, se subdivise naturellement en deux strates, à savoir les hommes et les femmes, nous utilisons un échantillonnage aléatoire stratifié comme méthode d’échantillonnage. Cela signifie que tout échantillon doit refléter les proportions des strates dans la population. Il est indiqué que 60 pour cent des employés sont des femmes. Et qu’un échantillon de 40 employés a été sélectionné. Donc 60 pour cent de ces 40 employés doivent être des femmes.
Comme les employés sont divisés en deux strates distinctes, hommes et femmes, si 60 pour cent sont des femmes, alors 100 moins 60 pour cent doivent être des hommes. Autrement dit, 40 pour cent des employés doivent être des hommes. Cela signifie alors que 40 pour cent de l’échantillon doivent également être des hommes. Afin de calculer le nombre d’hommes dans l’échantillon, nous utilisons la formule petit 𝑠 égale 𝜌 pour cent fois 𝑛, où petit 𝑠 est la taille de l’échantillon de la strate. 𝜌 est le pourcentage de la strate dans la population. Et 𝑛 est la taille globale de l’échantillon. Dans ce cas, la taille de la strate des hommes est égale à 40 pour cent fois 40, c’est-à-dire 40 sur 100 fois 40.
On peut simplifier le facteur commun 10. Et en simplifiant une nouvelle fois le facteur commun 10, on obtient quatre fois quatre, soit 16. Le nombre d’hommes dans l’échantillon est donc de 16.
Étudions un autre exemple.
Ethan doit mener une étude pour déterminer si les élèves de son école aiment jouer au football. Il décide de diviser les élèves en deux groupes, garçons et filles, sachant que l’école compte 200 élèves et que 80 d’entre eux sont des filles. Si Ethan décide que la taille de son échantillon est de 50 élèves, combien de filles doit-il sélectionner pour l’étude ?
Comme la population des élèves est divisée en deux strates distinctes, les garçons et les filles, la méthode d’échantillonnage appropriée est un échantillonnage aléatoire stratifié. Un échantillon aléatoire stratifié est un échantillon global composé d’échantillons aléatoires choisis dans des groupes ou des strates distincts de la population. La taille de l’échantillon de chaque strate reflète la proportion de la strate dans la population.
Pour calculer la taille de l’échantillon d’une strate, petit 𝑠, nous utilisons la formule petit 𝑠 égale grand 𝑆, qui est la taille de la strate, divisé par la taille de la population grand 𝑁, multiplié par petit 𝑛, qui est la taille globale de l’échantillon. Dans ce cas, il y a un total de 200 élèves donc grand 𝑁 est égal à 200. Nous savons qu’il y a 80 filles donc grand 𝑆 égale 80 et que la taille de l’échantillon d’Ethan est de 50. Autrement dit, petit 𝑛 égale 50. Donc la taille de l’échantillon pour les filles est égale à 80 filles divisé par une population de 200 multiplié par la taille de l’échantillon, 50. On peut simplifier le facteur commun 50, puis le facteur commun quatre, ce qui nous donne 20. Par conséquent, Ethan doit sélectionner 20 filles pour son étude.
Dans le prochain exemple, nous allons effectuer un échantillonnage aléatoire stratifié dans une population divisée en trois sous-groupes.
Un scientifique décide de mener une enquête sur l’effet d’un médicament dans une ville de 100 000 habitants. Il les divise en trois groupes en fonction de leur zone d’habitation : centre-ville, périphérie et banlieue. 10 000 personnes vivent en banlieue et 30 000 personnes vivent en périphérie. Si le scientifique décide de prélever un échantillon de 1 000 personnes, combien de personnes vivant en banlieue doit-il sélectionner ?
Sachant que la ville est divisée en trois groupes ou strates distincts, une méthode d’échantillonnage appropriée est l’échantillonnage aléatoire stratifié. On rappelle qu’un échantillon aléatoire stratifié est un échantillon qui combine plusieurs échantillons aléatoires provenant de groupes distincts de la population. La taille de l’échantillon de chaque groupe reflète la proportion de ce groupe ou de cette strate dans la population.
Afin de calculer la taille de l’échantillon de chaque strate, on utilise la formule petit s égale grand 𝑆, qui est la taille de la strate, divisé par grand 𝑁, qui est la taille de la population, multiplié par petit 𝑛, qui est la taille globale de l’échantillon. Dans ce cas, la taille de la population est de 100 000 habitants. Cela correspond à grand 𝑁. Et nous cherchons combien de personnes vivant en banlieue doivent être sélectionnées pour l’échantillon. La question nous indique que 10 000 personnes vivent en banlieue. Donc grand 𝑆 est égal à 10 000. La taille globale de l’échantillon de la population est de 1 000 personnes, donc petit 𝑛 égale 1 000. En substituant ces valeurs dans la formule, la taille de l’échantillon des personnes vivant en banlieue est égale à 10 000 divisé par 100 000 multiplié par 1 000, c’est-à-dire la taille de la strate divisée par la taille de la population multiplié par la taille globale de l’échantillon.
On peut simplifier le facteur commun 1 000, puis le facteur commun 100. Et nous obtenons une taille d’échantillon de 100 personnes vivant en banlieue. Donc, pour un échantillon de 1 000 personnes, 100 parmi elles doivent habiter en banlieue.
Terminons cette leçon en récapitulant certains points clés de l’échantillonnage aléatoire stratifié. L’échantillonnage aléatoire stratifié est une méthode d’échantillonnage utilisée lorsque la population peut être divisée en groupes ou strates distincts. Un échantillon stratifié combine des échantillons aléatoires, un par strate, où la taille de l’échantillon reflète la proportion de la strate dans la population. Pour une population de grand 𝑁 individus, une strate de grand 𝑆 individus et une taille globale de l’échantillon petit n, la taille de l’échantillon petit 𝑠 d’une strate est égale à grand 𝑆 sur grand N multiplié par petit n. Sinon, si nous connaissons le pourcentage d’une strate dans la population, par exemple 𝜌, la taille de l’échantillon de cette strate, petit 𝑠, est égale à 𝜌 pour cent fois petit 𝑛, qui est la taille globale de l’échantillon.