Video Transcript
Un élève veut effectuer des recherches sur le nombre d’élèves de son collège qui prennent le car scolaire. Laquelle des méthodes suivantes est la meilleure méthode pour obtenir un échantillon non biaisé ? L’option (A) demander à tous les élèves de l’équipe de gymnastique s’ils prennent dans le car scolaire. L’option (B) demander à tous les élèves présents à la bibliothèque le jeudi s’ils prennent le car scolaire. L’option (C) demander à un échantillon aléatoire de cinq élèves dans le couloir s’ils prennent le car scolaire. L’option (D) demander à un échantillon aléatoire de 50 élèves de sa classe s’ils prennent le car scolaire. Ou l’option (E) demander à un échantillon aléatoire de 100 élèves pendant le déjeuner s’ils prennent le car scolaire.
Nous pouvons rappeler qu’un échantillon biaisé est une méthode de choix d’un échantillon qui favorise certaines valeurs de la variable d’étude. La variable d’étude ici est prendre le car scolaire. Nous devons déterminer s’il existe un échantillon représentatif de la population. La population ici est composée des élèves du collège. S’il existe un échantillon représentatif, alors chaque individu de la population, dans ce cas du collège, a une chance égale d’être sélectionné dans l’échantillon. Voyons donc chaque scénario à tour de rôle.
Dans les options (A) et (B), l’élève demande à tous les élèves faisant partie de l’équipe de gymnastique ou étant à la bibliothèque le jeudi. Dans ces options, ces deux groupes de personnes feront partie de regroupements, qui peuvent avoir des caractéristiques similaires. Par exemple, on peut se demander si les élèves du groupe de gymnastique sont plus susceptibles de marcher ou même de faire du vélo jusqu’à l’école. Pour les élèves de la bibliothèque, peut-être participent-ils à une activité sportive le jeudi ? Peut-être que cela influencerait également la probabilité qu’ils prennent le car scolaire pour aller à l’école. Nous pouvons donc dire que, dans chacune des options (A) et (B), il peut y avoir un biais.
Dans les trois options suivantes, nous pouvons voir qu’il y a un nombre croissant d’élèves à chaque fois dans l’échantillon. Plus l’échantillon est grand, mieux c’est. Dans l’option (C), les cinq élèves sont choisis parmi ceux qui se trouvent dans le couloir. Cela peut aider à fonctionner de manière aléatoire, il s’agit donc d’un aspect positif de l’option (C). Mais la taille de l’échantillon est assez restreinte.
Voyons donc si les options (D) ou (E) seraient meilleures. Dans l’option (D), l’échantillon de 50 élèves est un échantillon choisi dans la même année que l’élève. Les 50 élèves sont plus nombreux, mais la même année indique que les élèves auront le même âge. Par conséquent, il existe un biais dans l’âge, qui affectera les résultats. Dans la dernière option, on nous dit que 100 élèves sont sélectionnés pendant le déjeuner. Il y a une dimension aléatoire dans ce scénario car les élèves ne sont pas sélectionnés par âge ou par activité. C’est donc la meilleure manière d’obtenir un échantillon représentatif et non biaisé.
Ainsi, la réponse est l’option (E) demander à un échantillon aléatoire de 100 élèves pendant le déjeuner s’ils prennent dans le car scolaire.