Le portail a été désactivé. Veuillez contacter l'administrateur de votre portail.

Vidéo de la leçon : Collecte de données Mathématiques

Dans cette vidéo, nous allons apprendre comment déterminer les sources de données primaires et secondaires, et comment choisir une taille d’échantillons suffisante pour la collecte de données.

11:30

Transcription de vidéo

Dans cette vidéo sur la collecte de données, nous allons comprendre ce que sont les sources de données primaires et secondaires et les différences entre elles. Nous allons également apprendre quels sont les avantages de l’utilisation de ces deux sources.

La collecte de données est la première étape de toute analyse statistique. Et on doit être prudent lorsqu’on collecte des données car la qualité de l’analyse statistique repose sur la qualité des données. Il existe tellement de façons différentes de collecter des données, que ce soit à partir d’entretiens, de questionnaires, de sites web ou de journaux. Et bien sûr, il existe des avantages et des inconvénients pour diverses sources de données. On peut diviser ces différentes sources de données en deux types : les données primaires et les données secondaires.

Les données primaires sont des informations nouvelles collectées et organisées directement par le chercheur. Bien sûr, s’il s’agit d’une collecte de données à grande échelle, ceci pourrait également alors être des informations collectées par une équipe travaillant pour le chercheur. Certaines des sources de données les plus courantes qui sont primaires sont les entretiens, les questionnaires, les groupes de discussion et les observations, qui proviendront toutes de sondages ou de questions posées à un plus petit groupe de personnes. Un recensement utilise des informations recueillies auprès d’un groupe de personnes. Et dans certains pays, on effectue un recensement tous les cinq ou 10 ans. Les documents originaux peuvent inclure des éléments tels que les actes de naissance, les permis de conduire ou même les actes de mariage.

Ensuite on a les données secondaires, qui sont des informations publiques ou préexistantes collectées et organisées par des tiers. Les exemples communs de sources de données secondaires sont les revues de recherche, les sites web, les journaux, les livres ou les rapports. Plus tard, dans cette vidéo, nous allons examiner les avantages et les inconvénients des données primaires et secondaires. Mais dans le premier exemple, nous allons commencer par identifier si une source donnée constitue des données primaires ou secondaires.

Un enseignant demande à ses élèves de collecter des données sur l’effet des jeux d’action sur les enfants à partir de différents sites web sur Internet. Quel est le type de données collectées ?

Rappelons qu’il existe deux types de données, à savoir, les données primaires et les données secondaires. Les données primaires sont des informations nouvelles collectées et organisées par un chercheur. Les données secondaires sont des informations publiques ou préexistantes collectées et organisées par des tiers. Puisqu’on nous dit que les élèves collectent des informations sur des sites web, c’est un bon indicateur que ce sera une source de données secondaires. Si les élèves essaient de comprendre l’effet des jeux d’action sur les enfants, alors s’il s’agissait d’une source de données primaires, ils devraient eux-mêmes poser des questions à leurs camarades ou à d’autres enfants. Cependant, puisqu’ils utilisent des informations collectées et organisées par d’autres groupes, il s’agit donc de données secondaires.

Considérons un autre exemple.

Laquelle des phrases suivantes n’est pas vraie ?

Et on nous donne cinq phrases que nous allons examiner à tour de rôle. La phrase (A) dit , « Les données primaires sont des données collectées par les chercheurs eux-mêmes. » Eh bien, cette phrase est essentiellement la définition des données primaires. Ce sont de nouvelles données qui sont collectées par les chercheurs eux-mêmes ou par quelqu’un qui les collecte pour leur compte. Par conséquent, l’option (A) est vraie. La phrase de l’option (B) est « Les pages web sont une source de données secondaires. » Nous pouvons rappeler que les données secondaires sont collectées et organisées par des tiers, et que les sites web ou les pages web peuvent être une bonne source de données secondaires. Ceci est une affirmation vraie.

La phrase (C) dit, « Les données secondaires sont des données collectées par les chercheurs eux-mêmes. » Comme nous l’avons vu dans l’option (A), on parle de données primaires lorsque les données sont collectées par les chercheurs eux-mêmes. Par conséquent, cette affirmation est fausse. Examinons les deux autres phrases. La phrase (D) dit, « Les questionnaires sont une source de données primaires », et la phrase (E) dit, « Les groupes de discussion sont une source de données primaires. » Les questionnaires et les groupes de discussion sont des méthodes de collecte de données qui donnent de nouvelles informations pouvant être collectées et organisées par les chercheurs eux-mêmes. Puisque ces deux sources sont des données primaires, les options (D) et (E) sont vraies. Par conséquent, la phrase qui n’est pas vraie est l’option (C) : les données secondaires sont des données collectées par les chercheurs eux-mêmes.

Nous allons maintenant examiner deux autres exemples dans lesquels on identifie des sources de données primaires et secondaires.

Quelle des options suivantes n’est pas une source de données secondaires ? Option (A) les revues de recherche et journaux, option (B) internet, option (C) les enseignements et les organisations de recherche, option (D) les questionnaires ou option (E) les organisations gouvernementales.

Commençons par rappeler que les données secondaires sont des informations publiques ou préexistantes collectées et organisées par des tiers. L’autre type de données sont les données primaires, qui sont des informations nouvelles collectées et organisées par le chercheur. Une façon de résoudre ce problème consiste à envisager différentes situations de collecte de données. Ici on a un chercheur qui collecte des informations auprès d’un groupe de personnes qu’il veut étudier. Ceci peut se faire par le biais d’entretiens, de questionnaires ou même de groupes de discussion. À ce stade, ce chercheur possède des données primaires.

Lorsqu’ils analysent ses données, il peut produire une sorte de rapport ou de revue, par exemple, en mettant cela dans un journal ou un site web. Un autre chercheur, qui fait des recherches sur autre chose, et qui examine ces différents rapports aura des données secondaires. Ainsi, lorsqu’on considère les types de données dans les options (A), (B), (C) et (E), il s’agit de données secondaires. En d’autres termes, on obtient des informations à partir de ce type d’informations, des rapports, des articles et autres, et non des personnes qui ont été interrogées.

Si nous considérons l’option (D), cependant, les questionnaires sont utilisés par les chercheurs pour collecter directement les données. Puisque l’utilisation de questionnaires conduit à de nouvelles informations collectées et organisées par le chercheur, ils constituent une source de données primaires. Par conséquent, les sources de (A), (B), (C) et (E) sont toutes des sources de données secondaires. Donc l’option qui n’est pas une source de données secondaires est (D), les questionnaires. Ceci est une source de données primaires.

Lequel des énoncés suivants n’est pas une source de données primaires ? Option (A) les groupes de discussion, option (B) une enquête personnelle, option (C) les appels téléphoniques, option (D) les questionnaires, ou option (E) les revues de recherche et les journaux.

Rappelons qu’on peut classer les données en deux types différents. Les données primaires sont des informations nouvelles collectées et organisées directement par le chercheur. Les données secondaires sont des informations publiques ou préexistantes collectées et organisées par des tiers. Les groupes de discussion, les enquêtes personnelles, les appels téléphoniques et les questionnaires sont des outils que les chercheurs peuvent utiliser pour collecter directement des données. L’utilisation de l’un de ces outils peut conduire à l’obtention de nouvelles informations collectées et organisées par les chercheurs eux-mêmes. Donc ce sont toutes des sources de données primaires.

Cependant, si nous considérons l’option (E), les revues de recherche et les journaux contiennent des données qui ont été collectées et organisées par des tiers. Ceci signifie que ces deux sources sont des données secondaires. Les revues de recherche et les journaux ne sont donc pas une source de données primaires.

Nous allons maintenant examiner certains des avantages et inconvénients des sources de données primaires et secondaires. Prenons la situation suivante comme exemple. Supposons qu’on collecte des données sur l’évolution du revenu par habitant dans une ville. Certaines des différentes façons de collecter ces données sont les groupes de discussion, les entretiens, les questionnaires, les documents gouvernementaux, les journaux ou les revues de recherche. Voyons d’abord certains des avantages et inconvénients des données secondaires. Eh bien, l’un des avantages de certains types de données secondaires, par exemple, les documents gouvernementaux, est qu’il y a beaucoup de données disponibles et que ces données sont souvent des choses que nous ne pouvons pas collecter nous-mêmes.

Par exemple, si quelqu’un donne des informations à un chercheur dans la rue, il se peut que cette personne ne soit pas très à l’aise à donner des informations sur ses revenus, mais elle donnerait ces informations dans un recensement. Souvent les données des sources secondaires sont bien organisées. Alors quels sont les inconvénients des données secondaires ? Eh bien, tout d’abord, il se peut qu’elles ne soient pas organisées comme on le souhaite. En outre, on ne peut pas contrôler de qui les données sont collectées. Par exemple, dans notre situation de collecte de données sur le revenu par habitant, les données des données secondaires pourraient inclure des adolescents ayant un emploi à temps partiel, et cela pourrait ne pas être nécessaire pour notre étude.

Bien sûr, lorsqu’on considère les données primaires, certains de leurs avantages et inconvénients seront tout simplement le contraire de ceux que nous avons pour les données secondaires. Le principal avantage des données primaires est qu’elles nous donnent exactement les données requises. S’il n’y avait absolument aucun inconvénient pour les données primaires, elles seraient presque toujours la meilleure source de données. Alors pourquoi ne pas choisir des sources de données primaires ? Eh bien, les deux principaux inconvénients des données primaires sont le coût et le fait qu’elles prennent du temps. On doit payer les personnes qui conduisent les entretiens. Et même pour les questionnaires, on doit payer les frais d’impression et d’envoi de ces questionnaires.

Lorsqu’on décide comment collecter des données pour une étude, on doit évaluer les options des deux types de données et comprendre les avantages et les inconvénients de chaque étude. Il se peut même qu’on utilise une panoplie de différentes options de collecte de données, y compris quelques des données primaires et quelques des sources secondaires. Nous allons maintenant examiner une dernière question sur les inconvénients des données secondaires.

Citez deux inconvénients des données secondaires.

Commençons par rappeler que les données secondaires sont des informations publiques ou préexistantes collectées et organisées par des tiers. Quelques exemples de sources de données secondaires sont les journaux, les sites web, les revues et les documents gouvernementaux. Un inconvénient des données secondaires est qu’on ne peut pas contrôler de qui les données sont collectées. Par exemple, on pourrait collecter les données d’un échantillon avec des caractéristiques différentes de celles de la population qu’on étudie. Ou les données secondaires pourraient contenir des données de différentes tranches d’âge qui ne nous intéressent pas. On constate également que les données secondaires sont souvent obsolètes. Les informations de la source de données secondaires peuvent avoir été collectées depuis plusieurs années.

On peut résumer ces deux inconvénients en disant que les données peuvent être non-pertinentes pour notre étude. On peut également citer le fait qu’on ne puisse pas contrôler comment les données secondaires sont collectées et organisées, comme inconvénient. Les données peuvent ne pas être une représentation exacte de la population qui nous intéresse. En général, cependant, les deux principaux inconvénients des données secondaires sont qu’elles peuvent être non pertinentes et pas fiables, et on peut donc donner comme réponse à cette question comme non pertinentes et pas fiables.

Nous pouvons maintenant résumer les points clés de cette vidéo. Nous avons vu que les données primaires sont des informations nouvelles qui sont collectées et organisées directement par le chercheur. Les données secondaires sont des informations publiques ou préexistantes collectées et organisées par des tiers. Nous avons également vu quelques exemples clés de types de données primaires et secondaires. Et enfin, nous avons examiné une série d’avantages et d’inconvénients liés aux données primaires et secondaires. Ceux-ci sont résumées dans le tableau donné.

Nagwa utilise des cookies pour vous garantir la meilleure expérience sur notre site. En savoir plus sur notre Politique de Confidentialité.