Le portail a été désactivé. Veuillez contacter l'administrateur de votre portail.

Fiche explicative de la leçon : Collecte de données Mathématiques

Dans cette fiche explicative, nous allons apprendre à reconnaître les différences entre les sources de données primaires et les sources de données secondaires, ainsi que leurs avantages respectifs.

La collecte de données est une étape incontournable au début de toute étude statistique. Il faut procéder à cette étape avec le plus grand soin, car la qualité de l’analyse statistique en dépend. Il est souvent possible de choisir parmi différentes sources pour collecter les données, c’est pourquoi il est important d’être conscient de leurs avantages et inconvénients respectifs. Imaginons par exemple que nous collections des données pour comprendre une tendance du revenu par habitant d’une ville donnée. On pourrait interroger un certain nombre de personnes au moyen de questionnaires ou d’entretiens, mais on pourrait aussi demander l’accès à des documents gouvernementaux qui contiendraient ces données, ou bien nous référer à des articles publiés dans des journaux économiques et des revues de recherche.

On constate donc qu’il existe de nombreuses sources de données, que l’on peut globalement classer en deux catégories: les sources de données primaires et les sources de données secondaires.

Définition : Données primaires et secondaires

Les données primaires sont des informations nouvelles, directement collectées et organisées par le chercheur.

Les données secondaires sont des informations publiques ou préexistantes, qui ont été collectées et organisées par un tiers.

Dans notre exemple, les questionnaires et les entretiens nous fourniraient des données primaires, car nous obtiendrions de nouvelles informations, collectées et organisées par nos soins. En revanche, les documents gouvernementaux, les journaux économiques et les revues de recherche nous fourniraient des données secondaires, car ce sont des sources d’informations préexistantes, collectées et organisées par d’autres.

Dans le premier exemple de cette fiche explicative, nous devrons déterminer si la source présentée est une source de données primaires ou secondaires.

Exemple 1: Déterminer si des données sont primaires ou secondaires

Un professeur demande à ses étudiants de collecter sur différents sites web des données relatives aux effets des jeux vidéo d’action sur les enfants. De quel type seront les données collectées par les étudiants?

Réponse

On rappelle que les données primaires sont des informations nouvelles, directement collectées et organisées par le chercheur, tandis que les données secondaires sont des informations publiques ou préexistantes, collectées et organisées par d’autres personnes. Dans notre exemple, les étudiants collectent des données concernant les effets des jeux vidéo d’action sur les enfants à partir de sites web. Les sites web, ainsi que l’Internet en général, présentent des informations collectées et organisées par des tiers.

Par conséquent, dans notre exemple, les données collectées par les étudiants sont des données secondaires.

Voyons un autre exemple traitant les différences entre les sources de données primaires et les sources de données secondaires.

Exemple 2: Comprendre la différence entre données primaires et données secondaires

Parmi les propositions suivantes, laquelle n’est pas correcte?

  1. Les données primaires sont des données collectées par le chercheur lui-même.
  2. Les pages web constituent une source de données secondaires.
  3. Les données secondaires sont des données que le chercheur collecte lui-même.
  4. Les questionnaires constituent une source de données primaires.
  5. Les groupes de discussion constituent une source de données primaires.

Réponse

On rappelle que les données primaires sont des informations nouvelles, directement collectées et organisées par le chercheur, tandis que les données secondaires sont des informations publiques ou préexistantes, collectées et organisées par d’autres personnes. Donc la proposition A est, par définition, correcte. Examinons les autres propositions.

Proposition B: Les pages web constituent une source de données secondaires.
Sur l’Internet, les pages web donnent accès à des données collectées et organisées par d’autres personnes. Par conséquent, les pages web constituent une source de données secondaires. Cette proposition est correcte.

Proposition C: Les données secondaires sont des données que le chercheur collecte lui-même.
Les données secondaires ne sont pas collectées et analysées par le chercheur directement, mais par d’autres personnes. Cette proposition est incorrecte.

Propositions D et E: Les questionnaires/groupes de discussion constituent une source de données primaires.
Les chercheurs ont souvent recours aux questionnaires et aux groupes de discussion pour collecter des données. Étant donné que les questionnaires et les groupes de discussion permettent d’obtenir de nouvelles informations, collectées et organisées par le chercheur lui-même, ce sont des sources de données primaires. Ces deux propositions sont correctes.

Par conséquent, la seule proposition qui n’est pas correcte est la C.

Dans les exemples précédents, nous avons considéré des sources et déterminé si leurs données étaient primaires ou secondaires. Nous avons déjà établi que les entretiens, les questionnaires et les groupes de discussion sont des sources de données primaires, alors que les documents gouvernementaux, les journaux, les revues de recherche et les sites web sont des sources de données secondaires. Voyons encore quelques exemples de sources de données primaires et secondaires.

Les sources de données primaires sont des outils utilisés par les chercheurs pour obtenir de nouvelles données à partir d’un échantillon. Quelques exemples de sources de données primaires fréquemment utilisées sont:

  • les entretiens;
  • les questionnaires;
  • les groupes de discussion;
  • les recensements;
  • l’observation;
  • les documents originaux (registres, actes de naissance, déclarations de revenus, journaux personnels, etc.).

Les données de sources secondaires sont collectées et organisées par des tiers. Elles sont souvent accompagnées d’une analyse et d’une interprétation. Quelques exemples de sources de données secondaires fréquemment utilisées sont:

  • les journaux;
  • les revues;
  • les sites web;
  • la télévision;
  • les manuels scolaires;
  • les dictionnaires;
  • les rapports;
  • les organisations gouvernementales;
  • les organismes d’enseignement ou de recherche.

Passons à un nouvel exemple dans lequel nous devrons distinguer entre des sources de données primaires et des sources de données secondaires.

Exemple 3: Reconnaître une source de données secondaires

Parmi les propositions suivantes, laquelle n’est pas une source de données secondaires?

  1. les revues de recherche et les journaux
  2. l’Internet
  3. les organisations d’enseignement et de recherche
  4. les questionnaires
  5. les organisations gouvernementales

Réponse

On rappelle que les données primaires sont des informations nouvelles, directement collectées et organisées par le chercheur, tandis que les données secondaires sont des informations publiques ou préexistantes, collectées et organisées par d’autres personnes. Les revues de recherche et les journaux, l’Internet, les organismes d’enseignement et de recherche, les organisations gouvernementales sont autant d’entités qui disposent de leurs propres chercheurs pour collecter et organiser leurs données. Des données qui ont été collectées et organisées antérieurement et indépendamment à l’étude sont des données secondaires. Par conséquent, les propositions A, B, C et E constituent toutes des sources de données secondaires.

D’autre part, les chercheurs ont souvent recours aux questionnaires pour collecter leurs propres données directement. Les questionnaires permettent d’obtenir de nouvelles informations collectées et organisées par le chercheur lui-même. Ils constituent donc une source de données primaires.

Par conséquent, seule la proposition D ne correspond pas à une source de données secondaires.

Voyons un autre exemple dans lequel nous devrons distinguer entre des sources de données primaires et des sources de données secondaires.

Exemple 4: Reconnaître une source de données primaires

Parmi les propositions suivantes, laquelle n’est pas une source de données primaires?

  1. les groupes de discussion
  2. les enquêtes personnelles
  3. les appels téléphoniques
  4. les questionnaires
  5. les revues de recherche et les journaux

Réponse

On rappelle que les données primaires sont des informations nouvelles, directement collectées et organisées par le chercheur, tandis que les données secondaires sont des informations publiques ou préexistantes, collectées et organisées par d’autres personnes. Les groupes de discussion, les enquêtes personnelles, les appels téléphoniques et les questionnaires sont autant d’outils à la disposition du chercheur pour collecter ses propres données directement. En les utilisant, il obtient de nouvelles informations, qu’il collecte et organise lui-même. Il s’agit par conséquent de sources de données primaires.

En revanche, les revues de recherche et les journaux contiennent des données qui ont été collectées et organisées par des tiers. Ce ne sont donc pas des sources de données primaires, mais de données secondaires.

Ainsi, seule la proposition E ne correspond pas à une source de données primaires.

Dans les exemples précédents, nous avons distingué entre des sources de données primaires et des sources de données secondaires. Examinons à présent quelques-uns des avantages de ces deux catégories de données. Pour cela, revenons à notre exemple initial, dans lequel il était question de collecter des données sur la tendance du revenu par habitant d’une ville donnée. Nous avions établi qu’il était possible de choisir parmi les sources suivantes pour collecter nos données: les questionnaires, les entretiens, les documents gouvernementaux, les journaux et les revues de recherche.

Commençons par considérer les avantages de chacune de ces sources. Enquêter auprès des individus de notre échantillon au moyen de questionnaires ou d’entretiens nous permettrait d’obtenir des données originales, nouvelles, que nous ne pourrions trouver ailleurs. Il serait par ailleurs possible de personnaliser le type de données collectées. Quant aux documents gouvernementaux, ils fournissent d’importantes quantités de données que nous ne serions pas en mesure de réunir au moyen d’entretiens individuels. Enfin, les journaux économiques et les revues de recherche ont pour avantage de fournir des données dûment organisées et faciles d’accès.

Passons aux inconvénients. Quels sont quelques-uns des inconvénients de ces sources? Les enquêtes auprès d’individus au moyen de questionnaires ou d’entretiens peuvent être coûteuses. Réaliser des questionnaires ou des entretiens impliquent des frais tels que le temps de travail des enquêteurs, le coût d’impression et d’envoi des questionnaires et les primes d’incitation destinées aux personnes interrogées. Les documents gouvernementaux, les journaux économiques et les revues de recherche présentent généralement des données organisées d’une façon bien spécifique, qui peut s’avérer inadaptée à notre étude. Et puisqu’il n’est pas possible de contrôler quand les données sont collectées, ni qui sont les personnes incluses dans l’échantillon, les données provenant de ces sources peuvent ne pas être pertinentes pour notre étude.

Notons qu’il existe différents avantages et inconvénients pour chaque source, y compris au sein d’une même catégorie de données (primaires ou secondaires). Il est donc important, au moment de choisir la méthode de collecte des données, de bien évaluer les différentes options et de comprendre les avantages et les inconvénients de chacune d’entre elles. L’un de nos objectifs, dans cette fiche explicative, est de décrire précisément les avantages et inconvénients inhérents aux deux catégories de données que sont les données primaires et les données secondaires. Commençons par les données primaires. Quels sont leurs principaux avantages et inconvénients?

L’avantage le plus évident des données primaires est le fait qu’elles constituent des informations authentiques, fiables et actuelles. Si ce type de données ne présentait pas également certains inconvénients, elles seraient toujours préférées aux données secondaires. Nous examinerons ces inconvénients dans le prochain exemple.

Exemple 5: Désavantages des données primaires

Parmi les propositions suivantes, laquelle est un désavantage des données primaires?

  1. On ne peut être sûr de leur exactitude.
  2. On est sûr de leur exactitude.
  3. Elles sont plus coûteuses en temps et en argent.
  4. Elles permettent d’économiser du temps et de l’argent.

Réponse

On rappelle que les données primaires sont des informations nouvelles directement collectées et organisées par le chercheur. L’avantage des données primaires par rapport aux données secondaires est le fait qu’elles constituent des informations authentiques, fiables et actuelles. Elles peuvent être obtenues au moyen d’entretiens, de questionnaires, de groupes de discussion ou par observation. Un avantage des données primaires est leur exactitude.

On peut cependant remarquer que toutes les méthodes citées peuvent être très coûteuses en temps, et d’autant plus s’il est nécessaire que l’échantillon sur lequel les données sont collectées soit grand. De plus, si nous collectons nos données par le biais de questionnaires envoyés par courrier, les coûts d’impression et d’envoi peuvent être conséquents.

Le principal inconvénient des données primaires est donc leurs coûts plus élevés en temps et en argent. La proposition correcte est la C.

Nous avons passé en revue les avantages et les inconvénients des données primaires. Examinons maintenant les avantages et inconvénients des données secondaires. Les données secondaires sont des données déjà collectées et organisées par un tiers. Par conséquent, elles présentent souvent l’avantage d’être peu coûteuses et faciles d’accès. Dans le prochain exemple, nous considérerons les inconvénients des données secondaires.

Exemple 6: Désavantages des données secondaires

Parmi les propositions suivantes, laquelle est un désavantage lié aux données secondaires?

  1. On ne peut être sûr de leur exactitude.
  2. On est sûr de leur exactitude.
  3. Elles sont plus coûteuses en temps et en argent.
  4. Elles permettent d’économiser du temps et de l’argent.

Réponse

On rappelle que les données secondaires sont des informations publiques ou préexistantes qui ont été collectées et organisées par un tiers. Quelques exemples de sources de données secondaires sont les journaux, les revues de recherche et les organisations gouvernementales. Comparées aux données primaires, qui impliquent la collecte directe de données au moyen d’outils tels que les sondages ou les entretiens, les données secondaires sont moins coûteuses en temps et en argent. L’un de leurs avantages est donc qu’elles nous permettent d’économiser du temps et de l’argent.

L’un des principaux inconvénients des données secondaires est le fait de ne pas pouvoir contrôler quelles sont les personnes choisies pour former l’échantillon, ni quelles sont précisément les données collectées. Si les caractéristiques de l’échantillon sur lequel les données ont été collectées ne correspondent pas à celles de notre population d’étude, elles ne sont pas pertinentes pour nous. Par ailleurs, si entre temps les données sont devenues obsolètes, elles ne sont pas non plus pertinentes pour notre étude.

Un autre désavantage des données secondaires est leur potentiel manque de fiabilité. En effet, nous ne pouvons pas contrôler la façon dont les données secondaires sont collectées et organisées, donc il existe toujours un risque qu’elles ne soient pas une représentation fidèle de la population. Par ailleurs, même lorsque les chercheurs ont ajouté des détails attestant de la fiabilité de leurs données, il est possible que ces données secondaires ne s’avèrent que d’une utilité limitée dans le cadre de notre propre étude.

Ainsi, l’inconvénient principal des données secondaires est leur potentiel manque d’exactitude et de pertinence. La proposition correcte est la A.

Pour finir, récapitulons quelques-uns des concepts vus dans cette fiche explicative.

Points clés

  • Les données primaires sont des informations nouvelles directement collectées et organisées par le chercheur, tandis que les données secondaires sont des informations publiques ou préexistantes collectées et organisées par d’autres personnes.
  • Le tableau ci-dessous présente quelques exemples de sources de données primaires et secondaires.
    Données primairesDonnées secondaires
    Entretiens
    Questionnaires
    Groupes de discussion
    Recensements
    Observations
    Documents originaux
    Revues de recherche
    Sites web
    Journaux
    Manuels scolaires
    Rapports
    Organisations diverses
  • Le tableau ci-dessous présente les avantages et inconvénients des données primaires et secondaires.
    Données primairesDonnées secondaires
    AvantagesAuthentiques, fiables et actuellesPeu coûteuses et faciles à obtenir
    InconvénientsCoûteuses en temps et en argentPertinence et fiabilité moindres

Nagwa utilise des cookies pour vous garantir la meilleure expérience sur notre site. En savoir plus sur notre Politique de Confidentialité.