Un échantillon est un ensemble de données prises à l'aide deprocédures spécifiques de la population générale pour l'analyse exploratoire. La représentativité est la propriété de reproduire l'idée du tout de sa part. Sinon, c'est la possibilité d'étendre l'idée d'une partie à un tout, qui comprend cette partie.
La représentativité de l'échantillon est un indicateurconsistant en ce que l'échantillon doit refléter de manière complète et fiable les caractéristiques de la population dont il fait partie. Elle peut également être définie comme la propriété d'un échantillon de représenter au mieux les caractéristiques de la population générale qui sont significatives du point de vue de l'objectif de recherche.
Supposons que la population générale soit toutélèves des écoles (900 personnes de 30 classes, 30 personnes par classe). L'objet de la recherche est l'attitude des écoliers face au tabagisme. Un échantillon de 90 élèves du secondaire représentera à lui seul l'ensemble de la population bien pire qu'un échantillon des mêmes 90 élèves, qui comprendrait 3 élèves de chaque classe. La raison principale est la répartition inégale des âges. Ainsi, dans le premier cas, la représentativité de l'échantillon sera faible. Dans le second cas, il est élevé.
En sociologie, on dit qu'il y a une représentativité d'un échantillon et sa non-représentativité.
Un exemple d'échantillon non représentatif est un cas classique survenu en 1936 aux États-Unis lors de l'élection présidentielle.
Le magazine "Literary Digest", qui avanttrès réussi à prédire les résultats des élections précédentes, commettant cette fois une erreur dans ses prédictions, bien qu'il ait envoyé plusieurs millions de questions écrites aux abonnés, ainsi qu'aux répondants qu'ils ont sélectionnés à partir des annuaires téléphoniques et des listes d'immatriculation des voitures. Dans 1/4 des bulletins qui sont revenus remplis, les votes ont été répartis comme suit: 57% ont préféré le candidat républicain nommé Alf Landon, et 41% ont préféré le président démocrate sortant Franklin Roosevelt.
En fait, F. Roosevelt a remporté l'élection avec près de 60% des voix. L'erreur de "Literary Digest" était la suivante. Ils voulaient augmenter la représentativité de l'échantillon. Et comme ils savaient que la plupart d'entre euxdes abonnés qui s'identifient comme républicains, ils ont décidé d'élargir l'échantillon aux dépens des répondants, sélectionnés par eux à partir des annuaires téléphoniques et des listes d'immatriculation des voitures. Mais ils n'ont pas pris en compte les réalités existantes et, en fait, ont sélectionné encore plus de partisans républicains, car pendant la Grande Dépression, la classe moyenne et supérieure pouvait se permettre des voitures et des téléphones. Et c'étaient surtout des républicains, pas des démocrates.
Il existe différents types d'échantillonnage: simple aléatoire, en série, typique, mécanique et combiné.
L'échantillonnage aléatoire simple consiste à sélectionner au hasard dans l'ensemble de la population d'unités étudiées, sans aucun système.
L'échantillonnage mécanique est utilisé lorsquede la population générale il y a de l'ordre, par exemple, il y a une certaine séquence d'unités (numéros d'enregistrement des employés, listes électorales, numéros de téléphone des répondants, nombre d'appartements et de maisons, etc.).
La sélection typique est utilisée lorsque tousla population peut être divisée en groupes par type. Lorsque vous travaillez avec la population, il peut s'agir, par exemple, de l'éducation, de l'âge, des groupes sociaux, lors de la recherche d'entreprises - une industrie ou une organisation distincte, etc.
La sélection par lots est utile lorsque les unités sont combinées en petits lots ou groupes. Une telle série peut être des lots de produits finis, des classes scolaires, des collectifs de travail et d'autres groupes.
L'échantillonnage combiné implique l'utilisation de tous les types d'échantillonnage précédents dans une combinaison ou une autre.