SAGE Publications, Bulletin of Sociological Methodology, 1(72), p. 20-36
DOI: 10.1177/075910630107200104
Full text: Unavailable
Greffe de données d'enquêtes. Cet article concerne la fusion de données venant de sources indépendantes. Les enquêtes sont un des moyens les plus utilisés pour obtenir des données quantitatives souvent à des coûts élevés. Toute fois, la fiabilité des informations saisies dans les sociétés modernes diminue à cause de la "pression des enquêtes" sur les répondants, rendant ainsi intéressants les moyens indirects d'obtenir des données. Mais cette tache est à la limite de ce que les statistiques sont capables de faire. Toute greffe peut être réduite à sa version canonique qui est un fichier complet "donneur", avec des variables x et y, et un autre fichier "destinataire" avec seulement des variables x. La greffe consiste dans le transfert des variables y "donneur" dans le fichier "destinataire". On note que la greffe n'engendre pas de nouvelles informations mais utilise celles présentes d'une manière plus approfondie. L'objectif est d'estimer des données individuelles importantes pour l'analyse agrégée. Il y a deux principales méthodes de greffe d'enquêtes: l'une est la modélisation de la relations des variables y par rapport aux variables x du fichier "donneur" et l'application de ce modèle au fichier "destinataire". L'autre méthode est le "Hot Deck" (plateau chaud) impliquant la désignation, pour chaque individu "destinataire", d'un ou plusieurs individus "donneur" similaires afin de transférer les valeurs y des "donneurs" au "destinataire". Quoi que le problème est de nature plus générale, ici nous nous limitons aux greffes des données d'enquêtes d'audience de télé et de consommation des ménages. Le "Hot Deck" par greffe des k voisins les plus proches est utilisé actuellement pour les enquêtes d'audience mais il réduit considérablement la variabilité des données "donneur". Notre objectif est de comparer la greffe des k voisins les plus proches avec l'imputation PCAR et la régression PLS pour voir leurs points forts et leurs points faibles.