Les téléphones devenant de moins en moins omniprésents, il devient difficile de mener des enquêtes par téléphone. Mais la bonne nouvelle, c’est qu’il existe une nouvelle façon de mener des enquêtes ! L’utilisation d’un dispositif aléatoire (RDE) est une méthode innovante de recherche qui utilise l’identifiant unique d’un répondant comme clé de voûte de sa participation.
Il est important de noter qu’en observant l’identifiant des publicités dans le monde des appareils, les instituts de sondage peuvent prévenir la fraude liée aux SUMA (utilisateurs uniques, comptes multiples). Les échantillons RDE sont également entièrement aléatoires et non biaisés. Il s’agit d’une amélioration de la numérotation aléatoire, qui permet de contacter les téléphones fixes (et maintenant les téléphones portables) de manière aléatoire.
Cette flexibilité présente un certain nombre d’avantages par rapport aux méthodes d’enquête traditionnelles : Les EFR sont moins coûteuses car elles ne nécessitent pas de déplacements ou d’autres coûts associés à la réalisation d’entretiens ; elles offrent davantage de confidentialité aux répondants car personne ne voit qui a ou n’a pas répondu à l’enquête ; et elles permettent de mieux contrôler le moment où les répondants ont accès à l’enquête car il n’est pas nécessaire d’avoir des enquêteurs ou d’autres membres du personnel sur les sites de collecte (Tucker 1983 ; West et Blom 2017).
Qu’est-ce que l’engagement aléatoire d’un dispositif ?
Présentons le Random Device Engagement (RDE), le successeur naturel du RDD (Random Digit Dialing), en termes d’orthographe, de philosophie et de qualité.
Les sondages sur l’engagement aléatoire des appareils (RDE) s’appuient sur des réseaux publicitaires ou d’autres portails sur les appareils pour engager des personnes aléatoires là où elles se trouvent. L’une des versions les plus courantes se trouve dans les modules publicitaires des smartphones, mais elle peut facilement être placée dans les jeux, la réalité virtuelle, etc.
Le principe du sondage par engagement aléatoire est que les personnes sélectionnées par un institut de sondage sont plus susceptibles de participer à des sondages que celles qui n’ont pas été sélectionnées. Les annonceurs peuvent ainsi tirer parti des sondages RDE pour mieux comprendre l’expérience des clients dans le cadre de leurs produits ou services et la manière dont ils pourraient l’améliorer.
L’engagement de dispositifs aléatoires représente un avantage considérable, en particulier par rapport au RDD. Alors que les enquêtes peuvent être réalisées en quelques jours, il n’est pas rare que le RDD prenne des semaines, voire des mois. Avec les réseaux sociaux et le crowdsourcing assisté, les enquêtes peuvent être complétées un peu plus rapidement qu’avec RDE, mais elles n’ont toujours pas la rapidité offerte par RDE.
Les panels en ligne sont comparables en termes de vitesse si vous payez un supplément pour obtenir des répondants provenant de panels fusionnés (les panels en ligne facturent un supplément pour obtenir des répondants provenant d’autres panels car cela augmente leur vitesse).
En ce qui concerne la précision de la RDE, il est important de savoir que la couverture est l’un des principaux facteurs. Sur le marché américain, les principales entreprises de RDE peuvent atteindre plus de 5 000 000 de répondants uniques. La RDE est encore à la traîne par rapport à la RDD en termes de couverture à l’heure actuelle, mais elle la rattrapera bientôt. Le sondage par la foule utilisant les médias sociaux est similaire au sondage par la foule assisté par les médias sociaux, et la couverture est supérieure à celle des panels en ligne.
Les panels disponibles en ligne ont une empreinte très réduite, ce qui affecte leur capacité à recueillir des informations détaillées sur la population.
Méthodes d’engagement des dispositifs aléatoires
Examinons les travaux publiés dans Goel, Obeng et Rothschild (2015) et Konitzer, Corbett-Davies et Rothschild (N.d.) pour montrer à quel point les échantillons RDE peuvent être efficaces. Ajoutez des exemples tirés des élections législatives spéciales de 2017-2018.
La première étude a été menée par Goel et al. (2015) qui ont utilisé un échantillon de population de 1 200 électeurs inscrits aux élections générales dans le Michigan. L’échantillon a été tiré des fichiers électoraux officiels du Board of Canvassers du Michigan et comprenait des électeurs qui avaient le droit de voter mais qui n’ont pas voté en 2004.
Cette étude a révélé que les non-votants étaient plus susceptibles que les votants de préférer Kerry à Bush en 2004, avec un avantage relatif de 8 points de pourcentage pour Kerry parmi les non-votants contre seulement 3 points de pourcentage parmi les votants (p<0.05).
La deuxième étude a été menée par Konitzer et al. (2016) qui ont utilisé la Cooperative Congressional Election Study (CCES), qui a interrogé 1 068 répondants par le biais de RDD pendant le cycle de l’élection présidentielle de 2008. L’ensemble de données du CCES comprend des informations sur les attitudes politiques des répondants ainsi que sur leur comportement électoral antérieur, ce qui a permis à Konitzer et al. d’examiner l’influence du comportement électoral antérieur sur la participation future.
Les chercheurs ont pu démontrer que l’utilisation de la RDE, par l’intermédiaire de Pollfish, permettait d’obtenir des résultats proches de ceux des sondages de référence, tels que l’enquête sociale générale. Les chercheurs ont constaté que cette méthode pourrait être utilisée pour remplacer les visites à domicile dans les enquêtes, étant donné que les visites à domicile sont souvent trop coûteuses pour la plupart des projets de recherche, et qu’il s’agit donc d’une référence utile.
Les résultats ont montré que leurs prédictions basées sur un seul sondage ne sont pas significativement plus mauvaises que les prédictions des agrégateurs de sondages tels que Huffington Post Pollster (HPP). En comparant leurs estimations État par État avec les résultats réels, ils ont constaté que, par rapport aux estimations de HPP, leur RMSE n’était que légèrement plus élevé : 4,24 % points contre 3,62 % points (pour 50 États à l’exclusion de DC).
Méthode n° 1 – Numérotation aléatoire (RDD)
La première méthode, la composition aléatoire (Random Digit Dialing – RDD), est la méthode traditionnelle. Cela fonctionne bien, mais c’est voué à l’échec dans les prochaines années. Il s’agit donc en réalité de déterminer laquelle des nouvelles méthodes d’échantillonnage des enquêtes en ligne la remplacera : les panels en ligne, le crowdsourcing assisté ou l’engagement de dispositifs aléatoires (Random Device Engagement, RDE). Nous pensons que la RDE est l’avenir.
Au cours des années 2017 et 2018, les instituts de sondage ont utilisé les trois nouvelles méthodes pour prédire les résultats des élections au Congrès : La RDE est nettement supérieure aux deux autres.
Les instituts de sondage ont utilisé trois nouvelles méthodes pour prévoir les résultats des élections au Congrès en 2017 et 2018. Le RDE est plus performant que les autres.
Dans cet article, nous analysons en détail les points forts de la méthode, en nous appuyant notamment sur des enquêtes menées par le Pew Research Center.
Méthode n° 2 –Données télémétriques
L’utilisation des données télémétriques dans les enquêtes n’est pas nouvelle. En fait, l’exemple le plus célèbre de cette technique est l’American National Election Studies (ANES), qui recueille des enquêtes téléphoniques et en face à face au niveau des ménages depuis 1948. L’ANES recueille ces informations sur une base continue afin que les chercheurs puissent suivre les changements dans le temps et dans les différentes zones géographiques.
Plus récemment, RDE a commencé à compléter les données attitudinales collectées par une variété de données paramétriques ou télémétriques.
Comme nous le savons tous, les personnes qui répondent à des enquêtes sont fondamentalement différentes de celles qui n’y répondent pas. Comme l’a récemment fait valoir CIVIS, une batterie de près de 30 questions supplémentaires sur la démographie, les attitudes et le mode de vie, qui abordent les notions de confiance sociale et de cosmopolitisme, est nécessaire pour pouvoir évaluer et corriger toutes les particularités des personnes interrogées dans le cadre de l’enquête.
Comme l’affirment Konitzer, Eckman et Rothschild (2016), les données télémétriques constituent un moyen beaucoup plus rentable (et discret) de collecter ces variables. Le lieu de résidence et de travail, les habitudes de déplacement ou de mobilité, ou la composition politique du quartier ou du réseau social d’une personne, dérivés de données longitudinales de coordonnées de localisation basées sur des satellites (lire : extrêmement précises), prédisent bien les variables démographiques.
Méthode n° 3 – Échantillonnage en rivière
L’échantillonnage en rivière est une méthode de recrutement des répondants qui utilise des bannières publicitaires. C’est une pratique courante dans les études de marché et les sondages, mais elle présente des inconvénients majeurs.
En fonction de la méthode d’échantillonnage fluvial, des bannières publicitaires pourraient être utilisées pour les sondages, ou l’engagement pourrait se faire par le biais de sites web existants ou de lieux où l’énumération rapide des données recrute des répondants. Le RDE a accès aux numéros de compte, ce qui n’est pas le cas de l’échantillonnage en rivière, ce qui présente deux inconvénients majeurs : L’échantillonnage en rivière est incapable de détecter les SUMA – les fraudeurs peuvent tricher en participant deux fois à la même enquête, surtout s’il y a une incitation financière à participer. De plus, tout degré de ciblage démographique/géographique semble impossible.
Le processus est simple : une requête publicitaire est envoyée au serveur, qui la redirige ensuite vers le réseau publicitaire pour qu’elle soit traitée directement. Le réseau publicitaire détermine s’il y a des publicités disponibles qui conviennent à cet utilisateur particulier et les envoie au serveur.
Un bon sondage RDE est effectué avec la coopération de l’éditeur, offrant une expérience native, tandis que les bannières publicitaires sont diffusées par le réseau publicitaire.
Exemples d’engagement de dispositifs aléatoires
Comme nous l’avons souligné précédemment, nous sommes convaincus que la numérotation aléatoire (RDD) est condamnée. Les panels en ligne sont efficaces mais coûteux, le crowd-sourcing assisté fonctionne bien mais prend trop de temps, et le Random Device Engagement (RDE) est beaucoup plus rapide et plus rentable.
L’avenir de la RDE est prometteur. La pénétration des appareils va encore augmenter à l’avenir, ce qui accroîtra la portée de la RDE aux États-Unis et en fera la seule alternative viable sur les marchés moins développés. Prenons l’exemple de l’Afrique : le taux de pénétration des smartphones devrait augmenter de 52,9 % d’une année sur l’autre.
Le continent compte actuellement 293 millions d’utilisateurs de smartphones, ce qui signifie qu’en tenant compte des taux de croissance actuels, l’Afrique comptera 929,9 millions de smartphones d’ici à 2021. Mais l’avenir prometteur du RDE ne se limite pas à la pénétration – les progrès réalisés dans le rapprochement des identifiants publicitaires avec d’autres identifiants connus sur le marché américain signifient qu’il sera possible de procéder à un ciblage individuel basé sur l’historique financier ou les habitudes de consommation de la carte de crédit.
Et puisqu’il est question de rapprocher les sources de données, les instituts d’études politiques peuvent désormais sonder directement un fichier électoral de 250 millions d’Américains.
Conclusion
Nous avons commencé par discuter du fonctionnement de la RDD traditionnelle et du fait qu’elle était condamnée par le manque de participation des jeunes, qui sont moins susceptibles d’avoir un téléphone fixe. Nous avons examiné deux nouvelles techniques : les panels en ligne et le Crowdsourcing assisté. Les panels en ligne sont similaires au RDD traditionnel, mais avec une technologie plus moderne ; ils ne demandent pas aux participants de répondre eux-mêmes aux questions, ni même de parler avec un être humain.
Au lieu de cela, ils utilisent des scripts et des algorithmes automatisés pour collecter des données auprès des internautes qui acceptent de participer. Le crowdsourcing assisté fait appel à des êtres humains ainsi qu’à des ordinateurs ; les êtres humains sont utilisés pour des tâches telles que le marquage d’images ou la transcription d’enregistrements vocaux, tandis que les ordinateurs effectuent d’autres tâches telles que l’analyse de documents textuels à des fins d’analyse des sentiments.
Enfin, nous avons discuté de notre méthode préférée : l’engagement aléatoire de dispositifs (Random Device Engagement – RDE). Cette méthode utilise des algorithmes sophistiqués pour identifier automatiquement les appareils.
Apprenez comment libérer la puissance de la recherche avec l’Audience de QuestionPro. Nos produits sont utilisés par plus de 3 millions de personnes dans plus de 50 pays et nous sommes toujours à la recherche de nouvelles façons d’utiliser notre technologie pour vous aider à recueillir des informations plus significatives sur vos clients.
Utilisation l’audience de QuestionPro de QuestionPro pour vous aider à créer des enquêtes plus précises qui vous fourniront de meilleures données.