Cuando los investigadores piden una muestra representativa nacional, quieren decir que la población de interés es la población entera del país en cuestión y que la muestra debe reflejar esto en su estructura.
Se denomina como muestra representativa nacional a un grupo de ciudadanos que representan la totalidad de todo un país, es utilizado para realizar investigaciones que proyecten algún resultado que refleje la realidad nacional, pueden ser preferencias de cualquier tipo, comportamiento o perfiles sociodemográficos.
En su mejor momento la muestra representativa dará la impresión de ser la población total, independientemente de cómo se vea. Los números de hombres vs. mujeres deben coincidir con las proporciones nacionales, el porcentaje en cada grupo de edad o cada región coincidirá exactamente con la población, etc. En medidas no demográficas (como la propiedad del producto o la segmentación psicográfica) la muestra debe coincidir con la población.
Para lograr esto, la teoría requiere una muestra aleatoria grande y una tasa alta de respuesta para minimizar el error sistemático y reducir el riesgo de errores asistemáticos resultantes del sesgo.
También te puede interesar: Como determinar el tamaño de la muestra.
En el «mundo real» de las encuestas online las tasas de respuesta no son altas y las tasas de respuesta diferencial por medio de resultado demográfico en muestras aleatorias más puras no representan a la población (a pesar de lo sofisticadas que sean las técnicas de estratificación). Por lo tanto, es típico al realizar encuestas, utilizar el muestreo por cuotas. Una muestra por cuotas garantiza al 100% lucir como la población de las características demográficas a los que decida orientarse. Sin embargo, todo lo demás está sujeto a error de muestreo.
Tomemos el ejemplo de la edad: si las cuotas se fijan en 16 a 34, 35 a 54, o mayores de 55 la muestra será representativa dentro de estas proporciones, pero si el análisis se realiza en rangos de edad 16 a 20, 21 a 30, 31 a 40, etc., no hay garantía de que la muestra seguirá siendo correcta.
La medida en que es posible el control de cuotas en una muestra depende del tamaño de la muestra y los datos de referencia disponibles en una encuesta. Seis períodos de edad, dos géneros y 15 regiones crean una cuadrícula de 180 celdas. Si el tamaño de la muestra es sólo de 100 no es posible llenar todas las celdas. Incluso con un tamaño de muestra más grande una celda puede requerir sólo la mitad de una persona, y por lo tanto no tendrá los datos en ésta.
Para hacer que una muestra sea más representativa, se puede utilizar la ponderación. Como una alternativa a las celdas entrelazadas, las celdas de cuotas pueden estructurarse de forma independiente. La desventaja aquí es que puede haber grandes “vacíos» en la muestra, si todos los jóvenes son hombres, por ejemplo, no va a ser posible usar la ponderación para corregir los vacíos.
¿Qué variables deben usarse para obtener una muestra representativa nacional?
No hay respuesta definitiva, depende del objetivo planteado al crear una encuesta y la zona geográfica. Por ejemplo se puede usar edad, género, región y clase social en el Reino Unido; edad, género, región y origen étnico en los Estados Unidos; o edad, género, región e idioma que se habla en Bélgica.
La edad, el género y la región geográfica por lo general se alían con algo que los diferencia de bienestar económico. Esto puede ser ingreso, educación, clase social o la representación por propiedad de la vivienda
Lo que SSI recomienda:
En ausencia de otras instrucciones, en América del Norte, SSI usará la edad, el género y una variable adicional que diferencia por bienestar económico. (En Norteamérica, la representación por zona geográfica se ajusta naturalmente.) En Europa, en ausencia de otras instrucciones, SSI usará la edad, el género y la región, ya que los datos de «bienestar económico» no están disponibles en el censo de todas las zonas geográficas.
Quizá te interese conocer la diferencia entre población y muestra.