La prueba U de Mann-Whitney es una técnica estadística que se utiliza comúnmente cuando nuestros datos no cumplen ciertos requisitos para ser evaluados a través de una prueba paramétrica.
En este artículo encontrarás en qué consiste esta prueba y cómo la puedes llevar a cabo paso a paso.
¿Qué es la prueba U de Mann-Whitney?
La prueba U de Mann-Whitney es una prueba no paramétrica alternativa a la prueba t de muestras independientes (una prueba de hipótesis estadística utilizada para determinar si una media poblacional desconocida es diferente de un valor específico).
La prueba U de Mann-Whitney se utiliza para comparar dos medias muestrales que provienen de la misma población, así como para probar si dos medias muestrales son iguales o no.
La prueba U de Mann-Whitney, también conocida como prueba de Mann-Whitney-Wilcoxon y como prueba de suma de rangos Wilcoxon, forma parte del grupo más grande de pruebas de dependencia. Las pruebas de dependencia suponen que las variables del análisis pueden dividirse en variables independientes y dependientes.
Las pruebas de dependencia que comparan las puntuaciones medias de una variable independiente y una dependiente suponen que las diferencias en la puntuación media de la variable dependiente están causadas por la variable independiente.
Te puede interesar también: ¿Qué son las pruebas paramétricas?
Importancia de la prueba U de Mann-Whitney
A diferencia de la prueba t de muestras independientes, la prueba U de Mann-Whitney permite sacar diferentes conclusiones sobre los datos en función de las suposiciones que se hagan sobre la distribución de los mismos.
Estas conclusiones pueden ir desde simplemente afirmar si las dos poblaciones difieren hasta determinar si hay diferencias en las medianas entre los grupos. Estas diferentes conclusiones dependen de la forma de las distribuciones de los datos.
Conoce diferencias entre las pruebas no paramétricas y las pruebas paramétricas
¿Cómo funciona la prueba U de Mann-Whitney?
La prueba U de Mann-Whitney realiza una comparación estadística de la media y determina si existe una diferencia en la variable dependiente para dos grupos independientes.
De esta forma, puede mostrar si la distribución de la variable dependiente es la misma para los dos grupos y, por tanto, de la misma población.
La prueba U de Mann-Whitney funciona a partir de clasificar todos los valores dependientes en orden ascendente, donde el valor más bajo recibe una puntuación de uno, y posteriormente utiliza la suma de los rangos de cada grupo en el cálculo de la estadística de la prueba.
Te puede interesar: ¿Qué es la media, la mediana y la moda?
Ejemplos de uso de U de Mann-Whitney
Un ejemplo del uso de la prueba U de Mann-Whitney puede encontrarse en un estudio para entender si las actitudes hacia la discriminación salarial, donde las actitudes se miden en una escala ordinal, difieren en función del género.
En este ejemplo, la variable dependiente sería «actitudes hacia la discriminación salarial» y su variable independiente sería «género», la cual tiene dos grupos: «hombre» y «mujer».
Alternativamente, se podría utilizar la prueba U de Mann-Whitney para saber si los salarios, medidos en una escala continua, difieren en función del nivel educativo. Aquí, la variable dependiente sería «salario» y la variable independiente sería «nivel educativo», la cual tiene dos grupos: «instituto» y «universidad».
Características que deben tener los datos para ser analizados por la prueba U de Mann-Whitney
Un punto importante a considerar son las características que los datos deben tener para poder ser analizados por la prueba U de Mann Whitney, entre las cuales destacan los siguientes:
1: La variable dependiente debe medirse a nivel ordinal o continuo
Ejemplos de variables ordinales son los ítems de la escala de Likert (una escala de 7 puntos que van desde «muy de acuerdo» hasta «muy en desacuerdo»), entre otras formas de clasificar categorías (por ejemplo, una escala de 5 puntos que explique cuánto le ha gustado un producto a un cliente, desde «No mucho» hasta «Sí, mucho»).
Algunos ejemplos de variables continuas son el tiempo de revisión (medido en horas), la inteligencia (medida mediante la puntuación del coeficiente intelectual), el rendimiento en los exámenes (medido de 0 a 100), el peso (medido en kg), etc.
Te puede interesar: Tipos de variables en una investigación
2: La variable independiente debe consistir en dos grupos
La variable independiente debe consistir en dos grupos categóricos e independientes. Algunos ejemplos de variables independientes que cumplen este criterio son el género (2 grupos: hombre o mujer), el estado de empleo (2 grupos: empleado o desempleado), fumador (2 grupos: sí o no), etc.
3: Debe haber independencia de las observaciones de cada grupo
Esto significa que no hay relación entre las observaciones de cada grupo o entre los propios grupos.
Por ejemplo, debe haber diferentes participantes en cada grupo y ningún participante debe estar en más de un grupo. Esta cuestión radica más en el diseño de la investigación que en algo que se pueda comprobar, pero es un supuesto importante de la prueba U de Mann-Whitney.
4. Las dos variables se distribuyen de forma anormal
La prueba U de Mann-Whitney puede utilizarse cuando las dos variables no se distribuyen de forma regular.
Sin embargo, para saber cómo interpretar los resultados de una prueba U de Mann-Whitney, tienes que determinar si la distribución de las puntuaciones para ambos grupos de la variable independiente (por ejemplo, «hombres» y «mujeres» para la variable independiente «género») tienen la misma forma.
Conoce más acerca de los niveles de medición y cómo dominarlos
¿Cómo interpretar los resultados de la prueba U de Mann-Whitney?
A continuación te presentaremos los pasos que debes realizar para interpretar los resultados de la prueba U de Mann-Whitney:
1: Establece el intervalo de confianza
El primer paso consiste en determinar un intervalo de confianza para la diferencia entre dos medianas de población.
En primer lugar, considera la diferencia de las medianas de la muestra y, a continuación, examina el intervalo de confianza.
La diferencia es una estimación de la diferencia entre las medianas de la población. Como este valor se basa en los datos de la muestra y no en toda la población, es poco probable que la diferencia de la muestra sea igual a la diferencia de la población.
Para estimar mejor la diferencia poblacional, utiliza el intervalo de confianza para la diferencia. El intervalo de confianza proporciona un rango de valores probables para la diferencia entre dos medianas poblacionales.
2: Determina si la diferencia es estadísticamente significativa
Para determinar si la diferencia entre las medianas es estadísticamente significativa, compara el valor p con el nivel de significación.
Normalmente, un nivel de significación (denotado como α o alfa) de 0,05 funciona bien. Un nivel de significación de 0,05 indica un riesgo del 5 % de concluir que existe una diferencia cuando en realidad no la hay.
- Valor p ≤ α: La diferencia entre las medianas es estadísticamente significativa (Rechazar hipótesis).
Si el valor p es menor o igual que el nivel de significación, la decisión es rechazar la hipótesis nula. - Valor p > α: La diferencia entre las medianas no es estadísticamente significativa (No se rechaza la hipótesis).
Si el valor p es mayor que el nivel de significación, la decisión es no rechazar la hipótesis nula.
3: Identificar los valores atípicos
Los valores atípicos, que son valores de datos que se alejan de otros valores, pueden afectar en gran medida a los resultados de tu análisis.
Por ello es importante que trates de identificar la causa de los valores atípicos. Corrige los errores de introducción de datos o de medición, o bien, considera la posibilidad de eliminar los valores de los datos para eventos anormales y puntuales (también llamados causas especiales). Una vez realizado lo anterior, repite el análisis.
Conoce también los criterios para la selección de una muestra de investigación
Conclusión
Como puedes ver, la prueba U de Mann-Whitney es una técnica de análisis de datos de gran utilidad para evaluar las diferencias entre las medias de dos conjuntos de datos que provienen de muestras independientes o bien, correlacionadas.
Si actualmente te encuentras en el proceso de determinar la muestra adecuada para tu investigación, te invitamos a probar la calculadora de muestra de QuestionPro, es totalmente gratuita y podrás utilizarla las veces que lo necesites.
Recuerda que también contamos con QuestionPro Audience, un servicio especializado en la obtención de muestras y análisis de resultados. ¡Solicita más información en el siguiente enlace!