La varianza es la medida de dispersión más utilizada, junto con la desviación estándar. Es una medida fiable a la hora de analizar los datos de una distribución. Al compararlo con la media, se puede reconocer la presencia de valores atípicos o datos distantes.
Conozcamos más sobre esta medida, sus características, ventajas y cómo calcularla.
Qué es la varianza
La varianza es una medida de dispersión que representa la variabilidad de una serie de datos con respecto a su media. Formalmente, se calcula como la suma de los cuadrados de los residuos dividida por las observaciones totales.
También puede calcularse como la desviación estándar al cuadrado. Por cierto, entendemos el residuo como la diferencia entre el valor de una variable a la vez y el valor medio de toda la variable.
El cálculo de la varianza es necesario para calcular la desviación estándar.
Quizá te interese conocer qué es la media, la mediana y la moda.
Ventajas y desventajas de la varianza
La varianza se utiliza para ver cómo se relacionan los números individuales dentro de un conjunto de datos, en lugar de utilizar técnicas matemáticas más amplias.
También se distingue por tratar a todas las desviaciones de la media como si fueran iguales, independientemente de su dirección. Las desviaciones al cuadrado no pueden sumar cero y dar la apariencia de que no hay variabilidad en los datos.
Sin embargo, un inconveniente es que da más peso a los valores atípicos. Estos son números alejados de la media. Elevar al cuadrado estos números puede sesgar los datos.
Otro inconveniente del uso de la varianza es que no es fácil de interpretar. Se suele emplear principalmente para sacar la raíz cuadrada de su valor, que indica la desviación estándar de los datos.
Ejemplo de varianza
He aquí un ejemplo hipotético para demostrar cómo funciona la varianza, es este caso en el rubro de finanzas. Supongamos que los rendimientos de las acciones de la empresa ABC son del 10% en el primer año, del 20% en el segundo y del -15% en el tercero. La media de estas tres rentabilidades es del 5%. Las diferencias entre cada rendimiento y la media son del 5%, 15% y -20% para cada año consecutivo.
Al elevar al cuadrado estas desviaciones se obtiene un 0,25%, un 2,25% y un 4,00%, respectivamente. Si sumamos estas desviaciones al cuadrado, obtenemos un total del 6,5%. Si dividimos la suma del 6,5% entre uno menos el número de rendimientos del conjunto de datos, ya que se trata de una muestra (2 = 3-1), nos da una varianza del 3,25% (0,0325). Si se saca la raíz cuadrada de la varianza, se obtiene una desviación estándar del 18% (√0,0325 = 0,180) para los rendimientos.
Cómo se calcula la varianza
Siga estos pasos para calcular la varianza:
- Calcula la media de los datos.
- Encuentra la diferencia de cada punto de datos con respecto al valor medio.
- Eleva al cuadrado cada uno de estos valores.
- Suma todos los valores elevados al cuadrado.
- Divide esta suma de cuadrados entre n – 1 (para una muestra) o N (para la población).
Fórmula para calcular la varianza
Antes de ver la fórmula, hay que decir que la varianza en estadística es muy importante. Porque, aunque es una medida sencilla, puede aportar mucha información sobre una variable concreta.
La unidad de medida será siempre la unidad de medida correspondiente a los datos pero al cuadrado. La varianza es siempre mayor o igual a cero. Como los residuos se elevan al cuadrado, es matemáticamente imposible que la varianza sea negativa. Y, por tanto, no puede ser inferior a cero.
¿Cuál es la diferencia entre varianza y desviación estándar?
En realidad, las dos están midiendo lo mismo. La varianza es la desviación estándar al cuadrado. O a la inversa, la desviación estándar es la raíz cuadrada de la varianza.
La desviación estándar se hace funcionar en las unidades de medida originales. Por supuesto, dado que esto es normal, cabe preguntarse qué sentido tiene la varianza como concepto. Pues bien, aunque la interpretación del valor que devuelve no nos da mucha información, su cálculo es necesario para obtener el valor de los demás parámetros.
Para calcular la covarianza necesitamos la varianza y no la desviación estándar, para calcular algunas matrices econométricas se utiliza la varianza y no la desviación estándar. Se trata de una cuestión de comodidad a la hora de trabajar con los datos según qué cálculos.
Conoce también qué es la desviación media.
La desviación estándar es la raíz cuadrada de la varianza. A veces es más útil, ya que al tomar la raíz cuadrada se eliminan las unidades del análisis. Esto permite realizar comparaciones directas entre diferentes cosas que pueden tener diferentes unidades o diferentes magnitudes.
Por ejemplo, decir que el aumento de X en una unidad aumenta Y en dos desviaciones estándar permite entender la relación entre X e Y independientemente de las unidades en que se expresen.
Conclusión
La varianza se utiliza en estadística y probabilidad como medida para caracterizar la dispersión de una distribución o muestra. En concreto, se define como la media de los cuadrados de las desviaciones de la media. La consideración del cuadrado de estas desviaciones evita que las desviaciones positivas y negativas se anulen entre sí.
Visualmente, una distribución con una varianza grande estará más repartida, mientras que una distribución con una pequeña estará muy apretada alrededor de su media.
Te invitamos a conocer otras medidas y técnicas de investigación descargando nuestro Ebook de Metodologías de Investigación Avanzada.
Recuerda que también contamos con otras herramientas como la calculadora de muestra y por supuesto, nuestra plataforma de encuestas online ¡Crea tu cuenta ahora!