Análisis de varianzas (ANOVA)
El Anova se refiere al análisis de la relación de dos grupos; variable independiente y variable dependiente. Es básicamente una herramienta estadística que se utiliza para probar hipótesis sobre la base de datos experimentales. Podemos utilizar el anova para determinar la relación entre dos variables; la variable independiente, el hábito alimentario, y la variable dependiente, el estado de salud.
La diferencia entre el anova de una vía y el anova de dos vías puede atribuirse al propósito para el que se utilizan y a sus conceptos. El propósito del anova de una vía es ver si los datos recogidos para una variable dependiente se acercan a la media común. Por otro lado, el anova de dos vías determina si los datos recogidos para dos variables dependientes convergen en una media común derivada de dos categorías.
Anova de una vía
El anova de una vía se utiliza cuando hay una sola variable independiente con varios grupos o niveles o categorías, y se miden las variables de respuesta o dependientes normalmente distribuidas, y se comparan las medias de cada grupo de variables de respuesta o resultado.
Ejemplo de anova de una vía: Considere dos grupos de variables, el hábito alimentario de las personas de la muestra la variable independiente, con varios niveles como, vegetariano, no vegetariano, y mezcla; y la variable dependiente siendo el número de veces que una persona cayó enferma en un año. Se miden y comparan las medias de las variables de respuesta pertenecientes a cada grupo formado por N personas.
Anova de dos vías
Cuando hay dos variables independientes, cada una con múltiples niveles, y una variable dependiente en cuestión, el anova se convierte en de dos vías. El anova de dos vías muestra el efecto de cada variable independiente sobre la respuesta única o las variables de resultado y determina si hay algún efecto de interacción entre las variables independientes. El anova de dos vías fue popularizado por Ronald Fisher, 1925, y Frank Yates, 1934. Años más tarde, en 2005, Andrew Gelman propuso un enfoque diferente de modelo multinivel de anova.
Ejemplo de anova de dos vías: Si en el ejemplo anterior de anova de una vía, añadimos otra variable independiente, «estatus de fumador» a la variable independiente existente «hábito alimentario», y múltiples niveles de estatus de fumador como no fumador, fumadores de un paquete al día y fumadores de más de un paquete al día, construimos un anova de dos vías.
Superioridad del anova de dos vías
El anova de dos vías tiene ciertas ventajas sobre el anova de una vía. Estas son;
i. El anova de dos vías es más efectivo que el anova de una vía. En el anova de dos vías hay dos fuentes de variables o variables independientes, a saber, el hábito alimentario y el estado de fumador en nuestro ejemplo. La presencia de dos fuentes reduce la variación del error, lo que hace que el análisis sea más significativo.
ii. El anova de dos vías nos ayuda a evaluar los efectos de dos variables al mismo tiempo. Esto no es posible en el anova de una vía.
iii. La independencia de los factores puede probarse siempre que haya más de una observación para cada combinación de factores o celda, y el número de observaciones en cada celda sea el mismo. En nuestro ejemplo, el factor hábito alimentario tiene 3 niveles y el factor estatus de fumador tiene 3 niveles. Por tanto, hay 3 x 3 = 9 combinaciones de factores o celdas.
Resumen
1. Anova es un análisis estadístico que se utiliza en la prueba de hipótesis sobre la base de datos experimentales. Aquí se analizan las relaciones entre dos grupos.
2. El anova de una vía se utiliza cuando hay una sola variable independiente con varios niveles. El anova de dos vías se utiliza cuando hay dos variables independientes con varios niveles.
3. El anova de dos vías es superior al anova de una vía ya que el método tiene ciertas ventajas sobre el anova de una vía.