anova

ANOVA: no ignore estos secretos

Los secretos de ANOVA residen en sus supuestos: independencia de las observaciones, normalidad y homocedasticidad. La selección adecuada del tipo ANOVA, el cálculo preciso del tamaño de la muestra y un análisis post hoc cuidadoso son cruciales para obtener resultados válidos.

¿Es usted consciente de que la aplicación incorrecta de pruebas estadísticas, incluido ANOVA, es más frecuente de lo que podríamos suponer y podría llevarnos a conclusiones erróneas? Esto es preocupante porque los hallazgos falsos pueden dar lugar a malas decisiones. Por eso, te invitamos a leer detenidamente este artículo para no caer en esta trampa.

Destacados

  • ANOVA es una prueba estadística que se utiliza para comparar las medias de dos o más grupos.
  • El ANOVA unidireccional y el ANOVA de mediciones repetidas son los tipos de ANOVA más utilizados.
  • La violación de la independencia de las observaciones puede sesgar el análisis y producir resultados engañosos.
  • Si el valor p de ANOVA es significativo, las pruebas post hoc pueden identificar qué grupos difieren.
  • El uso indebido de ANOVA es común, lo que hace que las conclusiones de muchos estudios sean cuestionables.

El problema

¿Tienes una sensación de déjà-vu mientras lees este artículo? Probablemente sea porque has leído nuestro artículo “Del estudiante Prueba T: no ignore estos secretos."

Estas dos pruebas, utilizadas para comparar medias, tienen muchas similitudes.

Si no has leído el artículo anterior, te recomendamos abrirlo y hacer las comparaciones necesarias al finalizar este. Si lo ha leído, utilice este artículo como base para comparar y revisar.

Al igual que la prueba t, la amplia disponibilidad y simplicidad de ANOVA, combinadas con su fácil comprensión y aplicación, la han convertido en una de las pruebas estadísticas inferenciales más utilizadas en todo el mundo.

Sin embargo, esta “popularización”, similar a la prueba t, ha generado problemas como el uso incorrecto de los análisis.

Varios recientes artículos de revisión sistemática revelan que casi el 80% de los artículos publicados en ciertos tipos de estudios tienen errores en sus análisis estadísticos.

Teniendo en cuenta que las soluciones a los problemas de la humanidad a menudo dependen de estos estudios, resulta inquietante darse cuenta de que una proporción tan significativa de ellos puede haber sido analizada incorrectamente, lo que podría llevar a conclusiones incorrectas.

Los “secretos” para realizar correctamente un ANOVA no son complejos.

¡Todo lo que necesita es comprender algunas características fundamentales del análisis!

La Solución

ANOVA, acrónimo de Análisis de Varianza, es esencialmente una prueba para comparar medias, es decir, inferir si las medias de 3 o más grupos son iguales.

Normalmente, utilizamos ANOVA para comparar tres o más grupos y la prueba t para comparar dos grupos.

Preste mucha atención porque los siguientes seis pasos son cruciales para una aplicación adecuada e inequívoca de ANOVA.

1. Identificar el tipo apropiado de ANOVA

Los tipos de ANOVA más utilizados son:

ANOVA unidireccional

Este es el tipo más común, que evalúa si las medias de las muestras tomadas de tres o más grupos independientes son iguales.

Para ser más técnico, comprueba el efecto de una variable independiente categórica sobre una variable dependiente continua.

Por ejemplo, podría usarse para comprobar si los promedios de envergadura de tres especies diferentes de aves son iguales.

ANOVA de medidas repetidas unidireccionales

Este tipo es equivalente al ANOVA unidireccional, pero las muestras entre los tres [o más] grupos son dependientes. Es decir, las muestras están apareadas o relacionadas.

Por ejemplo, supongamos que queremos comprobar si la presión arterial media de las mujeres mayores en una ciudad sigue siendo la misma:

  • Una hora después de tomar el medicamento.
  • Dos horas después de tomar el medicamento.
  • Cuatro horas después de tomar el medicamento.

En este caso, dado que la presión arterial de cada mujer se mide tres veces (una hora, dos horas y cuatro horas después de tomar el medicamento), existe un emparejamiento de cada unidad de muestra (medidas dentro del sujeto).

Otros tipos

En esta publicación, no profundizaremos en otros tipos de ANOVA, como el ANOVA de dos vías y el ANOVA de dos vías de medidas repetidas.

La principal diferencia entre estos dos análisis es que en el ANOVA de medidas repetidas, las muestras están emparejadas.

Estos representan una extensión del ANOVA unidireccional y verifican la influencia de dos variables categóricas independientes en una variable dependiente continua.

2. Calcular el tamaño de la muestra para ANOVA

Al determinar el tipo de ANOVA que empleará, el siguiente paso consiste en determinar la cantidad de sujetos necesarios para su estudio.

Lograr un tamaño de muestra adecuado a menudo mitiga muchos problemas estadísticos.

Para determinar el tamaño de muestra adecuado para su prueba, debe realizar un cálculo específico, que varía entre las pruebas estadísticas.

Para ANOVA, necesitará una media y una desviación estándar aproximadas o estimadas para cada población bajo estudio.

Estos valores se ingresan en una calculadora de tamaño de muestra dentro de su software estadístico, alineados con el tipo de ANOVA elegido.

Luego, el software proporciona el número óptimo de sujetos a recopilar.

¿Pero de dónde vienen estas medias y desviaciones estándar?

Por lo general, se derivan de estudios piloto anteriores o esfuerzos de investigación similares.

Pro consejo: G*Power es un excelente software estadístico gratuito que se puede utilizar para calcular el tamaño de la muestra.

3. ¡Las observaciones deben ser independientes!

La independencia de las observaciones es el supuesto estadístico más importante, aunque a menudo se pasa por alto.

Este supuesto es crucial para todas las pruebas estadísticas, incluido ANOVA, porque violarlo puede conducir a análisis sesgados y resultados engañosos.

Para mantener la independencia, asegúrese de que cada elemento de su muestra sea independiente.

El concepto de aleatoriedad es clave aquí; recopilar datos al azar de una población adecuada para su estudio puede ayudar a mantener esta suposición.

Por ejemplo, se debería utilizar una muestra aleatoria de individuos dentro de la ciudad para identificar el perfil genético de una ciudad. Por ejemplo, tomar muestras de una sola familia violaría el supuesto de independencia, ya que sus perfiles genéticos estarían estrechamente relacionados.

4. Normalidad de los residuos

Todos los análisis inferenciales paramétricos, incluido el ANOVA, requieren el supuesto de normalidad para los residuos (errores).

Sus residuos deben ajustarse a una distribución normal (o gaussiana).

Las pruebas estadísticas, como las pruebas de Shapiro-Wilk, Anderson-Darling y Kolmogorov-Smirnov, pueden ayudar a determinar si sus residuos se ajustan a esta distribución.

Tenga cuidado al interpretar los resultados de estas pruebas; si indican una violación del supuesto de normalidad, considere las siguientes opciones:

  • Continúe con el ANOVA, afirmando que es robusto contra las desviaciones de la normalidad, siempre que el tamaño de su muestra sea adecuado.

  • Transforme sus datos y vuelva a probar la normalidad.

  • Opte por un equivalente no paramétrico de la prueba t.

Si bien la primera opción puede parecer conveniente, generalmente no se recomienda.

Normalmente se opta por la segunda opción; si se continúa vulnerando el supuesto de normalidad, se recomienda la tercera opción.

Pruebas paramétricas y sus equivalentes no paramétricas:

  • ANOVA unidireccional = Kruskal-Wallis Prueba H.
  • ANOVA de medidas repetidas unidireccionales = Prueba de Friedman

5. Homoscedasticidad de los residuales.

Este paso sólo es necesario después de que los residuos se ajusten al supuesto de normalidad.

La homocedasticidad se refiere al requisito de variaciones similares u homogéneas entre las poblaciones muestreadas.

Varias pruebas, como las pruebas F, de Bartlett y de Levene, pueden detectar violaciones de este supuesto.

Sin embargo, una violación de esta suposición suele ser manejable.

Si tus datos presentan heterocedasticidad (varianzas desiguales), puedes ejecutar el ANOVA con un ajuste menor (Welch).

Los informes de análisis de la mayoría de los programas estadísticos proporcionan automáticamente este resultado ANOVA ajustado.

6. ANOVA y pruebas post hoc

Un valor de p significativo en el ANOVA indica al menos un par de medias diferentes.

Sin embargo, no especifica qué par o pares son diferentes.

Pruebas post hoc (posteriormente pruebas) se utilizan para determinar qué grupos son significativamente diferentes.

Dependiendo de si las varianzas son iguales (homoscedásticas) o desiguales (heteroscedásticas), se utilizan diferentes pruebas post hoc.

Cuando se suponen varianzas iguales, las pruebas comúnmente utilizadas incluyen las pruebas de Tukey (HSD), Bonferroni, Scheffé y Duncan.

La prueba de Games-Howell, la prueba T2 de Tamhane, la prueba T3 de Dunnet y la prueba C de Dunnet se emplean a menudo para varianzas desiguales.

Observaciones finales

ANOVA es uno de los análisis estadísticos inferenciales más utilizados a nivel mundial.

Aún así, su mal uso en muchos estudios ha llevado a resultados y conclusiones cuestionables.

Puede realizar un análisis más sólido y confiable siguiendo los seis pasos que describimos. Recuerda:

  1. Elija el tipo correcto de ANOVA,
  2. Calcule el tamaño de muestra apropiado,
  3. Garantizar un muestreo aleatorio adecuado,
  4. Comprobar la normalidad de los residuos,
  5. Confirmar el supuesto de homocedasticidad, y
  6. Realizar el ANOVA y posterior prueba post hoc.

Artículos recomendados

¿Estás preparado para explorar más a fondo las estadísticas y análisis de los datos? Consulta otros artículos informativos sobre temas relacionados en nuestro blog. Expande tus conocimientos y perfecciona tus habilidades explorando información valiosa y consejos de expertos. ¡Haz clic aquí para comenzar tu viaje de aprendizaje ahora!

Preguntas frecuentes (FAQ)

P1: ¿Qué es ANOVA? Es una prueba estadística que compara las medias de dos o más grupos.

P2: ¿Cuáles son los tipos más comunes de ANOVA? Los tipos más comunes son ANOVA unidireccional y ANOVA de mediciones repetidas.

P3: ¿Cómo se determina el tamaño de la muestra para ANOVA? Requiere medias estimadas y desviaciones estándar de cada población estudiada, calculadas mediante software estadístico.

P4: ¿Cuál es la importancia de la independencia de las observaciones en ANOVA? Es una suposición crítica en ANOVA. La violación de esto puede sesgar el análisis y producir resultados engañosos.

P5: ¿Qué se entiende por normalidad de los residuos en ANOVA? Significa que los residuos (errores) deben seguir la distribución normal. Esto es necesario para análisis inferenciales paramétricos.

P6: ¿Cómo podemos comprobar la normalidad de los residuos? Esto se puede verificar mediante pruebas de normalidad como las de Shapiro-Wilk, Anderson-Darling y Kolmogorov-Smirnov.

P7: ¿Qué es la homocedasticidad en ANOVA? Significa que las varianzas de las poblaciones muestreadas deben ser similares para aplicar ANOVA estándar.

P8: ¿Qué sucede si el valor p de ANOVA es significativo? Las pruebas post hoc pueden identificar qué grupos son diferentes si es significativo.

P9: ¿Cuál es el error común que se comete al utilizar ANOVA? El uso indebido de ANOVA es común y a menudo conduce a conclusiones de estudios cuestionables.

P10: ¿Cómo utilizar correctamente ANOVA? Siguiendo los seis pasos: elegir el tipo de ANOVA, calcular el tamaño de la muestra, realizar un muestreo aleatorio, verificar la normalidad de los residuos, verificar la homocedasticidad y ejecutar ANOVA con pruebas post hoc.

¿Pueden las desviaciones estándar ser negativas?

¡Conéctate Con Nosotros en Nuestras Redes Sociales!

¡PUBLICACIONES DIARIAS EN INSTAGRAM!

Mensajes similares

Deje un comentario

Su dirección de correo electrónico no será publicada. Las areas obligatorias están marcadas como requeridas *