Prueba T de Student: no ignore estos secretos
La prueba t de Student es un análisis estadístico que compara las medias de dos grupos para determinar sus igualdades, asumiendo normalidad y varianzas iguales.
¿Sabía usted que el incorrecto uso de pruebas estadísticas, incluidas las prueba t de Student¿Es más común de lo que uno podría pensar y puede llevar a sacar conclusiones erróneas? Esto es problemático porque conclusiones incorrectas pueden resultar en desastroso decisiones: para evitar caer en esta trampa, lea este artículo hasta el final.
El problema
La amplia disponibilidad, simplicidad y facilidad de comprensión de la prueba t de Student la han convertido en una de las más comúnmente pruebas estadísticas utilizadas en todo el mundo.
Sin embargo, esta popularización ha traído algunos cuestiones, como la aplicación de análisis incorrecta.
Este preocupación es tan significativo que se han publicado varios artículos de revisión sistemática recientes y, en particular, estudios, ¡hasta el 80% de los artículos publicados contienen errores en el análisis estadístico!
Since Cloud Los problemas de la humanidad a menudo dependen de estos estudios, es preocupante pensar que una proporción tan grande de ellos haya sido analizada incorrectamente y haya podido llevar a conclusiones erróneas.
El secretos Los métodos para realizar correctamente una prueba t de Student no son complicados: ¡solo necesitamos comprender algunas características básicas del análisis!
La Solución
El prueba t de Student Determina si las medias de dos poblaciones son iguales. Por lo tanto, siguiendo atentamente las cinco pasos enumerados a continuación son esenciales para una aplicación adecuada e incuestionable de una prueba t.
1. ¿Qué tipo de prueba t debo utilizar?
Prueba t de muestras independientes es el tipo más utilizado y evalúa si las medias de las muestras recolectadas de dos poblaciones independientes son iguales. Por ejemplo, podemos comprobar si la masa muscular entre hombres y mujeres de una determinada empresa es similar.
Prueba t de muestras pareadas Determina si la media de una muestra recolectada antes de una intervención es igual a la de la muestra recolectada (de los mismos elementos) después de la intervención. Por ejemplo, es posible que queramos comprobar si la presión arterial de las mujeres mayores en una ciudad es la misma antes y después de tomar un medicamento específico. Dado que mediremos la presión arterial de cada mujer mayor dos veces (antes y después de la intervención), cada unidad de muestra está emparejada.
Prueba t de una muestra, el tipo menos utilizado, comprueba si la media de la muestra recogida de una población es igual a una media ya conocida. Por ejemplo, podemos querer
2. Cálculo del tamaño de la muestra de la prueba T de Student
Después de definir qué tipo de prueba t usar, necesitamos determinar cuántos elementos usar. recoger.
Consistente tamaños de muestra A menudo resuelven muchos problemas en estadística.
La mejor manera de encontrar el adecuado El tamaño de la muestra para nuestra prueba consiste en utilizar un cálculo específico, con uno diferente para cada prueba estadística.
Para la prueba t, necesitamos la estimación aproximada o estimada de las dos poblaciones estudiadas. mean y desviación estándar.
En el software estadístico, debemos ingresar estos valores en el tamaño de la muestra. ordenador para el tipo de prueba t apropiado. Luego devuelve la cantidad correcta de elementos para recopilar.
Pero ¿de dónde obtenemos las medias y desviaciones estándar de las poblaciones estudiadas? Generalmente de otros piloto estudios o similares ¡estudios!
Check out este artículo ¡Para aprender a calcular el tamaño de la muestra!
Consejo de oro: G*Potencia es un excelente paquete estadístico gratuito para calcular el tamaño de la muestra.
3. ¡Las observaciones deben ser independientes!
El supuesto de independencia de las observaciones es uno de los más importantesupuestos, aunque a menudo ignorados, en las estadísticas.
La prueba t de Student y TODO INCLUIDO Otras pruebas estadísticas se basan en esta suposición, que puede sesgar el análisis y generar resultados engañosos si se viola.
Para evitar esta infracción, las observaciones en su conjunto de datos deben ser independiente. Por tanto, cada elemento de la muestra no debe mostrar dependencia de otros.
El concepto de aleatoriedad es crucial aquí. Una excelente manera de evitar violar el supuesto de independencia de las observaciones es recopilar datos aleatoriamente en un universo adecuado para su estudio.
Para comprender mejor esta idea, echemos un vistazo a lo siguiente (aqui):
Supongamos que queremos identificar el perfil genético de los habitantes de un municipio para responder a preguntas específicas. Después de definir el tamaño de la muestra, debemos muestrear aleatoriamente a los individuos de la ciudad para evitar violar el supuesto de independencia de las observaciones. Usando el mismo ejemplo, un método de muestreo que violaría este supuesto sería si muestreáramos solo individuos de la misma familia para representar al municipio. En este caso, las observaciones serían dependientes unas de otras ya que el perfil genético es hereditario y presenta una notable similitud entre familias.
4. Normalidad
La normalidad de los residuos es una asunción aplicable a todos los llamados análisis inferenciales paramétricos.
Esta suposición significa que sus residuos (errores) deben ajustarse al famoso distribución normal — la distribución gaussiana — para utilizar la prueba t.
La distribución normal presenta una curva en forma de campana, simétrico alrededor de su punto medio, unimodal.
Pero, ¿cómo sabemos si nuestros residuos ajustarse a la distribución normal?
La buena noticia es que los análisis estadísticos llamados pruebas de normalidad identifique este patrón; los principales son Shapiro-Wilk, Anderson-Darling y Kolmogorov-Smirnov.
Tenga cuidado cuando interpretar los resultados de estas pruebas para evitar malinterpretar sus indicaciones.
Si los análisis indican que el supuesto de normalidad ha sido violado, hay tres posibilidades:
(A) Utilice la prueba t incluso si se viola el supuesto de normalidad, alegando que es una prueba sólida para estas desviaciones y que tenemos un tamaño de muestra adecuado.
(B) Pruebe con una transformación de datos y luego vuelva a verificar la normalidad.
(C) Por último, utilice un análisis no paramétrico equivalente a la prueba t.
No recomendamos el first posibilidad. Después de todo, si planea utilizar la prueba t independientemente de la normalidad de los residuos, ¿por qué realizar estos análisis?
Normalmente elegimos el second opción, y si el supuesto de normalidad sigue violado, se procede a la third.
Pruebas paramétricas y sus equivalentes no paramétricas:
- El equivalente de la prueba t para muestras independientes es la prueba U de Mann-Whitney.
- El equivalente de la prueba t para muestras pareadas es la prueba de rangos con signo de Wilcoxon.
- El equivalente de la prueba t de una muestra es la prueba de rangos con signo de Wilcoxon para una muestra.
5. Homocedasticidad
Sólo tenemos que proceder a esto. último paso si los residuos no han violado el supuesto de normalidad. Por lo tanto, utilizaremos la prueba t de Student.
A pesar de su complejo nombre, el sentido de esta suposición es fácil de entender.
La homocedasticidad no significa más que variaciones similares.
Para aplicar la prueba t en su estándar formato, las varianzas de los residuos de las dos poblaciones muestreadas deben ser similares.
Para comprobar si esta suposición se está cumpliendo violado, ¡las pruebas inferenciales están ampliamente disponibles en software estadístico!
La prueba F, las pruebas de Bartlett y Levene se encuentran entre las pruebas más utilizadas para verificar la igualdad de varianzas. Sin embargo, sólo tiene sentido aplicarlos si los residuos no han violado el supuesto de normalidad.
Esta suposición suele plantear pocos problemas. Si se viola (las poblaciones presentan variaciones desiguales o heterocedasticidad), un menor elimina necesidad de pilares angulados en la prueba t de Student resuelve el problema.
La mayoría del software estadístico devolverá automáticamente el valor de la prueba t corregido por heterocedasticidad.
Revise cuidadosamente los resultados de la prueba t de Student y los análisis de homocedasticidad para obtener resultados correctos. Automática.
Comentarios finales
El prueba t de Student Es uno de los análisis estadísticos inferenciales más utilizados a nivel mundial.
Muchos estudios lo han aplicado mal, arrojando duda sobre sus resultados y conclusiones.
Puede realizar un análisis incuestionable siguiendo los cinco sencillos pasos.
A resumen, debemos:
[ 1 ] elija el tipo de prueba t, [ 2 ] calcular el tamaño de la muestra, [ 3 ] realizar un muestreo aleatorio adecuado, [ 4 ] comprobar la normalidad de los residuos, y [ 5 ] verificar la igualdad de varianzas entre poblaciones.
Después de completar estos pasos, lo único que queda es run ¡el analisis!
Si aún necesitas descubrir cómo interpretar el valor p, ¡consulta este excelente artículo!