“Qué significa el valor P” revisado
En un Artículo anterior, proporcionamos una definición didáctica del valor p. Sin embargo, es posible que no refleje con precisión su significado completo.
Esta simplificación beneficia a quienes se involucran inicialmente con el concepto, ayudando a construir una comprensión fundamental.
Ahora presentamos una definición más precisa del valor p, que requiere mayor atención.
Hipótesis estadísticas
Al realizar una prueba de hipótesis inferencial, como chi-cuadrado, prueba t, ANOVA, correlación, regresión, etc. — tenemos dos hipótesis:
HIPÓTESIS NULA (H0): Esta es la hipótesis predeterminada más simple. No asume ninguna “diferencia entre los grupos” ni ninguna “relación entre las variables”.
HIPÓTESIS ALTERNATIVA (H1): Esta hipótesis es el complemento de H0. Sugiere “diferencias entre grupos” o una “relación entre las variables”.
Nivel de significancia y valor P
El objetivo principal de cualquier prueba de hipótesis es determinar si se rechaza o no la hipótesis nula (H0). Esta decisión depende de dos factores clave:
NIVEL DE SIGNIFICACIÓN (α): Este es un valor umbral predeterminado que utilizamos para decidir si rechazamos o no H0. Por lo general, se establece en 1% o 5% antes de realizar la prueba.
VALOR P (p): El valor p es una probabilidad obtenida de cada prueba de hipótesis inferencial que realizamos.
¿Qué significa ser estadísticamente significativo?
Después de realizar nuestro análisis y obtener el valor p, lo comparamos con nuestro nivel de significancia preestablecido (α).
Por ejemplo, establecemos un nivel de significancia (α) de 0.05 (o 5%). Al comparar este α con nuestro valor p obtenido, tenemos dos posibilidades:
1. Si el valor p es menor o igual al nivel de significancia α (p ≤ 0.05), rechazamos la hipótesis nula (H0). En este escenario, nuestra prueba se considera estadísticamente significativa.
2. Si el valor p es mayor que el nivel de significancia α (p > 0.05), no rechazamos la hipótesis nula (H0). En este caso, nuestra prueba no se considera estadísticamente significativa.
El significado del valor P
En términos técnicos, el valor de p :
la probabilidad de obtener un resultado igual (o más extremo) al que observamos en nuestros datos, asumiendo que la hipótesis nula es verdadera.
Por ejemplo, si obtenemos un valor p del 2% (p = 0.02), esto significa que si H0 es verdadera, la probabilidad de obtener resultados iguales (o más extremos) que los nuestros es solo del 2%. Como esto es menor que α = 5%, rechazamos H0.
Ejemplo: La dama probando el té
Esta historia nos traslada a una tarde de verano en Harpenden, Inglaterra, a principios de los años 1920.
Un grupo de científicos (un estadístico, un algólogo y un bioquímico) se habían reunido para tomar el té de la tarde en la Estación Experimental de Rothamsted.
Muriel Bristol, la algóloga, insistió en que el té derramado sobre leche tenía un sabor diferente al de la leche derramada sobre té.
El grupo cuestionó su afirmación, encontrando difícil creer que pudiera haber una diferencia notable en el gusto.
Ronald Fisher, el estadístico, propuso un experimento. A Muriel le servirían ocho tazas de té. A la mitad de ellos se les vertió leche sobre té y a la otra mitad se les vertió té sobre leche. Sin embargo, ella no presenciaría el proceso de preparación.
Mientras probaba cada taza, Muriel identificó correctamente el método de preparación y ¡acertó con las ocho!
Observaciones finales
Respecto a nuestra discusión sobre el valor p.
Consideremos la hipótesis nula (H0) de que Muriel no puede identificar los diferentes preparados. Si H0 es verdadera, la probabilidad de que Muriel pueda identificar correctamente la preparación de té en las ocho tazas es sólo del 1.43%.
Dado que este valor p del 1.43% es menor que el nivel de significancia elegido (α) del 5%, consideramos la prueba estadísticamente significativa. Por lo tanto, rechazaríamos la hipótesis nula (H0) y en cambio apoyaríamos la hipótesis alternativa (H1) de que Muriel puede distinguir entre las diferentes preparaciones de té.
*Este ejemplo ilustra la importancia de establecer el nivel de significancia (α) antes de realizar la prueba. Normalmente, α se fija en 1% o 5%. Si obtuviéramos un valor p entre estos dos umbrales, podríamos estar sesgados hacia la elección del α que hace que nuestro resultado parezca significativo (en este caso, 5%).
¡Recuerda leer el primer artículo sobre el valor p! Haga clic aquí!