Este artículo le guiará en el cálculo del tamaño de la muestra para un Regresión logística binaria simple.
Utilizaremos el software popular y disponible gratuitamente. G*Potencia, que es uno de los más utilizados para este fin.
Estábamos inspirado para crear este artículo después de darme cuenta de que muchos tutoriales en línea para cálculos de tamaño de muestra basados en G*Power son inexactos.
Después de descargar e instalar G*Power, ábralo y elija la opción de cálculo del tamaño de muestra para regresión logística análisis haciendo clic Pruebas: Correlación y regresión: pestaña Regresión logística.
A continuación, ingrese lo siguiente parámetros:
In Cruz), seleccione Un para pruebas de una cola o Two para pruebas de dos colas.
A una cola La prueba es apropiada para una hipótesis alternativa específica, como “un mayor valor de X corresponde a una mayor probabilidad de que ocurra el evento."
A dos colas La prueba es adecuada para una hipótesis alternativa general, como "X influye en el evento Y,”sin una distinción direccional inicial.
Base su hipótesis en el conocimiento existente en su campo. Si no está seguro, opte por Dos (dos colas).
El nivel de significancia (α) representa la probabilidad de rechazar la hipótesis nula cuando es verdadera, lo que lleva a un error tipo I.
Normalmente, α se establece en 0.05 or 0.01. Un α de 0.05, por ejemplo, indica un riesgo del 5% de concluir que existe una relación significativa cuando en realidad no existe ninguna.
La Potencia de prueba (1 – β) es la probabilidad de rechazar la hipótesis nula si es falsa, controlando efectivamente el error tipo II (β).
Los valores aceptables generalmente oscilan entre 0.80 a 0.99. Es preferible una mayor potencia de prueba, pero también aumenta el tamaño de muestra requerido.
Dado que los modelos de regresión logística binaria simple solo tienen una variable independiente, establezca este valor en cero.
Seleccione el botón tipo de distribución para la variable X, que es la variable independiente o predictora del modelo.
Elegir Binomio para variables binarias, Para Tanque Empotrado o Alto para variables cuantitativas continuas, y Poisson para variables discretas. Utilice otras distribuciones disponibles sólo si es necesario.
Los últimos cuatro parámetros requieren estimaciones de población de un estudio piloto, investigación similar o cálculos teóricos.
Si es posible, utilice datos de un estudio piloto, como demostraremos aquí.
Ingrese la media y la desviación estándar de la variable X de los datos del estudio piloto para el Media poblacional de la variable X y Desviación estándar de población de los parámetros de la Variable X, respectivamente.
Obtenga los dos últimos parámetros a través de un preliminar análisis de regresión logística simple con los datos del estudio piloto.
Para nuestra demostración, usaremos el programa gratuito y fácil de usar. PSPP software. Cualquier software Se puede utilizar un programa capaz de ejecutar regresión logística.
La proporción de probabilidades Indica la asociación entre una exposición y un resultado y mide el tamaño del efecto.
Lleve a cabo una analisis preliminar con los datos piloto en PSPP para obtener la proporción de probabilidades valor (Exp(B) para la variable X, 1.48 en este ejemplo) e ingréselo en G*Power.
El último parámetro es la probabilidad de ocurrencia de la variable dependiente (y = 1) cuando la hipótesis nula (H0) es verdadera, es decir, cuando el coeficiente de la variable independiente (X) es igual a 0 y el modelo solo contiene el intercepto.
Para calcular este valor, ingrese el estimación constante (intersección) B del paso anterior a la siguiente fórmula de Excel:
=EXP(B)/(1+EXP(B))
Para nuestro ejemplo:
=EXP(-1.85)/(1+EXP(-1.85))
= 0.1355
Con todos los parámetros ingresados en G*Power, haga clic en Calcular para obtener el tamaño de muestra determinado por el cálculo!
En nuestros (aqui), el tamaño de muestra requerido para identificar el odds ratio estimado es de 97 individuos seleccionados aleatoriamente de la población objetivo.
Siguiendo estos pasos y utilizando G*Power, puede calcular de manera efectiva el tamaño de muestra apropiado para un análisis de regresión logística binaria simple.
Este le permite optimizar el diseño de su estudio, minimizar errores y mejorar la validez de sus hallazgos.
Además, comprensión El papel de diferentes parámetros en la determinación del tamaño de la muestra contribuye a una comprensión integral de la regresión logística en su conjunto.
¿Quiere aprender a calcular el tamaño de la muestra en G*Power para los análisis inferenciales más cruciales?
No te pierdas el GRATIS ¡Muestras de nuestro libro digital recientemente lanzado!
En el interior, dominará el cálculo del tamaño de la muestra para pruebas t independientes o pareadas; ANOVA de una o dos vías, con o sin medidas repetidas, y modelos mixtos; regresión lineal y logística simple y múltiple, y más.
Haz clic en este enlace y descubre todo lo que tiene para ofrecerte: Estadística Aplicada: Análisis de Datos.
Descubra el poder de los diagramas de caja en el análisis de datos estadísticos. ¡Aprenda a crear, interpretar y aplicar estas presentaciones gráficas de datos!
Evite sacar conclusiones precipitadas en ciencia de datos con estos conocimientos y métodos estadísticos. Aprenda cómo garantizar la precisión y la validez.
Aprenda a informar los resultados de ANOVA en estilo APA con nuestra guía paso a paso, que cubre elementos clave, tamaños de efectos e interpretación.
Domine la prueba t de Student para comparar con precisión las medias poblacionales y garantizar conclusiones válidas en su investigación. Evite errores comunes y mejore el análisis de datos.
Domine los modelos lineales generalizados en Python con nuestra guía detallada, que desbloquea poderosas técnicas de análisis de datos para descubrimientos reveladores.
Explore el concepto estadístico clave, la desviación media absoluta, sus ventajas, el proceso de cálculo y su aplicación práctica.