tamaño de muestra en regresión logística
|

Tamaño de muestra en regresión logística: un enfoque binario simple

Este artículo le guiará en el cálculo del tamaño de la muestra para un Regresión logística binaria simple.

Utilizaremos el software popular y disponible gratuitamente. G*Potencia, que es uno de los más utilizados para este fin.

Estábamos inspirado para crear este artículo después de darme cuenta de que muchos tutoriales en línea para cálculos de tamaño de muestra basados ​​en G*Power son inexactos.

Seleccionar el análisis de regresión logística

Después de descargar e instalar G*Power, ábralo y elija la opción de cálculo del tamaño de muestra para regresión logística análisis haciendo clic Pruebas: Correlación y regresión: pestaña Regresión logística.

¿De una cola o de dos colas?

A continuación, ingrese lo siguiente parámetros:

In Cruz), seleccione Un para pruebas de una cola o Two para pruebas de dos colas.

A una cola La prueba es apropiada para una hipótesis alternativa específica, como “un mayor valor de X corresponde a una mayor probabilidad de que ocurra el evento."

A dos colas La prueba es adecuada para una hipótesis alternativa general, como "X influye en el evento Y,”sin una distinción direccional inicial.

Base su hipótesis en el conocimiento existente en su campo. Si no está seguro, opte por Dos (dos colas).

Nivel significativo

El nivel de significancia (α) representa la probabilidad de rechazar la hipótesis nula cuando es verdadera, lo que lleva a un error tipo I.

Normalmente, α se establece en 0.05 or 0.01. Un α de 0.05, por ejemplo, indica un riesgo del 5% de concluir que existe una relación significativa cuando en realidad no existe ninguna.

Poder estatico

La Potencia de prueba (1 – β) es la probabilidad de rechazar la hipótesis nula si es falsa, controlando efectivamente el error tipo II (β).

Los valores aceptables generalmente oscilan entre 0.80 a 0.99. Es preferible una mayor potencia de prueba, pero también aumenta el tamaño de muestra requerido.

R² de Otras Variables Explicativas (X)

Dado que los modelos de regresión logística binaria simple solo tienen una variable independiente, establezca este valor en cero.

❓ ¿CONFUNDIDO POR EL ANÁLISIS DE DATOS?

Nuestra guía completa lo dejará muy claro
¡Haz click para aprender mas!

Distribución variable X

Seleccione el botón tipo de distribución para la variable X, que es la variable independiente o predictora del modelo.

Elegir Binomio para variables binarias, Para Tanque Empotrado o Alto para variables cuantitativas continuas, y Poisson para variables discretas. Utilice otras distribuciones disponibles sólo si es necesario.

¿Estudio piloto?

Los últimos cuatro parámetros requieren estimaciones de población de un estudio piloto, investigación similar o cálculos teóricos.

Si es posible, utilice datos de un estudio piloto, como demostraremos aquí.

Media estimada y desviación estándar

Ingrese la media y la desviación estándar de la variable X de los datos del estudio piloto para el Media poblacional de la variable X y Desviación estándar de población de los parámetros de la Variable X, respectivamente.

Analisis preliminar

Obtenga los dos últimos parámetros a través de un preliminar análisis de regresión logística simple con los datos del estudio piloto.

Para nuestra demostración, usaremos el programa gratuito y fácil de usar. PSPP software. Cualquier software Se puede utilizar un programa capaz de ejecutar regresión logística.

¡Aprenda a usar PSPP haciendo clic aquí!

Razón de probabilidades

La proporción de probabilidades Indica la asociación entre una exposición y un resultado y mide el tamaño del efecto.

Lleve a cabo una analisis preliminar con los datos piloto en PSPP para obtener la proporción de probabilidades valor (Exp(B) para la variable X, 1.48 en este ejemplo) e ingréselo en G*Power.

Probabilidad de y = 1 bajo H0

El último parámetro es la probabilidad de ocurrencia de la variable dependiente (y = 1) cuando la hipótesis nula (H0) es verdadera, es decir, cuando el coeficiente de la variable independiente (X) es igual a 0 y el modelo solo contiene el intercepto.

Para calcular este valor, ingrese el estimación constante (intersección) B del paso anterior a la siguiente fórmula de Excel:

=EXP(B)/(1+EXP(B))

Para nuestro ejemplo:

=EXP(-1.85)/(1+EXP(-1.85))

= 0.1355

Conclusión

Con todos los parámetros ingresados ​​en G*Power, haga clic en Calcular para obtener el tamaño de muestra determinado por el cálculo!

En nuestros (aqui), el tamaño de muestra requerido para identificar el odds ratio estimado es de 97 individuos seleccionados aleatoriamente de la población objetivo.

Siguiendo estos pasos y utilizando G*Power, puede calcular de manera efectiva el tamaño de muestra apropiado para un análisis de regresión logística binaria simple.

Este le permite optimizar el diseño de su estudio, minimizar errores y mejorar la validez de sus hallazgos.

Además, comprensión El papel de diferentes parámetros en la determinación del tamaño de la muestra contribuye a una comprensión integral de la regresión logística en su conjunto.

¿Quiere aprender a calcular el tamaño de la muestra en G*Power para los análisis inferenciales más cruciales?

No te pierdas el GRATIS ¡Muestras de nuestro libro digital recientemente lanzado!

En el interior, dominará el cálculo del tamaño de la muestra para pruebas t independientes o pareadas; ANOVA de una o dos vías, con o sin medidas repetidas, y modelos mixtos; regresión lineal y logística simple y múltiple, y más.

Haz clic en este enlace y descubre todo lo que tiene para ofrecerte: Estadística Aplicada: Análisis de Datos.

Visítanos en nuestras redes sociales

¡PUBLICACIONES DIARIAS EN INSTAGRAM!

Mensajes similares

Deje un comentario

Su dirección de correo electrónico no será publicada. Las areas obligatorias están marcadas como requeridas *