Análisis de Supervivencia: Métodos de Kaplan-Meier, Log-Rank y Regresión de Cox
Clasificado en Matemáticas
Escrito el en español con un tamaño de 3,68 KB
El análisis de supervivencia es un conjunto de métodos estadísticos para analizar el tiempo que transcurre hasta que ocurre un evento de interés. A continuación, se describen algunos de los métodos más comunes:
1) Método de Kaplan-Meier
El método de Kaplan-Meier se utiliza para estimar la función de supervivencia a partir de datos de tiempo hasta el evento. Es especialmente útil cuando hay datos censurados (es decir, cuando no se observa el evento para todos los individuos en el estudio).
Aplicación: Comparar dos tratamientos para determinar cuál ofrece una mayor supervivencia. Se genera una gráfica donde el eje Y representa la probabilidad de supervivencia (desde 1 hacia abajo) y el eje X representa el tiempo de supervivencia.
Variables clave:
- Tiempo de supervivencia
- Número de orden (n)
- Orden de las observaciones no censuradas (r)
- (n-r)/(n-r+1)
- Probabilidad de supervivencia (porcentajes acumulados)
Consideraciones adicionales:
En una variante del método, se incluye una columna de censura (0 o 1) para indicar si el evento fue observado (1) o censurado (0). Sin embargo, esta forma no permite la comparación entre tratamientos.
2) Prueba de Log-Rank para Comparar Curvas de Supervivencia
La prueba de Log-Rank se utiliza para comparar las curvas de supervivencia de dos o más grupos. La hipótesis nula (Ho) es que no hay diferencia entre los tratamientos. Se rechaza la hipótesis si el valor de D es mayor que el valor crítico de la distribución chi-cuadrado con 1 grado de libertad.
Elementos de la tabla:
- Mes del cuento
- Pacientes en riesgo (Tratamiento A, B, Total)
- Pérdidas observadas (Tratamiento A, B, Total)
- Pérdidas esperadas (A, B, Total) - Calculadas como (Pacientes en riesgo de cada tratamiento) / (Total de pacientes en riesgo)
Cálculo de D:
Primero, se calculan los totales de pérdidas observadas (OA y OB) y pérdidas esperadas (EA y EB) para cada tratamiento. Luego, se calcula D utilizando la fórmula:
D = (OA - EA)^2 / EA + (OB - EB)^2 / EB
Si D > chi-cuadrado, se rechaza la hipótesis nula, indicando que los tratamientos son significativamente diferentes.
3) Regresión de Cox
La regresión de Cox es un modelo de regresión que se utiliza para analizar la relación entre una o más variables predictoras y el tiempo hasta el evento. Proporciona estimaciones de los coeficientes y la exponencial de los coeficientes.
Interpretación:
El factor de riesgo se calcula como e^(Bi * Xi). Si el resultado es > 1, existe un mayor riesgo y menor supervivencia. Si el resultado es < 1, existe un menor riesgo y mayor supervivencia.
4) Regresión Logística
La regresión logística se utiliza para modelar la probabilidad de un evento binario (éxito/fracaso) en función de una o más variables predictoras.
Aplicaciones:
- Probabilidad de un evento: Se utiliza la fórmula de regresión logística para calcular la probabilidad.
- Significancia de una variable: Se verifica si el valor p (probabilidad) asociado a la variable es menor a 0.05. Si es menor, la variable es significativa; si es mayor, la variable no es significativa y podría no contribuir al modelo.
- Relación entre variables: Se analiza el signo del coeficiente de la variable para determinar si una mayor (o menor) cantidad de la variable se asocia con una mayor (o menor) probabilidad del evento de interés.