Modelos de Supervivencia: Kaplan-Meier y Regresión de Cox
Clasificado en Matemáticas
Escrito el en español con un tamaño de 3 KB
Modelos de Supervivencia: Enfoques No Paramétricos
Método de Kaplan-Meier
Este método sirve para estimar la función de supervivencia asociada a un conjunto de datos, asumiendo que todos los individuos tienen las mismas características y, por lo tanto, que ninguna de ellas influye sobre su supervivencia. Matemáticamente, esto significa que no se utilizan variables independientes, sino simplemente los tiempos en los que ocurren los eventos (muertes) y la presencia o ausencia de censura para cada individuo.
Suposiciones del Método de Kaplan-Meier
- Homogeneidad del tiempo de supervivencia: El instante en el cual se comienza a observar a un individuo no influye sobre su respuesta.
- La probabilidad de ser censurado debe ser independiente del efecto de interés. Esto significa que no puede aplicarse el método de Kaplan-Meier si se sabe que quienes se retiran del estudio tienen una esperanza de vida distinta (mejor o peor) de quienes son observados hasta el final.
Regresión de Cox
El objetivo de este método consiste, en primer lugar, en comparar el efecto que tienen sobre H(t) (función de riesgo) los tratamientos a los que son sometidos los individuos y, en segundo lugar, en estudiar la influencia de ciertos factores (características de los individuos y otros factores externos) sobre H(t).
El modelo de regresión de Cox es una función cuya variable dependiente es el riesgo en el que se encuentra un individuo en el instante t, y cuyas variables independientes son factores que se cree que pueden influir sobre dicho riesgo:
Aquí, H0(t) es el riesgo base que presentaría el individuo si x1=x2=...=xp=0. Es un riesgo referencial que equivale a ignorar el efecto de las variables independientes. La interpretación de H0(t) es irrelevante, ya que no está relacionado ni con las variables independientes ni con los tratamientos, que son los objetivos del estudio.
Cabe destacar que, de las variables independientes, al menos una se utilizará para modelar los tratamientos. Si se tienen T tratamientos, entonces son necesarias T-1 variables binarias para su representación. Por lo tanto, p ≥ T-1. Generalmente, suelen utilizarse las primeras variables para los tratamientos: x1, x2, ..., xT-1.
Validación del Modelo de Regresión de Cox
Prueba de Significancia de los Parámetros
- Estadístico de Wald (similar al de la regresión logística).
Prueba de Bondad de Ajuste
- -2*log(L); donde L es la verosimilitud (similar al de la regresión logística).