Riesgos Proporcionales de Cox
Riesgos Proporcionales de Cox
Riesgos Proporcionales de Cox
9/14/2006
Resumen
El procedimiento Riesgos Proporcionales de Cox esta diseñado para ajustar un modelo
estadístico semi-parámetrico a los tiempos de falla de una o mas variables predictoras. Los
predictoras pueden ser cuantitativos o categóricos. Modelos de primer o Segundo orden pueden
ser ajustados, con o sin interacciones. A diferencia del procedimiento Regresión con Datos de
Vida, ninguna suposición es hecha acerca de la distribución de los tiempos de falla. La única
suposición es que los predictoras actúan de manera multiplicativa en la función de riego. Los
tiempos de fallas pueden ser censurados o no censurados.
Entrada de Datos
La caja de dialogo de entrada requiere información sobre los tiempos de falla y las variables
predictoras:
• Variable Dependiente: Una variable numérica conteniendo Y, los tiempos de falla (para
datos sin censura) o los tiempos de censura (para datos censurados).
• (Censura): Una columna opcional indicando si cada valor ha sido censurado o no. Introduce
0 si el valor de la variable dependiente representa un tiempo de falla censurado. Introduce un
1 si el valor ha sido censurado por la derecha (el tiempo de falla verdadero es mas grande que
el valor introducido).
• Factores Cuantitativos: Columnas numéricas que contienen los valores de algunos factores
cuantitativos que son incluidos en el modelo.
Modelo Estadístico
Los modelos de riego proporcionales de Cox suponen que el efecto de las variables predictoras
sobre la función de riesgo puede ser expresado como un producto de términos que envuelven las
variables predoctora X y una función de base de riesgo. STATGRAPHICS ajusta un modelo de
la forma
donde h0(t) es una función base de riesgo apropiada cuando todas las variables predictoras son
igual a 0. La función exp (Xβ) es la razón de la función de riesgo para una observación con
variables predictoras X observadas y la función base de riesgo.
La tabla incluye:
• Pruebas Razón de Verosimilitud: Esta prueba se corre para determinar si los coeficientes
son o no significativamente distintos de 0. P-valores de dos colas son mostrados. P-valores
pequeños (menos que 0.05 si se opera en un nivel de confianza del 95%) corresponden a
variables estadísticamente significantes.
La tabla anterior muestra los resultados de ajustar un modelo de primer orden a los datos del
ejemplo. El modelo estimado es:
Los términos Nephrectomy=1, Age=2, y Age=3 son variables indicadoras boleanas que toman el
valor 0 si es falso y 1 si es verdadero. La prueba razón de verosimilitud indica un efecto
significante de la nefrectomía, pero el efecto de la edad no es significante en el nivel 95%. Note
que el efecto de Nefrectomía es negativo, indicando que esto exitosamente reduce la función de
riesgo y mejora así la supervivencia.
• Tipo de Modelo: Seleccione Primer Orden para ajustar un modelo que envuelva solamente
los efectos principales de cada factor. Selecciona Segundo Orden para incluir efectos
cuadráticos para los factores cuantitativos e interacciones de 2 factores entre todas las
variables.
• Excluir: Presionar este botón para excluir términos específicos del modelo. Una caja de
dialogo será desplegada enseguida:
Haz doble clic sobre un efecto para cambiarlo del campo Incluir a el campo Excluir o al
contrario.
Dos términos adicionales han sido adheridos al modelo, igual a los productos cruzados entre las
variables indicadoras para los efectos principales. La prueba razón de verosimilitud indica que
las interacciones estimadas no son significantes.
Funciones de Base
La función base de riesgo es la función de riesgo que corresponde a el caso en el que todas las
variables predictoras son igual a 0. Para un factor categórico, esto se iguala el primer nivel del
factor, cuando todas las variables indicadoras asociadas son fijadas 0. La tabla de la Funciones
de Base despliega la función base de riesgo y las funciones relacionadas.
Funciones de Base
Función de Función de Riesgo
Survival time Alfa Riesgo Supervivencia Acumulado
0.0- 0.0 1.0 0.0
5.0- 0.950245 0.0497546 0.950245 0.051035
6.0- 0.901201 0.0987991 0.856362 0.155062
8.0- 0.890785 0.109215 0.762834 0.270715
9.0- 0.779247 0.220753 0.594436 0.520142
10.0- 0.926728 0.0732716 0.550881 0.596236
12.0- 0.910413 0.0895868 0.501529 0.690093
14.0- 0.8918 0.1082 0.447264 0.804607
15.0- 0.883764 0.116236 0.395275 0.928173
17.0- 0.868258 0.131742 0.343201 1.06944
18.0- 0.738055 0.261945 0.253301 1.37318
21.0- 0.814989 0.185011 0.206438 1.57776
26.0- 0.63507 0.36493 0.131102 2.03178
35.0- 0.768142 0.231858 0.100705 2.29556
36.0- 0.5799 0.4201 0.058399 2.84046
38.0- 0.720924 0.279076 0.0421013 3.16768
48.0- 0.70074 0.29926 0.0295021 3.5233
52.0- 0.47569 0.52431 0.0140338 4.26628
56.0- 0.617835 0.382165 0.00867059 4.74782
68.0- 0.579434 0.420566 0.00502403 5.29352
72.0- 0.532782 0.467218 0.00267672 5.92316
84.0- 0.402576 0.597424 0.00107758 6.83304
108.0- 0.191974 0.808026 0.00107758 6.83304
115.0- 0.0 0.0
La función de riesgo es una función de saltos que cambia inmediatamente después de cada falla.
Desplegado en la tabla están:
hˆ0 (t j ) = 1 − α̂ j (2)
Sˆ 0 (t ) = ∏ αˆ
j |t ( j ) < t
j (3)
Hˆ 0 (t ) = − ln[Sˆ 0 (t )] (4)
Función de Supervivencia
El panel Función de Supervivencia muestra la función de supervivencia estimada para los niveles
seleccionados de una variable predictora, en los valores fijos de los otros predictoras.
0
0.8 1
0.6
0.4
0.2
0
0 20 40 60 80 100 120
Survival time
Si el factor seleccionado es categórico, una curva separada será graficada para cada nivel de este
factor. Si el factor seleccionado es cuantitativo, curvas serán graficadas en los valores bajo y alto
desplegados en la caja de dialogo Opciones del Panel.
Por ejemplo, la grafica anterior muestra la función de supervivencia estimada para pacientes en
el grupo que han tenido una nefrectomía y para aquellos que no, para Age = 1. Note el
considerable mejoramiento en la supervivencia para pacientes que han tenido cirugía.
• Bajo y Alto: Si el factor seleccionado es cuantitativo, los dos niveles en los cuales se
graficaran las funciones.
• Siguiente y Atrás: Usada para desplegar otros factores cuando más de 16 están presentes.
Tabla de la Función
Nephrectomy=1
Age=2
Los valores de las variables predictoras son fijados usando Opciones del Panel.
• Mantener En: Los valores de las variables predictoras en los cuales las funciones son
estimadas.
• Siguiente y Atrás: Usado para desplegar otros factores cuando más de 16 están
presentes.
Residuos
La tabla de residuos muestra varios tipos de residuos.
Residuos
Residuo Residuo Residuo Residuo
Fila Survival time Cox-Snell C.S. Modificado Martingale de Desviación
1 9.0 0.520142 0.520142 0.479858 0.589569
2 6.0 0.155062 0.155062 0.844938 1.42758
3 21.0 1.57776 1.57776 -0.577756 -0.493462
4 15.0 0.939796 0.939796 0.0602036 0.061456
5 8.0 0.274105 0.274105 0.725895 1.06616
6 17.0 1.08283 1.08283 -0.0828317 -0.0806492
7 12.0 2.63898 2.63898 -1.63898 -1.15636
8 104.0 1.66643 2.66643 -1.66643 -1.82561
9 9.0 0.126852 0.126852 0.873148 1.54375
10 56.0 1.15789 1.15789 -0.157893 -0.150273
11 35.0 0.559838 0.559838 0.440162 0.529048
12 52.0 1.04046 1.04046 -0.0404571 -0.039924
13 68.0 1.29098 1.29098 -0.290979 -0.266751
14 77.0 1.44454 2.44454 -1.44454 -1.69973
15 84.0 1.66643 1.66643 -0.666434 -0.558118
16 8.0 0.0660216 0.0660216 0.933978 1.88881
17 38.0 0.77253 0.77253 0.22747 0.247445
18 72.0 1.44454 1.44454 -0.444536 -0.391785
19 36.0 0.692728 0.692728 0.307272 0.345966
20 48.0 0.859258 0.859258 0.140742 0.147947
21 26.0 0.495507 0.495507 0.504493 0.628777
22 108.0 1.66643 1.66643 -0.666434 -0.558118
23 5.0 0.0124464 0.0124464 0.987554 2.60721
24 108.0 1.6873 2.6873 -1.6873 -1.83701
25 26.0 0.501713 0.501713 0.498287 0.618773
26 14.0 0.198684 0.198684 0.801316 1.2765
27 115.0
28 52.0 1.05349 1.05349 -0.0534871 -0.0525622
29 5.0 0.0126022 1.0126 -0.0126022 -0.158759
30 18.0 0.339083 0.339083 0.660917 0.917163
31 36.0 0.701403 0.701403 0.298597 0.33489
32 9.0 0.12844 0.12844 0.87156 1.53671
33 10.0 0.556059 0.556059 0.443941 0.534677
34 9.0 0.485092 0.485092 0.514908 0.645769
35 18.0 1.28065 1.28065 -0.280645 -0.257997
36 6.0 0.144613 0.144613 0.855387 1.46854
Residuos de Cox-Snell modificados basados en delta = 1.0
Incluidos están:
• Residuos Cox-Snell – Estos residuos deberían de comportarse como una muestra de una
distribución exponencial con media igual a 1. Observaciones censuradas tendrán residuos
censurados.
• Residuos Cox-Snell Modificados – Estos residuos son creados adhiriendo una cantidad
positiva Δ a todos los residuos censurados. Por defecto, Δ = 1 pero puede cambiarse
usando Opciones del Panel en el panel Gráfico de Residuos. Otro valor poblacional es Δ
= 0.693. Nota: estos residuos no son desplegados si no hay observaciones censuradas.
• Residuos de Desvianza – Ellos están relacionados con los residuos de martingalas pero
son transformados para tener una distribución más simétrica.
1.6
0.6
Log-riesgo acumulado
-0.4
-1.4
-2.4
-3.4
-4.4
-4.4 -3.4 -2.4 -1.4 -0.4 0.6 1.6
Log de residuo de Cox-Snell
Los log-residuos Cox-Snell para cada una de las observaciones censuradas son graficados en el
eje horizontal. El eje vertical muestra los log de la función de riesgo acumulada de los residuos
Cox-Snell, estimados usando el procedimiento de Kaplan-Meier. Si los residuos actúan como
una muestra de una distribución exponencial unitaria, estos deberían estar sobre la línea de 45°
línea diagonal.
Excepto para el primer punto todos los demás están razonable cerca de la línea.
Grafica de Residuos
Los residuos también pueden ser graficados contra otras cantidades.
3
no censurados
2.5 censurados
Residuo Cox-Snell
1.5
0.5
0
0 20 40 60 80 100 120
Survival time
Para los residuos Cox-Snell y Cox-Snell modificados, una línea de referencia es fijada en 1, ya
que los residuos deberían de seguir una distribución exponencial unitaria.
3
Residuo Cox-Snell modificado
no censurados
2.5 censurados
1.5
0.5
0
0 10 20 30 40
Rango de Survival time
1.3
no censurados
0.8 censurados
Residuo Martingale
0.3
-0.2
-0.7
-1.2
-1.7
0 10 20 30 40
Fila
3.1
no censurados
censurados
Residuo de desviación
2.1
1.1
0.1
-0.9
-1.9
1 2 3
• Grafica: Tipo de residuos a graficar. Para los residuos modificados de Cox-Snell, Delta es
adherida a cada residuo correspondiente a una observación censurada.
Grabar Resultados
Los siguientes resultados pueden ser guardados en una hoja de datos:
Función de Verosimilitud
⎧ ⎫
⎪ r exp( s j β ) ⎪
L = ∏⎨
j =1 ⎪ ∑
⎩ l ∈R (
[y ( j )
exp( xl β ) j
d
] ⎬
⎪
⎭
(5)
donde sj es un vector que contiene la suma de las variables predictoras para todas las fallas en el
tiempo y(j).
h0 ( y ( j ) ) = 1 − α̂ j (6)
( )
exp xl βˆ
∑(
l∈D y ( j ) ) 1 − αˆ exp( xl β )
ˆ
= ∑( exp(
)
l∈R y ( j )
x βˆ ) l (7)
j
Residuos
Sea δi = 1 para un tiempo de falla y 0 para una observación censurada.
⎧ri no − censorados
Cox-Snell Modificados: ri′ = ⎨ si (9)
⎩ri + Δ censorados
Martingala: mi = δ i − ri (10)