0% encontró este documento útil (0 votos)
4 vistas3 páginas

T11 La Curva ROC

Cargado por

ana.amablec
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
4 vistas3 páginas

T11 La Curva ROC

Cargado por

ana.amablec
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 3

Medicina de Familia.

SEMERGEN 49 (2023)(1) 101821

www.elsevier.es/semergen

FORMACIÓN CONTINUADA - METODOLOGÍA Y TÉCNICAS

La curva ROC
J.A. Martínez Pérez a,∗ y P.S. Pérez Martin b

a
Miembro de la Comisión Nacional de Calidad de SEMERGEN, Madrid, España
b
Médico de familia, Centro de Salud Palma Norte, Madrid, España

Recibido el 26 de abril de 2022; aceptado el 15 de julio de 2022


Disponible en Internet el 22 de septiembre de 2022

PALABRAS CLAVE Resumen La curva ROC es una herramienta estadística que se utiliza para evaluar la capacidad
Curva ROC; discriminativa de una prueba diagnóstica dicotómica. Se trata de curvas en las que se presenta
Punto de corte; la sensibilidad en función de los falsos positivos (complementario de la especificidad) para
Capacidad distintos puntos de corte. Son útiles para elegir el punto de corte más adecuado de una prueba,
discriminativa conocer el rendimiento global de esta y comparar la capacidad discriminativa de 2 o más pruebas
diagnósticas.
© 2022 Sociedad Española de Médicos de Atención Primaria (SEMERGEN). Publicado por Elsevier
España, S.L.U. Todos los derechos reservados.

KEYWORDS ROC curve


ROC curve;
Cut-off point; Abstract The ROC curve is a statistical tool used to evaluate the discriminative capacity of
Discriminative a dichotomous diagnostic test. These are curves in which sensitivity is presented as a function
capacity of false positives (complementary to specificity) for different cut-off points. They are useful
for choosing the most appropriate cut-off point for a test, knowing its overall performance and
comparing the discriminative capacity of 2 or more diagnostic tests.
© 2022 Sociedad Española de Médicos de Atención Primaria (SEMERGEN). Published by Elsevier
España, S.L.U. All rights reserved.

Introducción la traducción quizá se ajuste más a «curva de eficacia


diagnóstica») constituye un método estadístico para deter-
El análisis con base en curvas receiver operating characte- minar la exactitud diagnóstica de test que utilizan escalas
ristic (ROC, «característica operativa del receptor», aunque continuas, siendo utilizadas con 3 propósitos específicos:
determinar el punto de corte en el que se alcanza la sen-
sibilidad y especificidad más altas, evaluar la capacidad

Autor para correspondencia. discriminativa del test diagnóstico y comparar la capacidad
Correo electrónico: jmartinezp@semergen.es discriminativa de 2 o más test diagnósticos que expresan sus
(J.A. Martínez Pérez). resultados como escalas continuas1 .

https://doi.org/10.1016/j.semerg.2022.101821
1138-3593/© 2022 Sociedad Española de Médicos de Atención Primaria (SEMERGEN). Publicado por Elsevier España, S.L.U. Todos los derechos
reservados.

Descargado para Anonymous User (n/a) en University of Piura de ClinicalKey.es por Elsevier en mayo 01, 2023. Para uso personal
exclusivamente. No se permiten otros usos sin autorización. Copyright ©2023. Elsevier Inc. Todos los derechos reservados.
J.A. Martínez Pérez and P.S. Pérez Martin

Tabla 1 Capacidad discriminativa del cuestionario SCOFF


para la detección de trastornos de la conducta alimentaria
en Atención Primaria
Umbral de Sensibilidad, % Especificidad, %
detección de
respuestas
positivas
0+ 100 (73,5-100) 0 (0-1,4)
1+ 91,6 (61,5-99,7) 29,7 (24,2-35,2)
2+ 91,6 (71,8-100) 91 (87,5-94,5)
3+ 41,6 (15,1-72,3) 97 (94-99,3)
4+ 8,3 (0,2-38,4) 99,3 (96,2-99,5)
5+ 0 (0-26,4) 99,7 (99,2-99,9)
Los valores se presentan con un intervalo de confianza del 95%.

Estas curvas fueron desarrolladas en el seno de las inves- Figura 1 Curva ROC. Capacidad discriminativa del cuestiona-
tigaciones militares estadounidenses. Su primera aplicación rio SCOFF.
fue la detección de señales de radar durante los años 50
del siglo pasado. En los 60, Green y Swets2 la usaron para
experimentos psicofísicos y más tarde, en los 70, el radió- determina la sensibilidad y especificidad más altas conjun-
logo Leo Lusted3 las empleó para la toma de decisiones en tamente, pero no siempre este punto de corte determina la
la interpretación de imágenes radiológicas. sensibilidad ni la especificidad más altas del test.
Cuando los valores de una prueba diagnóstica siguen Generalmente, la sensibilidad más alta corresponde a
una escala cuantitativa, la sensibilidad y la especificidad un punto de corte, mientras que la especificidad más alta
varían según el punto de corte elegido para clasificar a la corresponde a otro, y en ocasiones interesa disponer de
población como enferma o no enferma. Mediante el uso de un test diagnóstico altamente sensible o altamente espe-
las curvas ROC hacemos una medición global del conjunto cífico. En este caso lo más adecuado es, una vez conocidas
de todos los puntos de corte y precisamos cuál de ellos la sensibilidad y la especificidad de los diferentes puntos de
alcanza la sensibilidad y la especificidad más altas4 , con- corte, decantarse por aquel que tenga la mayor sensibilidad
siderándose «positivos» aquellos valores mayores o iguales o especificidad, según sea el objetivo que nos propongamos1 .
al punto de corte y «negativos» aquellos valores menores al
mismo.
Para construir esta curva es necesario calcular la sen- Evaluar la capacidad discriminativa de un test
sibilidad y la especificidad para todos los posibles puntos
diagnóstico
de corte4 . En la tabla 1 exponemos un ejemplo basado en
un reciente trabajo nuestro, sobre la validez del cuestiona-
En la curva ROC existe un área denominada área bajo
rio SCOFF para la detección de trastornos de la conducta
la curva (ABC, o AUC en terminología anglosajona, por
alimentaria5 . Como podemos observar, la mayor sensibi-
area under the curve) que mide la facultad discrimina-
lidad y especificidad conjunta concurren en el punto de
tiva del test, es decir, su capacidad de diferenciar sujetos
corte 2.
sanos versus enfermos. El AUC la podemos definir como la
La sensibilidad o proporción de verdaderos positivos se
probabilidad de clasificar correctamente a un par de indi-
sitúa en el eje de ordenadas y el complemento de la especi-
viduos (uno sano y otro enfermo) seleccionados al azar al
ficidad (1 − especificidad) o proporción de falsos positivos,
aplicarles la prueba4 .
en el de abscisas4 . Ambos ejes engloban valores entre 0
El AUC refleja cómo de bueno es el test que queremos
y 1 (0 a 100%). La curva ROC se dibuja uniendo los pares
utilizar para discriminar pacientes con y sin enfermedad a
de valores (sensibilidad y complemento de la especificidad)
lo largo de todo el rango de puntos de corte posibles. Una
correspondientes a cada punto de corte (fig. 1).
prueba con discriminación perfecta (sensibilidad igual a 1 y
especificidad igual a 1) estaría representada por una curva
Punto de corte que determina la sensibilidad y ROC situada en el lado izquierdo y superior del gráfico. Si
la especificidad más altas la curva no fuera discriminativa (sensibilidad y especificidad
igual a 0,5), estaría representada por la diagonal del gráfico.
Es el que presenta el mayor índice de Youden, calculado Según el área que obtengamos, podemos estimar cuál es
según la fórmula (sensibilidad + especificidad − 1). Gráfica- el grado de discriminación del test. Cuanto más se acerque
mente, este corresponde al punto de la curva ROC más a 1, más discriminativo será, y cuanto más se aproxime a
cercano al ángulo superior-izquierdo del gráfico (punto 0,1), 0,5, menos discriminativo será. Una curva con un valor de
es decir, más cercano al punto del gráfico cuya sensibilidad 0,75 consideraremos que tiene una capacidad discriminativa
y especificidad son del 100%. media.
Sin embargo, en este aspecto hay que considerar que A título orientativo, podemos usar los siguientes interva-
este índice de Youden indica cuál es el punto de corte que los para interpretar los valores de AUC6 :

Descargado para Anonymous User (n/a) en University of Piura de ClinicalKey.es por Elsevier en mayo 01, 2023. Para uso personal
exclusivamente. No se permiten otros usos sin autorización. Copyright ©2023. Elsevier Inc. Todos los derechos reservados.
Medicina de Familia. SEMERGEN 49 (2023)(1) 101821

La comparación consiste en confrontar las respectivas


AUC de cada test, siendo más discriminativor el que tenga
una mayor AUC. Sin embargo, para poder afirmar que un
test tiene superio capacidad discriminativa sobre otro, es
preciso comparar estadísticamente ambas AUC según los
métodos descritos por Hanley y McNeil7 o DeLong et al.8
(preferentemente este último). Si no podemos utilizar estas
herramientas, solamente podremos sugerir que un test diag-
nóstico es más discriminativo que otro, pero no afirmarlo.
Como podemos comprobar en la figura 2, el AUC del
test SCOFF (0,9135) podemos considerarla muy buena y
es superior a la del test EAT-26 (0,6071), que definiremos
como regular. Con base en estos resultados, sugeriremos
que el primer test es más discriminativo que el segundo,
pero además, al comparar ambas áreas con el método
DeLong, vemos que el primero es estadísticamente signi-
ficativo respecto al segundo (p = 0,0001), lo que nos lleva a
afirmarlo.
Por otra parte, también podemos observar que el inter-
valo de confianza del test EAT-26 está comprendido entre
0,4787 y 0,7355%, es decir, incluye el 0,50%, lo que nos
conduce a concluir que este test en nuestro estudio no era
discriminativo.
Limitaciones de su uso: estas curvas solo contemplan 2
Figura 2 Comparación de curvas ROC de los cuestionarios
estados clínicos posibles (sano, enfermo) y no sirven para
SCOFF y EAT-26.
situaciones en que se trate de discernir entre más de 2
enfermedades.

- 0,5: el modelo no tiene capacidad discriminativa.


Bibliografía
- 0,5-0,6: test malo.
- 0,6-0,75: test regular.
1. Cerda J, Cifuentes L. Uso de curvas ROC en investigación clínica.
- 0,75-0,9: test bueno.
Aspectos teórico-prácticos. Rev Chil Infect. 2012;29:138---41,
- 0,9-0,97: test muy bueno. http://dx.doi.org/10.4067/S0716-10182012000200003.
- 0,97-1: test excelente. 2. Green DM, Swets JA. Signal detection theory and psichophysics.
New York: John Wiley & Sons, Inc.; 1966.
Por otra parte, hay que considerar que el AUC es un 3. Lusted LB. Signal detectability and medica decision-making.
estimador muestral de una población; por este motivo es Science. 1971;171:1271---9.
necesario hallar el intervalo del mismo con una confianza del 4. García de Yébenes Pous MJ, Rodríguez Salvanés F, Carmona Orte-
95%. Si este intervalo incluye el 0,50% (por ejemplo, 0,43- lls L. Validación de cuestionarios. Reumatol Clin. 2009;5:171---7.
0,68%) no podemos considerar que el test que evaluamos sea 5. Pérez Martín PS, Martínez Pérez JA, Espejo Gonzá-
lez A. Is early detection of eating disorders possible
discriminativo1 .
in primary care? Fam Med Prim Care Rev. 2022;24:61---5,
http://dx.doi.org/10.5114/fmpcr.2022.113015.
Comparar la capacidad discriminativa de 2 o 6. Wikipedia [Internet]. Curva ROC [consultado 29 Jun 2022]. Dis-
más test diagnósticos ponible en: https://es.wikipedia.org>wiki>Curva ROC.
7. Hanley JA, McNeil BJ. A method of comparing the areas under
receiver operating characteristic curves derived from the same
Para lograr este fin es necesario, en primer lugar, comprobar
cases. Radiology. 1983;148:839---43.
que se cumplen los siguientes requisitos: los test a compa- 8. DeLong ER, DeLong DM, Clarke-Pearson DL. Comparing the areas
rar deben ser medidos simultáneamente, aplicados sobre los under two or more correlated receiver operating characteristic
mismos sujetos y contrastados con el mismo patrón oro. curves: A nonparametric approach. Biometrics. 1988;44:837---45.

Descargado para Anonymous User (n/a) en University of Piura de ClinicalKey.es por Elsevier en mayo 01, 2023. Para uso personal
exclusivamente. No se permiten otros usos sin autorización. Copyright ©2023. Elsevier Inc. Todos los derechos reservados.

También podría gustarte