Giusephy Valladares Tesis Trabajo Final Version01

UNIVERSIDAD PERUANA DE CIENCIAS APLICADAS
FACULTAD DE INGENIERIA
PROGRAMA ACADÉMICO DE INGENIERÍA DE SISTEMAS
“Sistema de análisis predictivo para diagnostico temprano de neumonía
mediante algoritmos de reconocimiento de imágenes usando deep learning”
TESIS
Para optar el título profesional de Ingeniero de Sistemas
AUTOR(ES)
Valladares Peña, Giusephy Hugo ( u821174 )
ASESOR
Gutiérrez Monge, Yulisa Paula (código ORCID)
Lima, 03 de mayo del 2020

ÍNDICE
CAPÍTULO 1: INTRODUCCIÓN.........................................................................................5
1. ANTECEDENTES DEL PROBLEMA:.....................................................................................5
1.1. LA NEUMONIA EN EL MUNDO.........................................................................5

1.2. LA NEUMONIA EN EL PERU..............................................................................9
1.3. DEFINICION DE NEUMONIA...........................................................................10
2. PROBLEMA.................................................................................................................10
3. IMPORTANCIA DEL PROBLEMA...........................................................................11
4. MOTIVACIÓN DE LA PROPUESTA(LOGROS Y METAS) ..................................16
5. OBJETIVOS.................................................................................................................17
5.1. OBJETIVO GENERAL.........................................................................................15
5.2. OBJETIVO ESPECIFICO.....................................................................................19
6. PROPUESTA................................................................................................................17
CAPÍTULO 2: ESTADO DEL ARTE..................................................................................19
1. METODOLOGIA.........................................................................................................19
2. PLANIFICACION........................................................................................................21
3. DESARROLLO............................................................................................................21
4. RESULTADOS.............................................................................................................21
5. ANALISIS.....................................................................................................................21
6. CONCLUSIONES:.......................................................................................................45
BIBLIOGRAFÍA....................................................................................................................47
1
ÍNDICE DE TABLAS
Tabla 1: Criterios de selección y Criterios de exclusión............................................................8

Tabla 2: Lista de articulos seleccionados (10 papers)..............................................................23
Tabla 3:Tabla Paper 03............................................................................................................24
Tabla 4:Tabla Paper 04............................................................................................................26
2
ÍNDICE DE FIGURAS
Figura 1: Covip-19 numero de nuevos infectados ....................................................................5

Figura 2: Proceso redes neuronales............................................................................................6
Figura 3: Proceso lectura de imagenes.......................................................................................6
Figura 4: Proceso deep learning.................................................................................................5
Figura 5: Formula 01..................................................................................................................6
Figura 6: Formula 02..................................................................................................................7
Figura 7: Formula 03..................................................................................................................7
Figura 8: Formula 04..................................................................................................................8
3
CAPÍTULO 1: INTRODUCCIÓN
1. 1. ANTECEDENTES DEL PROBLEMA :
1.1 LA NEUMONIA EN EL MUNDO.

La neumonía puede ser causada por virus, bacterias u hongos que ataca los
pulmones. El año 2015 a nivel mundial se calcula que ha matado unos 920,136
niños, de esta forma es responsable aproximadamente del 15% de todas las
defunciones de menores de 5 años, esta grave enfermedad puede prevenirse por
medio de inmunización, una alimentación adecuada y mediante el control de
factores ambientales, se conoce que la neumonía causada por bacterias puede ser
tratada con antibióticos pero solo un tercio de de niños que la padecen reciben los
antibióticos que necesitan, sin embargo la causada por virus no sigue el tratamiento
anteriormente mencionado. En la actualidad el mundo es golpeada por una
pandemia de un tipo de neumonía causada por un nuevo virus SARS-CoV-2
(Síndrome respiratorio agudo severo coronavirus 2) del cual no hay una vacuna y
puede producir la muerte atacando especialmente los pulmones, hasta el
29/04/2020 se presenta a nivel mundial 3’117,880 contagiados y 217,212 muertes
produciendo un colapso de los sistemas sanitarios de todos los países del mundo
debido a que no hay ni una cura directa y ninguna vacuna por lo cual para evitar el
alto contagio que este virus produce, por lo cual los gobiernos a nivel mundial han
procedido al aislamiento social sus países, dando lugar a que la economía a nivel
mundial colapse por las pérdidas millonarias de muchas empresas y por ende
muchos puestos de trabajo, dando lugar a una gran recesión a nivel global.
4
1.2 LA NEUMONIA EN EL PERU.
Esta enfermedad respiratoria es la primera causa de muerte en el Perú. De acuerdo

al ministerio de salud tan solo el 2018 se reportaron 66,745 casos de neumonía, de
los cuales más de 48,000 episodios se han producido en niños menores de 5 años y
adultos mayores de 60 años. Según el boletín epidemiológico del Perú de la semana
20 (12-18 de mayo)-elaborado por el Centro Nacional de Epidemiologia,
Prevención y Control de enfermedades (Ministerio de Salud) , desde el inicio del
año 2019 se han notificado más de 16000 casos de neumonía en Infantes y adultos
mayores, produciéndose mayor número de muertos en el segundo grupo. En la
actualidad el Perú presenta una foco infeccioso de gran magnitud por el virus
SARS-CoV-2 (Covid-19) que según información del MINSA al día 29 de abril del
2020 se han producido 33,931 contagios y 943 fallecidos, dando lugar al mismo
efecto que se produce a nivel mundial el hacinamiento y desborde del sistema de
salud en Perú asi como el confinamiento social de la población y el cierre de
muchas empresas, lo cual perjudica económicamente a nuestro país.
Figura 1
5
.Fuente wikipedia
1.3 DEFINICION DE NEUMONIA.
Es una infección que inflama los sacos de aire de uno o ambos pulmones, los que
pueden llenarse de fluidos. La neumonía puede provocar que los sacos de aire se
llenen de fluido o pus. La infección puede ser mortal para cualquier persona pero
en especial para bebes, niños pequeños y adultos mayores de 65 años. Esta
enfermedad presenta síntomas como tos con flema y pus, fiebre y escalofríos y
dificultad para respirar. Esta enfermad se puede producir por bacterias o por virus
algunos tipos de neumonía pueden tratarse con antibióticos y algunos pueden
prevenirse con vacunas , a excepción del SARS-CoV-2 (Covid-19) que es un nuevo
tipo de coronavirus que tiene síntomas un poco diferentes pero al final ataca los
pulmones produciendo una seria neumonía, esta no tiene cura conocida y tampoco
existe una vacuna a la fecha para proteger a la población.
6
2. PROBLEMA :
Según los antecedentes mencionados anteriormente, el problema de la presente tesis

es la lectura lenta de las radiografías de los pulmones para pacientes con la
enfermedad de neumonía en especial con la enfermedad del SARS-CoV-2 (Covid-
19) debido a que para poder realizar esto rápido se requiere personal especializado
para determinar el estadio del paciente , este proceso puede tomar de 15 a 20
minutos por cada radiografía de tórax, en promedio llegan a hospitalizarse en el
Perú 16,000 pacientes por el nuevo Coronavirus (esta cantidad aumenta de forma
exponencial en nuestro territorio), lo cual es demasiado tiempo para esta gran
cantidad de pacientes que se presentan en las emergencias de todos los hospitales
del Perú, este problema afecta directamente la toma de decisiones rápidas y
7
efectivas para el tratamiento de enfermos de este tipo de neumonías y aplicar
soluciones para la mejora de los pacientes y tiene como limitante el tiempo que se
tiene al tener mayor cantidad de pacientes que crecen de manera exponencial por el
alto grado de contagio que presenta el virus que produce esta neumonía severa.
2. 3. IMPORTANCIA DEL PROBLEMA :
La importancia del problema radica en que al leer de manera mas rápida las
radiografías de tórax se pueden salvar más vidas, debido a que al hacer uso de la
tecnología los tratamientos según el estadio del paciente se tomaran de manera mas
ágil y precisa, logrando que las salas hospitalarias y centros de cuidados intensivos
trabajen de forma más eficiente, logrando salvar más vidas y administrar los
recursos que escasean al tener un diagnostico más acertado y rápido, esto conlleva a
salvar más vidas y lograr tener mayor cantidad de pacientes recuperados de la
enfermedad, lo cual sería muy favorable para nuestro país.
3.
4.
5. 4. MOTIVACION DE LA PROPUESTA (LOGROS Y METAS) :
 Los trabajos de identificación de imágenes con IA no están enfocados a la

nueva neumonía (producida por el SARS-CoV-2 / Covid-19) que se está
produciendo alrededor de todo el mundo y está causando muchas muertes.
 La mejor tasa de precisión que se han obtenido para los modelos de
predicción empleados llegan alcanzar el 95.3% , lo cual nos proporciona el
trabajo de poder mejorarlo.
 Existe pocos o nulos sistemas de identificación de este tipo usando la
técnica de IA deep Learning.
8
 Se quiere lograr un diagnostico efectivo usando inteligencia artificial para
poder acortar los tiempos y salvar la mayor cantidad de vidas para pacientes
con neumonía severa.
6. 5. OBJETIVOS :
1.1 OBJETIVO GENERAL.

Desarrollar un sistema inteligente para detectar y leer de forma rápida las
radiografías torácicas de pacientes con SARS-CoV-2 / Covid-19 a través de la
técnica de Inteligencia Artificial como es deep learning (aprendizaje profundo).
1.2 OBJETIVO ESPECIFICO.
 Identificar las variables que influyen en verificar los estadios de la

Neumonía a través de imágenes hechas con radiografías torácicas.
 Comparación de los diferentes modelos algoritmos y técnicas que existen

para la lecturas automáticas con Inteligencia Artificial.
 Comparar la técnica deep learning con las demás técnicas usadas para
automatizar la lectura de imágenes con Inteligencia Artificial.
 Implementar el sistema de predicción con Inteligencia Artificial haciendo
uso de deep learning.
7. 6. PROPUESTA :
8.
Se propone un nuevo Sistema de análisis predictivo para diagnostico temprano de
neumonía mediante algoritmos de reconocimiento de imágenes usando deep
learning en el cual se apliquen las técnicas necesarias para poder enfrentar el
problema de diagnosticar de manera rápida y eficiente los altos volúmenes de casos
9
de neumonías severas y de esta forma salvar más vidas con la toma de decisiones
mas ágil y certero por parte del personal médico.
CAPÍTULO 2: ESTADO DEL ARTE
En el presente capitulo se realiza una revisión de la literatura que he encontrado en

una variedad de artículos que hacen una investigación exhaustiva haciendo énfasis
en la solución del problema de realizar lecturas de imágenes con inteligencia
artificial.
En la parte de Metodología, se detallan los pasos de cómo buscar y también se

plantean las respectivas preguntas de investigación. Lo anteriormente señalado se
ha realizado por medio de tres pasos: La planificación, el desarrollo y la obtención
de resultados. Luego en la parte de análisis, se presentan todos los artículos
analizados que se han obtenido como resultado de la parte anterior. Como parte
final, la parte de conclusiones detalla las respuestas a las preguntas formuladas en la
parte primera donde indico los puntos que implican limitaciones del tema en
10
investigación.
1. METODOLOGIA :
Se ha realizado una investigación de artículos relacionados a lectura de imágenes

usando inteligencia artificial, así mismo se ha considerado los pasos usados por
Cabrera & Mauricio (2017) en cuyo artículo se determinan 3 fases:
 Planificación de la revisión: Fase en la cual realizo las respectivas preguntas

de investigación y el protocolo de revisión.
 Desarrollo de la revisión: Para esta segunda fase, los estudios de primer
orden son seleccionados según los criterios establecidos de exclusión e
inclusión.
 Resultado de la revisión: En la última fase, presento estadísticas y análisis
de los estudios que han sido seleccionados.
2. PLANIFICACION :
Para lograr el propósito de esta investigación , se proponen las siguientes preguntas

de investigación en el rubro de la ciencia de la computación aplicada a la parte
medica:
1.-¿Qué disciplinas se usan en la detección temprana de cáncer y en

neumonía?
2.-¿En el proceso de detección temprana de cáncer y neumonía se utilizan

métodos manuales?
3.- ¿Los métodos manuales son susceptibles de ser automatizados?.
4.- ¿Qué área de la tecnología de información nos puede ayudar a la
11
automatización de estos procesos manuales?
5.-¿Puede esta area de la informática realizarlo directamente o necesita alguna

manera especial de trabajar esta solución?
6.-¿La solución al problema ya existe en el mercado mundial ?
7.-¿Los algoritmos son fáciles de implementar?
8.-¿Existe data para poder realizar pruebas de la eficacia de la solución

planteada?
9.-¿La eficacia de estas soluciones que nivel de certeza tienen?\
10.-¿Cuánto se debe invertir para dar una solución a este problema?
Las siguientes base de datos fueron usadas: web sciencies, esta revisión de la
literatura abarco el periodo de búsqueda entre diciembre 2019 y abril del 2020.
El siguiente prototipo de búsqueda fue utilizado:
TITLE-ABS-KEY (” Artificial intelligence and lung cancer ”)
TITLE-ABS-KEY (” Artificial intelligence and pneumonia ”)
Los cuales aplican para el titulo, el resumen y las palabras clave. Despues se
aplicaron los criterios de selección y exclusión de la tabla nro 1
Tabla 1
Criterios de selección Criterios de exclusión

Idioma: inglés y español Idioma: Otro que no sea inglés , ni
español
Rango de antigüedad: 2019 a 2020 Rango de antigüedad: 2019 hacia atrás.
La revista tiene factor de impacto? La revista tiene factor de impacto? (SJR)
(SJR) =SI =NO
Tipo de publicación: publicación Tipo de publicación: publicación no
académica académica
12
Presenta información pertinente. No presenta información pertinente.
Fuente: elaboración propia
3. DESARROLLO:
Los estudios primarios que he identificado en el proceso de búsqueda en el banco
mencionado es sometido a un proceso de selección el cual es dado a conocer en la
tabla 1 donde se detallan los criterios inclusión y exclusión.
Se determino los papers más relevantes con respecto a estudios de inteligencia

artificial y al cáncer de pulmón debido a que las técnicas usadas para la detección
de imágenes con inteligencia artificial son muy parecidas a las usadas para detectar
la neumonía. En la siguiente tabla se presentan los 10 artículos seleccionados según
los criterios utilizados.
Tabla 2 .- Articulos seleccionados con criterios de selección.
Nro Autores Titulo Año

1 Schaffter,Thomas,Buist, Diana S. M. , Evaluation of Combined Artificial Intelligence and2020
Lee , Christoph Radiologist Assessment to Interpret
Screening Mammograms
2 Acs, B (Acs, B.) ; Rantalainen, M Artificial intelligence as the next step towards 2020
(Rantalainen, M.) ; Hartman, precision pathology
J(Hartman,J.)
3 Madekivi, V Can machine learning model improve the
(Madekivi, 2020
V.);Bostrom,P (Bostrom, P.); prediction of nodal stage after a positive
Karlsson, A(Karlsson sentinel lymph node biopsy in breast cancer ?
A.);Aaltonen,R
(Aaltonen,R.);Salminen, E
4 Alabi, RO (Alabi, Rasheed Comparison of supervised machine learning 2020
Omobolaji.); Elmusrati, M classification techniques in prediction of
(Elmusrati, Mohammed.) ; locoregional recurrences in early oral tongue
Sawasaki-Calone, I (Sawasaki) cancer
5 The path to implementation of artificial intelligence
Mello-Thoms, C (Mello-Thoms, 2020
Claudia) in screening mammography is not all that
clear
6 Eliminating biasing signals in lung cancer images2019
Van Amsterdam, WAC (Van
Amsterdam, W.A.C.), for prognosis predictions with deep learning
Verhoeff,JJC(Verhoeff, J.J.C.), de
Jong, PA(de Jong, P.A.), Leiner,
T(Leiner T.)
7 Alana Ebigbo, Robert Mendel,AndreasReal-time use of artificial intelligence in the 2020
Probst,Johannes evaluation of cancer in Barrett’s oesophagus
Manzeneder,friederike Prinz, Luis
13
A de Souza Jr,Joao Papa,
Christoph Palm, Helmut Messman
8 Shimizu, H (Shimizu, Artificial intelligence in oncology 2020
Hideyuki.),Nakayama Kl
9 Hamed Behzadi-khormouji, Habib Deep learning, reusable and problem-based 2020
Rostami, Sana Salehi, Touba architectures for detection of consolidation on
chest X-ray images
10 Coccia, M (Coccia, Mario) Deep learning technology for improving cancer 2020
care in society: New directions in cancer
imaging driven by artificial intelligence
Fuente: Elaboracion propia
4. RESULTADOS:
Tendencias de las publicaciones.
El resultado de la búsqueda de publicaciones en web sciencies dio 110 estudios de

los cuales 10 se seleccionaron de acuerdo con los criterios de la tabla 1 de selección
y exclusión, en este caso fueron sobre inteligencia artificial y el cáncer y cáncer de
pulmón y neumonía debido a que la técnica que usan para la solución de IA es la
que se necesita para el caso de neumonía. Todos son del año 2020 a excepción de
solo una que es del año 2019.
5. ANALISIS:
Los estudios realizados se han basado en los siguientes temas de investigación:
P1.-¿Qué disciplinas se usan en la detección temprana de cáncer y en

neumonía?
Según los autores la detección temprana de cáncer de pulmon se puede detectar

haciendo uso de la informática la cual engobla la inteligencia artificial y creando
algoritmos de aprendizaje profundo
14
PAPER 02
Titulo: Artificial intelligence as the next step towards precision pathology
Autor: Acs, B (Acs, B.) ; Rantalainen, M (Rantalainen, M.) ; Hartman,

J(Hartman,J.)
Motivación del autor.
Uno de los primeros objetivos de este estudio es crear el uso de algoritmos de

inteligencia artificial (aprendizaje profundo) y los realizados por expertos en
detección de cáncer de pulmon, de esta manera lograr una mayor eficiencia en la
detección rapida con IA.
Aporte relacionado con la pregunta
La patología es la piedra angular de la atención del cáncer. La necesidad de

precisión en el diagnóstico histopatológico del cáncer está aumentando a medida
que la terapia personalizada contra el cáncer requiere una evaluación precisa de
biomarcadores. La apariencia del análisis de imágenes digitales promete mejorar
tanto el volumen como la precisión de la evaluación histomorfológica.
Recientemente, el aprendizaje automático, y particularmente el aprendizaje
profundo, ha permitido avances rápidos en patología computacional.
Principal resultado:
15
 La integración del aprendizaje automático en la atención de rutina será un
hito para el sector de la salud en la próxima década, y la histopatología
está en el centro de esta revolución.
 Los ejemplos de posibles aplicaciones de aprendizaje automático de alto

valor incluyen la evaluación basada en modelos de las características de
diagnóstico de rutina en patología y la capacidad de extraer e identificar
características novedosas que proporcionan información sobre una
enfermedad.
 Resultados innovadores recientes han demostrado que las aplicaciones de
los métodos de aprendizaje automático en patología mejoran
significativamente la detección de metástasis en los ganglios linfáticos.
 La puntuación Ki67 en el cáncer de mama, la clasificación de Gleason en el
cáncer de próstata y la puntuación de linfocitos infiltrantes de tumores (TIL)
en el melanoma.
 También se ha demostrado que los modelos de aprendizaje profundo
pueden predecir el estado de algunos marcadores moleculares en el
cáncer de pulmón, próstata, gástrico y colorrectal en base a las diapositivas
estándar de HE.
 Se han demostrado modelos de redes neuronales profundas (resultados de
supervivencia) basados en diapositivas digitalizadas de HE en varias
enfermedades, incluyendo cáncer de pulmón, melanoma y glioma. En esta
revisión, nuestro objetivo es presentar y resumir los últimos desarrollos en
el análisis de imágenes digitales y en la aplicación de la inteligencia
artificial en la patología diagnóstica.
P2.-¿En el proceso de detección temprana de cáncer y neumonía se utilizan

métodos manuales?
Según los autores la detección temprana de cáncer de pulmón se puede detectar

haciendo uso de procedimientos manuales como es la lectura de mamografías y
16
radiografías de los pulmones, procedimientos que se desean automatizar.
PAPER 01
Titulo: Evaluation of Combined Artificial Intelligence and Radiologist Assessment

to Interpret Screening Mammograms
Autor: Schaffter,Thomas,Buist, Diana S. M. , Lee , Christoph
Uno de los primeros objetivos de este estudio es crear una comparación del uso
de algoritmos de inteligencia artificial y los realizados por expertos en
mamografías de esta manera lograr una mayor eficiencia en la detección correcta
del cáncer de mama con IA.
Este estudio de precisión diagnóstica evalúa si la inteligencia artificial puede

superar los límites de interpretación de la mamografía humana con una
evaluación rigurosa e imparcial de los algoritmos de aprendizaje de máquinas.
 La combinación de algoritmos de alto rendimiento y evaluaciones de
radiólogos de EE. UU. Resultó en un área más alta bajo la curva de 0.942 y
17
logró una especificidad significativamente mejorada (92.0%) con la misma
sensibilidad.
 Conclusiones y relevancia Si bien ningún algoritmo de inteligencia artificial
superó a los radiólogos, un conjunto de algoritmos de inteligencia artificial
combinados con la evaluación del radiólogo en un entorno de pantalla de
un solo lector mejoró la precisión general.
 Este estudio subraya el potencial del uso de métodos de aprendizaje
automático para mejorar la interpretación de la detección de mamografía
( método manual).
P3.- ¿Los métodos manuales son susceptibles de ser automatizados?.
Según los autores la detección temprana se pueden detectar haciendo uso de

procedimientos manuales como es la lectura de mamografías y radiografías de los
pulmones y estos si son susceptibles de ser automatizados por técnicas de
inteligencia artificial.
PAPER 03
Titulo: Can machine learning model improve the prediction of nodal stage after a
18
positive sentinel lymph node biopsy in breast cancer ?
Autor: Madekivi, V (Madekivi, V.) ; Bostrom, P (Bostrom, P.) ; Karlsson, A

(Karlsson A.);Aaltonen, R (Aaltonen, R.); Salminen, E (Salminen, E.)
La problemática en la cual se enfocan los autores es crear un nuevo modelo para

predecir la etapa nodal N2-3 después de un SLNB (La biopsia de ganglio linfático
centinela) positivo utilizando métodos de aprendizaje automático que rara vez se
ven en el desarrollo de nomogramas.
Este estudio de precisión diagnóstica evalúa si la inteligencia artificial puede

superar los límites de interpretación del diagnóstico del cáncer de mama con una
evaluación rigurosa e imparcial de los algoritmos en el modelado XGBoots
 La mejor combinación de variables asociadas con el estadio nodal N2-3 en

el modelado XGBoost incluyó el tamaño del tumor, el tipo histológico, la
multi focalidad, la invasión linfovascular, el porcentaje de células positivas
para ER, el número de ganglios linfáticos centinelas positivos (SLN) y el
número de SLN positivos multiplicados por tamaño tumoral. Indicando
discriminación.
19
 Los valores de AUC para el corte de entrenamiento y el corte de validación
fueron 0.80 (IC 95% 0.71-0.89) y 0.80 (IC 95% 0.65-0.92) en el modelo
XGBoost y 0.85 (IC 95% 0.77-0.93) y 0.75 ( IC del 95%: 0,58 a 0,89) en el
modelo de regresión logística, respectivamente.
Tabla 3
Corte de entrenamiento Corte de validación
( IC 95% 0.71 - 0.89 ) ( IC 95% 0.65 - 0.92 )
Modelo XGBoost 0.80 0.80
( IC 95% 0.77 – 0.93 ) ( IC 95% 0.58 – 0.89 )
Modelo Regresión 0.85 0.75
logística
P4.- ¿Qué área de la tecnología de información nos puede ayudar a la

automatización de estos procesos manuales?
Según los autores el área de tecnología de la información es la inteligencia

artificial, en el caso de los autores hacen de uso de machine learning para poder
automatizar estos procesos manuales.
PAPER 04
Titulo: Comparison of supervised machine learning classification techniques in

prediction of locoregional recurrences in early oral tongue cancer
Autor: Alabi, RO (Alabi, Rasheed Omobolaji.) ; Elmusrati, M (Elmusrati,

Mohammed.) ; Sawasaki-Calone, I (Sawasaki-Calone, Iris.);Kolwaski, LP
(Kolwaski, Luiz Paulo.); Haglund, C ( Haglund, Caj.)
20
La problemática en la cual se enfocan los autores es estratificar los pacientes con
OTSCC usando algoritmos de Machine Learning de Inteligencia Artificial para
ayudar en la planificación de su tratamiento individual.
La estimación adecuada del riesgo de recurrencias en el carcinoma de células

escamosas de la lengua oral en etapa temprana (OTSCC) es obligatoria para la
toma de decisiones de tratamiento individual. Sin embargo, esto sigue siendo un
desafío incluso para centros multidisciplinarios experimentados.
 comparamos el rendimiento del algoritmo que mostró la mayor precisión de

predicción con la importancia pronóstica de la profundidad de la invasión
(DOI).
 Los resultados mostraron que la especificidad promedio de todos los

algoritmos fue del 71%. El SVM mostró una precisión del 68% y una
puntuación F1 de 0,63, NB una precisión del 70% y una puntuación F1 de
0,64, BDT una precisión del 81% y F1 puntaje de 0.78, y DF una precisión
de 78% y puntaje F1 de 0.70.
 Además, estos algoritmos superaron el enfoque basado en DOI, que dio

una precisión del 63%. Con el análisis PFI, no hubo diferencias
significativas en las precisiones generales de tres de los algoritmos; La
precisión de PFI-BDT aumentó a 83.1%, PFI-DF aumentó a 80%, PFI-SVM
disminuyó a 64.4%, mientras que la precisión de PFI-NB aumentó
significativamente a 81.4%, respectivamente.
Tabla 4
Algoritmo Precisión Puntuación F1

SVM- Support Vector 68% 0.63
machine
NB - Naive Bayes 70% 0.64
BDT - Boosted 81% 0.78
21
Decision Tree
DF - Decision Forest 78% 0.70
P5.-¿Puede esta area de la informática realizarlo directamente o necesita

alguna manera especial de trabajar esta solución?
Según la autora pone en duda que solo una area sea suficiente para lograr
automatizar los procesos de lectura de radiografias torácicas haciendo énfasis en
que se necesita el trabajo interdisciplinario para lograr el objetivo, el cual es
automatizar con Inteligencia artificial lo que los radiólogos realizan.
PAPER 05
Titulo: The path to implementation of artificial intelligence in screening

mammography is not all that clear.
Autor: Mello-Thoms, C (Mello-Thoms, Claudia)
La motivación de la autora es verificar si realmente la inteligencia artificial es una

buena herramienta para la detección de cáncer de mama.
.
El cáncer de mama es el cáncer no relacionado con la piel más común entre las
mujeres y la principal causa de muertes relacionadas con el cáncer entre las
mujeres en todo el mundo. Si bien se ha demostrado que el examen de
mamografía reduce la morbilidad y mortalidad por cáncer de mama, la limitación

intrínseca de una mamografía, es decir, que es una proyección bidimensional de
una estructura tridimensional, aumenta la complejidad de la tarea de detección del
cáncer. En los Estados Unidos, un solo radiólogo interpreta mamografías de
detección para llevar a cabo esta tarea, mientras que la mayoría de Europa y
partes de Asia utilizan 2 radiólogos (lectura doble). En el escenario de lectura de
radiólogo único, las tasas de falsos negativos oscilan entre el 10% y el 30% 1, y
las tasas de falsos positivos son tales que el 49% de las mujeres examinadas
22
anualmente durante 10 años experimentarán al menos 1 resultado de mamografía
falso positivo.2 Claramente, esta es una tarea que puede beneficiarse de la
inteligencia artificial (IA), y de hecho, las aplicaciones de IA en el cáncer de mama
componen el 12% del total de las aplicaciones de IA en radiología.3 En particular,
las aplicaciones de aprendizaje profundo en mamografías digitales están en
aumento.
 Hay una razón por la cual estas limitaciones son importantes,

principalmente porque este ha sido el mayor esfuerzo hasta la fecha, que
yo sepa, para desarrollar IA que pueda ayudar a los radiólogos en la
lectura de mamografías de detección.
 En su mayor parte, demostró que la IA aún no está allí. Además, debido a
que muchos exigen una revisión total de la radiología debido a la IA,
estudios como este sugieren fuertemente que los radiólogos serán dueños
de su dominio durante bastante tiempo, ya que la tarea de interpretación de
imágenes es significativamente más compleja de lo que los radiólogos
obtienen crédito.
 Sin embargo, es necesario no perder de vista el hecho de que los

resultados presentados por Schaffter y sus colegas son temporales. No
muestran que la IA nunca sea útil para la mamografía de detección;
simplemente muestran que hoy, incluso con una increíble cantidad de
recursos, podría decirse que los mejores equipos de inteligencia artificial
del mundo no pudieron conocer ni vencer a los radiólogos.
P6.-¿La solución al problema ya existe en el mercado mundial ?
PAPER 06
Titulo: Eliminating biasing signals in lung cancer images for prognosis predictions
with deep learning.
23
Autor: Van Amsterdam, WAC (Van Amsterdam, W.A.C.), Verhoeff,JJC(Verhoeff,
J.J.C.), de Jong, PA(de Jong, P.A.), Leiner, T(Leiner T.)
La motivación de los autores es que el aprendizaje profundo tiene muchas

aplicaciones posibles en el cuidado de la salud, especialmente para tareas
que incluyen datos no estructurados, como imágenes médicas. Las redes
neuronales convolucionales (CNN) son modelos de aprendizaje profundo
que han demostrado un rendimiento notable en muchas tareas, incluidas
las imágenes. Estos modelos son atractivos para las tareas de predicción
en imágenes médicas, ya que las CNN se pueden optimizar de extremo a
extremo de la imagen al resultado.
.
Para apreciar las contribuciones de este estudio al campo,

La conexión entre imágenes y un DAG no siempre es fácil de ver.
Fundamentalmente, los resultados del paciente son impulsados por
procesos biológicos, y las imágenes pueden contener vistas (más o menos
ruidosas) de estos procesos. Por ejemplo, un tumor pulmonar
particularmente agresivo puede crecer mucho, como se puede ver en las
tomografías computarizadas, y este comportamiento biológico conduce a
una peor supervivencia general. Estos procesos biológicos pueden verse
como causas subyacentes de factores de variación o patrones en la
imagen en el lenguaje de los modelos causales estructurales. Por el
contrario, la información derivada de imágenes médicas a menudo se usa
para tomar decisiones de tratamiento.
24
 Describimos un escenario clínico ficticio pero realista donde se
cumplen las siguientes condiciones: (1) Existe una necesidad clínica
de predicción de resultados. (2) Este resultado depende en parte del
tratamiento, y se requiere una estimación imparcial del efecto del
tratamiento. (3) Se supone que el DAG que describe el proceso de
generación de datos es conocido. (4) Se supone que una imagen
contiene información importante para la tarea en (1).
 Sin embargo, uno de los factores de variación en la imagen
representa un colisionador en el DAG. El acondicionamiento de este
colisionador conducirá a una estimación sesgada de (2). (5) El
colisionador se puede medir a partir de la imagen. (6) El aprendizaje
profundo se utiliza para predecir de manera óptima (1).
 Hacemos hincapié en que esto plantea un problema conflictivo:
'simplemente' usar el aprendizaje profundo para predecir el
resultado basado en la imagen puede conducir a un bajo error de
predicción del resultado en los datos observados, pero conducirá a
un sesgo en el efecto estimado del tratamiento , ya que condiciona
un colisionador.
.
 No importa cuán precisas sean las predicciones resultantes en los
datos observados, tales modelos no pueden predecir con precisión
en el entorno en el que intervenimos en el tratamiento. Esto anula
efectivamente la utilidad clínica del modelo para seleccionar el mejor
tratamiento para nuevos pacientes.
 El modelo solo "funciona" cuando los tratamientos se asignan como
siempre se hizo sin el modelo. Por otro lado, ignorar la imagen todos
juntos conducirá a un peor error de predicción ya que la imagen
contiene información pronóstica importante.
 Nuestra contribución es que demostramos que al utilizar un

esquema de predicción de tareas múltiples para el resultado y el
colisionador, acompañado de un término de pérdida adicional para
inducir una forma de independencia lineal entre las activaciones de
la capa final, podemos satisfacer a ambos (1) los supervisados tarea
de predicción y (2) lograr una estimación imparcial del efecto del
tratamiento. Para mayor claridad en la notación, reservaremos el
término error de predicción para el rendimiento en la tarea de
predicción supervisada (por ejemplo, precisión del tiempo de
supervivencia previsto).
 Con sesgo nos referiremos a la diferencia entre la expectativa del

efecto estimado del tratamiento y el mecanismo de generación de
datos.
25
P7.-¿Los algoritmos son fáciles de implementar?
Según los autores la detección temprana de cáncer se puede detectar con

algoritmos de aprendizaje profundo, los cuales no son fáciles de
implementar debido a que para dar la solución se tienen formar equipos
interdisciplinarios, lo hace más complejo el uso y puesta en producción del
sistema, además del consumo de recursos en maquina que implica este
procedimiento automatico.
PAPER 07
Titulo: Real-time use of artificial intelligence in the evaluation of cancer in

Barrett’s oesophagus
Autor: Alana Ebigbo, Robert Mendel,Andreas Probst,Johannes

Manzeneder,friederike Prinz, Luis A de Souza Jr,Joao Papa, Christoph
Palm, Helmut Messmann.
Los autores utilizan imágenes visibles de cáncer de esófago de Barrett (BE),

donde desarrollaron un sistema de inteligencia artificial (IA) de aprendizaje
profundo en tiempo real. Mientras que un endoscopista experto realiza la
evaluación endoscópica de BE, su sistema de IA captura imágenes aleatorias de
la transmisión en vivo de la cámara en tiempo real y proporciona una predicción
global (clasificación), así como una predicción densa (segmentación) que
diferencia con precisión entre BE normal y esófago temprano adenocarcinoma
(EAC). El sistema de IA mostró una precisión del 89,9% en 14 casos con BE
neoplásico.
26
Los autores muestran la distribución espacial codificada por colores de las

probabilidades de cáncer .1 2 Todavía basado en redes neuronales
convolucionales profundas (CNN) y una arquitectura de red residual (ResNet) con
DeepLab V.3 +, se adaptó una red de codificador-decodificador de vanguardia.3
Para transferir la transmisión en vivo endoscópica a nuestro sistema de IA, una
tarjeta de captura (Avermedia, Taiwán) se conectó al monitor endoscópico.
 En nuestro presente estudio, el sistema de IA fue entrenado utilizando un

total de 129 imágenes endoscópicas de nuestra base de datos de
imágenes en el Hospital Universitario de Augsburgo.
 Para validar el sistema en tiempo real, el sistema de IA evaluó imágenes

adicionales (36 de EAC temprana y 26 de BE normal) de 14 pacientes (4
mujeres y 10 hombres) simultáneamente con el examen endoscópico por
un endoscopista experto en BE.
 Todas las imágenes se validaron mediante examen patológico de muestras

de resección (EAC), así como biopsias con fórceps (BE normal).
 El sistema de IA tuvo excelentes puntajes de rendimiento en la tarea de

clasificación con una sensibilidad y especificidad de 83.7% y 100.0%,
respectivamente, y una precisión general de 89.9%.
P8.-¿Existe data para poder realizar pruebas de la eficacia de la solución

planteada?
Según los autores si existe data, ellos lo demuestran con un ejemplo de cómo trabaja
el deep learning para leer las características más importantes de las imágenes .
27
PAPER 08
Titulo: Artificial intelligence in oncology
Autor: Shimizu, H (Shimizu, Hideyuki.), Nakayama Kl ( Nakayama,Keiichi

l.).
La inteligencia artificial (IA) ha contribuido sustancialmente a la resolución de una

variedad de problemas biomédicos, incluido el cáncer, en la última década. El
aprendizaje profundo, un subcampo de IA que es altamente flexible y admite la
extracción automática de características, se aplica cada vez más en diversas
áreas de la investigación básica y clínica del cáncer.
En esto en la revisión, describe numerosos ejemplos recientes de la aplicación de

IA en oncología, incluidos los casos en los que el aprendizaje profundo ha
resuelto eficientemente problemas que anteriormente se consideraban insolubles,
y abordamos los obstáculos que deben superarse antes de que dicha aplicación
pueda generalizarse. También destacamos recursos y conjuntos de datos que
pueden ayudar a aprovechar el poder de la IA para la investigación del cáncer. El
desarrollo de enfoques innovadores y aplicaciones de IA dará importantes
conocimientos en oncología en la próxima década.
El enfoque de aprendizaje profundo evolucionó a partir del estudio de las

neuronas artificiales, siendo propuesto por primera vez en 1943 como
modelo para el procesamiento de información por neuronas en el cerebro
biológico. En una red neuronal, la entrada se proporciona a una capa de
entrada, que transfiere su cálculo valor a una o más capas ocultas que
están vinculadas a una capa de salida.
28
Una capa consta de un conjunto de nodos, conocidos como "unidades" o
"características", que están conectados a través de los bordes a las capas
anteriores y siguientes. Cada unidad transforma los datos de manera no
lineal aplicando una función de activación (Figura 2A). Una red neuronal
profunda posee múltiples (a veces> 100) capas ocultas (Figura 2B). El
proceso de entrenamiento permite capas más profundas en la red para
combinar características de alto nivel que provienen de la capa anterior y
crean más características de este tipo. Como resultado, estos algoritmos
pueden diseñar características automáticamente que son apropiados para
resolver la tarea en cuestión.
Existen muchas arquitecturas de redes neuronales profundas. Una red
neuronal convolucional (CNN) se puede aplicar a datos que tienen
una topología de cuadrícula, como imágenes, y utiliza múltiples filtros para
detectar patrones dentro de los datos (Figura 2C). Una red completamente
convolucional (FCN) difiere de una CNN en que las capas completamente
conectadas de la CNN son reemplazados por capas de muestreo
ascendente y de desconvolución, que se consideran inversas de las capas
de agrupación y convolución, respectivamente (Figura 2D).
Un FCN genera un mapa de puntaje para cada clase de un puntaje de

probabilidad.17 q Este mapa tiene el mismo tamaño preciso que el
ingresa la imagen y clasifica la imagen por píxeles. Estas nuevas capas se
han utilizado para desarrollar algoritmos de aprendizaje profundo en
muchas aplicaciones. Finalmente, una red neuronal recurrente (RNN) es útil
para Análisis de datos secuenciales, como el lenguaje y las secuencias
genómicas.
(Figura 2E). Estas redes neuronales corresponden a métodos de
aprendizaje supervisados, que requieren respuestas para capacitar a la red.
Por el contrario, no se necesitan etiquetas para el aprendizaje no
supervisado. Un autoencoder es un ejemplo representativo de tal no
supervisado método que intenta proporcionar señales de salida idénticas
a la entrada original (Figura 2F). Una red generativa de confrontación
(GAN) en realidad consiste en dos redes: un generador y un discriminador.
La red neuronal del generador crea datos falsos para engañar a la red
discriminadora, mientras que la discriminadora distingue datos falsos de
datos verdaderos. Entrenar estas redes alternativamente permite al
generador para finalmente aprender cómo generar datos falsos
indistinguibles de datos reales (Figura 2G).
29
Aunque no profundizamos en los detalles aquí, varias arquitecturas
novedosas, como la convolución gráfica 18,19 y capsuleNet, se proponen y
aplican continuamente en biomedicina. Dado que cada tipo de red neuronal
está especializada en su estructura de datos específica, la combinación de
múltiples marcos existentes o el desarrollo de nuevas arquitecturas se
espera que mejore en gran medida la viabilidad de utilizando redes
neuronales para la interpretación de fenómenos complejos.
Figura 2
30
 Con la disminución del costo de la secuenciación del genoma, Sin

embargo, es necesario aclarar la asociación de cada una de estas
mutaciones con los fenotipos clínicos, que es actualmente un cuello de
botella para la medicina genómica.
31
 La interpretación clínica de las variantes genéticas depende principalmente
de la información en el ámbito científico y literatura médica. En otras
palabras, los investigadores necesitan encontrar la literatura relevante para
vincular las mutaciones genómicas identificadas con información sobre
estados de enfermedad, fármacos efectivos y pronóstico.
 Con más de 200,000 nuevos artículos relacionados con el cáncer que se

publicarán en 2019 solo, los recursos humanos no son suficientes para la
curación manual. Un ejemplo de una base de datos que resume la relación
entre variación genómica y enfermedad es la base de datos COSMIC
proporcionada por el Sanger Center. COSMIC versión 90, lanzada en
septiembre de 2019, extraída de 9 733 455 mutaciones en regiones de
codificación de genes de 26829 artículos. El uso de IA, por lo tanto, será
cada vez más indispensable.
 Antes de la aplicación de AI a los datos genómicos, la secuencia se

transforma en una tabla binaria (codificación en caliente) que muestra la
presencia o ausencia de cada una de las cuatro bases en cada posición.
Varios.
 Los filtros se aplican unidimensionalmente para la convolución de la tabla

(Figura 3A). Hay dos razones principales por las cuales el aprendizaje
profundo es útil en la genómica del cáncer. Primero, además del
aprendizaje de una sola tarea, permite el aprendizaje multitarea, en el que
la IA aprende múltiples diferentes tareas simultáneamente al compartir
partes de un modelo (Figura 3B). Pérdidas definidas por el usuario
(diferencias en los valores predichos y reales para cada tarea) se
minimizan durante el proceso de capacitación por un apropiado algoritmo
optimizador. Segundo, permite el aprendizaje multimodal, un método para
la integración de diferentes tipos de datos (como secuencia y accesibilidad
de cromatina) y su entrada como entradas. En este proceso, AI aprende
automáticamente cómo combinar estos diferentes tipos de datos.
 Dado que el cáncer es una enfermedad compleja, es preferible integrar

datos multicapa. La aplicación de IA al análisis de una gran cantidad de
datos "ómicas" (exoma, transcriptoma y epigenoma), así como datos sobre
la susceptibilidad de los pacientes con leucemia mieloide aguda a
medicamentos contra el cáncer dieron como resultado la identificación de
la susceptibilidad a los medicamentos genes. Watson for Genomics
también analizó 323 pacientes para identificar alteraciones genómicas con
32
posibles efectos clínicos que no fueron reconocidos por el panel de
tumores moleculares convencionales.
FIGURA 3
P9.-¿La eficacia de estas soluciones que nivel de certeza tienen?\
Según los autores la detección de deep lerning tiene un nivel de certeza de 95.4 %
33
PAPER 09
Titulo: Deep learning, reusable and problem-based architectures for detection of

consolidation on chest X-ray images.
Autor: Hamed Behzadi-khormouji, Habib Rostami, Sana Salehi, Touba

Derakhshande-Rishehri, Marzieh Masoumi, Siavash Salemi, Ahmad Keshavarz,
Ali Gholamrezanezhad, Majid Assadi y Ali Batouli
La motivacion de los autores es que la mayoría de los pacientes que presentan

síntomas respiratorios, los hallazgos de la radiografía de tórax juegan un papel
clave en el diagnóstico, el tratamiento y el seguimiento de la enfermedad. La
consolidación es un término común en radiología, que indica un aumento focal de
la densidad pulmonar. Cuando las estructuras alveolares se llenan de pus, líquido,
células sanguíneas o proteínas después de un proceso patológico pulmonar,
puede dar lugar a diferentes tipos de opacidad pulmonar en la radiografía de
tórax. Este estudio tiene como objetivo detectar consolidaciones en radiografías
de rayos X de tórax, con cierta precisión, utilizando inteligencia artificial y
especialmente redes neuronales convolucionales profundas para ayudar al
radiólogo a un mejor diagnóstico.
34
El autor proporciona un método para la detección de imágenes de rayos x de
tórax mediante el uso de inteligencia artificial usando de manera intensiva el
aprendizaje profundo lo brinda un nivel de certeza optimo debido a que los
algoritmos de inteligencia artificial usan conceptos de redes neuronales y a su vez
matemáticas con uso intensivo de métodos de probabilidades estadísticos que
hacen que su aproximación a la realidad sea la más cercana posible.
Para hacer frente a cada uno de los problemas anteriores, se realizan los
siguientes tres pasos de pre-procesamiento en el conjunto de datos de rayos X de
tórax pediátrico.
A.- Eliminar las variables de confusión
De acuerdo con la Fig. 4 A, cada imagen fue recortada por una ventana
predefinida para eliminar variables de confusión tales como cadenas en ambos
lados de las imágenes (el primer problema).
Figura 4
35
Coincidencia de histograma
A.1.- Primer paso
Es notable que todas las imágenes de rayos X del tórax son en escala de grises
(imágenes de 1 canal). Además, el conocido DCNN se entrenó previamente con
imágenes coloridas (imágenes de 3 canales), por lo que para usarlas y ajustarlas,
solo aceptan imágenes de 3 canales como su entrada. Por otro lado, las
imágenes etiquetadas como neumonía se consolidan con diferentes diversidades.
Como resultado, los expertos en radiología seleccionaron tres imágenes (una
normal y dos casos de neumonía (como consolidación)) como imágenes de
36
referencia, R 1, R 2 y R 3 (Fig. 1). El algoritmo de transformación de coincidencia
de histograma puede afectar la textura de las imágenes 303132. Para mantener la
textura de consolidación, seleccionamos dos imágenes capturadas de alta calidad
con consolidación. Además, para mantener los otros componentes, como el
corazón, las costillas y la columna vertebral, seleccionamos una imagen normal
de alta calidad como la tercera imagen de referencia del algoritmo de coincidencia
de histograma. Estas imágenes tienen una distribución de histograma diferente.
Para tener imágenes con una distribución de histograma similar, hacemos
coincidir el histograma de todas las imágenes con un histograma de las imágenes
de referencia utilizando el algoritmo de transformación de coincidencia de
histograma [33]. De acuerdo con este algoritmo, el mapeo de ecualización del
histograma de la imagen de entrada X es el siguiente:
FIGURA 5
Donde h x y H x son histograma y función acumulativa de probabilidad de la

imagen de entrada X. El índice j (j = = 0, 1 ... L −1) muestra el índice del nivel de
gris y L es el número de niveles de gris.
Además, para cada imagen de referencia R 1, R 2 y R 3, las funciones de mapeo
de ecualización de histograma se calculan de la siguiente manera:
FIGURA 6
donde hzr y Hzr (r = 1, 2, 3) muestran el histograma y la función acumulativa de

probabilidad de la rth imagen de referencia, respectivamente.
37
Para la asignación de cada nivel de gris i de la imagen de entrada X al nivel de
gris k de cada imagen de referencia, se calcula una tabla de búsqueda de la
siguiente manera:
FIGURA 7
donde x r [i] indica el i-ésimo nivel de gris de la imagen x r (resultado de la

coincidencia de la imagen de entrada X y la imagen de referencia R r) y R r [k]
muestra el késimo nivel de gris de la imagen de referencia R r.
B.2.- Segundo paso
La salida del paso anterior son tres imágenes de 1 canal con valores de píxeles
en el rango de [0,1] (x 1, x 2, x 3). A continuación, construimos una imagen de
rayos X de tórax en color Y combinando tres imágenes de 1 canal emparejadas
(imágenes de 1 canal consideradas como canales rojo, azul y verde,
respectivamente) de acuerdo con la ecuación. (5) El resultado de este paso se
muestra en la Fig. 1 B (el segundo problema).
38
FIGURA8
B.2.- Tercer paso
El tercer paso es de seguimiento hasta que finalice y nos brinde resultados este
método.
Resultado:
El principal conjunto de datos suplente en este trabajo fue la radiografía de tórax

pediátrica (conjunto de datos públicos del Centro médico para mujeres y niños de
Guangzhou). De acuerdo con la validación de retención de tres partes [39], este
conjunto de datos se organizó aleatoriamente en tres carpetas (capacitación,
validación y prueba) y contenía subcarpetas para cada categoría de imagen
(neumonía / normal). Hubo 6087 imágenes de rayos X (JPEG) divididas en dos
categorías de neumonía (4346 imágenes) y normales (1741 imágenes). Las
imágenes de rayos X de tórax de este conjunto de datos se seleccionaron de
cohortes retrospectivas en pacientes pediátricos de uno a cinco años del Centro
Médico para Mujeres y Niños de Guangzhou, Guangzhou.
Todas las imágenes de rayos X del tórax se realizaron como parte de la atención
clínica de rutina de los pacientes. Para el análisis de las imágenes de rayos X del
tórax, todas las radiografías de tórax se examinaron inicialmente para el control
de calidad, y se eliminaron los escaneos de baja calidad o ilegibles. Luego, dos
médicos expertos calificaron los diagnósticos de las imágenes antes de autorizar
el entrenamiento del sistema de IA. Para evitar errores, el conjunto de evaluación
fue verificado por un tercer experto. En este trabajo, el conjunto de datos de rayos
X de tórax pediátrico se utilizó para entrenar, evaluar y probar los modelos.
Con el fin de investigar los efectos de diferentes conjuntos de datos previos al

entrenamiento en el rendimiento final de nuestros modelos, se utilizaron los
39
conjuntos de datos Chest X-ray14, DDSM e INBreast para entrenar previamente
los modelos.
Este conjunto de datos se incrementó a 122,787 imágenes que se organizaron al
azar para entrenar (60,194 calcificación y 48,878 imágenes en masa) y datos de
validación (6411 calcificación y 7301 imágenes en masa). Este conjunto de datos
solo se usó para el entrenamiento previo de la arquitectura ChestNet.
P10.-¿Cuánto se debe invertir para dar una solución a este problema?
PAPER 10
Titulo: Deep learning technology for improving cancer care in society: New
directions in cancer imaging driven by artificial intelligence.
Autor: Coccia, M (Coccia, Mario)
La motivación del autor radica en el dominio del aprendizaje automático, el

aprendizaje profundo es una familia de métodos computacionales que permiten
que un algoritmo se programe a sí mismo al aprender de un amplio conjunto de
ejemplos que demuestran el comportamiento deseado, eliminando la necesidad
de especificar reglas explícitamente. Esta nueva tecnología, originada en la
informática, está desarrollando nuevos campos de investigación aplicada en
robótica, procesamiento del lenguaje natural, visión por computadora, imágenes
de cáncer, etc. El objetivo de este trabajo es analizar los estudios de tecnología
de aprendizaje profundo para la obtención de imágenes del cáncer que pueden
40
generar un cambio de paradigma tecnológico en oncología clínica para mejorar el
diagnóstico y el tratamiento del cáncer. En particular, este estudio muestra el
potencial de la tecnología de aprendizaje profundo en imágenes de cáncer para
distinguir entre diferentes tipos de cáncer, detectar la difusión de metástasis, etc.
Este estudio se centra en estudios de casos de nuevos algoritmos de aprendizaje
profundo aplicados para la detección de pulmón y seno cáncer que son dos de las
enfermedades más importantes en la sociedad. Estos estudios de caso muestran
resultados interesantes de la tecnología de aprendizaje profundo en oncología
para una posible generalización fructífera.
Cuando se utiliza una red neuronal profunda para predecir un determinado

resultado clínico, hará uso de todos los factores de variación en una imagen que
están estadísticamente asociados con ese resultado. Por lo tanto, predecir un
resultado con aprendizaje profundo basado en una imagen puede verse como
condicionante (vistas ruidosas) de los factores causales subyacentes de los
patrones en estas imágenes. Las imágenes médicas, especialmente las imágenes
de grandes partes del cuerpo, como una tomografía computarizada del tórax en el
caso del cáncer de pulmón, pueden contener muchos factores de variación
diferentes que pueden tener diferentes "roles".
En particular, cuando un factor de variación específico representa un

colisionador , el condicionamiento de la imagen mediante el uso de un modelo de
aprendizaje profundo puede introducir un sesgo en la estimación de los efectos
del tratamiento.
41
 Tecnología de aprendizaje profundo para detectar la tipología del cáncer de
pulmón.
 El cáncer de pulmón es una de las principales enfermedades en varios
países y una de las principales causas de muerte por cáncer, en ambos
sexos, en todo el mundo.
 El cáncer de pulmón está relacionado con varios factores de riesgo en la
sociedad, como el tabaquismo, el tabaquismo pasivo, la contaminación del
aire, etc.
 El cáncer de pulmón puede ser cáncer de pulmón de células pequeñas o
no cáncer de pulmón de células pequeñas.
 La mortalidad por cáncer de pulmón es muy alta y la tasa de supervivencia
a cinco años de los pacientes es de aproximadamente 2 a 10% [29-32].
 La detección del tipo de cáncer de pulmón (p. Ej., Adenocarcinoma,
carcinoma de células escamosas, etc.), de mutaciones (p. Ej., EGFR:
receptor del factor de crecimiento epidérmico; ALK: reordenamientos de
tirosina cinasa del receptor de linfoma anaplásico, etc.) y de secuenciales
mutaciones (T790) es un proceso crítico en el diagnóstico para seleccionar
la terapia más adecuada para el cáncer de pulmón, como: quimioterapias
convencionales (p. ej., cisplatino, carboplatino, etc.) terapias dirigidas,
como gefitinib, erlotinib, etc.Nuevas terapias inmunes, por ejemplo,
nivolumab, atezolizumab [30,31].
 Para decirlo de otra manera, la detección del tipo de cáncer y mutación es

un proceso de diagnóstico crítico para apoyar medicamentos innovadores
en medicina y aplicar opciones de tratamiento apropiadas para diferentes
tipos de cáncer de pulmón, como el adenocarcinoma de pulmón,
carcinomas de células escamosas de pulmón y cáncer de pulmón mutante
específico. La tecnología actual para un diagnóstico preciso y la selección
de opciones de tratamiento se basa en biomarcadores moleculares
aplicados en biopsias pulmonares y / o análisis de sangre.
 Este enfoque puede diagnosticar el tipo, la etapa y la mutación del cáncer
de pulmón. Esta tecnología actual tiene algunos efectos negativos. Por un
lado, los pacientes deben recibir, al comienzo, una intervención quirúrgica
invasiva para realizar biopsias de tejido y esperar un cierto tiempo (más de
un mes) antes de tener un diagnóstico preciso del tipo de cáncer y luego
42
comenzar los tratamientos contra el cáncer adecuados. De hecho, las colas
largas y el largo tiempo de espera para los procesos de diagnóstico del
cáncer son factores críticos que afectan la supervivencia y, cuando es
posible, la curación. Por otro lado, los hospitales tienen un alto costo (por
ejemplo, días de hospitalización) con estos enfoques basados en biopsias
que requieren equipos, materiales y materiales apropiados.
6. CONCLUSIONES:
 La detección temprana de cáncer de pulmón se puede detectar haciendo

uso de la informática la cual engloba la inteligencia artificial, machine
lerning y deep learning, creando algoritmos de aprendizaje profundo
 La detección temprana de cáncer de pulmón se puede detectar haciendo

uso de procedimientos manuales como es la lectura de mamografías y
radiografías de los pulmones, procedimientos que se desean automatizar.
 Los procedimientos manuales como es la lectura de mamografías y

radiografías de los pulmones si son susceptibles de ser automatizados por
técnicas de inteligencia artificial.
 El área de tecnología de la información es la inteligencia artificial, en el

caso de los autores hacen de uso de machine learning para poder
automatizar estos procesos manuales.
 Se pone en duda que solo una área sea suficiente para lograr automatizar
los procesos de lectura de radiografías torácicas haciendo énfasis en que
se necesita el trabajo interdisciplinario para lograr el objetivo, el cual es
 La detección temprana de cáncer se puede detectar con algoritmos de

aprendizaje profundo, los cuales no son fáciles de implementar debido a
que para dar la solución se tienen formar equipos interdisciplinarios, lo
hace más complejo el uso y puesta en producción del sistema, además del
43
consumo de recursos en maquina que implica este procedimiento
automático.
 Existiendo data se puede entrenar los algoritmos de deep learning.
 El deep learning es la técnica usada para leer las características mas

importantes de las imagenes .
 Según los autores la detección de deep lerning tiene un nivel de certeza de

95.4 %.
BIBLIOGRAFÍA
● Mitchell, Tom M. (2016) “Machine Learning”. ISBN-13: 978-0070428072 pp.

230-245
● Stuart Russell,Peter Norvig (1995) “Artificial Intelligence a Modern Approach ”

Pearson pp. 120-155
● WINSTON, PATRIC HENRY (2014) “ARTIFICIAL INTELLIGENCE” ISBN

10: 0201518767 / ISBN 13: 9780201518764 pp 15-25
● Ryszard S. Michalski, Carbonell Jaime, R. (2008) “Machine Learning an Artificial

Intelligence approach” ISBN-13: 978-0934613095. pp. 69-74
44
45

Giusephy Valladares Tesis Trabajo Final Version01

Cargado por

Copyright:

Formatos disponibles

Giusephy Valladares Tesis Trabajo Final Version01

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Giusephy Valladares Tesis Trabajo Final Version01

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD PERUANA DE CIENCIAS APLICADAS

PROGRAMA ACADÉMICO DE INGENIERÍA DE SISTEMAS

“Sistema de análisis predictivo para diagnostico temprano de neumonía

mediante algoritmos de reconocimiento de imágenes usando deep learning”

Para optar el título profesional de Ingeniero de Sistemas

Valladares Peña, Giusephy Hugo ( u821174 )

Gutiérrez Monge, Yulisa Paula (código ORCID)

Lima, 03 de mayo del 2020

1. ANTECEDENTES DEL PROBLEMA:.....................................................................................5

1.1. LA NEUMONIA EN EL MUNDO.........................................................................5

CAPÍTULO 2: ESTADO DEL ARTE..................................................................................19

Tabla 1: Criterios de selección y Criterios de exclusión............................................................8

Figura 1: Covip-19 numero de nuevos infectados ....................................................................5

1. 1. ANTECEDENTES DEL PROBLEMA :

1.1 LA NEUMONIA EN EL MUNDO.

Esta enfermedad respiratoria es la primera causa de muerte en el Perú. De acuerdo

1.3 DEFINICION DE NEUMONIA.

Según los antecedentes mencionados anteriormente, el problema de la presente tesis

2. 3. IMPORTANCIA DEL PROBLEMA :

 Los trabajos de identificación de imágenes con IA no están enfocados a la

1.1 OBJETIVO GENERAL.

1.2 OBJETIVO ESPECIFICO.

 Identificar las variables que influyen en verificar los estadios de la

 Comparación de los diferentes modelos algoritmos y técnicas que existen

CAPÍTULO 2: ESTADO DEL ARTE

En el presente capitulo se realiza una revisión de la literatura que he encontrado en

En la parte de Metodología, se detallan los pasos de cómo buscar y también se

Se ha realizado una investigación de artículos relacionados a lectura de imágenes

 Planificación de la revisión: Fase en la cual realizo las respectivas preguntas

Para lograr el propósito de esta investigación , se proponen las siguientes preguntas

1.-¿Qué disciplinas se usan en la detección temprana de cáncer y en

2.-¿En el proceso de detección temprana de cáncer y neumonía se utilizan

3.- ¿Los métodos manuales son susceptibles de ser automatizados?.

4.- ¿Qué área de la tecnología de información nos puede ayudar a la

5.-¿Puede esta area de la informática realizarlo directamente o necesita alguna

6.-¿La solución al problema ya existe en el mercado mundial ?

7.-¿Los algoritmos son fáciles de implementar?

8.-¿Existe data para poder realizar pruebas de la eficacia de la solución

9.-¿La eficacia de estas soluciones que nivel de certeza tienen?\

10.-¿Cuánto se debe invertir para dar una solución a este problema?

El siguiente prototipo de búsqueda fue utilizado:

TITLE-ABS-KEY (” Artificial intelligence and lung cancer ”)

TITLE-ABS-KEY (” Artificial intelligence and pneumonia ”)

Criterios de selección Criterios de exclusión

Fuente: elaboración propia

Se determino los papers más relevantes con respecto a estudios de inteligencia

Tabla 2 .- Articulos seleccionados con criterios de selección.

Nro Autores Titulo Año

Fuente: Elaboracion propia

Tendencias de las publicaciones.

El resultado de la búsqueda de publicaciones en web sciencies dio 110 estudios de

Los estudios realizados se han basado en los siguientes temas de investigación:

P1.-¿Qué disciplinas se usan en la detección temprana de cáncer y en

Según los autores la detección temprana de cáncer de pulmon se puede detectar

Titulo: Artificial intelligence as the next step towards precision pathology

Autor: Acs, B (Acs, B.) ; Rantalainen, M (Rantalainen, M.) ; Hartman,

Motivación del autor.

Uno de los primeros objetivos de este estudio es crear el uso de algoritmos de

Aporte relacionado con la pregunta