Giusephy Valladares Tesis Trabajo Final Version01
Giusephy Valladares Tesis Trabajo Final Version01
Giusephy Valladares Tesis Trabajo Final Version01
FACULTAD DE INGENIERIA
TESIS
AUTOR(ES)
ASESOR
CAPÍTULO 1: INTRODUCCIÓN.........................................................................................5
1. METODOLOGIA.........................................................................................................19
2. PLANIFICACION........................................................................................................21
3. DESARROLLO............................................................................................................21
4. RESULTADOS.............................................................................................................21
5. ANALISIS.....................................................................................................................21
6. CONCLUSIONES:.......................................................................................................45
BIBLIOGRAFÍA....................................................................................................................47
1
ÍNDICE DE TABLAS
2
ÍNDICE DE FIGURAS
3
CAPÍTULO 1: INTRODUCCIÓN
4
1.2 LA NEUMONIA EN EL PERU.
Figura 1
5
.Fuente wikipedia
Es una infección que inflama los sacos de aire de uno o ambos pulmones, los que
pueden llenarse de fluidos. La neumonía puede provocar que los sacos de aire se
llenen de fluido o pus. La infección puede ser mortal para cualquier persona pero
en especial para bebes, niños pequeños y adultos mayores de 65 años. Esta
enfermedad presenta síntomas como tos con flema y pus, fiebre y escalofríos y
dificultad para respirar. Esta enfermad se puede producir por bacterias o por virus
algunos tipos de neumonía pueden tratarse con antibióticos y algunos pueden
prevenirse con vacunas , a excepción del SARS-CoV-2 (Covid-19) que es un nuevo
tipo de coronavirus que tiene síntomas un poco diferentes pero al final ataca los
pulmones produciendo una seria neumonía, esta no tiene cura conocida y tampoco
existe una vacuna a la fecha para proteger a la población.
6
2. PROBLEMA :
7
efectivas para el tratamiento de enfermos de este tipo de neumonías y aplicar
soluciones para la mejora de los pacientes y tiene como limitante el tiempo que se
tiene al tener mayor cantidad de pacientes que crecen de manera exponencial por el
alto grado de contagio que presenta el virus que produce esta neumonía severa.
La importancia del problema radica en que al leer de manera mas rápida las
radiografías de tórax se pueden salvar más vidas, debido a que al hacer uso de la
tecnología los tratamientos según el estadio del paciente se tomaran de manera mas
ágil y precisa, logrando que las salas hospitalarias y centros de cuidados intensivos
trabajen de forma más eficiente, logrando salvar más vidas y administrar los
recursos que escasean al tener un diagnostico más acertado y rápido, esto conlleva a
salvar más vidas y lograr tener mayor cantidad de pacientes recuperados de la
enfermedad, lo cual sería muy favorable para nuestro país.
3.
4.
5. 4. MOTIVACION DE LA PROPUESTA (LOGROS Y METAS) :
8
Se quiere lograr un diagnostico efectivo usando inteligencia artificial para
poder acortar los tiempos y salvar la mayor cantidad de vidas para pacientes
con neumonía severa.
6. 5. OBJETIVOS :
7. 6. PROPUESTA :
8.
Se propone un nuevo Sistema de análisis predictivo para diagnostico temprano de
neumonía mediante algoritmos de reconocimiento de imágenes usando deep
learning en el cual se apliquen las técnicas necesarias para poder enfrentar el
problema de diagnosticar de manera rápida y eficiente los altos volúmenes de casos
9
de neumonías severas y de esta forma salvar más vidas con la toma de decisiones
mas ágil y certero por parte del personal médico.
10
investigación.
1. METODOLOGIA :
2. PLANIFICACION :
11
automatización de estos procesos manuales?
Las siguientes base de datos fueron usadas: web sciencies, esta revisión de la
literatura abarco el periodo de búsqueda entre diciembre 2019 y abril del 2020.
Los cuales aplican para el titulo, el resumen y las palabras clave. Despues se
aplicaron los criterios de selección y exclusión de la tabla nro 1
Tabla 1
12
Presenta información pertinente. No presenta información pertinente.
3. DESARROLLO:
Los estudios primarios que he identificado en el proceso de búsqueda en el banco
mencionado es sometido a un proceso de selección el cual es dado a conocer en la
tabla 1 donde se detallan los criterios inclusión y exclusión.
13
A de Souza Jr,Joao Papa,
Christoph Palm, Helmut Messman
8 Shimizu, H (Shimizu, Artificial intelligence in oncology 2020
Hideyuki.),Nakayama Kl
9 Hamed Behzadi-khormouji, Habib Deep learning, reusable and problem-based 2020
Rostami, Sana Salehi, Touba architectures for detection of consolidation on
chest X-ray images
10 Coccia, M (Coccia, Mario) Deep learning technology for improving cancer 2020
care in society: New directions in cancer
imaging driven by artificial intelligence
4. RESULTADOS:
5. ANALISIS:
14
PAPER 02
Principal resultado:
15
La integración del aprendizaje automático en la atención de rutina será un
hito para el sector de la salud en la próxima década, y la histopatología
está en el centro de esta revolución.
16
radiografías de los pulmones, procedimientos que se desean automatizar.
PAPER 01
Uno de los primeros objetivos de este estudio es crear una comparación del uso
de algoritmos de inteligencia artificial y los realizados por expertos en
mamografías de esta manera lograr una mayor eficiencia en la detección correcta
del cáncer de mama con IA.
Principal resultado:
radiólogos de EE. UU. Resultó en un área más alta bajo la curva de 0.942 y
17
logró una especificidad significativamente mejorada (92.0%) con la misma
sensibilidad.
( método manual).
PAPER 03
Titulo: Can machine learning model improve the prediction of nodal stage after a
18
positive sentinel lymph node biopsy in breast cancer ?
Principal resultado:
19
Los valores de AUC para el corte de entrenamiento y el corte de validación
fueron 0.80 (IC 95% 0.71-0.89) y 0.80 (IC 95% 0.65-0.92) en el modelo
XGBoost y 0.85 (IC 95% 0.77-0.93) y 0.75 ( IC del 95%: 0,58 a 0,89) en el
modelo de regresión logística, respectivamente.
Tabla 3
Corte de entrenamiento Corte de validación
( IC 95% 0.71 - 0.89 ) ( IC 95% 0.65 - 0.92 )
Modelo XGBoost 0.80 0.80
( IC 95% 0.77 – 0.93 ) ( IC 95% 0.58 – 0.89 )
Modelo Regresión 0.85 0.75
logística
PAPER 04
20
La problemática en la cual se enfocan los autores es estratificar los pacientes con
OTSCC usando algoritmos de Machine Learning de Inteligencia Artificial para
ayudar en la planificación de su tratamiento individual.
Tabla 4
21
Decision Tree
DF - Decision Forest 78% 0.70
Según la autora pone en duda que solo una area sea suficiente para lograr
automatizar los procesos de lectura de radiografias torácicas haciendo énfasis en
que se necesita el trabajo interdisciplinario para lograr el objetivo, el cual es
automatizar con Inteligencia artificial lo que los radiólogos realizan.
PAPER 05
El cáncer de mama es el cáncer no relacionado con la piel más común entre las
mujeres y la principal causa de muertes relacionadas con el cáncer entre las
mujeres en todo el mundo. Si bien se ha demostrado que el examen de
22
anualmente durante 10 años experimentarán al menos 1 resultado de mamografía
falso positivo.2 Claramente, esta es una tarea que puede beneficiarse de la
inteligencia artificial (IA), y de hecho, las aplicaciones de IA en el cáncer de mama
componen el 12% del total de las aplicaciones de IA en radiología.3 En particular,
las aplicaciones de aprendizaje profundo en mamografías digitales están en
aumento.
Principal resultado:
Según la autora pone en duda que solo una area sea suficiente para lograr
automatizar los procesos de lectura de radiografias torácicas haciendo énfasis en
que se necesita el trabajo interdisciplinario para lograr el objetivo, el cual es
automatizar con Inteligencia artificial lo que los radiólogos realizan.
PAPER 06
Titulo: Eliminating biasing signals in lung cancer images for prognosis predictions
with deep learning.
23
Autor: Van Amsterdam, WAC (Van Amsterdam, W.A.C.), Verhoeff,JJC(Verhoeff,
J.J.C.), de Jong, PA(de Jong, P.A.), Leiner, T(Leiner T.)
Principal resultado:
24
Describimos un escenario clínico ficticio pero realista donde se
cumplen las siguientes condiciones: (1) Existe una necesidad clínica
de predicción de resultados. (2) Este resultado depende en parte del
tratamiento, y se requiere una estimación imparcial del efecto del
tratamiento. (3) Se supone que el DAG que describe el proceso de
generación de datos es conocido. (4) Se supone que una imagen
contiene información importante para la tarea en (1).
Sin embargo, uno de los factores de variación en la imagen
representa un colisionador en el DAG. El acondicionamiento de este
colisionador conducirá a una estimación sesgada de (2). (5) El
colisionador se puede medir a partir de la imagen. (6) El aprendizaje
profundo se utiliza para predecir de manera óptima (1).
Hacemos hincapié en que esto plantea un problema conflictivo:
'simplemente' usar el aprendizaje profundo para predecir el
resultado basado en la imagen puede conducir a un bajo error de
predicción del resultado en los datos observados, pero conducirá a
un sesgo en el efecto estimado del tratamiento , ya que condiciona
un colisionador.
.
No importa cuán precisas sean las predicciones resultantes en los
datos observados, tales modelos no pueden predecir con precisión
en el entorno en el que intervenimos en el tratamiento. Esto anula
efectivamente la utilidad clínica del modelo para seleccionar el mejor
tratamiento para nuevos pacientes.
El modelo solo "funciona" cuando los tratamientos se asignan como
siempre se hizo sin el modelo. Por otro lado, ignorar la imagen todos
juntos conducirá a un peor error de predicción ya que la imagen
contiene información pronóstica importante.
25
P7.-¿Los algoritmos son fáciles de implementar?
PAPER 07
26
Aporte relacionado con la pregunta
Principal resultado:
Según los autores si existe data, ellos lo demuestran con un ejemplo de cómo trabaja
el deep learning para leer las características más importantes de las imágenes .
27
PAPER 08
28
Una capa consta de un conjunto de nodos, conocidos como "unidades" o
"características", que están conectados a través de los bordes a las capas
anteriores y siguientes. Cada unidad transforma los datos de manera no
lineal aplicando una función de activación (Figura 2A). Una red neuronal
profunda posee múltiples (a veces> 100) capas ocultas (Figura 2B). El
proceso de entrenamiento permite capas más profundas en la red para
combinar características de alto nivel que provienen de la capa anterior y
crean más características de este tipo. Como resultado, estos algoritmos
pueden diseñar características automáticamente que son apropiados para
resolver la tarea en cuestión.
Existen muchas arquitecturas de redes neuronales profundas. Una red
neuronal convolucional (CNN) se puede aplicar a datos que tienen
una topología de cuadrícula, como imágenes, y utiliza múltiples filtros para
detectar patrones dentro de los datos (Figura 2C). Una red completamente
convolucional (FCN) difiere de una CNN en que las capas completamente
conectadas de la CNN son reemplazados por capas de muestreo
ascendente y de desconvolución, que se consideran inversas de las capas
de agrupación y convolución, respectivamente (Figura 2D).
La red neuronal del generador crea datos falsos para engañar a la red
discriminadora, mientras que la discriminadora distingue datos falsos de
datos verdaderos. Entrenar estas redes alternativamente permite al
generador para finalmente aprender cómo generar datos falsos
indistinguibles de datos reales (Figura 2G).
29
Aunque no profundizamos en los detalles aquí, varias arquitecturas
novedosas, como la convolución gráfica 18,19 y capsuleNet, se proponen y
aplican continuamente en biomedicina. Dado que cada tipo de red neuronal
está especializada en su estructura de datos específica, la combinación de
múltiples marcos existentes o el desarrollo de nuevas arquitecturas se
espera que mejore en gran medida la viabilidad de utilizando redes
neuronales para la interpretación de fenómenos complejos.
Figura 2
30
Principal resultado:
31
La interpretación clínica de las variantes genéticas depende principalmente
de la información en el ámbito científico y literatura médica. En otras
palabras, los investigadores necesitan encontrar la literatura relevante para
vincular las mutaciones genómicas identificadas con información sobre
estados de enfermedad, fármacos efectivos y pronóstico.
32
posibles efectos clínicos que no fueron reconocidos por el panel de
tumores moleculares convencionales.
FIGURA 3
Según los autores la detección de deep lerning tiene un nivel de certeza de 95.4 %
33
PAPER 09
34
El autor proporciona un método para la detección de imágenes de rayos x de
tórax mediante el uso de inteligencia artificial usando de manera intensiva el
aprendizaje profundo lo brinda un nivel de certeza optimo debido a que los
algoritmos de inteligencia artificial usan conceptos de redes neuronales y a su vez
matemáticas con uso intensivo de métodos de probabilidades estadísticos que
hacen que su aproximación a la realidad sea la más cercana posible.
Principal resultado:
Para hacer frente a cada uno de los problemas anteriores, se realizan los
siguientes tres pasos de pre-procesamiento en el conjunto de datos de rayos X de
tórax pediátrico.
De acuerdo con la Fig. 4 A, cada imagen fue recortada por una ventana
predefinida para eliminar variables de confusión tales como cadenas en ambos
lados de las imágenes (el primer problema).
Figura 4
35
Coincidencia de histograma
Es notable que todas las imágenes de rayos X del tórax son en escala de grises
(imágenes de 1 canal). Además, el conocido DCNN se entrenó previamente con
imágenes coloridas (imágenes de 3 canales), por lo que para usarlas y ajustarlas,
solo aceptan imágenes de 3 canales como su entrada. Por otro lado, las
imágenes etiquetadas como neumonía se consolidan con diferentes diversidades.
Como resultado, los expertos en radiología seleccionaron tres imágenes (una
normal y dos casos de neumonía (como consolidación)) como imágenes de
36
referencia, R 1, R 2 y R 3 (Fig. 1). El algoritmo de transformación de coincidencia
de histograma puede afectar la textura de las imágenes 303132. Para mantener la
textura de consolidación, seleccionamos dos imágenes capturadas de alta calidad
con consolidación. Además, para mantener los otros componentes, como el
corazón, las costillas y la columna vertebral, seleccionamos una imagen normal
de alta calidad como la tercera imagen de referencia del algoritmo de coincidencia
de histograma. Estas imágenes tienen una distribución de histograma diferente.
Para tener imágenes con una distribución de histograma similar, hacemos
coincidir el histograma de todas las imágenes con un histograma de las imágenes
de referencia utilizando el algoritmo de transformación de coincidencia de
histograma [33]. De acuerdo con este algoritmo, el mapeo de ecualización del
histograma de la imagen de entrada X es el siguiente:
FIGURA 5
37
Para la asignación de cada nivel de gris i de la imagen de entrada X al nivel de
gris k de cada imagen de referencia, se calcula una tabla de búsqueda de la
siguiente manera:
FIGURA 7
La salida del paso anterior son tres imágenes de 1 canal con valores de píxeles
en el rango de [0,1] (x 1, x 2, x 3). A continuación, construimos una imagen de
rayos X de tórax en color Y combinando tres imágenes de 1 canal emparejadas
(imágenes de 1 canal consideradas como canales rojo, azul y verde,
respectivamente) de acuerdo con la ecuación. (5) El resultado de este paso se
muestra en la Fig. 1 B (el segundo problema).
38
FIGURA8
El tercer paso es de seguimiento hasta que finalice y nos brinde resultados este
método.
Resultado:
Todas las imágenes de rayos X del tórax se realizaron como parte de la atención
clínica de rutina de los pacientes. Para el análisis de las imágenes de rayos X del
tórax, todas las radiografías de tórax se examinaron inicialmente para el control
de calidad, y se eliminaron los escaneos de baja calidad o ilegibles. Luego, dos
médicos expertos calificaron los diagnósticos de las imágenes antes de autorizar
el entrenamiento del sistema de IA. Para evitar errores, el conjunto de evaluación
fue verificado por un tercer experto. En este trabajo, el conjunto de datos de rayos
X de tórax pediátrico se utilizó para entrenar, evaluar y probar los modelos.
39
conjuntos de datos Chest X-ray14, DDSM e INBreast para entrenar previamente
los modelos.
Este conjunto de datos se incrementó a 122,787 imágenes que se organizaron al
azar para entrenar (60,194 calcificación y 48,878 imágenes en masa) y datos de
validación (6411 calcificación y 7301 imágenes en masa). Este conjunto de datos
solo se usó para el entrenamiento previo de la arquitectura ChestNet.
Según la autora pone en duda que solo una area sea suficiente para lograr
automatizar los procesos de lectura de radiografias torácicas haciendo énfasis en
que se necesita el trabajo interdisciplinario para lograr el objetivo, el cual es
automatizar con Inteligencia artificial lo que los radiólogos realizan.
PAPER 10
Titulo: Deep learning technology for improving cancer care in society: New
directions in cancer imaging driven by artificial intelligence.
40
generar un cambio de paradigma tecnológico en oncología clínica para mejorar el
diagnóstico y el tratamiento del cáncer. En particular, este estudio muestra el
potencial de la tecnología de aprendizaje profundo en imágenes de cáncer para
distinguir entre diferentes tipos de cáncer, detectar la difusión de metástasis, etc.
Este estudio se centra en estudios de casos de nuevos algoritmos de aprendizaje
profundo aplicados para la detección de pulmón y seno cáncer que son dos de las
enfermedades más importantes en la sociedad. Estos estudios de caso muestran
resultados interesantes de la tecnología de aprendizaje profundo en oncología
para una posible generalización fructífera.
Principal resultado:
41
Tecnología de aprendizaje profundo para detectar la tipología del cáncer de
pulmón.
El cáncer de pulmón es una de las principales enfermedades en varios
países y una de las principales causas de muerte por cáncer, en ambos
sexos, en todo el mundo.
El cáncer de pulmón está relacionado con varios factores de riesgo en la
sociedad, como el tabaquismo, el tabaquismo pasivo, la contaminación del
aire, etc.
El cáncer de pulmón puede ser cáncer de pulmón de células pequeñas o
no cáncer de pulmón de células pequeñas.
La mortalidad por cáncer de pulmón es muy alta y la tasa de supervivencia
a cinco años de los pacientes es de aproximadamente 2 a 10% [29-32].
La detección del tipo de cáncer de pulmón (p. Ej., Adenocarcinoma,
carcinoma de células escamosas, etc.), de mutaciones (p. Ej., EGFR:
receptor del factor de crecimiento epidérmico; ALK: reordenamientos de
tirosina cinasa del receptor de linfoma anaplásico, etc.) y de secuenciales
mutaciones (T790) es un proceso crítico en el diagnóstico para seleccionar
la terapia más adecuada para el cáncer de pulmón, como: quimioterapias
convencionales (p. ej., cisplatino, carboplatino, etc.) terapias dirigidas,
como gefitinib, erlotinib, etc.Nuevas terapias inmunes, por ejemplo,
nivolumab, atezolizumab [30,31].
42
comenzar los tratamientos contra el cáncer adecuados. De hecho, las colas
largas y el largo tiempo de espera para los procesos de diagnóstico del
cáncer son factores críticos que afectan la supervivencia y, cuando es
posible, la curación. Por otro lado, los hospitales tienen un alto costo (por
ejemplo, días de hospitalización) con estos enfoques basados en biopsias
que requieren equipos, materiales y materiales apropiados.
6. CONCLUSIONES:
Se pone en duda que solo una área sea suficiente para lograr automatizar
los procesos de lectura de radiografías torácicas haciendo énfasis en que
se necesita el trabajo interdisciplinario para lograr el objetivo, el cual es
automatizar con Inteligencia artificial lo que los radiólogos realizan.
43
consumo de recursos en maquina que implica este procedimiento
automático.
BIBLIOGRAFÍA
44
45