RFM 25 1 41-49
RFM 25 1 41-49
RFM 25 1 41-49
Durante los tratamientos de Radioterapia, se adquieren imágenes tomográficas del paciente. Estas imágenes presentan
artefactos que limitan su validez para el cálculo de dosis. Es posible, con el uso de redes neuronales, hacerlas más adecuadas
para el cálculo de dosis. Empleamos la conocida red neuronal U-NET para entrenar un modelo capaz de generar imágenes
tomográficas aptas para el cálculo de dosis. El modelo se entrena con imágenes de tórax de 25 pacientes. El resultado se
verifica sobre las imágenes de 14 pacientes: 10 de tórax y 4 de pelvis. Con las Imágenes de CBCT se generan unas TC sinté-
ticas que se comparan con las de simulación. Se evalúan el error medio (EM) error absoluto medio (EAM) la relación máxima
de señal ruido (RMSR) y el índice de similitud estructural (ISE).
Se compara la dosis calculada sobre el TC con la calculada sobre ambos CBCT. Se calcula el índice gamma de similitud
entre las matrices de dosis y los valores de D5, D95 y dosis media sobre el PTV.
Se observa una mejora estadísticamente significativa en todos los parámetros estudiados.
La red neuronal U-NET puede emplearse para modificar imágenes de CBCT y hacerlas más aptas para el cálculo de dosis.
Palabras clave: TC sintético, redes neuronales, U-NET, Radioterapia adaptativa.
During radiotherapy treatments, tomographic images of the patient are acquired. There is interest in using those images
for treatment re-planning. LINAC images, in general, have artifacts that limit their validity for dose calculation. The use of
neural networks can enhance the image quality to make them more apt for dose calculation. In this work, we use the well-
known neural network U-NET to train a model capable of generating tomographic images valid for dose calculation. The
model is trained with images of thorax of 25 patients. The result is verified over the images of 14 patients: 10 thorax and
4 pelvis. The CBCT images are used to generate synthetic CT’s which are compared with the simulation ones. Mean error,
mean absolute error, maximum signal to noise ratio and structural similarity index are evaluated.
Doses calculated on both CBCT images and CT are compared. Evaluated parameters are gamma index, D5, D95 and
mean dose in the dose volume histogram of the target volume.
All the parameters evaluated presented a statistically relevant improvement.
U-NET neural network can be used on CBCT images to make them more apt for dose calculation.
*Correspondencia: mllorente@mdanderson.es
https://doi.org/10.37004/sefm/2024.25.1.003
42 M Llorente Manso et al.
contracción, la información espacial se reduce mientras ción se usaron imágenes distintas de las empleadas
que la información de características aumenta. La ruta para el entrenamiento de las redes.
expansiva combina la característica y la información
espacial a través de una secuencia de convoluciones
ascendentes y concatenaciones con características de Evaluación de la imagen
alta resolución de la ruta de contracción.
En este caso partimos de imágenes de 384 × 384 Para la evaluación de la similitud entre las imágenes
píxeles a las que aplicamos hasta cuatro contracciones, de TC sintéticas, se emplearon varias métricas siguien-
que reducen la resolución hasta 24 × 24 píxeles y otros do el trabajo de Xuetao Wang:15 error medio (EM), error
cuatro pasos de expansión que devuelven una imagen absoluto medio (EAM), relación máxima de señal ruido
de la resolución original. La función de activación en (RMSR) y el índice de similitud estructural (ISE).
las capas intermedias es ReLU y la de la capa final El error medio viene definido en la ecuación (1),
es una función sigmoide. La función de pérdida es el donde P indica el valor del píxel y denota la diferencia
error absoluto promedio. La red se ha implementado entre los valores de píxel de cada par de imágenes.
en TensorFlow.† En la figura 1 se muestra un esquema
n
de la red neuronal empleada. Se indican las operacio- 1 CBCT
EM = Pi − PiTC
nes que se realizan con el nombre de la función en n (1)
i=1
Tensorflow que las lleva a cabo.
Para mejorar los resultados, se emplea la técnica de
aumento de los datos que consiste en aplicar rotaciones El error absoluto medio, definido en la ecuación (2),
y traslaciones a las imágenes. evalúa el valor absoluto de la diferencia píxel a píxel.
El modelo se entrenó sobre un procesador Intel Core
n
i7 11ª generación, con una memoria RAM de 32 Gb. El 1 CBCT
EAM = Pi − PiTC
proceso de entrenamiento llevó alrededor de 16 h. La (2)
n
red resultante tarda, sobre la misma máquina, aproxi- i=1
MAX2
La evaluación se realizó tomando pares de imágenes RMSR = 10 · log10 (3)
de TC y CBCT de 14 pacientes: 10 de tórax, 3 de pelvis ECM
y uno de abdomen. En todos los casos, para la evalua-
† https://www.tensorflow.org
Fig. 2. Comparativa de las métricas de similitud entre imágenes: error medio (EM) error absoluto medio (EAM) relación
máxima señal-ruido (RMSR) e índice de similitud estructural (ISE). Se muestran los valores de comparar la imagen de simu-
lación con el CBCT original (azul), el corregido con la red de tórax (naranja) y las corregidas con la red de pelvis (verde). Los
pacientes aparecen agrupados por localización anatómica.
Los pacientes se muestran agrupados por localización todos los parámetros dosimétricos estudiados, tal y
anatómica (tórax, mama, abdomen-pelvis). El análisis como se recoge en la tabla 1. En ella, se puede ver que
estadístico indica que hay una mejora significativa en el valor de p es de 0.006 o menor.
Tabla 1. Valor del estadístico W y p al aplicar la prueba de los rangos con signo de Wilcoxon a las distintas métricas evaluadas:
error medio (EM) error absoluto medio (EAM) relación máxima señal-ruido (RMSR) índice de similitud estructural (ISE),
índice gamma y diferencia con respecto al de simulación de Dosis media, D95 y D5 en el PTV.
Métrica Estadístico (W) p
EM 3 0.0006
EAM 0 0.0001
RMSR 2 0.0007
ISE 0 0.001
Gamma (2 mm/3%) 12 0.008
Dosis media (diferencia %) 3 0.006
D95 (diferencia %) 11 0.006
D5 (diferencia %) 1 0.0002
Fig. 3. Diferencias en la dosis media dentro del PTV entre la calculada sobre las imágenes de simulación y las calculadas
sobre las imágenes de CBCT. Se emplean las imágenes sin corregir (cbct), corregidas con el modelo de tórax (cbct corr) y
el modelo de pelvis (corr pelvis).
Fig. 4. Diferencias en la dosis que recibe el 5% del volumen (D5) dentro del PTV entre la calculada sobre las imágenes de
simulación y las calculadas sobre las imágenes de CBCT. Se emplean las imágenes sin corregir (cbct), corregidas con el
modelo de tórax (cbct corr) y el modelo de pelvis (corr pelvis).
Fig. 5. Diferencias en la dosis que recibe el 95% del volumen (D95) dentro del PTV entre la calculada sobre las imágenes
de simulación y las calculadas sobre las imágenes de CBCT. Se emplean las imágenes sin corregir (cbct), corregidas con el
modelo de tórax (cbct corr) y el modelo de pelvis (corr pelvis).
Fig. 6. Valores del índice gamma (2 mm/3%) al comparar la matriz de dosis de simulación con la calculada sobre la imágenes
de CBCT originales (gamma cbct), sobre las corregidas con la red de tórax (gamma cbct corr.) y las corregidas con la red
de pelvis (corr pelvis). Los pacientes aparecen agrupados por localización anatómica.
Discusión hace más similares los números TC del CBCT a los del
TC de simulación, que tomamos como verdaderos.
Los resultados presentados demuestran la capa- Aunque el número de muestras por cada localiza-
cidad de una red neuronal U-NET para mejorar las ción anatómica no permite hacer un análisis estadístico
imágenes de CBCT para su uso en el cálculo de dosis fiable, sí se puede apreciar que la mejora para los
en Radioterapia. Cabe señalar que la mejora es signifi- casos de mama es menor que para los de tórax o pel-
cativa incluso para una red entrenada con un número vis. Una posible explicación es que el PTV de la mama
muy limitado de muestras (49), por lo que se espera es un tejido de densidad uniforme y periférico, menos
que se puedan mejorar los resultados aumentando el afectado por los artefactos de imagen que los de otras
número de muestras para el entrenamiento de la red. localizaciones como el mediastino o la pelvis, que se
Las imágenes generadas presentan una mejoría en encuentran en profundidad y en zonas con heteroge-
las métricas de similitud de imagen que hemos evalua- neidades debidas al pulmón, los huesos o los gases
do. Eso quiere decir que las imágenes generadas están intestinales.
más cerca de las de simulación que las originales. Sin El cambio en el promedio de tasa de paso del
embargo, la mejora se hace menos aparente en el índi- índice gamma pasa de 90.5% a 94.8% y 94% para
ce de similitud estructural. Posiblemente, eso se deba los modelos de tórax y pelvis, respectivamente. Para
a que esta métrica se fija en la textura de las imágenes. calibrar la relevancia clínica de esta mejora, el criterio
En las imágenes generadas por la red neuronal, el para aceptación de las medidas de control de calidad
valor del píxel se hace más parecido al de la imagen de tratamientos en nuestro centro es que el parámetro
original a costa de perder resolución y detalle. Es decir, gamma sea mayor del 95% (2 mm/3%). Salvando las
son imágenes más borrosas que, aunque presenten distancias, se podría extrapolar este criterio para decir
los artefactos atenuados o una mejor correlación con que el primer cálculo sería claramente no aceptable,
la densidad del tejido, serán peores para contornear mientras que los otros estarían mucho más cerca de
estructuras que las originales, como se puede apreciar ser aceptables. Así mismo encontramos interesante la
en la figura 7. Este aspecto se podría estudiar emplean- mejora de más del 1% en la dosis media dentro del
do imágenes de maniquíes de control de calidad, aun- PTV.
que cae fuera del objetivo primario de este trabajo y También cabe señalar que la red de pelvis ofrece
queda pendiente para un futuro estudio. El análisis de buenos resultados y hace pensar que una red entre-
las magnitudes dosimétricas también arroja una mejora nada en una localización anatómica se puede emplear
en todos los parámetros medios. como punto de partida para entrenar una segunda en
La explicación para esto es que la tabla de con- otra localización con número reducido de muestras, lo
versión de números TC a densidad para el CBCT se que permitiría ahorrar trabajo y tiempo de cálculo.
obtiene a partir de unas imágenes de un maniquí de La metodología empleada presenta el problema de
control de calidad de un tamaño mucho menor que el que las imágenes de simulación y las de tratamiento no
del paciente. Las imágenes de un paciente real están se corresponden exactamente. El día de tratamiento,
afectadas por múltiples artefactos que hacen que pier- el paciente puede encontrarse en una posición ligera-
da validez esa tabla de conversión obtenida en condi- mente distinta a la del día de la simulación o pueden
ciones ideales. La corrección a través de la red neurona haberse producido cambios anatómicos. Esos cam-