Materials and Methods Subjects - Advanced MR Imaging Techniques in Localizing and Local Staging

En esta sección se explicarán en detalle cada una de las métricas utilizadas en este trabajo para la comparación de las imágenes predichas por cada una de las redes y las correspondientes originales. Se han propuesto varias métricas para la comparación las cuales son las conocidas como NRMSE, Información mutua, PSNR, SSIM y por último Perceptual Similarity. Se explicarán los procesos de cálculo de cada una de estas métricas, el objetivo de cada una y una representación de sus posibles resultados. Este análisis se encuadra en el campo del IQA (image quality assesment) dónde se proponen gran cantidad de métodos para la evaluación y comparación de imágenes.

3.4.1 Normalized Root Mean-Square Error

La primera métrica propuesta se conoce como Mean Square Error (MSE) [73], que simboliza la media de la diferencia entre los p´ıxeles de las imágenes. Un MSE alto simboliza una mayor diferencia entre la imagen original y la imagen estimada. Sin embargo, es muy importante tener cuidado con los bordes. La fórmula para el cálculo del MSE es:

M SE= 1

iXj(Eij −Oij)2 (10)

Donde N significa el tamaño de la imagen (ancho x alto x canales), E es la imagen predicha y O la imagen original. El RMSE es una medida frecuentemente utilizada de las diferencias entre los valores predichos por un modelo o un estimador y los valores realmente observados. La RMSE sirve para agregar las magnitudes de los errores en las predicciones de varios en una única medida de poder de predicción. Su fórmula es:

RM SE= r 1 N X iXj(Eij−Oij)2 (11)

La normalización del RMSE facilita la comparación entre datasets de distintas escalas. Se considera en este caso que se normaliza respecto a un valor, que corresponde al valor máximo menos el valor m´ınimo de los datos medidos.

N RM SE= RM SE

ymax−ymin

(12)

La ecuación 12 corresponde a la métrica “Normalized Root-Mean-Square Error” (NRMSE), donde los valores más bajos indican menor variación residual entre los p´ıxeles de las imágenes. Es posible que los resultados de la comparación se vean alterados por el tamaño de las imágenes

de entrada, por lo que se suelen considerar varios tamaños al aplicar la métrica. Cuando se utiliza para encontrar la similitud, se pueden tener problemas. El principal es que las grandes distancias entre las intensidades de los p´ıxeles no significan necesariamente que el contenido de las imágenes sea dramáticamente diferente.

3.4.2 Normalized Mutual Information

Se puede entender fácilmente la información mutua como la cantidad de información que posee una variable (imagen de salida) acerca de otra variable (imagen de entrada). Cuando se evalúa la información mutua, se considera la similitud existente entre 1 zona de cada una de las 2 imágenes. La influencia de estas zonas a evaluar puede verse en 2 aspectos fundamentales: Primero, al reducir el tamaño de esta zona, se reduce el número de muestras, lo cual reduce la precisión de la estimación de la distribución de probabilidad. Segundo, puede darse el caso de que al reducir estas zonas, aumente la información mutua cuando las entrop´ıas marginales aumentan más rápido que la entrop´ıa conjunta. La normalización de la información mutua (NMI)[80] presenta una independencia de estas zonas de estudio, por lo tanto se considera una medida más robusta. Sus resultados var´ıan entre cero (no existe información mutua) y 1 (correlación perfecta).

N M I(U, V) = M I(U, V)

media(H(U), H(V)) (13)

Donde la informaci´on mutua es calculada como:

M I(U, V) = |U| X i=1 |V| X j=1 |Ui∩Vj| N log( N|Ui∩Vj| |Ui||Vj| ) (14)

Donde U y V hacen referencia a las 2 im´agenes que se est´an comparando, H(u) y H(V) simbolizan la entrop´ıa de cada una de las variables.

3.4.3 Peak Signal-to-Noise Ratio

Métrica usualmente utilizada para medir la calidad de imágenes que luego de ser comprimidas han sido reconstruidas. El PSNR computa la mayor relación señal ruido entre dos imágenes, en decibelios. Mayor PSNR simboliza una mejor calidad de la imagen generada por el modelo.

Para el c´alculo del PSNR se utiliza el MSE (Ecuaci´on 15): P SN R= 10log10 2552 1 N P iP j(Eij −Oij)2 ! (15)

Donde N (ancho x alto x canales) simboliza el tamaño de la imagen, E la imagen predicha y O la imagen original. El numerador representa el valor máximo de un p´ıxel, en este caso 255 puesto que son imágenes dónde cada valor se codifica a 8 bits.

3.4.4 SSIM

La métrica SSIM [81] es un modelo basado en la percepción que considera que la degradación de las imágenes se percibe como un cambio en su información estructural, a la vez que incluye las máscaras de luminancia y de contraste. La información estructural es la idea de que los p´ıxeles tienen una fuerte dependencia entre ellos cuando se encuentran cerca en el espacio. Estas dependencias contienen información importante acerca de la estructura de los objetos. La máscara de luminancia es un fenómeno donde las distorsiones de la imágen tienden a ser menos visibles en las regiones iluminadas, mientras que el fenómeno del contraste es aquel donde las distorsiones son menos visibles cuando en la imagen existe alguna actividad significativa o textura. El ´ındice de SSIM es calculado en varias ventanas de una imagen. La medida entre dos ventanas x e y del mismo tamaño NxN es :

SSIM(x, y) = (2µxµy +c1)(2σxy +c2) (µ2

x+µ2y+c1)(σx2+σy2+c2)

(16)

En la ecuación previa µ hace referencia a la media de la ventana x o y mientras que σ hace alusión a la varianzas o covarianza entre ventanas. Lo valores c son simples regularizadores para cuando los valores del numerador o denominador son demasiado pequeños. El resultado es un valor decimal ente -1 y 1, dónde 1 representa imágenes idénticamente iguales y un valor de 0 indica que no existe ninguna similitud.

3.4.5 Perceptual Similarity

Debido al aumento de las aplicaciones que usan algoritmos de Deep Learning, se hace necesario en gran medida el uso de métricas de similitud de imágenes cuando se usan redes generativas. Siguiendo esta idea, varios trabajos encuadrados en el campo del IQA han comenzado a proponer métricas que se basan en redes neuronales entrenadas para proporcionar este tipo de comparativas. En este trabajo con el fin de utilizar alguna de las métricas más novedosas propuestas recientemente se va a hacer uso de la conocida como ”Perceptual Similarity”[82].

Esta métrica consiste en la utilización de redes neuronales entrenadas para la clasificación de imágenes a alto nivel, incluso a través de las redes, sin necesidad de ninguna calibración extra. Esta red puede ser utilizada para medir la similitud entre 2 imágenes. En efecto ha sido demostrado que se obtienen mejores resultados que con las métricas utilizadas normalmente como la MSE o SSIM, las cuales no fueron diseñadas para situaciones donde la ambigüedad espacial es un factor a considerar. Se ha demostrado también que redes entrenadas para otras funciones como resolución de rompecabezas también cumplen esta función y lo siguen haciendo mejor que las métricas comunes. En este caso, se utilizará la red neuronal AlexNet para calcular la similitud entre la imagen original y la predicha. Las redes se entrenan con pares de imágenes buscando aprender cual es la similitud entre ambas. Un valor más alto final de la media de salida, corresponde a imágenes más diferentes. Mientras un valor bajo representa que las imágenes son más similares.

In document Advanced MR Imaging Techniques in Localizing and Local Staging of Prostate Carcinoma. (Page 97-99)