Herramienta de IA detecta con precisión la ubicación del tumor en la RM de mama

OAK BROOK, Ill. — Un modelo de IA entrenado para detectar anormalidades en imágenes de resonancia magnética de mama representó con precisión las ubicaciones de los tumores y superó a los modelos de referencia cuando se probó en tres grupos diferentes, según un estudio publicado en Radiology.

Dr. Felipe Oviedo
Dr. Felipe Oviedo

“La resonancia magnética asistida por IA podría potencialmente detectar cánceres que los humanos no detectarían de otro modo”, dijo el investigador principal del estudio, Felipe Oviedo, Ph.D., analista de investigación sénior en AI for Good Lab de Microsoft.

La mamografía de detección se considera el estándar de atención para la detección del cáncer de mama. Sin embargo, es menos efectiva en pacientes con mamas densas. La densidad mamaria es un factor de riesgo independiente para el cáncer de mama y puede enmascarar un tumor. Los médicos pueden solicitar una resonancia magnética mamaria como complemento a la mamografía de detección en mujeres con mamas densas y en aquellas con alto riesgo de cáncer.

Figura 1. Resumen del método. (A) El diagrama muestra la detección profunda de anomalías explicables en la resonancia magnética de mama. Se pasa una proyección de intensidad máxima (MIP) de una mama a un modelo de red neuronal completamente convolucional entrenado mediante una función de pérdida de detección de anomalías explicable (descripción de datos completamente convolucional [FCDD]). (B) El diagrama muestra una comparación conceptual entre la clasificación binaria y la detección de anomalías: el sombreado representa los espacios de características normales (azul) y anormales (rojo) aprendidos, y los puntos representan casos individuales normales (azul) y anormales (rojo).
Figura 1. Resumen del método. (A) El diagrama muestra la detección profunda de anomalías explicables en la resonancia magnética de mama. Se pasa una proyección de intensidad máxima (MIP) de una mama a un modelo de red neuronal completamente convolucional entrenado mediante una función de pérdida de detección de anomalías explicable (descripción de datos completamente convolucional [FCDD]). (B) El diagrama muestra una comparación conceptual entre la clasificación binaria y la detección de anomalías: el sombreado representa los espacios de características normales (azul) y anormales (rojo) aprendidos, y los puntos representan casos individuales normales (azul) y anormales (rojo).

“La resonancia magnética es más sensible que la mamografía”, dijo el Dr. Oviedo. “Pero también es más cara y tiene una mayor tasa de falsos positivos”.

Para mejorar la precisión y la eficiencia de la resonancia magnética mamaria de cribado, el equipo de investigación del Dr. Oviedo colaboró estrechamente con investigadores clínicos del Departamento de Radiología de la Universidad de Washington para desarrollar un modelo explicable de IA para la detección de anomalías. Los modelos de detección de anomalías distinguen entre datos normales y anormales, señalando las anomalías o anormalidades para su posterior investigación.

Figura 2. Conjuntos de datos de resonancia magnética de mama. (A) El conjunto de datos de desarrollo del modelo se compuso de datos de 5026 pacientes. Se definieron dos tareas de detección: detección balanceada (que incluía todos los datos) y detección desbalanceada (que excluía las resonancias magnéticas con cánceres conocidos). También se evaluaron dos conjuntos de datos independientes: (B) un conjunto de datos interno de 171 exámenes, evaluado para las tareas de detección balanceada y desbalanceada, y (C) un conjunto de datos multicéntrico externo de 221 exámenes, evaluado para la tarea de detección balanceada y para las explicaciones del modelo espacial.
Figura 2. Conjuntos de datos de resonancia magnética de mama. (A) El conjunto de datos de desarrollo del modelo se compuso de datos de 5026 pacientes. Se definieron dos tareas de detección: detección balanceada (que incluía todos los datos) y detección desbalanceada (que excluía las resonancias magnéticas con cánceres conocidos). También se evaluaron dos conjuntos de datos independientes: (B) un conjunto de datos interno de 171 exámenes, evaluado para las tareas de detección balanceada y desbalanceada, y (C) un conjunto de datos multicéntrico externo de 221 exámenes, evaluado para la tarea de detección balanceada y para las explicaciones del modelo espacial.

“Los modelos desarrollados previamente se entrenaron con datos de los cuales el 50% correspondía a casos de cáncer y el 50% a casos normales, lo cual representa una distribución muy poco realista”, afirmó el Dr. Oviedo. “Estos modelos no se han evaluado rigurosamente en poblaciones de baja prevalencia de cáncer o de cribado (donde el 2% de todos los casos son cáncer o menos), y además carecen de interpretabilidad, dos aspectos esenciales para su adopción clínica”.

Figura 3. Rendimiento de la detección de cáncer en tareas balanceadas y desbalanceadas. (A–D) La entropía cruzada binaria (BCE) se compara con la clasificación de hiperesferas (HSC) y la descripción de datos completamente convolucional (FCDD) de los modelos de detección de anomalías en el amplio conjunto de datos de desarrollo del modelo. (A, B) Los diagramas de caja y bigotes muestran las distribuciones del área bajo la curva ROC (AUC) para (A) la tarea 1 y (B) la tarea 2 para cinco pliegues de prueba de validación cruzada agrupados, con cinco inicializaciones aleatorias por pliegue. (C, D) Curvas ROC para (C) la tarea 1 y (D) la tarea 2 en la validación cruzada agrupada. Las áreas sombreadas corresponden a las curvas ROC para diferentes pliegues de prueba e inicializaciones aleatorias del modelo. (E, F) Curvas ROC para (E) la tarea 1 y (F) la tarea 2 para el conjunto de prueba interno independiente.
Figura 3. Rendimiento de la detección de cáncer en tareas balanceadas y desbalanceadas. (A–D) La entropía cruzada binaria (BCE) se compara con la clasificación de hiperesferas (HSC) y la descripción de datos completamente convolucional (FCDD) de los modelos de detección de anomalías en el amplio conjunto de datos de desarrollo del modelo. (A, B) Los diagramas de caja y bigotes muestran las distribuciones del área bajo la curva ROC (AUC) para (A) la tarea 1 y (B) la tarea 2 para cinco pliegues de prueba de validación cruzada agrupados, con cinco inicializaciones aleatorias por pliegue. (C, D) Curvas ROC para (C) la tarea 1 y (D) la tarea 2 en la validación cruzada agrupada. Las áreas sombreadas corresponden a las curvas ROC para diferentes pliegues de prueba e inicializaciones aleatorias del modelo. (E, F) Curvas ROC para (E) la tarea 1 y (F) la tarea 2 para el conjunto de prueba interno independiente.

Para abordar estas limitaciones, los investigadores entrenaron su modelo utilizando datos de casi 10 000 exámenes consecutivos de resonancia magnética de mama con contraste realizados en la Universidad de Washington entre 2005 y 2022. Las pacientes eran predominantemente blancas (más del 80 %) y el 42,9 % tenía mamas heterogéneamente densas, mientras que el 11,6 % tenía mamas extremadamente densas.

“A diferencia de los modelos tradicionales de clasificación binaria, nuestro modelo de detección de anomalías aprendió una representación robusta de casos benignos para identificar mejor las neoplasias malignas anormales, incluso si están subrepresentadas en los datos de entrenamiento”, afirmó el Dr. Oviedo. “Dado que las neoplasias malignas pueden presentarse de múltiples maneras y son escasas en conjuntos de datos similares, el tipo de modelo de detección de anomalías propuesto en el estudio es una solución prometedora”.

Además de proporcionar una puntuación de anomalía estimada, el modelo de detección genera un mapa de calor con resolución espacial para una imagen de RM. Este mapa de calor resalta en color las regiones de la imagen que el modelo considera anormales. Las regiones anormales identificadas por el modelo coincidieron con las áreas de malignidad comprobada por biopsia, anotadas por un radiólogo, superando ampliamente el rendimiento de los modelos de referencia.

Figura 4. Mapas de calor de explicación del modelo para un pliegue de prueba de validación cruzada. (A, B) Mapas de explicación para una muestra aleatoria de proyecciones de intensidad máxima (MIP) en (A) tarea 1 y (B) tarea 2. La descripción de datos completamente convolucional (FCDD) produce un mapa de calor más específico que los calculados para la entropía cruzada binaria (BCE) y la clasificación de hiperesferas (HSC). (C) Matriz de confusión de mapas de calor de anomalías FCDD representativos para casos muestreados aleatoriamente, comparando predicciones y clases reales. Para mamas con neoplasias malignas, las ubicaciones de los cánceres no detectados se indican con flechas. El signo de interrogación denota un carcinoma ductal conocido in situ que no mostró realce en la resonancia magnética, lo que puede haberse debido a un alto nivel de realce parenquimatoso de fondo; un factor común de los cánceres no detectados fue la baja visibilidad en las imágenes MIP. Grad-CAM = mapeo de activación de clase ponderado por gradiente.
Figura 4. Mapas de calor de explicación del modelo para un pliegue de prueba de validación cruzada. (A, B) Mapas de explicación para una muestra aleatoria de proyecciones de intensidad máxima (MIP) en (A) tarea 1 y (B) tarea 2. La descripción de datos completamente convolucional (FCDD) produce un mapa de calor más específico que los calculados para la entropía cruzada binaria (BCE) y la clasificación de hiperesferas (HSC). (C) Matriz de confusión de mapas de calor de anomalías FCDD representativos para casos muestreados aleatoriamente, comparando predicciones y clases reales. Para mamas con neoplasias malignas, las ubicaciones de los cánceres no detectados se indican con flechas. El signo de interrogación denota un carcinoma ductal conocido in situ que no mostró realce en la resonancia magnética, lo que puede haberse debido a un alto nivel de realce parenquimatoso de fondo; un factor común de los cánceres no detectados fue la baja visibilidad en las imágenes MIP. Grad-CAM = mapeo de activación de clase ponderado por gradiente.

El modelo se probó con conjuntos de datos internos y externos. El conjunto de datos interno consistió en resonancias magnéticas realizadas a 171 mujeres (edad media de 48,8 años) para cribado (71,9 %; 31 cánceres confirmados mediante biopsia posterior) o evaluación preoperatoria de un cáncer conocido (28,1 %; 50 cánceres confirmados mediante biopsia). El conjunto de datos externo, multicéntrico y de acceso público, incluyó resonancias magnéticas de mama previas al tratamiento de 221 mujeres con cáncer de mama invasivo.

El modelo de detección de anomalías representó con precisión la ubicación del tumor y superó a los modelos de referencia en la validación cruzada agrupada, en conjuntos de datos de prueba internos y externos, y en tareas de detección equilibradas (alta prevalencia de cáncer) y desequilibradas (baja prevalencia de cáncer).

Figura 5.  Validación de mapas de calor de explicación de modelos en el conjunto de prueba de explicación segmentado por lesiones. (A–D) Los diagramas de caja y bigotes muestran el área bajo la curva característica operativa del receptor (AUC) a nivel de píxel para tres modelos: entropía cruzada binaria (BCE), clasificación de hiperesferas (HSC) y descripción de datos completamente convolucional (FCDD), utilizando la anotación retrospectiva del radiólogo como estándar de referencia. Cada punto corresponde al AUC a nivel de píxel entre un mapa de calor de explicación y la anotación del radiólogo en una imagen de mama. Se muestran datos para (A) todas las imágenes en el conjunto de prueba de explicación, (B) imágenes estratificadas por tipo de lesión, (C) imágenes estratificadas por carcinoma invasivo versus carcinoma ductal in situ (DCIS) y (D) imágenes estratificadas por estadio T para casos invasivos. Los casos con múltiples lesiones de diferentes tipos y características histológicas en la misma mama se excluyeron de B (un caso) y C (dos casos). (E) Se muestran las proyecciones de intensidad máxima (MIP), los mapas de saliencia de la BCE, los mapas de anomalías de la FCDD y las anotaciones del radiólogo para una muestra aleatoria de casos de prueba con lesiones en estadios T1, T2 y T3. Todos los mapas de explicación están normalizados localmente. Las mamas con lesiones pequeñas (p. ej., caso 7) o múltiples (p. ej., casos 11 y 12) tendieron a presentar peores explicaciones. Las lesiones más grandes en estadio T3 (p. ej., casos 14 y 15) tendieron a ser mal explicadas por los mapas de la BCE; aunque los mapas de la FCDD fueron más consistentes, tendieron a subestimar el tamaño de la región afectada.
Figura 5. Validación de mapas de calor de explicación de modelos en el conjunto de prueba de explicación segmentado por lesiones. (A–D) Los diagramas de caja y bigotes muestran el área bajo la curva característica operativa del receptor (AUC) a nivel de píxel para tres modelos: entropía cruzada binaria (BCE), clasificación de hiperesferas (HSC) y descripción de datos completamente convolucional (FCDD), utilizando la anotación retrospectiva del radiólogo como estándar de referencia. Cada punto corresponde al AUC a nivel de píxel entre un mapa de calor de explicación y la anotación del radiólogo en una imagen de mama. Se muestran datos para (A) todas las imágenes en el conjunto de prueba de explicación, (B) imágenes estratificadas por tipo de lesión, (C) imágenes estratificadas por carcinoma invasivo versus carcinoma ductal in situ (DCIS) y (D) imágenes estratificadas por estadio T para casos invasivos. Los casos con múltiples lesiones de diferentes tipos y características histológicas en la misma mama se excluyeron de B (un caso) y C (dos casos). (E) Se muestran las proyecciones de intensidad máxima (MIP), los mapas de saliencia de la BCE, los mapas de anomalías de la FCDD y las anotaciones del radiólogo para una muestra aleatoria de casos de prueba con lesiones en estadios T1, T2 y T3. Todos los mapas de explicación están normalizados localmente. Las mamas con lesiones pequeñas (p. ej., caso 7) o múltiples (p. ej., casos 11 y 12) tendieron a presentar peores explicaciones. Las lesiones más grandes en estadio T3 (p. ej., casos 14 y 15) tendieron a ser mal explicadas por los mapas de la BCE; aunque los mapas de la FCDD fueron más consistentes, tendieron a subestimar el tamaño de la región afectada.

El Dr. Oviedo afirmó que, si se integra en los flujos de trabajo de radiología, el modelo de detección de anomalías podría potencialmente excluir exploraciones normales para fines de triaje y mejorar la eficiencia de la lectura.

“Nuestro modelo proporciona una explicación comprensible, a nivel de píxel, de las anomalías en una mama”, afirmó. “Estos mapas de calor de anomalías podrían identificar áreas potencialmente preocupantes, lo que permitiría a los radiólogos centrarse en los exámenes con mayor probabilidad de ser cancerosos”.

Antes de su aplicación clínica, dijo que el modelo necesita ser evaluado en conjuntos de datos más grandes y estudios prospectivos para evaluar su potencial para mejorar el flujo de trabajo de los radiólogos.

Artículos relacionados

CLIM Academy 2026: innovación, comunidad y nuevas voces en diagnóstico por imágenes de mama

Desde Miami, Diagnóstico Journal acompañó una nueva edición de CLIM Academy 2026, un encuentro que volvió a poner en el centro a la educación,...

Inteligencia artificial en mamografía y radiografía de tórax: las innovaciones de Lunit presentadas en ECR 2026

Durante el European Congress of Radiology, Diagnóstico Journal visitó el stand de Lunit para conocer sus últimas soluciones en inteligencia artificial aplicadas al diagnóstico...

Metaltronica en ECR 2026: innovación en mamografía y soluciones integrales para la salud de la mujer

Durante el European Congress of Radiology 2026, Diagnóstico Journal visitó el stand de Metaltronica, empresa italiana con más de cuatro décadas de trayectoria dedicada...

Desafio de IA da SPR premiará em dólar soluções para apoiar diagnóstico do câncer de mama

Integrado à 56ª Jornada Paulista de Radiologia, o desafio reconhecerá os três melhores projetos e conta com apoio da Siemens para acelerar soluções aplicadas...

Seguinos

2,319FansLike
0FollowersFollow
1,324FollowersFollow

MÁS LEIDOS