Modelos challenge de IA de RSNA pueden interpretar mamografías en forma independiente

Los algoritmos presentados para un desafío de inteligencia artificial organizado por la RSNA han demostrado un excelente desempeño para detectar cánceres de mama en imágenes de mamografía, aumentando la sensibilidad de detección y manteniendo bajas tasas de recuperación, según un estudio publicado en Radiology.

Dra. Yan Chen
Dra. Yan Chen

El Challenge de IA para la Detección del Cáncer de Mama mediante Mamografía de Cribado de la RSNA fue una competencia de colaboración abierta que se celebró en 2023, con la participación de más de 1500 equipos. El artículo de Radiology detalla un análisis del rendimiento de los algoritmos, dirigido por la Dra. Yan Chen, profesora de cribado del cáncer en la Universidad de Nottingham (Reino Unido).

Figura 1. (A) Mamografía oblicua mediolateral izquierda (LMLO) en una mujer de 58 años con un área de microcalcificación (recuadro). (B) Vista ampliada (2,2×) del recuadro en A. Este caso fue recuperado por los 10 principales algoritmos de inteligencia artificial, pero se determinó que era benigno en el análisis de la biopsia.
Figura 1. (A) Mamografía oblicua mediolateral izquierda (LMLO) en una mujer de 58 años con un área de microcalcificación (recuadro). (B) Vista ampliada (2,2×) del recuadro en A. Este caso fue recuperado por los 10 principales algoritmos de inteligencia artificial, pero se determinó que era benigno en el análisis de la biopsia.

“Nos impresionó la cantidad de participantes y algoritmos de IA presentados como parte del Desafío”, afirmó la profesora Chen. “Es uno de los Challenge de IA de la RSNA con mayor participación. También nos impresionó el rendimiento de los algoritmos, considerando el plazo relativamente corto para su desarrollo y el requisito de obtener datos de entrenamiento de fuentes abiertas”.

Figura 2. Mamografía de mama derecha en una mujer de 69 años. Se observa una masa espiculada de 6 mm en la posición de las 12 en punto (flecha), visible tanto en la proyección oblicua mediolateral (A) como en la craneocaudal (B) . Este caso no fue recuperado por ninguno de los 10 mejores algoritmos de inteligencia artificial, pero se trataba de un carcinoma invasivo diagnosticado mediante biopsia.
Figura 2. Mamografía de mama derecha en una mujer de 69 años. Se observa una masa espiculada de 6 mm en la posición de las 12 en punto (flecha), visible tanto en la proyección oblicua mediolateral (A) como en la craneocaudal (B). Este caso no fue recuperado por ninguno de los 10 mejores algoritmos de inteligencia artificial, pero se trataba de un carcinoma invasivo diagnosticado mediante biopsia.

El objetivo del challenge fue obtener modelos de IA que mejoren la automatización de la detección del cáncer en las mamografías de detección, ayudando a los radiólogos a trabajar de manera más eficiente, mejorando la calidad y la seguridad de la atención al paciente y reduciendo potencialmente los costos y los procedimientos médicos innecesarios.

La RSNA invitó a equipos de todo el mundo a participar. La Universidad Emory de Atlanta, Georgia, y BreastScreen Victoria de Australia proporcionaron un conjunto de datos de entrenamiento de aproximadamente 11.000 imágenes de mamografía, y los participantes del Challenge también pudieron obtener datos de entrenamiento públicos para sus algoritmos.

Figura 3. Distribución de (A) la tasa de detección de cáncer y (B) la tasa de recuperación entre los 1537 algoritmos de inteligencia artificial evaluados en este estudio (barras grises). La mediana se representa con la línea negra, y las puntuaciones del algoritmo mejor clasificado y de los dos modelos de conjunto se muestran con líneas de color.
Figura 3. Distribución de (A) la tasa de detección de cáncer y (B) la tasa de recuperación entre los 1537 algoritmos de inteligencia artificial evaluados en este estudio (barras grises). La mediana se representa con la línea negra, y las puntuaciones del algoritmo mejor clasificado y de los dos modelos de conjunto se muestran con líneas de color.

El equipo de investigación de la profesora Chen evaluó 1.537 algoritmos funcionales presentados al desafío y los probó en un conjunto de 10.830 exámenes de una sola mama (completamente separados del conjunto de datos de entrenamiento) que fueron confirmados por resultados de patología como positivos o negativos para el cáncer.

En conjunto, los algoritmos arrojaron una mediana de especificidad del 98,7 % para confirmar la ausencia de cáncer en las imágenes de mamografía, una sensibilidad del 27,6 % para la identificación positiva del cáncer y una tasa de recuperación (el porcentaje de casos que la IA consideró positivos) del 1,7 %. Al combinar los 3 y los 10 algoritmos con mejor rendimiento, la sensibilidad aumentó al 60,7 % y al 67,8 %, respectivamente.

Figura 4. Distribución del (A) valor predictivo positivo (VPP) y (B) valor predictivo negativo (VPN) entre los 1537 algoritmos de inteligencia artificial evaluados en este estudio (barras grises). La mediana se representa con la línea negra, y las puntuaciones del algoritmo mejor clasificado y de los dos modelos de conjunto se muestran con líneas de color.
Figura 4. Distribución del (A) valor predictivo positivo (VPP) y (B) valor predictivo negativo (VPN) entre los 1537 algoritmos de inteligencia artificial evaluados en este estudio (barras grises). La mediana se representa con la línea negra, y las puntuaciones del algoritmo mejor clasificado y de los dos modelos de conjunto se muestran con líneas de color.

“Al reunir las entradas con mejor rendimiento, nos sorprendió la gran complementariedad de los distintos algoritmos de IA, que permitían identificar distintos tipos de cáncer”, afirmó la profesora Yan Chen. “Los algoritmos contaban con umbrales optimizados para un valor predictivo positivo y una alta especificidad, por lo que las distintas características del cáncer en distintas imágenes generaban puntuaciones altas de forma distinta para los distintos algoritmos”.

Figura 5. Distribución de (A) sensibilidad y (B) especificidad entre los 1537 algoritmos de inteligencia artificial (IA) evaluados en este estudio (barras grises). La mediana se representa con la línea negra, y las puntuaciones del algoritmo mejor clasificado y de los dos modelos de conjunto se muestran con líneas de color. (C) Diagrama de dispersión de la sensibilidad frente a la especificidad para cada algoritmo de IA, donde cada punto gris representa un único algoritmo de IA. El recuadro de la derecha ofrece una vista ampliada del área en el recuadro discontinuo, de modo que la distribución de los algoritmos de mayor rendimiento se puede visualizar con mayor resolución. FPR = tasa de falsos positivos, TPR = tasa de verdaderos positivos.
Figura 5. Distribución de (A) sensibilidad y (B) especificidad entre los 1537 algoritmos de inteligencia artificial (IA) evaluados en este estudio (barras grises). La mediana se representa con la línea negra, y las puntuaciones del algoritmo mejor clasificado y de los dos modelos de conjunto se muestran con líneas de color. (C) Diagrama de dispersión de la sensibilidad frente a la especificidad para cada algoritmo de IA, donde cada punto gris representa un único algoritmo de IA. El recuadro de la derecha ofrece una vista ampliada del área en el recuadro discontinuo, de modo que la distribución de los algoritmos de mayor rendimiento se puede visualizar con mayor resolución. FPR = tasa de falsos positivos, TPR = tasa de verdaderos positivos.

Según los investigadores, la creación de un conjunto de los 10 algoritmos de mejor rendimiento produjo un desempeño cercano al de un radiólogo de detección promedio en Europa o Australia.

Los algoritmos individuales mostraron diferencias significativas en su rendimiento según factores como el tipo de cáncer, el fabricante del equipo de imagenología y el centro clínico donde se adquirieron las imágenes. En general, los algoritmos mostraron mayor sensibilidad para detectar cánceres invasivos que para los no invasivos.

Dado que muchos de los modelos de IA de los participantes son de código abierto, los resultados del Challenge pueden contribuir a una mayor mejora de las herramientas de IA tanto experimentales como comerciales para la mamografía, con el objetivo de mejorar los resultados del cáncer de mama en todo el mundo, explicó la profesora Yan Chen.

Figura 6. Gráficos de barras que muestran la sensibilidad (A-E) y la especificidad (F-I) de la detección del cáncer mediante el algoritmo de inteligencia artificial (IA) de mayor rendimiento y los 3 y 10 modelos de conjunto principales cuando el conjunto de datos se estratificó en función de diferentes características de los pacientes: (A, F) edad, (B, G) sitio 1 (Estados Unidos) frente a sitio 2 (Australia), (C, H) fabricante del equipo, (D) cáncer invasivo frente a no invasivo, y (E, I) mamas de baja densidad (Breast Imaging Reporting and Data System A o B) frente a mamas de alta densidad (Breast Imaging Reporting and Data System C o D). Las diferencias significativas entre subgrupos no se indican para los gráficos de especificidad debido a las diferencias relativamente pequeñas en magnitud, pero * indica características para las que hubo una diferencia significativa entre subgrupos para una o más de las entidades de IA.
Figura 6. Gráficos de barras que muestran la sensibilidad (A-E) y la especificidad (F-I) de la detección del cáncer mediante el algoritmo de inteligencia artificial (IA) de mayor rendimiento y los 3 y 10 modelos de conjunto principales cuando el conjunto de datos se estratificó en función de diferentes características de los pacientes: (A, F) edad, (B, G) sitio 1 (Estados Unidos) frente a sitio 2 (Australia), (C, H) fabricante del equipo, (D) cáncer invasivo frente a no invasivo, y (E, I) mamas de baja densidad (Breast Imaging Reporting and Data System A o B) frente a mamas de alta densidad (Breast Imaging Reporting and Data System C o D). Las diferencias significativas entre subgrupos no se indican para los gráficos de especificidad debido a las diferencias relativamente pequeñas en magnitud, pero * indica características para las que hubo una diferencia significativa entre subgrupos para una o más de las entidades de IA.

“Al poner a disposición del público los algoritmos y un conjunto completo de datos de imágenes, los participantes aportan recursos valiosos que pueden impulsar futuras investigaciones y facilitar la evaluación comparativa necesaria para la integración eficaz y segura de la IA en la práctica clínica”, afirmó.

El equipo de investigación planea realizar estudios de seguimiento para comparar el desempeño de los principales algoritmos Challenge con el de los productos disponibles comercialmente utilizando un conjunto de datos más grande y más diverso.

“Además, investigaremos la eficacia de conjuntos de pruebas más pequeños y complejos con sólidos parámetros de lectura humana, como los desarrollados por el programa PERFORMS, un programa del Reino Unido para evaluar y garantizar la calidad del desempeño de los radiólogos como enfoque para la evaluación de la IA, y compararemos su utilidad con la de conjuntos de datos a gran escala”, afirmó la profesora Yan Chen.

La RSNA organiza anualmente un desafío de inteligencia artificial; la competencia de este año busca presentaciones de modelos que ayuden a detectar y localizar aneurismas intracraneales.

Artículos relacionados

CLIM Academy 2026: innovación, comunidad y nuevas voces en diagnóstico por imágenes de mama

Desde Miami, Diagnóstico Journal acompañó una nueva edición de CLIM Academy 2026, un encuentro que volvió a poner en el centro a la educación,...

Inteligencia artificial en mamografía y radiografía de tórax: las innovaciones de Lunit presentadas en ECR 2026

Durante el European Congress of Radiology, Diagnóstico Journal visitó el stand de Lunit para conocer sus últimas soluciones en inteligencia artificial aplicadas al diagnóstico...

Metaltronica en ECR 2026: innovación en mamografía y soluciones integrales para la salud de la mujer

Durante el European Congress of Radiology 2026, Diagnóstico Journal visitó el stand de Metaltronica, empresa italiana con más de cuatro décadas de trayectoria dedicada...

Desafio de IA da SPR premiará em dólar soluções para apoiar diagnóstico do câncer de mama

Integrado à 56ª Jornada Paulista de Radiologia, o desafio reconhecerá os três melhores projetos e conta com apoio da Siemens para acelerar soluções aplicadas...

Seguinos

2,319FansLike
0FollowersFollow
1,324FollowersFollow

MÁS LEIDOS