Una estrategia de lectura híbrida para la mamografía de screening, desarrollada por investigadores holandeses e implementada retrospectivamente en más de 40.000 exámenes, redujo la carga de trabajo del radiólogo en un 38% sin afectar las tasas de repetición ni de detección de cáncer.
El estudio enfatiza un punto clave: confiar en la IA.
El estudio, que enfatiza la confianza en la IA, se publicó en Radiology.
«Aunque el rendimiento general de los modelos de IA de vanguardia es muy alto, a veces comete errores», afirmó Sarah D. Verboom, M.Sc., candidata a doctorado en el Departamento de Imagenología Médica del Centro Médico Universitario Radboud (Países Bajos). «Identificar los exámenes en los que la interpretación de la IA no es fiable es crucial para permitir y optimizar el uso de modelos de IA en los programas de detección del cáncer de mama».

Los exámenes con alta incertidumbre se derivan a radiólogos para una doble lectura
estándar. De lo contrario, la decisión de repetir el examen se basa únicamente en la PdM.
¿Cómo funciona la estrategia híbrida?
La estrategia de lectura híbrida implica el uso de una combinación de lectores radiólogos y una interpretación de IA independiente de casos en los que el modelo de IA funciona tan bien o mejor que el radiólogo.
Podemos alcanzar este nivel de rendimiento si el modelo de IA proporciona no solo una evaluación de la probabilidad de malignidad (PoM) de un caso, sino también una calificación de la certeza de dicha evaluación”, afirmó Verboom.
“Desafortunadamente, la PoM por sí sola no siempre es un buen predictor de certeza, ya que las redes neuronales profundas tienden a confiar demasiado en sus predicciones”.

Datos del estudio:
Para desarrollar y evaluar una estrategia de lectura híbrida, los investigadores utilizaron un conjunto de datos de 41.469 mamografías de screening de 15.522 mujeres (edad media
de 59 años) con 332 cánceres detectados mediante screening y 34 cánceres de intervalo. Las mamografías se realizaron entre 2003 y 2018 en Utrecht (Países Bajos), como parte del Programa Nacional Holandés de Screening del Cáncer de Mama.
Metodología del análisis.
El conjunto de datos se dividió a nivel de paciente en dos grupos iguales con idénticas tasas de detección, recuerdo e intervalo de cáncer. El primer grupo se utilizó para determinar los umbrales óptimos para la estrategia de lectura híbrida, mientras que el segundo se utilizó para evaluar las estrategias de lectura.
Resultados clave:
De las métricas de incertidumbre evaluadas, la entropía de la puntuación PoM media de la región más sospechosa produjo una tasa de detección de cáncer de 6,6 por 1.000 casos y una tasa de recuperación de 23,7 por 1.000 casos, similar a las tasas de doble lectura estándar por parte de los radiólogos.

¿Cómo decide la IA?
La estrategia final de lectura híbrida implicó que la IA evaluara cada mamografía de screening para generar dos resultados: el PoM y una estimación de la incertidumbre de
dicha predicción.
Algoritmo de decisión:
Cuando la IA determinaba con certeza que el PoM estaba por debajo del umbral establecido, el caso se consideraba normal. Cuando la IA detectaba un PoM por encima del umbral establecido, se citaba a las mujeres para realizar más pruebas, pero solo cuando la predicción se consideraba fiable. De lo contrario, los radiólogos realizaban
una segunda lectura del examen.
El 38% de los estudios pudo ser leído solo por IA.
Aunque la mayoría de las decisiones de la IA fueron inciertas y se remitieron a un lector humano, el 38 % se clasificaron como ciertas y solo la IA pudo leerlas.
La estrategia de los investigadores redujo la carga de trabajo de lectura del radiólogo al 61,9 % sin modificar las tasas de recuerdo (23,6‰ frente a 23,9‰) ni de detección de cáncer (6,6‰ frente a 6,7‰), ambas comparables a las de la doble lectura estándar.
Cuando el modelo de IA era certero, el área bajo la curva (AUC) era mayor (0,96 frente a 0,87). Su sensibilidad era casi igual a la de la lectura doble por radiólogo (85,4 % frente
a 88,9 %). Las mujeres más jóvenes con mamas densas tenían mayor probabilidad de presentar una puntuación de IA incierta.

Más allá del rendimiento: el valor de la incertidumbre.
“El componente clave de nuestro estudio no es necesariamente que esta sea la mejor manera de distribuir la carga de trabajo, sino la utilidad de integrar la cuantificación de
la incertidumbre en los modelos de IA”, afirmó Verboom.
“Espero que los productos comerciales la integren en sus modelos, porque creo que es una métrica muy útil“.
Verboom señaló que si los resultados del estudio se produjeran en la práctica clínica, la decisión de volver a incluir al 19% de las mujeres la tomaría una IA sin la intervención de un radiólogo.
“Varios estudios han demostrado que las mujeres que participan en programas de detección del cáncer de mama tienen una actitud positiva hacia el uso de la IA”, afirmó.
“Sin embargo, la mayoría prefiere que su mamografía sea interpretada por al menos un radiólogo”.
IA con cuantificación de incertidumbre =
confianza + solución a escasez de especialistas.
Ella dijo que puede ser más aceptable para los radiólogos revisar los exámenes que la IA considera inciertos, así como los casos de recuperación de la IA.
Conclusión:
“El uso de IA con cuantificación de la incertidumbre puede ser una posible solución a la escasez de mano de obra y podría ayudar a generar confianza en la implementación de
la IA”, afirmó Verboom.

Para ambos exámenes, se muestran vistas oblicuas mediolaterales (izquierda) y craneocaudales (derecha) de la mama afectada. (A) Imágenes de una mujer de 67 años que fue llamada a llamar porque ambos radiólogos calificaron la mama derecha con un valor de 0 en el Sistema de Datos e Informes de Imágenes de Mama (BI-RADS).
La mujer no habría sido llamada a llamar si el examen hubiera sido leído por el modelo de IA, que asignó una puntuación de PoM de 40, pero la predicción se habría clasificado como incierta con una cuantificación de incertidumbre de 0,86. (B) Imágenes de una mujer de 63 años que fue llamada nuevamente al examen porque ambos radiólogos calificaron la mama derecha como BI-RADS 4. La mujer no habría sido llamada nuevamente al examen si el modelo de IA hubiera leído el examen, con una puntuación PoM de 44, pero la predicción se clasificaría como una predicción incierta con una cuantificación de incertidumbre de 0,98.
Verboom dijo que se necesita más investigación, idealmente un ensayo prospectivo, para determinar cómo la reducción de la carga de trabajo lograda por la estrategia de lectura híbrida podría disminuir el tiempo de lectura del radiólogo.
Un paso clave hacia un modelo híbrido eficiente y seguro.
“Creo que en el futuro, podríamos llegar a un punto en que una parte de las mujeres sean enviadas a casa sin que un radiólogo revise su mamografía, ya que la IA determinará que su examen es normal”, dijo. “Aún no hemos llegado a ese punto, pero creo que podríamos lograrlo con esta métrica de incertidumbre y el control de calidad”.
Este estudio es parte del proyecto aiREAD, financiado por el Consejo de Investigación Holandés, la Sociedad Holandesa del Cáncer y Health Holland.

de malignidad (PoM) de la región más sospechosa.
Durante el cribado, se volvió a llamar a una mujer de 52 años tras la puntuación de arbitraje de la mama derecha como Sistema de
Informes y Datos de Imágenes de Mama (BI-RADS) 4, después de que el primer y el segundo radiólogo calificaran la mama derecha como BI-RADS 1 y 4, respectivamente.
Esta mujer no habría sido llamada a llamar si el examen hubiera sido leído por el modelo de IA, que asignó una puntuación PoM de 30, que se clasificaría como una predicción segura con una cuantificación de incertidumbre de 0,57. Se muestran las proyecciones oblicua mediolateral (izquierda) y craneocaudal (derecha) de la mama afectada.
Los recuadros indican las calcificaciones encontradas durante el cribado, y el diagnóstico final de este examen fue carcinoma ductal in situ.

