IA vs. Médicos: La Herramienta de Microsoft Supera a los Doctores en Diagnóstico de Casos Médicos Complejos

por Lisa Stiffler el 30 de junio de 2025 a las 10:23 am

Microsoft anunció hoy una herramienta de inteligencia artificial que superó a un panel de médicos en el diagnóstico de casos complicados.
El Microsoft AI Diagnostic Orchestrator (MAI-DxO) compitió con 21 médicos experimentados de EE. UU. y el Reino Unido que se enfrentaron a casos complejos documentados en el New England Journal of Medicine. MAI-DxO logró un diagnóstico correcto en el 85.5% de los casos de prueba, mientras que los médicos acertaron en el 20% de las veces.
La herramienta aún no está disponible para uso clínico.
“Estamos dando un gran paso hacia la superinteligencia médica”, dijo Mustafa Suleyman, CEO de Microsoft AI, en una publicación de LinkedIn.
Microsoft utilizó la herramienta con modelos de IA bien conocidos, incluidos GPT, Llama, Claude, Gemini, Grok y DeepSeek. La mejor combinación fue MAI-DxO emparejado con el o3 de OpenAI.
Al igual que un médico humano, MAI-DxO diagnostica al analizar síntomas, plantear preguntas y recomendar pruebas médicas. Una característica clave es su capacidad para optimizar costos, evitando la ordenación de diagnósticos superfluos que contribuyen al exceso de gasto en salud.
Si bien MAI-DxO superó a los proveedores médicos, la empresa tecnológica reconoció que, en condiciones normales, los doctores no operarían de forma aislada y podrían consultar a colegas y recursos en línea y en papel.
El nuevo punto de referencia de rendimiento diagnóstico fue creado a partir de 304 casos recientes documentados por el New England Journal of Medicine.
La herramienta se basa en pruebas anteriores de rendimiento de IA en medicina que evaluaron a los bots en el examen estandarizado de licencia médica de EE. UU. (USMLE). Microsoft indicó que las herramientas de IA han evolucionado hasta obtener puntuaciones casi perfectas en la prueba, pero su estructura de opción múltiple favorece “la memorización sobre la comprensión profunda”.
El nuevo punto de referencia que utiliza casos complicados requiere habilidades de orden superior para realizar "diagnósticos secuenciales, un pilar de la toma de decisiones médica en el mundo real", según la publicación del blog de Microsoft.
Los próximos pasos para desarrollar la herramienta para uso público incluyen probar sus capacidades contra dolencias más comunes. Antes de ser implementada en prácticas de salud, se requeriría pruebas en un entorno clínico para garantizar seguridad y rendimiento, así como la aprobación de los reguladores.
Como ha hecho con otras aplicaciones de IA, Microsoft enfatizó que los bots no están destinados a reemplazar a las personas, sino a optimizar su rendimiento, en este caso, automatizando tareas rutinarias, asistiendo en diagnósticos y creando estrategias de atención personalizadas.
No olvides suscribirte a nuestro boletín para obtener contenido más especializado.
Comments ()