Categoría: informatica en medicina

Retos y oportunidades para la práctica generalista en la era de la tecnología y la IA

Está a punto de publicarse un más que interesante artículo titulado Challenges and opportunities for generalist practice in the era of technology and Al de F. BorrellCarriö y Josep Vidal Alaball en Revista Clínica Española.

He tenido la fortuna de poder leerlo y entre Perplexity y yo, hemos hecho un resumen.

Resumen

El artículo aborda cómo la medicina que ejercen los generalistas puede experimentar una transformación (los autores lo dan como hecho) gracias a tres pilares fundamentales:

  • Formación continuada enfocada en la adquisición de hábitos clínicos sólidos y adaptativos,
  • Integración de tecnología avanzada al alcance de todos los profesionales (desde dispositivos diagnósticos portátiles hasta sistemas de telemedicina)
  • Aparición de la inteligencia artificial (IA) como soporte en la reflexión y toma de decisiones clínicas personalizadas.

Supongo que ese último apartado se podía haber incluido en el segundo; al fin y al cabo, la IA es tecnología avanzada, o al menos así lo queremos seguir considerándola.

Pero veamos estos tres pilares con detalle:

1. Formación continuada para modificar hábitos clínicos

Se recalca que, una vez que el acceso al conocimiento está democratizado, el diferencial profesional radica en los hábitos de reflexión y los hábitos clínico-comunicacionales. El desarrollo de hábitos inteligentes —capaces de adaptarse a entornos complejos y siempre basados en las necesidades y valores individuales de los pacientes— (debe) representar el eje de la formación. La formación continuada no debe limitarse a la adquisición de información, sino transformar la práctica clínica mediante ejercicios de reflexión sobre valores, seguridad clínica y comunicación.

Se proponen estrategias formativas tanto institucionales (laboratorios de habilidades clínicas, simulaciones, escenarios de resolución de problemas, entrenamiento en flexibilidad cognitiva y metacognición) como individuales (grabación de consultas, feedback con expertos, consultas compartidas periódicas).

2. Disponibilidad e integración de tecnología avanzada

El profesional generalista del siglo XXI debe disponer (poseer, según los autores) de un set de herramientas tecnológicas fundamentales: estetoscopio digital, ecógrafo de bolsillo, endoscopio digital, electrocardiógrafo portátil, oxímetro avanzado, dermatoscopio espirómetro digital, acceso a telemedicina (síncrona y asíncrona), así como pruebas de laboratorio rápidas para uso en consulta. Estas herramientas deben incorporar tecnología de IA para facilitar diagnósticos, monitorización y toma de decisiones.

A nivel institucional, la IA debe aprovecharse para optimizar procesos organizativos (como agendas inteligentes adaptadas a la complejidad de los pacientes, análisis de adherencia terapéutica, monitorización poblacional). Garantizar la equidad en el acceso y uso de la tecnología, así como la actualización y adquisición de competencias técnicas, requiere políticas institucionales y acuerdos con entidades para facilitar formación y adquisición de herramientas.

3. La IA como ayuda para la reflexión clínica personalizada

La inteligencia artificial puede actuar como consultora clínica, supervisora de la práctica profesional y como instrumento de análisis poblacional. Puede recomendar medidas preventivas personalizadas, evaluar adherencia, detectar enfermedades no diagnosticadas, identificar interacciones farmacológicas y predecir riesgos en pacientes vulnerables.

La aplicación efectiva de la IA requiere validación rigurosa de las herramientas disponibles, con avales de calidad y seguridad clínica. Se recomienda a los profesionales seleccionar sistemas y bots adaptados a sus necesidades y acreditados por expertos, sin depender únicamente de la administración, ¡ojo a la recomendación!

4. Falacias, riesgos y precauciones

El artículo desmonta mitos recurrentes, como la creencia de que la IA reemplazará la necesidad de formación continua en los médicos, o que los médicos serán menos responsables de los resultados clínicos por seguir indicaciones de IA. Al contrario, el médico debe ser un intérprete experto de la información generada por la IA, aportando juicio clínico, experiencia y visión sistémica del paciente en su contexto biopsicosocial. La responsabilidad clínica sigue residiendo plenamente en el profesional.

El texto también señala el riesgo de que los sistemas de IA desarrollados únicamente a nivel local pueden quedar obsoletos o ser menos competitivos que soluciones internacionales, recomendando acuerdos y estándares de calidad para su adopción.

Como conclusiones, se incluyen los siguientes puntos y recomendaciones, no todas soportadas explícitamente en el texto: ¿Mala jugada de Perplexity?

  • Promover la formación continuada, activa y contextualizada.
  • Facilitar el acceso a tecnología tanto desde el ámbito institucional como favoreciendo y apoyando el individual.
  • Priorizar la validación y seguridad de herramientas de IA.
  • Fomentar un ejercicio clínico reflexivo, personalizando la medicina basada en evidencia.
  • No abandonar los instrumentos clásicos (como la exploración física y la anamnesis exhaustiva) como elementos de “tecnología de punta”.

Sin olvidar que la tecnología, incluida la IA, debe orientarse siempre a potenciar la competencia clínica, la seguridad del paciente y la calidad humana de la atención.

Cuando los pacientes llegan con respuestas

Traducido de When Patients Arrive With Answers por Sundar, Kumara Raja en JAMA 2025; 334; (8): 672-673.  doi:10.1001/jama.2025.10678

…No es nada nuevo que los pacientes lleguen con información. Desde hace mucho tiempo traen recortes de periódico, resultados de búsquedas en Internet o notas de conversaciones con familiares. Las posibles soluciones que se transmiten en los hilos de WhatsApp han sido en ocasiones una parte integral de mis conversaciones clínicas

La búsqueda de información fuera del ámbito sanitario siempre ha formado parte del panorama asistencial.

Pero hay algo en este momento que parece diferente. La inteligencia artificial generativa (IA), con herramientas como ChatGPT, ofrece información de una manera que parece única, conversacional y personalizada. Su tono invita al diálogo. Su confianza implica competencia. Cada vez más, los pacientes traen a mi consulta conocimientos generados por la IA y, a veces, se sienten lo suficientemente seguros como para cuestionar mi evaluación y mi plan.
Había oído que estas herramientas eran útiles, pero solo comprendí su atractivo después de utilizarlas yo mismo. Estudios recientes han respaldado esta afirmación: los grandes modelos de lenguaje (LLM) muestran una sorprendente fortaleza en el razonamiento y el tono relacional. Después de verlo de primera mano, mi reacción fue sencilla: «Vaya, entiendo por qué a mis pacientes les gusta».


Sin embargo, comparar los LLM con los médicos parece intrínsecamente injusto.

[Comentario: como otras comparaciones, en este ejemplo o este]

Los médicos suelen trabajar bajo presión, con visitas apresuradas y bandejas de entrada desbordadas, ya que los sistemas de salud exigen productividad y rendimiento. Mi preocupación es que la investigación compara a los médicos, que no tienen el lujo de rendir al máximo en sistemas saturados, con los recursos inagotables de la IA generativa. No es una lucha justa, pero es la realidad. Creo que los pacientes pueden buscar respuestas claras, pero, sobre todo, quieren sentirse reconocidos, tranquilos y verdaderamente escuchados. Por desgracia, bajo el peso de las exigencias contrapuestas, eso es lo que a menudo se me escapa, no solo por las limitaciones sistémicas, sino también porque soy humano.

A pesar de las capacidades de la IA generativa, los pacientes siguen acudiendo a mí. Las herramientas que utilizan suelen ofrecer sugerencias fiables, pero al final se remiten a alguna versión de la conocida advertencia: «Consulte a un profesional médico». La responsabilidad de la atención sigue recayendo en el médico. Tanto en términos de responsabilidad civil, quién asumirá la culpa si algo sale mal o alguien resulta perjudicado, como en términos de responsabilidad, quién dará las órdenes para los planes de diagnóstico y las prescripciones de atención. Los médicos siguen siendo los guardianes (gatekeepers). En la práctica, esto significa atender las solicitudes de los pacientes, como una prueba de mesa basculante para los mareos intermitentes, pruebas que no son inusuales, pero que pueden no ser adecuadas en una etapa específica de la atención. Me encuentro explicando conceptos como el sobrediagnóstico, los falsos positivos u otros riesgos de pruebas innecesarias. En el mejor de los casos, el paciente entiende las ideas, aunque es difícil identificarse con ellas cuando uno es la persona que experimenta los síntomas. En el peor de los casos, parezco desdeñoso. No hay ninguna función que le diga a ChatGPT que los médicos carecen de acceso rutinario a las pruebas de mesa basculante o que las citas para ecocardiogramas se retrasan debido a la escasez de personal. Tengo que llevar esas limitaciones a la sala de exploración mientras sigo tratando de mantener la confianza.

Cuando hablo con estudiantes de medicina, noto que se está infiltrando un tipo diferente de paternalismo. Y lo he detectado en mi monólogo interior, aunque no lo diga en voz alta. La obsoleta frase «Probablemente lo hayan buscado en WebMD y crean que tienen cáncer» se ha transformado en una nueva frase, igual de desdeñosa: «Probablemente lo hayan buscado en ChatGPT y vayan a decirnos qué recetar». A menudo refleja una actitud defensiva por parte de los médicos, en lugar de un compromiso genuino, y conlleva un mensaje implícito: nosotros seguimos sabiendo más. Es una actitud que corre el riesgo de erosionar la sagrada y frágil confianza entre los médicos y los pacientes. Refuerza la sensación de que no estamos «en el mismo barco» que nuestros pacientes y que, en realidad, estamos actuando como guardianes en lugar de como socios. Irónicamente, esa es a menudo la razón por la que oigo a los pacientes recurrir a los LLM en primer lugar.

Una paciente dijo claramente: «Así es como puedo defenderme mejor». La palabra «defender» me llamó la atención. Es lo que se hace cuando se intenta convencer a alguien con más poder. Sé que los médicos siguen teniendo la última palabra a la hora de solicitar pruebas, derivaciones y planes de tratamiento, pero la palabra «defender» transmite la sensación de prepararse para una lucha. Cuando los pacientes se sienten ignorados, armarse de conocimientos se convierte en una estrategia para que se les tome en serio. Recuerdo vívidamente a otra paciente que, tras sufrir un aborto espontáneo, llegó con una serie de evaluaciones específicas que quería que se le realizaran. Su petición estaba cargada de dolor, rechazo previo y la silenciosa esperanza de que estar preparada pudiera finalmente llevarla a ser escuchada. No necesitó la estrategia habitual de lanzarse a una explicación sobre los falsos positivos, el sobrediagnóstico y las características de las pruebas. Desde la perspectiva de la paciente, me di cuenta de que todas las explicaciones cognitivas pueden sonar así: «Sigo sabiendo más que tú, independientemente de la herramienta que hayas utilizado, y voy a abrumarte con cosas que no entiendes». Lo que funcionó en ese momento fue muy diferente. Le dije: «Hablaremos de las opciones de pruebas. Pero primero, siento mucho tu pérdida. No puedo imaginar cómo te sientes. Quiero resolver esto con usted y hacer un plan juntos». Ese momento de reconocimiento fue lo que realmente abrió la puerta.

Nuestras funciones como médicos han cambiado constantemente desde mi formación. La atención centrada en el paciente y la colaboración formaban parte del léxico durante la carrera de medicina. Los médicos han evolucionado desde hace tiempo, pasando de ser expertos autoritarios a guías colaborativos, pero ahora el ritmo se está acelerando. La democratización del conocimiento médico exige a los médicos, más que nunca, una humildad relacional como prioridad.

Ver las visitas informadas por la IA como oportunidades para un diálogo más profundo en lugar de amenazas a la autoridad clínica puede parecer una aspiración, pero refleja un cambio necesario. Los retos prácticos son reales. Los pacientes pueden acudir con expectativas poco realistas o citar recomendaciones que no se ajustan a las directrices basadas en la evidencia o que son poco prácticas para un determinado entorno de recursos. Estos momentos no son nuevos. Durante mucho tiempo hemos tenido que explicar por qué no siempre es necesaria una resonancia magnética para el dolor de espalda o por qué los antibióticos no ayudan a una infección viral. Sabemos que la solución no es cerrar estas conversaciones, sino abordarlas con paciencia y curiosidad. La medicina siempre ha dependido de las relaciones. Lo que está cambiando es cómo comienzan esas relaciones y lo que los pacientes aportan. Si los pacientes se arman de información para ser escuchados, nuestra tarea como médicos es recibirlos con reconocimiento, no con resistencia. Al hacerlo, preservamos lo que siempre ha hecho humana a la medicina: la voluntad de compartir juntos el significado, la incertidumbre y la esperanza.

Escribas digitales

Extracto y traducción de Unintended consequences of using ambient scribes in general practice.  BMJ 2025; 390 doi: https://doi.org/10.1136/bmj-2025-085754 (Publicado el 27 de agosto 2025)

Los ambient scribes* han despertado rápidamente el interés internacional entre los profesionales sanitarios, los investigadores y los proveedores comerciales, y se estima que más de 100 empresas ofrecen servicios de transcriptores ambientales en entornos sanitarios de todo el mundo. También conocidos como tecnologías de voz ambiental o transcriptores digitales, los transcriptores ambientales transcriben las consultas en tiempo real y generan resúmenes para su uso en las notas de los pacientes. Algunos pueden solicitar pruebas o redactar cartas de derivación, y es posible que pronto puedan generar consejos o indicaciones personalizadas durante las consultas (fig. 1).⁴

*Ambient scribes: El término inglés relacionado con la IA de «ambient scribes» puede traducirse al español como «escribas ambientales», «transcriptores ambientales» o «escribas digitales», incluso «escribientes digitales, dependiendo del contexto.

El entusiasmo en torno a los escribas ambientales se ve reforzado por las primeras investigaciones y comentarios que sugieren que ahorran tiempo, permiten a los médicos centrarse en sus pacientes, reducen la carga cognitiva y son aceptables para los pacientes y los médicos. Sin embargo, gran parte de la bibliografía actual se centra en resultados u opiniones a corto plazo.

Los posibles beneficios y riesgos de los escribas ambientales pueden clasificarse en los seis ámbitos de la calidad de la atención (tabla 1). Consideramos estos efectos en el contexto de la precisión, el arte de ejercer o práctica de la medicina, las normativas, responsabilidades y derechos, y el efecto sobre la carga de trabajo.

Un futuro digital seguro

Aún está por ver si los escribas ambientales son la panacea para la sobrecarga de trabajo de los médicos de cabecera, pero parece poco probable, dado que las presiones no se limitan a la toma de notas. No obstante, su rápida adopción no es de extrañar en un contexto en el que el Gobierno del Reino Unido hace hincapié en las tecnologías de inteligencia artificial como posible solución a la crisis de los servicios públicos, junto con el oportunismo comercial. No se trata de si se utilizarán, sino de cómo garantizar que su implementación respalde todos los ámbitos de la asistencia sanitaria de calidad, sin comprometerlos.

Mensajes clave
El uso de escribas ambientales o digitales por parte de los médicos generales está aumentando rápidamente y se considera que tiene el potencial de reducir la carga de trabajo administrativo.  

Los escribas también tienen el potencial de tener efectos no deseados en la calidad de la atención y la toma de decisiones clínicas.  

Se carece de pruebas sobre los efectos indirectos y a largo plazo de los escribas ambientales.  

También es necesario aclarar las responsabilidades y los derechos que conlleva el uso de escribas ambientales.

Hasta que se disponga de pruebas, los médicos deben utilizar la tecnología con diligencia y precaución.

Adenda, fragmento de la editorial: Bravo Toledo R. Atención primaria y transformación digital. Aten Primaria. 2025 Aug 8;57(11):103360. doi: 10.1016/j.aprim.2025.103360.

El pionerismo o adanismo 7, o la costumbre de gestores y políticos de presentar proyectos como novedosos e innovadores, dando por sentado su éxito y como si nadie los hubiera realizado anteriormente, es un fenómeno demasiado presente en cuanto se habla de nuevas tecnologías y TD. Un ejemplo relevante es la reciente implantación de sistemas de escribientes médicos digitales en diversos servicios sanitarios autonómicos 8. Estas aplicaciones, basadas en inteligencia artificial generativa, automatizan la redacción de notas clínicas a partir de la conversación médico-paciente y las versiones más actuales superan ampliamente la simple transcripción 9. Si bien han demostrado utilidad en países como Estados Unidos, donde la documentación clínica rigurosa es imprescindible, su adopción en la atención primaria española siembra una serie de dudas. La ausencia previa de la figura del “medical scribe”, al cual estas aplicaciones sustituyen, la escasa valoración de una documentación clínica detallada en la AP española, sumadas a deficiencias en los actuales historiales electrónicos, sugieren la necesidad de profundas adaptaciones tecnológicas y culturales antes de lograr que estos sistemas tengan un impacto significativo.

La recogida de datos está en el mismo corazón de la asistencia clínica; se facilitan muchas de las actividades relacionadas con la atención al paciente. Estos datos están anonimizados y custodiados, suponemos, por la sanidad pública, pero estas garantías se han visto demasiadas veces quebradas, como para pensar que son inquebrantables. Las nuevas propuestas de IA suponen una amenaza a la confidencialidad, ya que ya no sería necesario acceder a los registros clínicos, ni siquiera contar con la complicidad del médico que transcribe; bastaría con tener acceso, por ejemplo, a las conversaciones grabadas para disponer de una información que se puede utilizar de muy diversas maneras, no relacionadas precisamente con la salud. La ausencia de una planificación adecuada en la transformación digital puede conducir a la aparición de la brecha digital, en tanto en cuanto ocasiona las desigualdades en el acceso, el uso y las habilidades en relación con las TIC entre distintos grupos de personas 10.

Por último, es sorprendente la falta de regulación de todos los proyectos relacionados con las nuevas tecnologías. Al contrario que otras intervenciones sanitarias como medicamentos o dispositivos médicos, a los proyectos de transformación digital no se les pide, en nuestro país, que sean eficaces y eficientes y mucho menos efectivos: podríamos decir que no hay evidencias salvo proyectos piloto trucados y un ensimismamiento general digno del cervantino retablo de las maravillas.

Bloqueantes

Cuando por fin el servicio sanitario autonómico decidió introducir un sistema de ayuda a la toma de decisiones en el módulo de prescripción (MUP), no le acompañó la suerte. Con cierto retraso con respecto a regiones menos «importantes», el MUP, más que ayudar, se convertía en un incordio al tener que traspasar y leer una serie de mensajes sobre contraindicaciones e interacciones de los medicamentos, pocas veces relevantes y casi nunca adaptados al contexto.

Era una especie de martirio que, por fortuna, se solventaba con olvidos cognitivos y atención selectiva.

Con todo, lo peor venía del nombre con que se designaba los tipos de alerta en función de su gravedad: alertas no bloqueantes y alertas bloqueantes. Las primeras serían aquellas que se debían tener en cuenta, pero que no impedían la prescripción, mientras que las segundas no dejaban que se finalizara el proceso hasta que no se resolvieran por parte del prescriptor.

Toda una subliminal declaración de intenciones.

No, no se podían haber clasificado por colores tipo semáforo y/o con denominaciones amables como “supervise la combinación” o “considere la modificación del tratamiento” o incluso “evite este medicamento en la condición x o simultanearlo con el medicamento y”. La nomenclatura no nacía de un concepto de ayuda, sino de una jerarquía que “bloqueaba” o no tu actuación y razonamiento según unos criterios opacos y no explícitos.

Pregúntale a TRIP. AskTrip

Los más viejos aficionados a la medicina basada en la evidencia recordamos que esta invitación a una nueva manera de practicar la medicina se acompañaba de forma ineludible de una serie de propuestas de cambio. Entre ellas, la manera de acceder a la información científico-médica. Estaba claro que, si el médico asistencial debía utilizar la literatura médica en su trabajo cotidiano, esta debería estar accesible física, temporal y funcionalmente; es decir, se debería tener en el lugar que se necesita, en el momento que se precise y en un formato y validez que hiciera posible que el médico pudiera interpretarla.

Desde el principio se empezó a idear fuentes que facilitaran este trabajo, desde el naïf —visto con el paso del tiempo— carrito de la evidencia de Sackett, hasta los servicios de preguntas y respuestas*, o la figura del clinical informationist, pasando por buscadores federados tipo Tripdatabase o ACCESSSS.

*ATTRACT con el ya veterano y excepcional PREEVID, ejemplo nacional de este tipo de propuestas.

Tripdatabase es un buscador federado que se convirtió rápidamente en un referente en este tipo de servicios; incluso tuvo una efímera versión en español. Se ha mantenido durante todos estos años debido a su calidad y la actualización constante inducida por su inquieto creador Jon Brasey. Esta renovación nos ha traído un nuevo y lógico paso: Pregúntale a TRIP o AsKTrip.

AskTrip es el resultado de décadas de experiencia en esta parcela informacional (ATTRACT – Tripdtabase). Se puede considerar como una herramienta diseñada para responder a preguntas clínicas utilizando contenido de alta calidad basado en la evidencia. Impulsada por inteligencia artificial avanzada y un modelo masivo de lenguaje (LLM), ofrece respuestas rápidas y fiables, lo que ayuda a los médicos a tomar mejores decisiones con mayor rapidez.

Como en otros proyectos de IA conversacional, el usuario envía su pregunta clínica en lenguaje natural, tal y como se la haría a un colega. La IA procesa su pregunta: interpreta la consulta, identifica los componentes clínicos clave y busca en la base de datos de evidencias de alta calidad seleccionadas por Trip. Cuando se recuperan y sintetizan las pruebas, el sistema da prioridad a fuentes fiables, como guías de práctica clínica y revisiones sistemáticas.

Al igual que otros agentes de IA, esta herramienta tiene la potencialidad de permitir interaccionar en idiomas distintos del inglés; en TRIP están trabajando para ofrecer una verdadera versión multilingüe que permitiría, por ejemplo, interrogar y obtener la respuesta en español.

Como en otros recursos, tanto TRIP Database como AskTRIP tienen una versión gratuita, una versión PRO con muchas más posibilidades y una versión PRO institucional. Es una lástima que las bibliotecas virtuales autonómicas no contemplen una suscripción de este tipo. Cuesta mucho menos que otros recursos no tan útiles y, sobre todo, pone a la famosa IA al servicio de los médicos asistenciales, pero claro, no está patrocinada por ningún gurú, los «informáticos» de la comunidad no la conocen y sobre todo, el consejero de turno no puede dar una rueda de prensa apuntándose una iniciativa pionera, así que va a ser difícil que esto se logre.

La paradoja generalista-especialista de la IA médica

Traducción de The Generalist–Specialist Paradox of Medical AI por V. L. Murthy, M.D., Ph.D., publicado en NEJM-AI Editorial: https://nejm.ai/4nm6054.

Resumen: Los rápidos avances en las herramientas médicas de IA han permitido que las herramientas de software funcionen de manera similar o mejor que muchos expertos en tareas tradicionalmente realizadas por especialistas médicos, como la interpretación de electroencefalogramas por parte de neurólogos. Por el contrario, las herramientas de IA médica han mostrado un progreso más lento para lograr la equivalencia práctica con los médicos generalistas fuera de entornos altamente controlados, por ejemplo, cuando se enfrentan a preguntas de examen de junta simuladas y viñetas clínicas. Esta divergencia se reconoce como la paradoja generalista-especialista de la IA médica y tiene causas multifactoriales y, si persiste, tendrá amplias implicaciones para la medicina, la formación y la política.

 

En este número de NEJM AI, Li y sus colegas describen un avance significativo en la interpretación de los datos del electroencefalograma (EEG) para la identificación de descargas epileptiformes o «picos».1

Los autores describen el desarrollo y la rigurosa validación de SpikeNet2, un modelo de aprendizaje profundo de última generación que no solo puede identificar los picos distintivos de la epilepsia, sino que también puede clasificar trazados EEG completos como positivos o negativos con una precisión equivalente o superior al 68% de los expertos. El estudio tiene muchas fortalezas notables, incluida una gran base de datos de capacitación de dos centros médicos académicos y dos conjuntos de datos independientes utilizados exclusivamente para la evaluación. El estándar de oro fue el consenso de ocho expertos, y el comparador fue un grupo de 24 especialistas, lo que permitió contextualizar el rendimiento de la nueva herramienta de IA en relación con los humanos.

 Este estudio amplía el espectro de campos en los que las herramientas de IA han igualado o superado el rendimiento humano para incluir una prueba diagnóstica clave normalmente interpretada por los neurólogos, que se suma a la interpretación de los cardiólogos de los electrocardiogramas 2, 3y ecocardiogramas 4, 5 y a la interpretación de los radiólogos de las radiografías 6, 7, 8y las imágenes de tomografía computarizada.9 Cientos de herramientas de IA ya han recibido la autorización de la Administración de Alimentos y Medicamentos de EE. UU., con un gran número en campos de especialidades médicas. No obstante, aunque se sigue avanzando a un ritmo rápido, muchas de estas herramientas se centran únicamente en determinados aspectos de la interpretación de las pruebas. Es importante destacar que las herramientas más recientes se han centrado en generar interpretaciones integrales de pruebas especializadas.10

 Por el contrario, los avances en las herramientas de IA para fines médicos generales están avanzando, pero parece menos probable que alcancen el nivel de expertos de manera inminente.11 Aunque varias herramientas de IA han demostrado un rendimiento excelente, comparable al de los médicos titulados, en los exámenes estandarizados utilizados para evaluar a estos y a médicos en formación, la importancia de esto sigue siendo discutible.12

¿Qué explica esta aparente paradoja de un rendimiento a nivel experto en tareas especializadas, pero solo un rendimiento justo en tareas médicas generales?

En primer lugar, es posible que las tareas de los expertos parezcan inescrutables para los no expertos debido a las empinadas curvas de aprendizaje y a las estructuras de datos inusuales. Las tareas especializadas pueden ser más estructuradas y, por su naturaleza, estar estrictamente definidas. La mayor inversión en tecnología de la información realizada durante décadas para acelerar los flujos de trabajo de los especialistas altamente remunerados puede haber dado lugar a mayores conjuntos de datos estructurados para la formación y la validación. Quizás, lo más importante, mucho de lo que sucede en el encuentro médico general puede no estar capturado en el registro formal. Las expresiones faciales, el tempo y el tenor de las conversaciones, los gestos, la apariencia y otros factores rara vez se registran, aunque esto puede evolucionar con el despliegue cada vez mayor de herramientas de documentación basadas en modelos de lenguaje ambiental. Tener un panel de expertos readjudicando ciegamente una sola visita a la clínica sin duda sería un desafío.

En consecuencia, es posible que estemos entrando en una era de paradoja de la IA médica generalista y especializada, en la que la IA avanza más rápidamente en la realización de tareas para las que los humanos requieren especial En términos más generales, es concebible que, con el tiempo, la mayoría de las tareas cognitivas que suelen realizar los especialistas médicos puedan ser realizadas suficientemente bien por los generalistas, redefiniendo los límites entre las diferentes especialidades médicas y, quizás aún más impactante, volviendo a enfatizar el papel de la atención primaria. Sin duda, es probable que las herramientas de IA generalistas también acaben teniendo un gran impacto en la medicina clínica. Sin embargo, si continúan rezagados con respecto a las herramientas especializadas, las implicaciones para la formación, las inversiones y las políticas pueden ampliarse, motivando la reorganización de las becas de especialidad y la repriorización y la reingeniería de las residencias generalistas.

Referencias

1. Li J, Goldenholz DM, Alkofer M, et al. Expert-level detection of epileptiform discharges on short and long time scales. NEJM AI 2025;2(7). DOI: 10.1056/AIoa2401221.

2. Al-Zaiti SS, Martin-Gill C, Zègre-Hemsey JK, et al. Machine learn­ing for ECG diagnosis and risk stratification of occlusion myocar­dial infarction. Nat Med 2023;29:1804-1813. DOI: 10.1038/s41591-023-02396-3.

3. Mayourian J, La Cava WG, de Ferranti SD, et al. Expert-level auto­mated diagnosis of the pediatric ECG using a deep neural network. JACC Clin Electrophysiol 2025; 17 de marzo (Epub ahead of print). DOI: 10.1016/j.jacep.2025.02.003.

4. He B, Kwan AC, Cho JH, et al. Blinded, randomized trial of sonogra­pher versus AI cardiac function assessment. Nature 2023;616:520-524. DOI: 10.1038/s41586-023-05947-3.

5. Elias P, Poterucha TJ, Rajaram V, et al. Deep learning electrocardio­graphic analysis for detection of left-sided valvular heart disease. J Am Coll Cardiol 2022;80:613-626. DOI: 10.1016/j.jacc.2022.05.029.

6. Liu Y, Liu W, Chen H, et al. Artificial intelligence versus radiol­ogist in the accuracy of fracture detection based on computed tomography images: a multi-dimensional, multi-region analysis. Quant Imaging Med Surg 2023;13:6424-6433. DOI: 10.21037/qims-23-428.

7. Wu JT, Wong KCL, Gur Y, et al. Comparison of chest radiograph interpretations by artificial intelligence algorithm vs. radiology res­idents. JAMA Netw Open 2020; 3:e2022779. DOI: 10.1001/jama­networkopen.2020.22779.

8. Plesner LL, Müller FC, Nybing JD, et al. Autonomous chest radio­graph reporting using AI: estimation of clinical impact. Radiology 2023;307:e222268. DOI: 10.1148/radiol.222268.

9. Rajpurkar P, Acosta JN, Dogra S, et al. a2z-1 for multi-disease detection in abdomen–pelvis CT: external validation and perfor­mance analysis across 21 conditions. December 17, 2024 (http://arxiv.org/abs/2412.12629). Preprint.

10. Vukadinovic M, Tang X, Yuan N, et al. EchoPrime: a multi-video view-informed vision-language model for comprehensive echo­cardiography interpretation. October 13, 2024 (http://arxiv.org/abs/2410.09704). Preprint.

11. Takita H, Kabata D, Walston SL, et al. A systematic review and meta-analysis of diagnostic performance comparison between generative AI and physicians. NPJ Digit Med 2025; 8:1-13. DOI: 10.1038/s41746-025-01543-z.

12. Raji ID, Daneshjou R, Alsentzer E. It’s time to bench the medical exam benchmark. NEJM AI 2025;2(2). DOI: 10.1056/AIe2401235.

Viernes Negro en la AP de la comunidad de Madrid

Si el viernes 29 no solo hubo Black Friday en los comercios de la capital, nuestra querida consejería nos obsequio con un auténtico Viernes Negro en los centros de salud. La «caida del sistema informático que sostiene la HCE ( Historia Clínica Electrónica ) y otras aplicaciones necesarias para le funcionamiento de los centros de salud, impidió durante toda la mañana trabajar, no ya con normalidad, sino trabajar a secas. Cuando uno monta un sistema centralizado, mastodóntico y encima no lo mantiene adecuadamente, suceden estas cosas,

Muy de mañana las redes empezaron a arder

Como dice el @DoctorCasado Si los responsables de @SaludMadrid no son capaces de mantener correctamente su servicio de historia clínica electrónica,

deberían preguntar sobre:

1.Implementar arquitectura de alta disponibilidad (HA).

Clusterización de Servidores: Configurar servidores en clústeres redundantes para que, si uno entra en mantenimiento, otro asuma su carga sin interrupción del servicio.

Balanceadores de Carga: Utilizar balanceadores que distribuyan las solicitudes entre varios servidores activos. Durante el mantenimiento, el balanceador puede redirigir el tráfico automáticamente a servidores operativos.

2. Migración a Microservicios:

Dividir el sistema en microservicios independientes en lugar de mantener una arquitectura monolítica. Esto permite realizar actualizaciones o mantenimiento en un módulo sin afectar a los demás.

Cada microservicio puede ser implementado con su propio ciclo de vida y despliegue.

3. Despliegue en la Nube o Arquitectura Híbrida:

Usar servicios de nube que permitan escalabilidad automática y actualizaciones sin tiempo de inactividad.

Configurar una infraestructura híbrida que permita alternar entre servidores locales y en la nube.

4. Mantenimientos en Vivo con Técnicas de Rolling Updates o Blue-Green Deployment:

Rolling Updates: Actualizar los componentes del sistema en fases, asegurando que siempre haya instancias activas mientras se actualizan las demás.

Blue-Green Deployment: Mantener dos entornos (Blue y Green). El entorno Blue está en uso, mientras que el Green se actualiza. Una vez probado, el tráfico se redirige al entorno actualizado.

5. Implementación de Entornos de Pruebas y Simulación:

Realizar pruebas extensivas de actualizaciones y cambios en un entorno de simulación antes de aplicarlos en producción.

Esto reduce el riesgo de errores que podrían causar interrupciones imprevistas.

6. Ventanas de Mantenimiento Fuera del Horario Laboral:

Planificar las intervenciones durante las horas de menor actividad o fuera del horario laboral. Esto puede minimizar el impacto, aunque no lo elimina completamente.

7. Uso de Bases de Datos con Replicación Activa:

Configurar bases de datos en modo de replicación activa para que las actualizaciones no interrumpan el acceso a los datos. Una réplica puede mantenerse en operación mientras la principal se actualiza.

8. Monitoreo Proactivo y Automatización:

Implementar sistemas de monitoreo avanzados que detecten posibles fallos antes de que ocurran, permitiendo una gestión proactiva.

Automatizar procesos de actualización y mantenimiento para reducir errores humanos.

9. Capacitación del Personal:

Asegurar que el personal de TI esté capacitado en las mejores prácticas para gestión de infraestructuras críticas y sistemas de alta disponibilidad.

Hacia una inteligencia artificial de diagnóstico conversacional

Por Julio Bonis Sanz. Médico de familia + MBA + Ingeniero de IA PLN

En el repositorio arXiv investigadores de Google han publicado hace tres días un artículo titulado: «Hacia una IA de diagnóstico conversacional» (Towards Conversational Diagnostic AI)

Diseño del estudio: en un estudio aleatorizado, doble ciego cruzado de consultas basadas en texto. Se elaboraron 149 escenarios clínicos que fueron representados por actores entrenados, al estilo de un Examen Clínico Objetivo Estructurado (ECOE). Los actores interaccionaban exclusivamente vía chat de texto, bien con 20 médicos de atencion primaria (10 canadienses y 10 indios) con amplio rango de experiencia (entre 3 y 30 años), o bien con un modelo de lenguaje (estilo chatGPT) denominado AMIE (Articulate Medical Intelligence Explorer).

Se pidió a los médicos y a la IA elaborar un listado de los 10 diagnósticos más probables ordenados de más a menos probables. Además se evaluaron multitud de dimensiones de la entrevista clínica; desde aspectos relacionados con la empatía, presencia del diagnóstico correcto entre el listado de diagnóstico, si el tratamiento recomendado era apropiado, si las pruebas complementarias solicitadas eran apropiadas, si las derivaciones al especialista eran adecuadas, etc.

Esta evaluación se realizó mediante dos tipos de cuestionarios: unos de satisfacción validados, rellenados por los actores (para las dimensiones de empatía) y otros cuestionarios rellenados POR MÉDICOS ESPECIALISTAS seleccionando la especialidad según el caso, a juicio de los investigadores (ingenieros informáticos de Google) para evaluar la calidad clínica. Se media por tanto esta última y , pero también la calidad empática del encuentro.

Resultados: La IA obtuvo mejores resultados en todas las dimensiones (clínicas y empáticas) que los médicos de atención primaria… a juicio de médicos especialistas.

AMIE supera a los médicos de familia en varios ejes de evaluación para el diálogo diagnóstico

Conclusión: La IA puede cambiar ciertas cosas, pero hay otras que no van a cambiar. Ninguno de los investigadores (ingenieros de Silicon Valley) ni ninguno de los médicos y expertos que andan estos días discutiendo las limitaciones del estudio (que las tiene) ha caído en la cuenta de que a lo mejor el criterio de un médico especialista no es lo mejor para valorar lo que ocurre en una consulta de atención primaria. Se considera una obviedad que el juicio clínico del médico especialista es el gold standard que por pura epistemología se asume que nunca se podrá superar (como mucho igualar).

Interpretación alternativa: Los resultados del estudio sugieren que la IA se comporta, en cuanto a sus decisiones clínicas, más como un especialista que como un médico de atención primaria. Esto tiene sentido pues los modelos de lenguaje están entrenados con el contenido encontrado en internet (incluido PubMed) y eso es lo que replican al generar textos.

Por tanto no sería descabellado pensar que los primeros susceptibles de ser sustituidos deberían ser los médicos especialistas y no los generalistas. Sin embargo eso tampoco lo veremos.

PD: como dato curioso se pidió a los especialistas indicasen si el «médico de familia/IA» había producido una «alucinación» (se define como un contenido sin sentido, erróneo o inventado por un modelo de lenguaje). Según se puede ver en el artículo publicado los especialistas (que evaluaban los chats sin saber si eran generados por humanos o una IA) encontraron alucinaciones en un 10% de los casos en la IA… y en un 15% de los médicos de familia. Corolario: Conviene no ir puestos de LSD al centro de salud.

Resumen canónico : En el corazón de la medicina se encuentra el diálogo médico-paciente, en el que una hábil anamnesis allana el camino para un diagnóstico preciso, un tratamiento eficaz y una confianza duradera. Los sistemas de Inteligencia Artificial (IA) capaces de dialogo diagnóstico podrían aumentar la accesibilidad, la coherencia y la calidad de la atención. Sin embargo, aproximarse a la experiencia de los médicos es un gran reto pendiente. Presentamos AMIE (Articulate Medical Intelligence Explorer), un sistema de IA basado en un modelo de lenguaje amplio (LLM) optimizado para el diálogo diagnóstico.

AMIE utiliza un novedoso entorno simulado basado en el juego automático con mecanismos de retroalimentación automatizados para escalar el aprendizaje a través de diversas enfermedades, especialidades y contextos. Diseñamos un marco para evaluar ejes de rendimiento clínicamente significativos, como la elaboración de la historia clínica, la precisión diagnóstica, el razonamiento de gestión, las habilidades de comunicación y la empatía. Comparamos el rendimiento de los AMIE con el de los médicos de atención primaria (MAP) en un estudio aleatorizado, doble ciego cruzado de consultas basadas en texto con actores pacientes validados al estilo de un Examen Clínico Objetivo Estructurado (ECOE). El estudio incluyó 149 escenarios de casos clínicos de profesionales de Canadá, el Reino Unido y la India, 20 MAPs para comparar con AMIE y evaluaciones por parte de médicos especialistas y  los actores que actuaban como pacientes.

AMIE demostró una mayor precisión diagnóstica y un rendimiento superior en 28 de 32 ejes según los médicos especialistas y en 24 de 26 ejes según los pacientes actores. Nuestra investigación tiene varias limitaciones y debe interpretarse con la debida cautela. Los médicos se limitaron a un chat de texto sincrónico poco familiar que permite interacciones a gran escala entre el AMIE y el paciente, pero que no es representativo de la práctica clínica habitual. Aunque es necesario seguir investigando antes de que AMIE pueda trasladarse a entornos reales, los resultados representan un hito hacia la IA de diagnóstico conversacional.

Pulse F1 para ayuda

En el mundo de la gestión sanitaria, en particular de los responsables de la mejora de las aplicaciones informáticas que utilizan los profesionales sanitarios, hay dos grupos de personas: un grupo, poco numeroso, que entiende su trabajo como un servicio al usuario de estas aplicaciones. Esos, que creen que su aportación a la misión común de elevar el nivel de salud de la población es hacer más fáciles y mejorar continuamente estas aplicaciones. Otro grupo, que por el contrario carece de empatía con las necesidades de los usuarios, hacen caso omiso de sugerencias, críticas y su única misión parece ser cumplir, y hacer cumplir, unas normas reales o supuestas, como si ellos, y solo ellos, fueron los amos y señores del santo grial informático. Lo peor es que esta alianza entre burócratas, gestores e informáticos (muchas veces en una misma persona, en una trinidad no santa) es terriblemente exitosa para cumplir espurios objetivos, a la vez que obstaculizan el trabajo de los profesionales.

Para muestra un sencillo, muy sencillo, botón:

por Quino

Caso 1- Responsables de sistema de información de atención primaria y centro de medicamentos de Cataluña, publican en la revista Atención Primaria un artículo donde se muestra como una medida sencilla (informar de la posología o frecuencia de administración en el módulo de prescripción de forma predeterminada) aumentaba la adecuación de esta frecuencia en las prescripciones, lo que suponía una mejora en la seguridad y en la eficacia de los tratamientos.

Caso 2- Prescripción de heparinas de bajo peso molecular en el módulo unificado de prescripción, más conocido como “el MUP”. Estas heparinas tienen dos posibles vías de administración, a saber: subcutánea (sc) para prácticamente todas las indicaciones, e intravenosa en el tratamiento inicial del IAMCEST agudo, es decir que se administra en situaciones de urgencia y en hospitales.

En resumen, el 99,999999 de las veces que un profesional prescriba en el MUP estas heparinas, la vía de administración será subcutánea. Pues bien, unos preclaros farmacéuticos encargados del MUP decidieron que cada vez que se prescribiera una de estas heparinas, el medico debería elegir la vía de administración. Podrían haber dejado esta elección con la vía subcutánea por defecto, pero que va, eso seria facilitar las cosas, hay que elegir por narices la vía sc de un panel de dos posibles elecciones, si no la haces, el modulo no te deja prescribir el medicamento. Cientos de miles de clics gratuitos por mor del capricho de unos indocumentados.

El diseño y la implantación de mejoras en los sistemas de prescripción electrónica contribuye a aumentar la calidad de la prescripción.

¿Podrías decirnos, cual de los dos casos cumple esta sentencia?

Periódicos del Reino Unido ‘en pie de guerra’: análisis de los medios de comunicación sobre la consulta no presencial de atención primaria en 2021

Periódicos del Reino Unido ‘en pie de guerra’: análisis de los medios de comunicación de la consultoría remota de práctica general en 2021; traducción del resumen de UK newspapers ‘on the warpath’: media analysis of general practice remote consulting in 2021. British Journal of General Practice 3 October 2022; BJGP.2022.0258. DOI: https://doi.org/10.3399/BJGP.2022.0258

Resumen

Antecedentes Tras un cambio a gran escala impulsado por la pandemia hacia la consulta remota (o no presencial) en la práctica de la medicina general del Reino Unido en 2020, 2021 vio un regreso parcial a las consultas en persona (o presenciales). Esto ocurrió en el contexto de presiones extremas sobre la carga de trabajo debido a los retrasos, la escasez de personal y el cambio de tareas.

Objetivo Estudiar las representaciones de los medios de comunicación de las consultas remotas en la práctica general del Reino Unido en un momento de estrés del sistema.

Diseño y configuración Análisis temático de artículos de periódicos nacionales sobre consultas remotas de médicos de cabecera en dos períodos de tiempo: del 13 al 26 de mayo de 2021, tras una carta del NHS England, y del 14 al 27 de octubre de 2021, siguiendo una directiva respaldada por el gobierno, ambas estipulando un regreso a la consultoría en persona.

Metodo Los artículos se identificaron a través de LexisNexis y se recuperaron de él. Se desarrolló iterativamente un sistema de codificación de temas y recursos narrativos para informar el análisis de datos.

Resultados En total, 25 artículos informaron sobre la carta y 75 sobre la directiva. La cobertura periodística de la consultoría remota fue sorprendentemente negativa. La prensa de tendencia derechista en particular elogió el regreso a las consultas en persona, describiendo la atención remota como la creación de barreras de acceso y comprometiendo la seguridad. Dos periódicos encabezaron campañas nacionales presionando al gobierno para que exigiera a los médicos de cabecera que ofrecieran consultas en persona. Los médicos de cabecera fueron citados como reacios a regresar a un servicio «en persona por defecto» (ya que presionaría aún más a un sistema que ya está cerca del punto de ruptura).

Conclusión Las consultas a distancia se han asociado en los medios de comunicación con malas prácticas. Algunos periódicos estaban liderando activamente la «guerra» contra la práctica general en lugar de limitarse a informar sobre ella. El diálogo proactivo entre los profesionales y los medios de comunicación podría ayudar a minimizar la polarización y mejorar las percepciones en torno a la práctica general.

En 2021, los periódicos del Reino Unido describieron negativamente las consultas remotas de médicos de cabecera; y algunos lideraron campañas impulsadas por la política para volver a la atención presencial. Una nueva investigación de la profesora Trish Greenhalgh y sus colegas examina la tendencia de los periódicos ‘en pie de guerra’ contra la consultoría remota. Después de la descripción inicial de una respuesta ‘heroica’ a la COVID-19 a principios de 2020, muchos periódicos del Reino Unido volvieron a presentar a los médicos de cabecera en términos negativos, describiendo las dificultades para acceder a la atención pero omitiendo el contexto clave de un sistema bajo una tensión sin precedentes.