Categoría: Atención Primaria

De obligada lectura

En medicina hay libros o artículos de esos que te llevan a decir: “todo estudiante (o residente) debería leer”. Aunque la comprendo, a mí no me gusta la frase, es lógico que tu sorpresa o ilusión ante un buen trabajo te lleve a recomendarlo a generaciones venideras, pero esa «obligación» que impones, no es de recibo. Puede que el artículo no sea tan bueno, o el momento no sea el adecuado como lo fue para ti, es probable que esa persona a la que se lo dices, no lo necesite o no lo entienda en ese momento determinado. Seria mejor recomendar, e incluso recomendar solo a demanda del interesado. Solo en contadas ocasiones y conociendo al que crees que lo necesita, le puedes decir eso de “léete esto ¡chaval!”

Gracias a Juan Gérvas (una vez más) he llegado a este antiguo articulo que documenta y explica un hecho típico de la medicina generalista y que todos los que trabajamos en atención primaria deberíamos aprehender, ya que conocer casi todos lo conocemos. Se trata de eso que los bayesianos y evidenciologos llaman la probabilidad preprueba y cómo varía esta probabilidad según el entorno en el que trabajemos

Juan,lo aplica para ilustrar la peligrosidad de la desaforada afición de nuestros conciudadanos para acudir a los servicios de urgencias, y lo explica sencillo y bien. Da igual, casi nadie lo leerá y de los que lo hagan unos será para criticarlo sin misericordia por venir de quien viene, otros porque nunca entenderán, a pesar de su aparente formación intelectual, este sencillo problema de la masificación de las urgencias ambulatorias y el abuso de las hospitalarias.

Bien, pero hablemos del artículo. Se titula: Occurrence and clinical significance of overt blood loss per rectum in the general population and in medical practice (Frecuencia e importancia clínica de la pérdida manifiesta de sangre por recto en la población general y en la práctica médica) y el resumen traducido es este

Aunque la pérdida de sangre por el recto en medicina general es frecuente y no suele ser grave, puede ser el primer síntoma de un trastorno maligno colorrectal. Para determinar la incidencia y la importancia clínica de la pérdida evidente de sangre por el recto, se realizó una búsqueda bibliográfica en Medline. Se informó de que la incidencia de este síntoma en la población general era de aproximadamente 20 por 100 personas al año, la «incidencia de consulta de atención primaria» de aproximadamente seis por 1.000 y la incidencia de derivación a un especialista médico se estimó en aproximadamente siete por 10.000 al año. La importancia clínica del síntoma variaba en función de la población: el valor predictivo de la pérdida de sangre rectal manifiesta para una neoplasia maligna colorrectal se estimaba en menos de uno de cada 1.000 en la población general, aproximadamente dos de cada 100 en la práctica general y hasta 36 de cada 100 en pacientes derivados. Se desconoce cómo contribuye la manifestación de la hemorragia (y otros signos y síntomas) a la selección de pacientes en cada uno de estos estadios, dando lugar a probabilidades previas crecientes.

Juan Gérvas nos lo explica en este articulo :

En general la rectorragia es “inocente”, se debe a hemorroides o fisuras anales, y los pacientes lo suelen saber y manejar por sí mismos, sin consultar con el médico de cabecera y sin ir a urgencias. La probabilidad de que la rectorragia se deba a un cáncer del aparato digestivo es muy baja, del 1 por 1000.

Cuando los pacientes en ese estudio decidieron consultar con su médico de cabecera la probabilidad del cáncer subió al 20 por 1000. Es decir, los pacientes, si deciden consultar es porque “saben” que la rectorragia es distinta, que vale la pena la consulta, y sube a veinte por mil la probabilidad de cáncer, un ejercicio excelente de “auto-cuidado”, de “auto-selección”.

Después, cuando los médicos generales decidieron mandar a los pacientes con rectorragia a los especialistas focales, o a urgencias, la probabilidad de cáncer subió a 360 por 1000. Es decir, los médicos de cabecera seleccionaron a los que tenían mayor probabilidad de cáncer (en los que valía “la pena” el realizar más pruebas) y multiplicaron por 18 la probabilidad de cáncer de aparato digestivo. Así, de 1000 personas con rectorragia que a través del médico de cabecera llegaron a urgencias o especialistas focales, 360 tenían cáncer (640 no)

¿Se imagina si los pacientes con rectorragia de este estudio hubieran ido todos a urgencias hospitalarias o los especialistas “para estar tranquilos”, pruebas y más pruebas, daños sin sentido a 999 de cada 1000?

De todas formas, lo “recomendable” que no obligatorio, es cogerse el artículo completo en PDF con lápiz, «borra» y subrayador de colorines y estudiarlo en profundidad

Más información en El fundamento científico de la función de filtro del médico general del mismo autor y Mercedes Pérez Fernández

Olvidos imperdonables

Cuando, por fin, en esa comunidad se implantó el tan deseado programa de cribado de detección del cáncer de colon, parecía una buena noticia. Al contrario que en otros cribados, como el de cáncer de mama, esta vez sí se había pensado en Atención Primaria (AP) como integrante de su implantación y desarrollo. Pero pronto, las cañas se tornaron lanzas. Las críticas al tiempo que demandaba la confección de la plantilla informatizada, y lo farragoso de los protocolos de actuación, se hicieron notar en forma de protestas y quejas.

Surgió este problema porque la AP no había intervenido en el proceso de elaboración, solo se la había considerado como ejecutor sumiso de unas directrices, venidas desde arriba, que desconocían cómo se trabaja en este nivel de atención. Como en otras tantas ocasiones, los «hacedores» de guías, protocolos y campañas de cribado habían olvidado un concepto magníficamente expuesto en un artículo publicado en el BMJ. Esto no es otro que el tiempo necesario para tratar (TNT).

Se podría decir que el TNT es el tiempo que el clínico invierte en la aplicación de las recomendaciones de las guías.

Guidelines should consider clinicians’ time needed to treat

Más exacto sería decir que el TNT se calcula basándose en el concepto de Número Necesario para Tratar (NNT), que representa el número de pacientes durante un periodo de tiempo determinado que sería necesario tratar para alcanzar un criterio de valoración adicional del estudio. como se dice en el articulo citado.

El tiempo necesario para tratar (TNT) hace explícito: el tiempo clínico estimado necesario para mejorar el resultado de una persona en la población objetivo (TNT-NNT), el tiempo clínico necesario para implementar la recomendación para todas las personas elegibles en una consulta (TNT absoluto), y la proporción del tiempo clínico total disponible para la atención al paciente que sería necesario para implementar la recomendación para todos los pacientes elegibles (TNT relativo).

Como ya comentamos anteriormente [esta entrada está basada en un artículo publicado en la sección «Un vistazo a las ultima publicaciones» de la revista AMF] , los profesionales no tienen tiempo suficiente para proporcionar la atención recomendada por las GPC y servicios clínicos preventivos. El estudio que citábamos, y algunos más, ponen de manifiesto que es prácticamente imposible que en la jornada de un médico se puedan aplicar todas las recomendaciones que estos programas imponen. Todo el tiempo que se dedicara al flamante y perfecto programa de cribado se hurtaría a otras actividades; se aplica, por tanto, al encuentro clínico el famoso coste de oportunidad, en el que la moneda de cambio sería el tiempo del profesional. Tras plantear el problema y desarrollar el concepto, el artículo propugna que los organismos que crean las guías consideren explícitamente el TNT, incluyéndolo en las estimaciones a la hora de decidir si se recomienda una intervención, en el balance entre riesgos y beneficios del sistema GRADE.

Helen Salisbury, médica general británica, comenta en un artículo de opinión que el TNT le pareció muy oportuno, sobre todo después de oír a un catedrático de urología recomendar en la radio de la BBC, que «todos los hombres mayores de 50 años pidieran a su médico de cabecera una prueba del antígeno prostático específico» ; o que una nueva guía NICE sobre riesgo cardiovascular sugiriera que todas las personas con más de un 5% de riesgo de sufrir un infarto de miocardio o un ictus en los próximos 10 años deberían considerar la posibilidad de tomar estatinas. Nuestra colega opina que, aparte de que el médico general esté de acuerdo o no con estos consejos, estas invitaciones conllevan una visita al centro de salud que no es sencilla, ni rutinaria y, sobre todo, no es corta.

Algo parecido nos pasa a nosotros cuando vemos que se nos cita una revisión de tratamiento crónico en 3 minutos o se oye a un catedrático de ejercicio físico declarar muy ufano que «pide a los médicos que dejen de enviar a la gente a caminar sin más». Cabría recordar, en este caso, el ejemplo que ponen los autores del concepto de TNT. Según estos, si se siguieran las directrices de la guía NICE sobre «Actividad física: consejos breves para adultos en atención primaria», el TNT absoluto (tiempo clínico necesario para aplicar la recomendación a todas las personas elegibles) en una consulta de 2.000 adultos sería de 10.000 minutos o, lo que es lo mismo, 167 horas, de tiempo de un general practitioner. Trasladado a España, un médico de familia necesitaría más de un mes al año a tiempo completo para poner en marcha estas recomendaciones. Podríamos acabar con una frase de la propia Salisbury:

«Cuando trabajas como médico de cabecera, mucha gente parece tener ideas brillantes sobre lo que deberías hacer para mejorar la salud de tus pacientes. El problema es que solo se dispone de un número limitado de horas a la semana».

Helen Salisbury: Opportunity costs and the time needed to treat

Que las campañas de cribado, protocolos, guías de práctica clínica y otros documentos que pretenden ordenar nuestro trabajo fueran más realistas es un deseo que compartimos con Helen Salisbury. Añadir el tiempo necesario para tratar cada nuevo proyecto sería una excelente forma de comenzar. También sería recomendable que los médicos de familia asistenciales participen o lideren cualquier propuesta que se pretenda implantar en AP

Tos tras un infección respiratoria en adultos

Postinfectious cough in adults

Traducción de Postinfectious cough in adults por Kevin Liang, Philip Hui and Samantha Green. CMAJ February 12, 2024 196 (5) E157; DOI: https://doi.org/10.1503/cmaj.231523

Cinco cosas que hay que saber sobre…» la tos tras un infección respiratoria en adultos

La tos postinfecciosa afecta al 11-25% de los adultos tras una infección respiratoria
La tos postinfecciosa se define como una tos subaguda, con síntomas que duran entre 3 y 8 semanas.1 La infección precedente desencadena una cascada inflamatoria que aumenta la sensibilidad bronquial y la producción de moco, al tiempo que reduce su eliminación.1

Diagnóstico por exclusión
Este diagnóstico clínico requiere una infección respiratoria previa, la ausencia de hallazgos preocupantes en la exploración física y la exclusión de otros diagnósticos diferenciales de tos subaguda (p. ej., asma, enfermedad pulmonar obstructiva crónica [EPOC], enfermedad por reflujo gastroesofágico o uso de inhibidores de la enzima convertidora de angiotensina).1,2 Debe considerarse la tos ferina en pacientes con tos paroxística, vómitos con o tras la tos y sibilantes inspiratorios.1

Las señales de alarma y la duración prolongada de la tos deben motivar la realización de más pruebas
La presencia de hemoptisis, síntomas sistémicos, disfagia, disnea excesiva o ronquera justifica la realización de estudios como una radiografía de tórax.2 Otras señales de alarma son los antecedentes de neumonía recurrente o un largo historial de tabaquismo.2 La tos que dura más de 8 semanas se considera crónica y requiere una evaluación adicional, como una prueba de función pulmonar para descartar asma o EPOC.1

No hay pruebas que apoyen el tratamiento farmacológico, el cual se puede asociar a daños
Las revisiones sistemáticas de los ensayos controlados aleatorizados que evaluaron los corticoesteroides inhalados, los broncodilatadores y los agentes orales para la tos postinfecciosa concluyeron que no hay pruebas de beneficio.3,4 La mayoría de los ensayos encontraron que los síntomas de la tos mejoran sin medicación, lo que pone de relieve la naturaleza autolimitada de la tos postinfecciosa.3 Más allá de los efectos adversos y los costes de la medicación, los inhaladores presurizados emiten potentes gases de efecto invernadero.5 El uso no indicado de inhaladores también puede aumentar el gasto médico.

Es fundamental tranquilizar y educar al paciente
Tranquilizar a los pacientes diciéndoles que la tos postinfecciosa tiene una duración limitada y se resuelve por sí sola puede reducir las prescripciones innecesarias, incluidas las de antibióticos.6 Los médicos deben aconsejar a los pacientes que concierten una cita de seguimiento para realizar más pruebas si la tos no se ha resuelto en 8 semanas o si aparecen nuevos síntomas.

adenda:

Galo Sanchez nos envía este comentario:

«Sobre este asunto hizo un ensayo la médico Kate B Thomas, en su propia consulta en 1987, que nosotros tradujimos y recalculamos hace varios años para una mejor comprensión de los resultados. Por si a alguien le interesa, puede encontrarlo en la web evalmed: El médico como placebo: ventajas e inconvenientes. [Kate B Thomas, 1987]«

.

De los Balcanes al Ministerio de Sanidad

Hace un año nos vimos sorprendidos por la noticia de que el Ministerio de Sanidad financiaba un nuevo medicamento para dejar de fumar. La sorpresa no fue tanto porque se comunicará a la prensa antes que a los profesionales, hecho habitual en todas las administraciones sanitarias, sino porque era un fármaco apenas conocido en nuestro ámbito, a pesar de que como se recogía en la noticia estaba disponible en España algunos años antes. El medicamento era la citisina o citisiniclina (marca comercial Todacitan® al que a finales de año se ha unido Recigarum® y un genérico no comercializado).

La citisina es un alcaloide que actúa como agonista de los receptores nicotínicos ya que tiene una estructura molecular similar a la de la nicotina. Durante la Segunda Guerra Mundial, en los Balcanes, los fumadores utilizaban las hojas de Cytisus laburnum, ricas en citisina, para suplir la carencia de tabaco y pocos años más tarde un laboratorio búlgaro, comercializo el principio activo como tratamiento para dejar de fumar bajo la marca Tabex.

Si uno indaga un poco sobre el fármaco se topa varias peculiaridades: en primer lugar, que el principio activo es de origen vegetal y se puede considerar, por tanto un medicamento “natural” como así se hace en otros países y en Internet. También sorprende que pesar de no ser un fármaco nuevo, los ensayos clínicos publicados son escasos y relativamente recientes en comparación con la antigüedad del fármaco.

Como se relata en las primeras revisiones sistemáticas, las publicaciones iniciales sobre la citisina sufrieron una difusión escasa, dadas las barreras políticas, lingüísticas y, porque no decirlo, por su pobreza metodológica. A partir del comienzo de la primera década del siglo XXI empiezan a aparecer en revistas “occidentales” ensayos clínicos y revisiones sistemáticas que seguían los estándares de realización y publicación

En ese momento se empieza a considerar su utilización en clínica. A pesar de que era un medicamento “sin padrinos industriales”, de países comunistas, por tanto, pobres, y poco estudiado, poco a poco (salvo en España que fue de manera brusca) se ha ido posicionando como tratamiento para la deshabituación tabáquica, oponiendo a la escasez de pruebas de eficacia y efectos adversos, una ventaja tan importante como el precio mucho, más bajo que la vareniclina. Suponemos que será esta y no otra, la razón para su atropellada introducción en el mercado español y la financiación por el ministerio con aportación normal por parte del paciente*. Nada más anunciarse la financiación en nuestro país, se incorporó a protocolos y vías clínicas ya que esta implicaba que el paciente debería estar en un programa de apoyo (individual y/o grupal) de deshabituación tabáquica que estuviera implementado en las diferentes comunidades autónomas.

Esta compleja pauta de administración se justifica, al parecer, en la farmacocinética del fármaco y su capacidad para imitar los efectos de la nicotina, reduciendo al mismo tiempo los efectos gratificantes de esta y disminuyendo el ansia de fumar. Sin embargo, como decíamos antes no está suficientemente documentada y cada vez más, se piensa en establecer unas pautas más razonables que la actual.

En este sentido se ha publicado recientemente varios ensayos clínicos aleatorizados con este propósito, entre ellos destaca la serie ORCA, el primero de ellos ORCA-1 se publicó hace dos años, su objetivo era comparar dos dosis de citisiniclina (1,5 mg y 3 mg) frente a placebo, y dos pautas de administración: el ajuste descendente conocido, frente a una pauta de 3 veces al día. Los participantes en el grupo de citisiniclina 3 mg tres veces al día tuvieron la tasa de abstinencia más alta.

 El año pasado, se publicó en la revista JAMA, se publica el ORCA- 2 donde se ponen a prueba dos posologías de diferente duración (3 mg tres veces al día durante seis semanas y la misma dosis durante doce semanas) entre sí y frente a placebo. Es un ensayo clínico multicéntrico aleatorizado, ciego y con asignación enmascarada. Como variable de resultado se evalúo la abstinencia de tabaco a partir de las tres semanas de iniciar el tratamiento y hasta las seis y doce semanas según la pauta. También se evalúo esta abstinencia a las 24 semanas como variable secundaria. En ambas pautas los resultados fueron favorables a la citisiniclina con odds ratio de 8 para la pauta de seis semanas y de 6,3 para la de doce, calculándose unos NNT de 5 y de 4 respectivamente. Como limitaciones de estudio: hacer notar que tuvo pérdidas de seguimiento de hasta el 28% y fue realizado con unos restrictivos criterios de inclusión. Aun así, con los resultados se puede considerar la citisiniclina como un medicamento eficaz en la lucha contra el tabaco, como se puede confirmar en la tabla de NNTs comparativa publicada en una “pregunta clínica” publicada recién en AMF.

Pero sobre todo muestra que otras pautas de administración son posibles, con la salvedad de que incluso la pauta de seis semanas implica tomar más del doble de medicamento que la esotérica pauta recomendada hasta ahora.

Notas

* El bupropion (Zyntabac) tiene un coste menor para el paciente que las otras dos opciones y goza además de aportación reducida , con lo cual el paciente solo aporta un máximo de 5,45 euros. La retirada del mercado de la vareniclina (Champix) por contaminación por nitrosaminas y el desabastecimiento de bupropion también han colaborado.

Romper las reglas para una mejor atencion sanitaria

Extracto de Breaking the Rules for Better Care de Berwick DM, Loehrer S, Gunther-Murphy C. JAMA. 2017 Jun 6;317(21):2161-2162. doi: 10.1001/jama.2017.4703 + pagina web de Institute for Healthcare Improvement + Leadership Alliance y sobre todo gracias a @conectantes que me hicieron buscar más información sobre este tema, en su podcast nº 235 se puede encontrar buenos comentarios sobre el asunto

Las cargas y la complejidad administrativas es una de las maneras más costosas de despilfarrar en sanidad. La burocracia merma la experiencia asistencial de los pacientes y restan tiempo y moral a los médicos y demás personal, impidiendo las interacciones de valor añadido. La revista JAMA publicó hace unos años un comentario sobre la iniciativa de una red de ejecutivos de hospitales y clínicas, empresas, gobiernos, asociaciones y organizaciones sin fines de lucro norteamericanas (Institute for Healthcare Improvement (IHI) Leadership Alliance) para estudiar los tipos y magnitud de este despilfarro en la primera línea asistencial.

Uno de los principios de “rediseño radical”  que propone la Alianza es el de «Hacerlo fácil». Este exige la eliminación continua de las barreras administrativas que aportan poco o ningún valor a la asistencia, obstaculizan el trabajo de los médicos, frustran a pacientes y familiares y hacen perder tiempo y otros recursos.

En enero de 2016,  esta Alianza (Alliance), declaró la «Semana de romper las reglas para mejorar la atención» (Breaking the Rules Week) . En este apartado de “romper las reglas”, la alianza se basó en la premisa de que las reglas y regulaciones existentes a menudo impiden que los profesionales brinden la mejor atención posible a sus pacientes. Al romper estas reglas, la alianza esperaba crear un sistema de atención médica más eficiente, efectivo y centrado en el paciente.

Las organizaciones participantes plantearon a su personal y pacientes una sencilla pregunta:

«Si pudiera interrumpir o cambiar cualquier norma para mejorar la experiencia asistencial para pacientes o profesionales, ¿Cuál sería?».

https://www.ihi.org/networks/leadership-alliance/breaking-the-rules-for-better-care

El personal del Institute for Healthcare Improvement revisó todas las normas propuestas por los participantes y clasifico las normas «a romper» en 3 tipos:

1. Hábitos arraigados en comportamientos organizativos, basados en interpretaciones erróneas y con poco o ningún fundamento real en requisitos legales, reglamentarios o administrativos (por ejemplo, prohibir que haya agua potable a disposición del personal en los puestos de enfermería).

2. Requisitos específicos de la organización que las autoridades locales podrían cambiar sin infringir ningún estatuto o reglamento formal (por ejemplo, obligar a los pacientes y familiares a pagar por el aparcamiento o restringir las horas de visita).

3. Requisitos legales y reglamentarios reales (por ejemplo, la «norma de los 3 días» para el acceso de los pacientes a los centros de enfermería especializada).

De las 342 normas recopiladas, 57 (16%) eran de tipo 1; 211 (62%) de tipo 2; y 74 (22%) eran de tipo 3.

Muchos miembros de la Alianza tomaron medidas en relación con las normas identificadas por sus pacientes y personal. Las acciones más comunes fueron de cuatro tipos: (1) desmentir mitos sobre normas reglamentarias y administrativas inexistentes o malinterpretadas mediante la formación del personal, (2) buscar la claridad de los organismos reguladores pertinentes sobre el verdadero alcance e intención de las normas, (3) cambiar las políticas administrativas locales para las que no se encontró una justificación suficiente y (4) hablar con una «voz colectiva» a los responsables políticos sobre normas perjudiciales para la atención o que suponen un despilfarro de recursos limitados. (La última categoría incluía reunirse con los responsables de los Centros de Servicios de Medicare y Medicaid para debatir los efectos adversos de la norma de los 3 días y el excesivo número de medidas exigidas por el gobierno federal).

Contrariamente a las expectativas iniciales, aunque existían obstáculos legales y reglamentarios que suponían un despilfarro, la mayoría (78%) de las normas obstruccionistas y despilfarradoras identificadas por los pacientes y el personal estaban totalmente bajo el control administrativo de los directivos y gestores sanitarios que podían cambiarlas.

La mayoría de las sugerencias del personal para cambiar las normas no iban dirigidas a sus propias condiciones de trabajo, sino más bien a atender mejor la comodidad de los pacientes y familiares, aliviando sus preocupaciones físicas, emocionales y financieras.

En gran parte de los casos, el personal tenía recomendaciones muy concretas sobre cómo abordar problemas antiguos como el acceso o los tiempos de espera. Aunque las normas que con más frecuencia se sugería cambiar eran a menudo complejas, muchas eran tan sencillas como el límite de una manta por paciente o no ofrecer comida a las parejas de las pacientes de maternidad.

Estas sugerencias de la Leadership Alliance indican que las organizaciones sanitarias pueden emprender acciones directas para reducir una parte sustancial del oneroso despilfarro administrativo tan frecuente en la sanidad, sin necesidad de batallas políticamente difíciles para modificar reglamentos, leyes o políticas de pago. Como suele ocurrir en los sistemas de producción complejos, gran parte de la sabiduría reside en los trabajadores y en las personas a las que prestan sus servicios. Si se les pide, en un entorno seguro, que identifiquen los obstáculos sin sentido al trabajo productivo, pueden hacerlo y lo harán al servicio de una mejor atención a los pacientes y sus familias.

Los responsables sanitarios harían bien en preguntar a sus médicos, personal y pacientes qué hábitos y normas parecen estar perjudicando la atención sin los beneficios correspondientes y, con prudencia y circunspección, cambiarlos.

Evaluación de modelos de lenguaje en IA médica: Importancia del estándar de referencia

adenda a Hacia una inteligencia artificial de diagnóstico conversacional

comentarios a adicionales a la entrada Hacia una inteligencia artificial de diagnóstico conversacional

Por Julio Bonis Sanz. Médico de familia + MBA + Ingeniero de IA PLN

Ojo, que el problema como siempre, es de fundamentos.

Lo más relevante en este estudio, y en otros, es el diseño del estudio y lo que ese diseño implica.

Es un diseño elaborado por ingenieros informáticos de Google (es decir clase media alta de San Francisco) asesorados por expertos clínicos (me apuesto a que especialistas de hospital de renombre).

El meollo del asunto es la definición del estándar de referencia o gold standard (el que se asume que clasifica de forma válida a los sujetos respecto a la presencia o ausencia de una condición clínica)

Cuando quieres evaluar cómo de buenas son los textos generados por un modelo de lenguaje (listas de diagnósticos, recomendaciones, etc) tienes que decidir cual es el texto «correcto» sobre el cual compararlo. Por ejemplo si le pides al modelo «dame los 10 diagnósticos por orden de más a menos probable» para saber cómo de bueno es, tienes que definir cual es el diagnostico correcto. Así puedes ver en qué posición incluyó el modelo el diagnóstico correcto y compararlo con la posición en la que lo incluyó el médico de familia. Pues bien, los ingenieros de google decidieron que el gold standard (el que juzga cómo de correcto o incorrecto el razonamiento clínico de la IA o del médico de familia) es la opinión de ¡un especialista!

El propio hecho de que evaluen el modelo viendo si elabora un diagnostico correcto (como si toda consulta de AP tuviese que concluir con un diagnóstico específico al final de la misma) revela su marco conceptual. Además los ingenieros decidieron qué especialista era el «adecuado». Uno de los problemas está, claro, en qué especialista elegir como gold standard para una paciente de 65 años que consulta en el centro de salud por «un mareillo que me da por las tardes» (¿cardiólogo? ¿Neurólogo? ¿Psiquiatra? ¿Digestivo?)

Naturalmente si como especialista eres el gold standard ninguna IA te va a poder superar, para eso eres el gold standard. Por eso digo que nada cambia. Lo que vemos en este (y otros estudios) es la asunción de que los especialistas son los que saben lo que hay que hacer, y pueden dar lecciones a los medfams sobre lo mal que lo hacen. Es la asunción del médico de familia como «especialista de segunda», que no aporta valor diferencial alguno en cuanto a abordaje especifico de la presentación clínica «indiferenciada» en etapas iniciales de la historia natural de la enfermedad, manejo de la incertidumbre, integración de los valores personales del paciente en la toma de decisiones (valores que se conocen a través de la relación longitudinal), sino simplemente una solución de «bajo coste» al hecho de no poder tener a un dermatólogo atendiendo todos los granos o a un cardiólogo atendiendo todas las palpitaciones o hipertensiones de la población.

La Atención Primaria está en crisis, porque nuestros políticos, dirigentes y resto de especialistas creen y actúan como si la función de la Atención Primaria fuese atender problemas menores, para que los pacientes no molesten en el hospital.

Julio Bonis y Rafael Bravo en los constipadillos

Podrían haber decidido que el gold standard fuera un panel de médicos de familia con más de 10 años de experiencia (por ejemplo) pero no, decidieron que fuese un endocrinólogo quien juzgara si la IA y el medfam habían hecho bien su trabajo al manejar un caso de paciente con glucemias mal controladas.

El diseño de este (y otros estudios) lo que demuestra es que la IA piensa más como un especialista de hospital que como un médico general (es decir la IA se aproxima más al gold standard que el médico general). Lo que subyace es la idea de que lo deseable sería que los pacientes pudiesen acceder directamente al especialista. Si la IA maneja los problemas cardiológicos mejor que un MedFam (a juicio de un cardiólogo) y los problemas neurológicos mejor que un MedFam (a juicio de un neurólogo) entonces mejor pongamos a la IA a pasar consultas de primaria porque sería como poder darles acceso directo a los distintos especialistas. Ninguno de los ingenieros de Google ni quienes les asesoran o financian comprenden el papel de filtro, el concepto de prevención cuaternaria, etc, etc. Si lo comprendieran usarían gold standards distintos para los distintos niveles asistenciales y estarían elaborando modelos específicos entrenados para elaborar razonamientos clínicos como un médico de atención primaria (no como un especialista de hospital).

Cribado y registro de los determinantes sociales de la salud: ¿Oportunidad o una carga irrazonable?

Por Paco Camarelles

La publicación del documento Condicionantes sociales y del contexto familiar que sería recomendable incluir en la historia de salud digital (PDF) me suscita algunas dudas y preguntas como médico de familia clínico que se han planteado tambien otros médicos de familia en países como USA.

La primera duda es si el cribado y registro de los determinantes sociales de la salud es una oportunidad o una carga irrazonable. El artículo publicado en la revista FPM Screening for Social Determinants of Health: An Opportunity or Unreasonable Burden?” nos aporta algunos aspectos de reflexión con los que coincido:

  • Creo que la atención médica que proporciono promueve resultados saludables. Sin embargo, hay estudios que estiman que la atención clínica representa solo del 10 al 20 por ciento de los contribuyentes modificables a los resultados de salud en una población. De otro 80 o 90 por ciento de los factores de salud modificables son comportamientos relacionados con la salud, entre ellos los factores socioeconómicos y factores de entorno físico que, generalmente, caen fuera del alcance de lo que consideramos atención médica (determinantes sociales de la salud DSS).
  • La genética es, por supuesto, un importante contribuyente a los resultados de salud. Pero al menos, por ahora, no es un contribuyente modificable de la salud.
  • La investigación que respalda los beneficios de agregar la responsabilidad de cribado de los DSS a la atención primaria es limitada. Con las consultas sobrecargadas, y el déficit de profesionales sanitarios que tenemos, la responsabilidad de abordarlos no debería ser únicamente del médico de familia.
  • Como médico que cree en el modelo biopsicosocial, encuentro el concepto de tratar de modificar los DSS de los pacientes atractivo. Pero como médico que es muy consciente de las expectativas en constante expansión de lo que debería estar haciendo para brindar atención de «calidad» en mi consulta, enfrentarme a esta nueva tarea me crea dudas: ¿Tiene sentido «medicalizar» cuestiones como la inseguridad económica, las desigualdades sociales y las condiciones de la vivienda? ¿No es este un cometido de la Salud Publica, las políticas y el trabajo sociales? ¿Deberíamos emplear más trabajadores sociales para ayudarnos a guiar a nuestros pacientes cuando sus resultados de detección de los DSS nos digan que necesitan ayuda? ¿Es posible dedicar mayores recursos? ¿Qué intervenciones marcarán la mayor diferencia? Y, finalmente, ¿Dónde está la investigación para apoyar este esfuerzo?
  • Esas son algunas preguntas  de la editorial que es necesario hacerse, al igual que reflexionar sobre la pertinencia de introducir otra encuesta de detección en mi práctica y luego no saber qué hacer con los resultados anormales, tema que me preocupa.

Hay otros aspectos del documento del Ministerio de Sanidad que creo que debemos abordar las sociedades científicas: la factibilidad del cribado de los DSS, como llevar a cabo la implementación de la propuesta y cómo podemos aumentar la implicación de los médicos de familia en esta tarea, y consensuar un paquete mínimo y factible de cribado de los DSS.  

Hacia una inteligencia artificial de diagnóstico conversacional

Por Julio Bonis Sanz. Médico de familia + MBA + Ingeniero de IA PLN

En el repositorio arXiv investigadores de Google han publicado hace tres días un artículo titulado: «Hacia una IA de diagnóstico conversacional» (Towards Conversational Diagnostic AI)

Diseño del estudio: en un estudio aleatorizado, doble ciego cruzado de consultas basadas en texto. Se elaboraron 149 escenarios clínicos que fueron representados por actores entrenados, al estilo de un Examen Clínico Objetivo Estructurado (ECOE). Los actores interaccionaban exclusivamente vía chat de texto, bien con 20 médicos de atencion primaria (10 canadienses y 10 indios) con amplio rango de experiencia (entre 3 y 30 años), o bien con un modelo de lenguaje (estilo chatGPT) denominado AMIE (Articulate Medical Intelligence Explorer).

Se pidió a los médicos y a la IA elaborar un listado de los 10 diagnósticos más probables ordenados de más a menos probables. Además se evaluaron multitud de dimensiones de la entrevista clínica; desde aspectos relacionados con la empatía, presencia del diagnóstico correcto entre el listado de diagnóstico, si el tratamiento recomendado era apropiado, si las pruebas complementarias solicitadas eran apropiadas, si las derivaciones al especialista eran adecuadas, etc.

Esta evaluación se realizó mediante dos tipos de cuestionarios: unos de satisfacción validados, rellenados por los actores (para las dimensiones de empatía) y otros cuestionarios rellenados POR MÉDICOS ESPECIALISTAS seleccionando la especialidad según el caso, a juicio de los investigadores (ingenieros informáticos de Google) para evaluar la calidad clínica. Se media por tanto esta última y , pero también la calidad empática del encuentro.

Resultados: La IA obtuvo mejores resultados en todas las dimensiones (clínicas y empáticas) que los médicos de atención primaria… a juicio de médicos especialistas.

AMIE supera a los médicos de familia en varios ejes de evaluación para el diálogo diagnóstico

Conclusión: La IA puede cambiar ciertas cosas, pero hay otras que no van a cambiar. Ninguno de los investigadores (ingenieros de Silicon Valley) ni ninguno de los médicos y expertos que andan estos días discutiendo las limitaciones del estudio (que las tiene) ha caído en la cuenta de que a lo mejor el criterio de un médico especialista no es lo mejor para valorar lo que ocurre en una consulta de atención primaria. Se considera una obviedad que el juicio clínico del médico especialista es el gold standard que por pura epistemología se asume que nunca se podrá superar (como mucho igualar).

Interpretación alternativa: Los resultados del estudio sugieren que la IA se comporta, en cuanto a sus decisiones clínicas, más como un especialista que como un médico de atención primaria. Esto tiene sentido pues los modelos de lenguaje están entrenados con el contenido encontrado en internet (incluido PubMed) y eso es lo que replican al generar textos.

Por tanto no sería descabellado pensar que los primeros susceptibles de ser sustituidos deberían ser los médicos especialistas y no los generalistas. Sin embargo eso tampoco lo veremos.

PD: como dato curioso se pidió a los especialistas indicasen si el «médico de familia/IA» había producido una «alucinación» (se define como un contenido sin sentido, erróneo o inventado por un modelo de lenguaje). Según se puede ver en el artículo publicado los especialistas (que evaluaban los chats sin saber si eran generados por humanos o una IA) encontraron alucinaciones en un 10% de los casos en la IA… y en un 15% de los médicos de familia. Corolario: Conviene no ir puestos de LSD al centro de salud.

Resumen canónico : En el corazón de la medicina se encuentra el diálogo médico-paciente, en el que una hábil anamnesis allana el camino para un diagnóstico preciso, un tratamiento eficaz y una confianza duradera. Los sistemas de Inteligencia Artificial (IA) capaces de dialogo diagnóstico podrían aumentar la accesibilidad, la coherencia y la calidad de la atención. Sin embargo, aproximarse a la experiencia de los médicos es un gran reto pendiente. Presentamos AMIE (Articulate Medical Intelligence Explorer), un sistema de IA basado en un modelo de lenguaje amplio (LLM) optimizado para el diálogo diagnóstico.

AMIE utiliza un novedoso entorno simulado basado en el juego automático con mecanismos de retroalimentación automatizados para escalar el aprendizaje a través de diversas enfermedades, especialidades y contextos. Diseñamos un marco para evaluar ejes de rendimiento clínicamente significativos, como la elaboración de la historia clínica, la precisión diagnóstica, el razonamiento de gestión, las habilidades de comunicación y la empatía. Comparamos el rendimiento de los AMIE con el de los médicos de atención primaria (MAP) en un estudio aleatorizado, doble ciego cruzado de consultas basadas en texto con actores pacientes validados al estilo de un Examen Clínico Objetivo Estructurado (ECOE). El estudio incluyó 149 escenarios de casos clínicos de profesionales de Canadá, el Reino Unido y la India, 20 MAPs para comparar con AMIE y evaluaciones por parte de médicos especialistas y  los actores que actuaban como pacientes.

AMIE demostró una mayor precisión diagnóstica y un rendimiento superior en 28 de 32 ejes según los médicos especialistas y en 24 de 26 ejes según los pacientes actores. Nuestra investigación tiene varias limitaciones y debe interpretarse con la debida cautela. Los médicos se limitaron a un chat de texto sincrónico poco familiar que permite interacciones a gran escala entre el AMIE y el paciente, pero que no es representativo de la práctica clínica habitual. Aunque es necesario seguir investigando antes de que AMIE pueda trasladarse a entornos reales, los resultados representan un hito hacia la IA de diagnóstico conversacional.

Autojustificación de bajas breves y otras propuestas de mejora en incapacidad temporal

Leon Vázquez F. Cubero Gonzalez P, Ballarin Gonzalez A. Autojustificación de bajas breves y otras propuestas de mejora en incapacidad temporal. AMF 2022;18(9):507-514.

Disponible en https://www.amf-semfyc.com/es/web/articulo/la-legislacion-sobre-incapacidad-temporal

  • La incapacidad temporal (IT) incluye una prestación sanitaria, una prestación económica y un permiso para ausentarse del trabajo.
  • La Unión Europea lo reconoce como un derecho de todos los trabajadores comunitarios, desarrollado de forma soberana por cada Estado.
  • La IT en España supone anualmente la pérdida de 1.700 millones de horas de trabajo, un coste patronal estimado de 31.000 millones euros y un coste para la Seguridad Social de 10.800 millones euros.
  • La tasa de absentismo laboral en España (6,6%) está en la media europea, muy por debajo de países como Francia (18%).
  • El médico de familia soporta, por motivos históricos, la mayor parte de las tareas derivadas de la IT durante los primeros 365 días, muchas de las cuales no aportan valor y deben ser revisadas.
  • La autojustificación de las bajas breves (hasta 7 días) está presente en muchos países de nuestro entorno y podría aplicarse al nuestro.
  • Los primeros 3 días de baja por contingencia común, el trabajador no recibe prestación económica, salvo mejora por vía de convenio colectivo, por lo que una baja breve no tiene relevancia económica para la Seguridad Social.
  • El Real Decreto 625/2014 establece que el médico que reconoce al enfermo es quien debe emitir el parte de baja, sin especificar si se trata del médico hospitalario, el de familia, el de urgencias o privado.
  • Para que se genere derecho a IT, la norma exige que el paciente reciba tratamiento en la Seguridad Social, lo que deja en un limbo legal la atención privada.
  • Debería habilitarse un procedimiento ajeno al médico de familia para la gestión de las bajas nacidas de procesos en seguimiento en centros privados.
  • Las mutualidades de funcionarios (MUFACE, ISFAS, MUGEJU) deberían tener una normativa homogénea con el resto de los trabajadores.
  • La diferenciación entre contingencias comunes y laborales es fuente de conflictos por algunos casos que resultan mal definidos.
  • Gran parte del contenido de los partes de incapacidad temporal son ajenos al acto clínico y al médico y deben ser aportados por el trabajador, la empresa o la mutua

¿Son fiables las nuevas recomendaciones de la Asociación Americana de la Diabetes?

Cada año por estas fechas, la ADA (American Diabetes Association) publica las Standards of Care in Diabetes que como su propio nombre indica marcas los estándares de atencion de los pacientes con diabetes.

un conjunto de pautas integrales basadas en evidencia para el manejo de la diabetes tipo 1, tipo 2, diabetes gestacional y prediabetes, según las últimas investigaciones científicas y ensayos clínicos. Incluye estrategias para diagnosticar y tratar la diabetes tanto en jóvenes como en adultos, métodos para prevenir o retrasar la diabetes tipo 2 y sus comorbilidades, como las enfermedades cardiovasculares (ECV) y la obesidad, y enfoques terapéuticos para minimizar las complicaciones y mejorar los resultados de salud. 
https://diabetes.org/newsroom/press-releases/la-asociacion-americana-de-la-diabetes-publica-los-estandares-de-cuidado

Nada mas publicarse son comentadas y difundidas en múltiples formatos por muchos interesados y asociaciones de médicos de familia, internistas, cardiólogos, nefrólogos y endocrinólogos, ya que al fin y al cabo se consideran como «El Caton» de todo aquél interesado en esta enfermedad.

Hasta tal punto se considera un fuente de autoridad que cualquier critica a estas origina polémica, no siempre científica. Por otro lado desde comienzos de este siglo el «mercado» de la diabetes se ha visto sacudido intensamente por la aparición de nuevos fármacos y la consiguiente del aumento explosivo de ensayos, publicaciones, guías, formación continuada, cursos, etc. que la promoción de estos medicamentos conlleva. En estos materiales las recomendaciones de la ADA suelen ocupar un lugar fundamental.

La revista Journal of Evaluation in Clinical Practice publica un breve comentario con el sugestivo titulo de Are American Diabetes Association’s new guidelines reliable? * donde se pone en duda la confiabilidad de estas directrices. En resumen, los autores piensan que estas recomendaciones fallan a la hora de realizar revisiones de la literatura y utilizar revisiones sistemáticas y metanálisis que apoyen sus recomendaciones, un paso imprescindible a la hora de emitir pautas fiables. Tomando como base las recomendaciones de la ADA de 2023 utilizan dos ejemplos que expresan como esta revisión sistemática falla o no se ha realizado, a saber:

  • En el capitulo «Objetivos glucémicos», sólo se identificó un metanálisis que evaluaba el control. mientras que hay otros 11 metanálisis que evaluaron la eficacia del control glucémico intensivo y el logro de los objetivos de HbA1c que no se nombran, ni citan.
  • En el capítulo «Enfoques farmacológicos del tratamiento glucémico«, se citan 114 referencias. Sin embargo, no se citan dos metaanálisis críticos con las aseveraciones de la recomendación, en concreto con a la eficacia de la metformina en el desarrollo de las complicaciones de las Diabetes Mellitus tipo II.

Los autores concluyen que los médicos asistenciales hacen bien en delegar las búsqueda y critica de la evidencia en otros expertos, siempre que dichos expertos respeten el enfoque que recomienda la medicina basada en la evidencia. Sin embargo, no parece que éste sea el caso de las recomendaciones Standards of Care in Diabetes-2023 de la ADA.

* Se puede consultar al traducción del texto completo aquí

Próximo comentario: «Reacciones a una entrada en X en el que se recogía la aparición de este artículo