Categoría: Investigación en medicina

Hacia una inteligencia artificial de diagnóstico conversacional

Por Julio Bonis Sanz. Médico de familia + MBA + Ingeniero de IA PLN

En el repositorio arXiv investigadores de Google han publicado hace tres días un articulo titulado: «Hacia una IA de diagnóstico conversacional» (Towards Conversational Diagnostic AI)

Diseño del estudio: en un estudio aleatorizado, doble ciego cruzado de consultas basadas en texto. Se elaboraron 149 escenarios clínicos que fueron representados por actores entrenados, al estilo de un Examen Clínico Objetivo Estructurado (ECOE). Los actores interaccionaban exclusivamente via chat de texto bien con 20 médicos de atencion primaria (10 canadienses y 10 indios) con amplio rango de experiencia (entre 3 y 30 años) bien con un modelo de lenguaje (estilo chatGPT) denominado AMIE (Articulate Medical Intelligence Explorer).

Se pidió a los médicos y a la IA elaborar un listado de los 10 diagnósticos más probables ordenados de más a menos probables. Además se evaluaron multitud de dimensiones de la entrevista clínica; desde aspectos relacionados con la empatía, presencia del diagnóstico correcto entre el listado de diagnóstico, si el tratamiento recomendado era apropiado, si las pruebas complementarias solicitadas eran apropiadas, si las derivaciones al especialista eran adecuadas, etc.

Esta evaluación se realizó mediante dos tipos de cuestionarios: unos de satisfacción validados, rellenados por los actores (para las dimensiones de empatía) y otros cuestionarios rellenados POR MEDICOS ESPECIALISTAS seleccionando la especialidad según el caso a juicio de los investigadores (ingenieros informáticos de Google) para evaluar la calidad clínica. Se media por tanto esta ultima y , pero también la calidad empática del encuentro.

Resultados: La IA obtuvo mejores resultados en todas las dimensiones (clínicas y empáticas) que los médicos de atención primaria… a juicio de médicos especialistas.

AMIE supera a los médicos de familia en varios ejes de evaluación para el diálogo diagnóstico

Conclusión: La IA puede cambiar ciertas cosas, pero hay otras que no van a cambiar. Ninguno de los investigadores (ingenieros de Silicon Valley) ni ninguno de los médicos y expertos que andan estos días discutiendo las limitaciones del estudio (que las tiene) ha caído en la cuenta de que a lo mejor el criterio de un médico especialista no es lo mejor para valorar lo que ocurre en una consulta de atención primaria. Se considera una obviedad que el juicio clínico del médico especialista es el gold standard que por pura epistemología se asume nunca se podrá superar (como mucho igualar).

Interpretación alternativa: Los resultados del estudio sugieren que la IA se comporta, en cuanto a sus decisiones clínicas, más como un especialista que como un médico de atención primaria. Esto tiene sentido pues los modelos de lenguaje están entrenados con el contenido encontrado en internet (incluido PubMed) y eso es lo que replican al generar textos.

Por tanto no sería descabellado pensar que los primeros susceptibles de ser sustituidos deberían ser los médicos especialistas y no los generalistas. Sin embargo eso tampoco lo veremos.

PD: como dato curioso se pidió a los especialistas indicasen si el «medico de familia/IA» habia producido una «alucinación» (se define como un contenido sin sentido, erróneo o inventado por un modelo de lenguaje).Según se puede ver en el artículo publicado los especialistas (que evaluaban los chats sin saber si eran generados por humanos o una IA) encontraron alucinaciones en un 10% de los casos en la IA… y en un 15% de los médicos de familia. Corolario: Conviene no ir puestos de LSD al centro de salud.

Resumen canónico : En el corazón de la medicina se encuentra el diálogo médico-paciente, en el que una hábil anamnesis allana el camino para un diagnóstico preciso, un tratamiento eficaz y una confianza duradera. Los sistemas de Inteligencia Artificial (IA) capaces de dialogo diagnóstico podrían aumentar la accesibilidad, la coherencia y la calidad de la atención. Sin embargo, aproximarse a la experiencia de los médicos es un gran reto pendiente. Presentamos AMIE (Articulate Medical Intelligence Explorer), un sistema de IA basado en un modelo de lenguaje amplio (LLM) optimizado para el diálogo diagnóstico.

AMIE utiliza un novedoso entorno simulado basado en el juego automático con mecanismos de retroalimentación automatizados para escalar el aprendizaje a través de diversas enfermedades, especialidades y contextos. Diseñamos un marco para evaluar ejes de rendimiento clínicamente significativos, como la elaboración de la historia clínica, la precisión diagnóstica, el razonamiento de gestión, las habilidades de comunicación y la empatía. Comparamos el rendimiento de los AMIE con el de los médicos de atención primaria (MAP) en un estudio aleatorizado, doble ciego cruzado de consultas basadas en texto con actores pacientes validados al estilo de un Examen Clínico Objetivo Estructurado (ECOE). El estudio incluyó 149 escenarios de casos clínicos de profesionales de Canadá, el Reino Unido y la India, 20 MAPs para comparar con AMIE y evaluaciones por parte de médicos especialistas y  los actores que actuaban como pacientes.

AMIE demostró una mayor precisión diagnóstica y un rendimiento superior en 28 de 32 ejes según los médicos especialistas y en 24 de 26 ejes según los pacientes actores. Nuestra investigación tiene varias limitaciones y debe interpretarse con la debida cautela. Los médicos se limitaron a un chat de texto sincrónico poco familiar que permite interacciones a gran escala entre el AMIE y el paciente, pero que no es representativo de la práctica clínica habitual. Aunque es necesario seguir investigando antes de que AMIE pueda trasladarse a entornos reales, los resultados representan un hito hacia la IA de diagnóstico conversacional.

Nirsevimab (Beyfortus®)

Por Juan Gérvas, Doctor en Medicina, médico general jubilado, ex-profesor de salud pública, Equipo CESCA, Madrid, España. jjgervas@gmail.com

Inyectar “nirsevimab” (Beyfortus ), un anticuerpo monoclonal, a recién nacidos y bebés para, preventivamente, evitar ingresos por bronquiolitis (por virus sincitial respiratorio)?

¡Pero si estos ingresos hospitalarios son pediatra-dependientes y Beyfortus no compensa beneficios con daños!

1. En mi pueblo

Cuando era médico rural, durante la semana los niños tenían catarro “que le había bajado” pero si no se había pasado la infección y seguían tosiendo, el viernes tenían bronquiolitis por virus sincitial respiratorio porque sabía que ese era el diagnóstico inevitable si la familia llevaba el bebé a urgencias al hospital.

De paso advertía: “Si lo lleváis a urgencias del hospital, para la bronquiolitis no hay tratamiento específico: no sirve adrenalina, ni antibióticos, ni corticoides, ni antitusivos, ni salbutamol, ni suelo salino hipertónico nebulizado, etc.”

Y “Lamentablemente, si vais a urgencias del hospital, el ingreso depende del pediatra que lo vea. Los hay que ponen la etiqueta a todos los niños para justificar su ingreso y los hay raros y sensatos que apenas ingresan con el diagnóstico de bronquiolitis”.

Y “Lo más importante, sigue dando el pecho que eso sí que evita bronquiolitis, neumonías, otitis y los ingresos y la mortalidad”.

Insistía en la lactancia al pecho porque se asocia a menos neumonías e infecciones en general de vías respiratorias bajas, menor mortalidad y también menos otitis media graves. El riesgo de hospitalización por infecciones de las vías respiratorias bajas como bronquiolitis en el primer año se reduce un 72% si los lactantes son amamantados exclusivamente durante más de 4 meses

Por cierto, justo el ingreso en el hospital de los bebés con la etiqueta de bronquiolitis conlleva en muchos casos la interrupción de la lactancia materna

2. En España, la bronquiolitis es una vergüenza

En España “bronquiolitis” es un diagnóstico que justifica ingresos con una variabilidad asombrosa, según zona geográfica.

Tenemos áreas sanitarias como Navalmoral de la Mata (en Cáceres) con 60 ingresos de bronquiolitis por 10.000 niños (en el año 2018). Al lado está Plasencia, con 443.

En Murcia, en la Vega Media del Segura los ingresos son 112 por 10.000 niños, y al lado Yecla-Jumilla tiene 800. En Lérida, en Pallars 917 ingresos, y al lado Alt Urgell 256.

[Por cierto, eche un ojo a este Atlas de Variaciones en Hospitalizaciones Pediátricas y localice su zona geográfica para hacerse idea de qué pie cojean sus pediatras].

No se ingresa por gravedad de la bronquiolitis, sino por los hábitos de los pediatras que trabajan dónde vive el bebé.

Como bien escribió un pediatra sensato, “La bronquiolitis es una vergüenza para la Pediatría”.

Se emplea todo medicamento que no se debe emplear ya que falla la ciencia, la ética y la profesionalidad. Además, se toman decisiones erróneas y dañinas con métodos diagnósticos como oximetría y radiografía de tórax, véase por ejemplo:

¿Hemos de poner suero salino hipertónico a los lactantes con bronquiolitis en Urgencias Pediátricas?
Manejo de la bronquiolitis aguda en atención primaria: análisis de variabilidad e idoneidad (proyecto aBREVIADo)
Effect of Oximetry on Hospitalization in BronchiolitisA Randomized Clinical Trial
Avoid doing chest x rays in infants with typical bronchiolitis

Por cierto, la mortalidad por bronquiolitis en España y los países desarrollados es prácticamente inexistente, aunque la propaganda del anticuerpo se base en que [el virus sincitial respiratorio] “es la segunda causa de muerte en el mundo en menores de un año”

3. “Nirsevimab” (Beyfortus)

Los anticuerpos monoclonales son medicamentos agresivos y caros («los medicamentos que llevan a los médicos a congresos más lejanos y lujosos»), que pueden tener graves efectos adversos. Entre ellos: reactivación de infecciones, enfermedad tiroidea, lupus eritematoso, dermatitis, cánceres, leucoencefalopatía, etc.

Beyfortus (nirsevimab) es un anticuerpo monoclonal humano de inmunoglobulina G1 kappa (IgG1κ) producido en células de ovario de hámster chino (CHO) mediante tecnología de ADN recombinante.  De hecho, aunque en el ensayo clínico para prevenir los ingresos por bronquiolitis no hubo efectos adversos importantes, en la Ficha Técnica y en el prospecto de Beyfortus se advierte de que: «Este medicamento está sujeto a seguimiento adicional, lo que agilizará la detección de nueva información sobre su seguridad«

4. ¿Tenemos ya suficiente información para hacer la recomendación de introducir Beyfortus (nirsevimab)?

No

Unos pediatras sensatos revisaron la literatura y concluyeron :

“¿Es ya el momento para extender su uso universal? Si tenemos en cuenta la carga de enfermedad y la potencial gravedad de las bronquiolitis encontramos argumentos a favor. Pero si consideramos las limitaciones de la evidencia disponible y la conveniencia de conocer los resultados de otros estudios en marcha, la urgencia de la decisión queda cuestionada, por lo que parece prudente esperar para hacer recomendaciones”

Nirsevimab y prevención de bronquiolitis en lactantes nacidos a término. Evidencias en Pediatria Septiembre 2023. Volumen 19. Número 3

Así mismo, la evaluación con el método GRADE del ensayo clínico que “justifica” su venta concluyó que:

“No se encontraron diferencias estadísticamente significativas entre ambos grupos [placebo y tratado], durante 150 días de seguimiento, en las variables:

1) Hospitalización, con prueba positiva a virus respiratorio sincitial, y

2) Hospitalización por todas las enfermedades respiratorias de cualquier causa»

Conviene tener en cuenta, también, la presión selectiva del medicamento sobre el virus. Es decir, la selección por el uso de nirsevimab de variedades del virus sincitial con mutaciones que le hagan resistente.

5. La tesitura de las familias españolas este otoño-invierno: “Si el pediatra sabe que no hemos inyectado al bebé con Beyfortus (nirsevimab), seguro que le diagnostica bronquiolitis y en urgencias lo ingresan por lo mismo”

Efectivamente, esa es la cuestión, que en muchos casos el ingreso por infección por virus sincitial respiratorio, bronquiolitis, es un “diagnóstico a posteriori” (se emplea para etiquetar  justificar acciones sin ciencia ni ética). El diagnóstico va detrás de la decisión clínica, una irracionalidad frecuente por más que sea increíble (Diagnosis, the Achiles heel).

Como el ingreso por bronquiolitis es pediatra-dependiente, los bebés no inyectados con el anticuerpo monoclonal serán ingresados con más frecuencia que los inyectados. Es un sesgo de confirmación (todo lo que conseguimos parece confirmar lo que pensamos).

¡Pobres familias que tendrán que aceptar la inyección de Beyfortus (nirsevimab) a sabiendas de su negativo balance daños-beneficios!

l

Primum non chirurgiae

Por Gustavo Aparicio Campillo.

Dentro de la Estrategia de Seguridad del Paciente del Servicio Madrileño de Salud 2027 , se encuentra la línea estratégica 8:

Los sistemas sanitarios deben prestar una asistencia de alto valor, y la atención de menor valor o ineficiente, debe ser identificada, reducida de forma segura y, si procede, interrumpida. Una recomendación en este sentido, es una indicación de abandonar una práctica clínica de escaso valor. El escaso valor lo determina el hecho de que la práctica no reporte ningún beneficio conocido para los pacientes y/o les ponga en riesgo de sufrir daños y además pueda suponer un derroche de recursos, sanitarios y/o sociales.

Estrategia de seguridad del paciente del servicio madrileño de salud 2017

En relación a lo anteriormente expuesto traemos a este blog el artículo Common elective orthopaedic procedures and their clinical effectiveness: umbrella review of level 1 evidence (Blom et al. BMJ 2021;374:n1511). En esta revisión sistemática «paraguas» se reviso la evidencia disponible de diez de los procedimientos ortopédicos electivos más frecuentes, a saber:

  • Ligamentoplastia de ligamento cruzado anterior
  • Sutura meniscal
  • Meniscectomía parcial artroscópica
  • Reparación del manguito rotador
  • Descompresión subacromial artroscópica
  • Liberación del túnel carpiano
  • Descompresión lumbar
  • Artrodesis lumbar
  • Prótesis total de cadera
  • Prótesis total de rodilla

Los resultados de la revisión mostraron que solo la descompresión del túnel carpiano y la prótesis total de rodilla aportaban evidencia de la superioridad sobre tratamientos no quirúrgicos o conservadores, basada en ensayos clínicos controlados y aleatorizados (ECAs). La descompresión del tunel carpiano es la técnica con evidencia más «potente». En el caso de de la prótesis total de cadera o la sutura meniscal no se encontró ningún ECA que las compararan con otros tratamientos.

Las pruebas para los otros seis procedimientos citados no mostraron beneficio alguno sobre el tratamiento conservador.

En la conclusión, se señala que aunque pueden ser eficaces, no existe evidencia de alta calidad en muchos de los procedimientos ortopédicos. Esto es debido a la ausencia de ECAs que comparen cada procedimiento en cuestión con el manejo conservador. Algunos de estos procedimientos, directamente no son eficaces clínicamente, o solo en circunstancias específicas. Por ejemplo, la meniscectomía parcial artroscópica especialmente en pacientes con artrosis de rodilla o con rotura degenerativa no debe ser recomendada en general, salvo en casos concretos de pacientes. Sin embargo, y a pesar de la solida evidencia sobre la ineficacia de la descompresión subacromial artroscópica, las guías nacionales siguen recomendando su uso para pacientes con un síndrome subacromial aislado cuyos síntomas no se resuelven con un adecuado tratamiento no quirúrgico.

Algunos procedimientos pueden ser válidos incluso aunque la evidencia de alta calidad no se haya establecido todavía , o que la evidencia observacional sea tan abrumadora que realizar ensayos clínicos pudiera considerarse incluso poco ético o redundante. Un ejemplo de esto es el caso de las prótesis de cadera.

En una entrevista al Dr Julio Doménech publicada en la revista Clinical Orthopaedics and Related Research, con motivo de la publicación de un estudio observacional donde se mostro el aumento de las meniscectomías artroscópicas (especialmente entre adultos y mayores) comenta que en cuando los incentivos económicos tienen poco peso, como es el caso de España con un sistema sanitario publico donde los médicos son asalariados, hay que buscar otros condicionantes y causas. Para él, la forma en que los médicos adquieren el conocimiento y la forma de interpretarlo, es fundamental.

Por tanto, creo que el factor explicativo más potente es la falta de difusión de los nuevos conocimientos o el descreimiento de la evidencia por parte de los cirujanos españoles.

Julio Doménech Fernández MD, PhD

Remarca, que ni las autoridades sanitarias ni las sociedades científicas han hecho campaña para revertir prácticas quirúrgicas inapropiadas.. Las iniciativas españolas, como las señaladas en la propia estrategia de seguridad del paciente ( Compromiso por la calidad de las Sociedades Científicas, «Si no es necesario puede hacer daño” y la iniciativa “Essencial”) se comportan como brindis al sol o iniciativas para cumplir el expediente, donde se manifiesta una preocupación voluntarista, más que campañas reales bien publicitadas y difundidas.

Hablemos de la revisión por pares


Traducción de Let’s Talk Peer Review original de John Mandrola

El Estudio de la Semana explora el juicio de la ciencia médica. Aquí hay tres ejemplos que enfatizan algunas de las limitaciones de la revisión por pares

Enjuiciar ciencia siempre ha sido polémico. Pero el debate solía permanecer entre los científicos.

Las redes digitales y sociales, y, por supuesto, la pandemia y su politización de la ciencia han llevado el debate de revisión por pares a asunto principal. Tanto es así que la revisión por pares es ahora una  especie de modificador común.

Como en:

«Este documento revisado por pares informó …»

o

Este preprint, que aún no ha sido revisado por pares, encontró …»

Sin embargo, algo tan importante como juzgar la ciencia de alguna manera ha escapado en gran medida al estudio empírico.

Una revisión sistemática Cochrane de solo 28 estudios encontró que «hay poca evidencia empírica disponible para apoyar el uso de la revisión editorial por pares como un mecanismo para garantizar la calidad de la investigación biomédica».

Bueno, es decir, hasta el mes pasado

La influyente revista científica Proceedings of the National Academy of Science (PNAS para abreviar) publicó un experimento real para resolver el «sesgo del status» (n del t: también conocido como Efecto Mateo) en la revisión por pares. El sesgo de estatus es cuando los investigadores prominentes disfrutan de un trato más favorable que los investigadores sin tanto renombre.

Los autores invitaron a más de 3.300 investigadores a revisar un trabajo de investigación financiera escrito conjuntamente por un autor prominente (un premio Nobel) y un autor relativamente desconocido (un asociado de investigación en los inicios de su carrera), variando si los revisores podían ver el nombre del autor prominente, una versión anónima del artículo o el nombre del autor menos conocido.

Completaron 537 reseñas. La figura cuenta una historia impactante. Recuerde, es el MISMO documento

El lado izquierdo considera el rechazo. Aquí, el 65% de los revisores recomienda el rechazo, si el autor era un investigador junior (AL), el 48% rechazó una versión anónima frente a solo el 22% rechaza si el investigador prominente fue el autor (AH).

El lado derecho de la figura considera críticas positivas. Los autores consideraron una combinación de revisión menor o aceptar como «positiva», y se puede ver claramente un inverso de la relación. 10% para el investigador junior, 24% para el artículo anónimo y un masivo 59% para el investigador senior.

Podrías decir, vamos Mandrola, ese es un estudio. Estás recogiendo cerezas. ¡La revisión por pares es excelente!

Permítanme mostrarles dos ejemplos más.

Primero, es de la misma revista, PNAS, en 2014. En este experimento, los investigadores utilizaron los datos de un conjunto de más de 1000 manuscritos enviados a 3 revistas médicas de élite. La idea era evaluar las citas de los artículos que recibieron diferentes evaluaciones por parte de editores y revisores pares. En este conjunto de datos, 946 envíos fueron rechazados y 62 aceptados. De los rechazados, se publicaron (posteriormente) 757 artículos.

Como era de esperar, los artículos que inicialmente fueron rechazados o recibieron puntuaciones más bajas de revisión por pares terminaron con menos citas que los que pasaron la prueba. Pero. Hubo numerosas decisiones cuestionables en el proceso de control de acceso

Al examinar del total de los 808 manuscritos finalmente publicados, nuestras tres revistas focales rechazaron los 14 artículos más citados». De hecho, 12 de estos 14 artículos rechazados ni siquiera fueron enviados a revisores pares. El comité editorial lo rechazó.

Mira el extremo derecho. Los documentos más importantes fueron rechazados inicialmente.

.

Ahora una historia personal de cómo una revisión por pares sesgada afecta la interpretación de un estudio.

Junto con un equipo de investigación de Penn State, realizamos un metanálisis de estudios que compararon dos formas de evaluar a los pacientes que presentan sospecha de enfermedad coronaria.

Una forma fue con una angiografía coronaria por tomografía computarizada (CTA). Esto detecta obstrucciones anatómicas. La otra forma fue con una prueba funcional, como una prueba de esfuerzo. Esto detecta si la obstrucción suponer una carga para el corazón.

Hubo 13 estudios que compararon directamente estas técnicas. Un metaanálisis agrupa los resultados de estos juntos: la idea de combinar estudios (similares) pero más pequeños en uno grande conduce a una mayor precisión en la estimación.

La clave absoluta es que los estudios sean similares.

Si lee nuestro artículo en la importante revista JAMA-Internal Medicine, podra ver que los pacientes que fueron evaluados con cualquiera de las pruebas, no tuvieron diferencias en la mortalidad futura o la hospitalización por causa cardíaca. Pero aquellos que se sometieron a imágenes de CTA tuvieron una probabilidad ligeramente reducida de un futuro IM (ataque cardíaco). Nuestro estudio ahora es citado por los defensores de las imágenes CTA basándose en esta pequeña diferencia.

Pero este hallazgo fue 100% susceptible a la inclusión de un estudio, llamado SCOT-HEART, que no pensamos que pertenecía al análisis. El artículo original no incluyó SCOT-HEART porque ese ensayo comparó la CTA y las pruebas de esfuerzo funcional con las pruebas funcionales solas. No fue lo suficientemente similar a los otros estudios, en nuestra opinión.

Adivina qué: los revisores no aceptaron nuestra decisión. Tuvimos la opción de publicar el artículo con SCOT-HEART incluido o irnos con la música a otra parte.

Sí, explicamos el hecho de que SCOT-HEART no pertenecía, y que excluirlo eliminó la señal de reducción de IM en la sección de resultados y discusión, pero el resumen y los hallazgos principales incluyen el resultado favorable. Esto es lo que escribimos, bien abajo en la sección de discusión. Esa parte rara vez se cita.

Conclusión:

Mostrar defectos en la revisión por pares no es argumentar que deberíamos eliminarla.

Sin embargo, debemos comprender sus limitaciones, considerar formas de mejorarlo y nunca aceptar ciegamente un hallazgo únicamente porque ha pasado la revisión por pares. Del mismo modo, tampoco debemos ignorar los hallazgos que no han pasado la revisión por pares.

El propósito de la Medicina Sensible es elevar el nivel de evaluación crítica de la ciencia médica. La revisión por pares nunca debe detenerse o influir indebidamente en nuestro proceso de pensamiento.

La mayoría de las intervenciones para la salud sometidas a revisiones Cochrane no son eficaces…

Howick J, Koletsi D, Ioannidis JPA, Madigan C, Pandis N, Loef M, Walach H, Sauer S, Kleijnen J, Seehra J, Johnson T, Schmidt S. Most healthcare interventions tested in Cochrane Reviews are not effective according to high quality evidence: a systematic review and meta-analysis. J Clin Epidemiol. 2022 Apr 18;148:160-169

Traducido por Salud y Fármacos, publicado en Salud y Fármacos: Agencias Reguladoras 2022; 25 (2)

Aspectos destacados:

  • En esta gran muestra de 1.567 intervenciones sometidas a revisiones Cochrane, los efectos de la mayoría de las intervenciones (94%) no estaban respaldados por evidencia de gran calidad.
  • Los daños potenciales de las intervenciones en salud se midieron con menor frecuencia que los beneficios.
  • Los pacientes, los médicos y los responsables políticos, cuando toman decisiones, deben tener en cuenta la falta de pruebas de gran calidad para respaldar los beneficios y los daños de muchas intervenciones.

Resumen
Objetivo: Estimar la proporción de intervenciones en salud que se han sometido a revisiones Cochrane que cuentan con evidencia de gran calidad de su efectividad.

Métodos. De todas las Revisiones Cochrane publicadas entre el 1 de enero de 2008 y el 5 de marzo de 2021 se seleccionó una muestra aleatoria de 2.428 (35%) revisiones. Se extrajeron datos sobre las intervenciones incluidas en estas revisiones que se compararon con placebo, o con ningún tratamiento, y la calidad de los resultados se calificó mediante el sistema de Evaluación, Desarrollo y Valoración de Recomendaciones (Grading of Recommendations Assessment, Development and Evaluation o GRADE). Se calculó la proporción de intervenciones que contaban con evidencia de gran calidad para respaldar sus beneficios (definidas como que tenían una calificación GRADE de calidad alta para al menos un resultado primario, resultados positivos estadísticamente significativos y que los autores de las revisiones consideraron que eran eficaces). También se calculó la proporción de intervenciones que sugerían daños.

Resultados. De las 1.567 intervenciones elegibles, 87 (5,6%) contaban con evidencia de gran calidad que apoyaba sus beneficios. Se midieron los daños de 577 (36,8%) intervenciones. Hubo pruebas estadísticamente significativas de daño en 127 (8,1%) de ellas. La principal limitación que podría tener nuestro estudio es que confiamos en la válidez de las evaluaciones que hicieron los autores de las evaluaciones Cochrane (incluyendo sus evaluaciones GRADE).

Conclusión. Más de 9 de cada 10 intervenciones estudiadas en las revisiones Cochrane recientes no están respaldadas por evidencia de alta calidad, y los daños están infradeclarados.

Musculo y estatinas

El estudio StatinWISE, publicado a principios de 2021 en BMJ, sorprende por tres razones: la primera por su metodología, ya que emplea un diseño poco conocido como el ensayo de n igual a 1 a; la segunda, porque pone de relieve un problema frecuente y tercero porque da resultados que, sin duda, resultan polémicos. El artículo en cuestión es un ensayo n = 1 (más bien una serie de ensayos n = 1) multicéntrico, aleatorizado y controlado con 200 pacientes que habían interrumpido poco antes el tratamiento con estatinas o estaban considerando interrumpirlo, debido a síntomas musculares. Los participantes fueron distribuidos de forma aleatoria a una secuencia de seis períodos de tratamiento (de 2 meses cada uno) doble ciego, con 20 mg de atorvastatina una vez al día o placebo con doble ciego. El análisis primario comparó los síntomas musculares evaluados por los participantes en una escala visual analógica (0-10) durante los períodos de estatina o placebo. Los participantes incluidos en el análisis no mostraron diferencia en las puntuaciones de los síntomas musculares en los períodos de estatinas y los de placebo (diferencia de medias de estatinas menos placebo –0,11, intervalo de confianza del 95%: de –0,36 a 0,14; p = 0,40). En cuanto a los resultados secundarios: un 88% dijeron, a los 3 meses de finalizar el último tratamiento, que el ensayo había sido útil; dos tercios de los participantes que completaron el ensayo informaron que reiniciarían el tratamiento a largo plazo con estatinas que habían seguido con anterioridad. La suspensión de la medicación debido a síntomas musculares no tolerables fue del 9% durante el período de estatinas y del 7% durante el período de placebo.

Los resultados de este estudio es probable que sean válidos, pero ponen muy en cuestión una creencia arraigada en Atención Primaria y que, a tenor de los resultados, parece que ha sido exagerada. Cuando un paciente consulta por síntomas musculares frecuentes, como dolor, debilidad, sensibilidad, rigidez o calambres, es un clásico en las consultas, achacarlos a la toma de estatinas. Se ha sumado a la lista de efectos adversos comunes de medicamentos muy utilizados que cualquier profesional tiene en mente. Sin embargo, aunque la percepción por parte de pacientes y profesionales sea esa, parece que los dolores musculares por estatinas no tienen la entidad, ni la frecuencia que, por ejemplo, las cefaleas y edemas maleolares de los antagonistas del calcio, o la tos por inhibidores de la enzima conversora de angiotensina. Además, los resultados sugieren que muchos de estos síntomas serían atribuibles al efecto nocebo. Detener el tratamiento con estatinas debido a estos síntomas musculares inespecíficos no graves, puede tener algún beneficio, como es el caso de una indicación terapéutica no adecuada, tan frecuente con estos fármacos, pero no deja de ser una treta, no muy elegante. Además, puede ocasionar un perjuicio si, como sucedió en el estudio, alrededor del 70% de los participantes tenían enfermedad cardiovascular conocida que requería tratamiento para la prevención del riesgo cardiovascular.

a El ensayo clínico de N igual a 1 es un tipo de ensayo en el que toda la población se limita a un paciente que recibe consecutivamente y por períodos de tiempo el fármaco o intervención y el comparador o placebo, el orden de administración de los tratamientos comparados se determina de manera aleatoria; podríamos decir que el paciente hace su propio control en períodos consecutivos.

Publicado en Bravo Toledo R. Leyendas en la consulta de una médica de familia. AMF 2021; 17(8); 489-490

Enfriamiento después de un paro cardíaco: la esclerosis de la moda terapéutica

Traducción libre de Cooling After Cardiac Arrest – The Sclerosis of Therapeutic Fashion por John Mandrola

La historia de cómo una terapia ineficaz ha persistido durante décadas

Una inversión reciente en una práctica establecida en cardiología proporciona un hermoso ejemplo de cómo la ciencia sesgada, el conflicto de intereses intelectuales y el sesgo de intervención pueden llevar por el mal camino a la práctica médica, durante dos décadas.

La práctica en reversión implica el cuidado de los supervivientes de paro cardíaco. Se llama control de temperatura dirigido o hipotermia inducida. Más simple: enfriamiento.

Como consultor de arritmias, a menudo me piden que vea a supervivientes de paro cardíaco en la UCI. Lo que se ve es un espectáculo: el paciente está sedado, paralizado, conectado al aparato de refrigeración y casi siempre atendido por un miembro del personal de la UCI.

Cada vez que veo algo tan laborioso y agresivo, me pregunto sobre la evidencia. La parte marciana neutral de mi cerebro pregunta: ¿todo esto realmente ayuda?

La respuesta más corta es no, no lo hace.

Tenga en cuenta que la relevancia de esta historia se extiende más allá de los detalles de una terapia de UCI, ya que la mayoría de nosotros no somos médicos de la UCI.

La gran historia es cómo una práctica agresiva se convirtió en moda terapéutica a pesar de la evidencia de mala calidad. luego, incluso cuando la evidencia publicada mostró que no funcionó, la práctica persistió.

Hay cuatro capítulos en esta historia:

Capítulo 1: El viento de cola de la plausibilidad:

El paro cardíaco hace que el cerebro se vea privado de oxígeno y nutrientes. Cuanto más largo sea el período sin flujo sanguíneo, mayor será la lesión cerebral.

El enfriamiento rápido puede reducir la demanda de nutrientes y reducir la lesión cerebral. El enfriamiento, por ejemplo, se usa durante algunas cirugías en las que detiene transitoriamente el flujo sanguíneo al cerebro. Los estudios en animales sugirieron que el enfriamiento mitigaba el daño cerebral después de un paro cardíaco.

En otras palabras: el enfriamiento después de un paro cardíaco tiene sentido. Dado que la lesión de órganos ocurre cuando la demanda de nutrientes supera el suministro, el enfriamiento reduce la demanda y eso puede reducir la lesión cerebral.

El problema es que enfriar a un ser humano no es poca cosa. Bajar a 33 grados requiere colocar al paciente en un sistema de enfriamiento, con almohadillas envueltas alrededor del cuerpo. Esto induce escalofríos, que luego se suprimen con sedación intensa y agentes paralíticos.

Luego está el hecho de que las funciones normales del cuerpo se optimizan a 37 °grados (C). El enfriamiento puede afectar la presión arterial, aumentar el riesgo de infección, disminuir la frecuencia cardíaca, inducir arritmia y prolongar el tiempo hasta la vigilia.  El enfriamiento también requiere mucha atención profesional: más extracciones de sangre, monitoreo y tiempo de personal.

Capítulo 2: Los estudios de 2002:

En 2002, el New England Journal of Medicine publicó dos estudios que sugerian que el enfriamiento mejora los resultados en los sobrevivientes de un paro cardíaco.

Un estudio australiano (Bernard et al) comparó solo 77 pacientes y encontró que la supervivencia con una buena función neurológica ocurrió en el 49% del grupo de enfriamiento frente al 26% en el grupo de control. Los autores hicieron conclusiones cautelosas, llamando a sus observaciones «preliminares», utilizando la frase «parece mejorar los resultados» para describir sus hallazgos.

El segundo estudio, llamado estudio de hipotermia después de un paro cardíaco o HACA, comparó el enfriamiento en 275 pacientes. Se observó un resultado neurológico favorable en el 55% en el grupo enfriado frente al 39% en el grupo de temperatura normal. Además, la tasa de mortalidad también fue un 14% más baja en el grupo de enfriamiento.

Ambos ensayos fueron susceptibles de sesgo. Por ejemplo, ninguno de los ensayos utilizó el cegamiento en la decisión de terminar la atención que se proporcionaba al paciente. Los defensores del enfriamiento podrían haber estado menos dispuestos a retirar la atención en pacientes asignados al brazo de enfriamiento. La preocupación más evidente fue que: las grandes reducciones en la muerte (14% en el ensayo HACA) parecen altamente sospechosas de ser un valor atípico, porque ninguna terapia de UCI, nunca, ha logrado tal reducción.

Las debilidades de estos dos estudios no importaron. El enfriamiento se convirtió en el estándar de atención durante más de una década hasta que llegó el siguiente ensayo en 2013.

Capítulo 3: El estudio de 2013:

El ensayo TTM  comparó 33 grados frente a 36 grados en sobrevivientes de paro cardíaco posterior en una muestra más grande de 975 pacientes. En esta prueba más rigurosa, no hubo diferencias en la muerte o la función neurológica. Además, el brazo de enfriamiento tuvo más eventos adversos. Los autores concluyeron que TTM no proporcionó evidencia de que el enfriamiento a 33 grados tuviera algún  beneficio sobre 36 grados.

Uno pensaría que esto acabaría con el enfriamiento. Pero no fue así. El enfriamiento de los pacientes siguió siendo la norma. Las guías de práctica clínica recomendaban 33 o 36 grados.

El intensivista Josh Farkas, MD, postula que el enfriamiento persiste debido al sesgo del status quo. Recientemente fui a un curso de la Asociación Americana del Corazón sobre soporte vital cardíaco avanzado y se recomendó el enfriamiento.

Capítulo 4: El estudio de 2021

Siete años después del ensayo TTM no significativo, NEJM publicó el ensayo TTM2,  que inscribió a 1850 supervivientes de paro cardíaco a 33 grados frente a la normotermia (con prevención de la fiebre). Los autores también ocultaron a los médicos y las familias ante la decisión de abandonar la atención.

Los resultados fueron claros: no hubo diferencias en la motalidad ni en los resultados neurológicos. Hubo más arritmias, mayor uso de bloqueantes neuromusculares y más tiempo en el ventilador en el brazo de enfriamiento.

Cualquier observador neutral pensaría que este sería el final del enfriamiento de los pacientes que sobreviven a un paro cardíaco. La estrategia invasiva más agresiva no proporcionaba ninguna diferencia en los resultados, causaba más efectos adversos y requería más atención de enfermería. Ahora había dos ensayos grandes y rigurosos que no mostraban ningún beneficio.

Pero no estoy tan seguro.

El editorial  que acompaña al ensayo TTM2 es increíblemente claro y presagia la dificultad de des-adoptar una terapia ya acomoadada.

La conclusión clave del ensayo TTM2 para los médicos debe ser que el manejo específico de la temperatura que involucra farmacoterapia, dispositivos de enfriamiento y pronóstico neurológico oportuno, es una estrategia de tratamiento crucial para mejorar los resultados en pacientes que han tenido un paro cardíaco.

La temperatura objetivo, a discreción del médico, podría ser de 33 ° C, 36 ° C o 37.5 ° C o menos.

¿De verdad?

Para llevar a casa

El ensayo original de Bernard et al en 2002 advirtió explícitamente que estos eran datos preliminares. Pero los dos primeros ensayos, aunque defectuosos, establecieron el enfriamiento como moda terapéutica. Tan fuerte era esa moda, que los resultados no significativos del ensayo TTM 2013 no la movieron.

Y ahora, después del segundo gran ensayo TTM2 no significativo, todavía debería ser difícil adoptar el enfriamiento a 33 grados como intervención.

La historia de enfriamiento subraya dos sesgos importantes que los médicos (y los pacientes) deben tener en cuenta.

El primero es el exceso de confianza. En un estudio encuesta reciente, Dan Morgan y sus colegas, encontraron que los médicos sobreestiman masivamente los beneficios de los tratamientos. Su estudio involucró terapias simples como estatinas y control de la presión arterial, pero supongo que las intervenciones agresivas más grandes engendran aún más exceso de confianza.

El otro factor es el sesgo de intervención.

Los médicos prefieren los errores de acción más que la omisión. Usando argumentos condicionales y datos observacionales, mi amigo y coautor frecuente Andrew Foy, junto con Ed Filippone, MD, encontraron un caso solido para el sesgo de intervención en Medicina. Y no es simplemente medicina defensiva. Es como si viniéramos preprogramado para intervenir.

Lo inusual del enfriamiento es que, a diferencia de muchas otras terapias de bajo valor (piense en la detección cardiovascular), el conflicto de intereses financieros no parece ser un factor.

Más bien, el enfriamiento persiste más a partir de un conflicto intelectual profundamente arraigado, como es el caso de: esto tiene sentido, lo hemos hecho siempre, y debemos continuar haciéndolo. Este pensamiento probablemente tenga una intención benéfica: los supervivientes de un paro cardíaco tienen un mal pronóstico, por lo que más debe ser mejor.

Pero los dos grandes ensayos recientes de TTM muestran que más no es mejor; es peor. Mayores costos, más efectos adversos y ningún beneficio en la eficacia.


La desaprobación del enfriamiento agresivo a 33 grados ocurrirá. El nuevo estándar de atención se convertirá en el mantenimiento de la temperatura normal y evitar la fiebre.

Después de unos años, la práctica del enfriamiento se olvidará, como el error de tratar las ESV después del IM. Pero creo que esta historia debe ser preservada, por el bien del aprendizaje.

Las lecciones aquí son muchas: el peligro de aceptar intervenciones basadas en estudios defectuosos y plausibilidad; el poder de la moda terapéutica, el exceso de confianza y el sesgo de intervención de los médicos, pero sobre todo el increíble poder de los ensayos controlados aleatorios adecuados para enseñarnos lo que funciona y lo que no. Esta historia nos indica la necesidad de tener evidencia de ensayos aleatorios adecuados antes de adoptar una intervención agresiva y costosa.

Los golfos apandadores

Cuando hace veinticinco años publicaba junto a Concepción Campos, un trabajo sobre comunicación de reacciones adversas a medicamentos por médicos de atención primaria, nos topamos con un hallazgo que nos sorprendió mucho: la presencia, porcentualmente pequeña pero no despreciable de faltas de ética en el proceso de publicación científica, en concreto de publicaciones duplicadas, publicaciones salami y meat extender.

En las publicaciones salami, como si fuera este embutido, un trabajo de cierta entidad se corta en porciones menores que serán publicados como artículos independientes en diferentes revistas. Adaptando el término al castellano, se le podría llamar publicaciones chorizo aludiendo a nuestro embutido autóctono, y de paso a la catadura moral de sus practicantes. Los fragmentos en que se divide, o lo que se ha llamado «unidad mínima publicable», no aportan aisladamente nada nuevo y se deberían publicar como el todo que fueron en el momento del estudio» Las publicaciones “meat extender” (expansores de carne) consistían en publicaciones que, a la manera de los aditivos que se emplean para dar volumen a la carne, se duplican artificialmente por la técnica de añadir resultados o casos clínicos a series previamente publicadas. Se publica un artículo con las mismas conclusiones que uno anterior al que únicamente se han añadido más datos o casos. La extensa y amplia revisión bibliográfica que realizan los autores de revisiones sistemáticas, ha confirmado que estas prácticas, lejos de disminuir, han aumentado, seguramente debido a la falta de una política editorial homogénea, extendida y clara.

Con todo, no dejan de ser manifestaciones menores de fraude científico, mucho más importante son la invención, la falsificación y la manipulación datos. Todos presentes en un caso que encontró Paddy Ekkekakis, psicólogo especializado en psicología del ejercicio y profesor en la universidad de Iowa, en uno de sus cursos de «Evaluación crítica para la práctica basada en la evidencia”. En estos cursos sus alumnos eligen un metanálisis, sobre un tema de su elección para intentar replicarlo, de tal forma que este ejercicio de ingeniería inversa les sirve de un estupendo aprendizaje de lectura crítica.

Como expone el propio P Ekkekakis en Twitter, (consultar hilo) uno de los elegidos fue un metanálisis de ensayos clínicos donde se comparaba ejercicio físico frente a control en enfermedad renal crónica. Se trataba de una revisión titulada Physical Exercise and Patients with Chronic Renal Failure: A Meta-Analysis publicado en Biomed Research International, revista anual presente en las principales bases de datos y con factor de impacto en 2019 de 2.276. La revisión evaluaba como intervencion programas diversos de ejercicio físico y como variables de resultado, los niveles de presión arterial y el nivel máximo de consumo de oxígeno en pacientes con insuficiencia renal en hemodiálisis.

MIentras trabajaban con este metanálisis los alumnos empezaron a pensar que estaban equivocados, que no sabían lo suficiente. Al profesor le paso lo mismo.

Una primera lectura encontró algunos errores, inconsistencias y falta información suficiente para hacer una lectura crítica. Nada que no hubieran visto antes, además en una carta de respuesta publicada en la misma revista se hacían eco de algunos de estas faltas.

La sorpresa surgió cuando se recuperaron los artículos analizados en el metanálisis

Como se puede ver en el hilo de @Ekkekakis, de los nueve artículos seleccionados, solo dos eran auténticos ensayos clínicos aleatorizados (RCT) a pesar de que en los criterios de selección se señalaba explícitamente que debían de ser RCTs.

En los siete artículos restantes hay una variedad de irregularidades, desde que él no tenía nada que ver con el tema, hasta uno que utiliza los niveles séricos de sodio (Na) del estudio como valores de presión arterial media, pasando por, al menos dos, en que los datos estaban claramente inventados

Como ejemplo, un artículo incluido en el metanálisis, Henrique (2010) fue una intervención no controlada (un solo grupo). Los meta-analistas utilizaron los números de presión arterial sistólica basal como la tensión del «grupo de control» y la final como la del grupo ejercicio dividieron el tamaño de la muestra (N = 14) por 2, diciendo que cada «grupo» tenía 7 participantes.

Este tremendo engaño, abunda en lo que ya hace un tiempo denunciara Ioannidis sobre la producción masiva de revisiones sistemáticas y metanálisis redundantes, engañosos y conflictivos, muchos de ellos procedentes de China.

El profesor lo denuncio en Twitter y se puso en conocimiento de los editores de la revista sin que hasta la fecha se haya tomado ninguna medida (comunicación personal).

El asunto seria divertido si no tuviera las implicaciones que tiene: la diseminación del conocimiento científico engañoso. La revisión ha recibido hasta hoy en Google Académico 53 citas. Una revisión de los 18 artículos citantes localizados vía PubMed y WOS, mostraba que más del 80% se apoyaban en las conclusiones del articulo fraudulento (revisión personal).

Actualización 23/02/2024

Hoy, comunica el profesor Ekkekakis que por fin y tras 3 años se ha comunicado por parte de los editores de la revista la retractación del «famoso» metanálisis. Se añade a la historia la publicación /copia de ese mismo articulo en una revista depredadora de la India, por parte de un grupo de investigación saudí.

Hilarante si no fuera un reflejo de los problemas del a ciencia biomédica actual

Aspectos éticos de las publicaciones científicas

Aprovechando que me he inscrito un webinar sobre ética en las publicaciones científicas recupero un viejo articulo publicado en  JANO 1997; 52 (1208): 74-76  y basado en la ponencia a las Sextas Jornadas Gallegas de Medicina Familiar y Comunitaria, a las que tuvo la gentileza  de invitarme Carlos González Guitián. 

Aspectos éticos de las publicaciones científicas

Hace unos años la revista British Journal of Obstetrics and Gynecology, publicó un caso clínico en el que los autores describían la implantación del feto de un embarazo ectópico en el útero de una joven y el posterior parto de un niño sin complicaciones. El artículo resultó ser falso e implicaba además como coautor al director de la revista. Este suceso se añadía a una serie de casos de similares características, que han puesto en evidencia los principios de la conducta profesional concernientes a la publicación de la investigación médica  Aunque no existe un consenso en cuanto a definiciones y clasificación, se les suele agrupar de forma general bajo el epígrafe de mala conducta científica (scientific misconduct ), que incluiría tanto las faltas graves, como el fraude científico, y  prácticas menores relacionadas con el proceso último de la publicación

Fraude científicoInvenciónEl fraude científico nunca ha sido una práctica generalizada. Se puede presentar de diversas formas; la Invención, en la que los autores «fabrican» la totalidad o parte de los datos de un estudio remitido para publicación.
Falsificación y manipulación datosLa Falsificación consiste en proporcionar datos o métodos falsos dentro de un estudio. Los datos correctos existen, pero los autores modifican los valores a su antojo con el fin de obtener un resultado favorable a la hipótesis del estudio. Formas menores de este tipo de fraude son las que, el considerado padre de los ordenadores Babage, denominó «de recorte y de cocina» Trimming and cooking. «El recortador poda pequeños elementos, aquí y allá, de las observaciones que más difieren en exceso de la media y los agrega a aquellas que son demasiado pequeñas con el propósito de lograr un ajuste equilibrado». “El cocinero hace multitud de observaciones y solo elige las que concuerdan con su hipótesis»
PlagioEl Plagio o apropiación de ideas o frases de otros artículos, presentándose como trabajo original y sin citar la fuente, constituye otra forma de fraude.  
Faltas de ética en el proceso de publicaciónAutoría ficticiaEl concepto de autor en las publicaciones científicas se aplica a los que redactan el original y a la vez contribuyen sustancialmente al desarrollo de la investigación. Sin embargo, es práctica común el incluir a otras personas que no cumplen estos requisitos dándose el fenómeno conocido como autoría regalada, honoraria o ficticia. El regalo de la coautoría se utiliza para recompensar algún favor, como forma de halagar a un superior, o como derecho arrogado por el jefe del Departamento donde se realiza la investigación, también es frecuente el intercambio reciproco de autorías en otros artículos. La autoría ficticia debe ser evitada ya que, al figurar como autor, se adopta responsabilidad pública del contenido del artículo.
En varios casos de fraude se han visto involucrados prestigiosos científicos, que, si bien no participaron en él, si consintieron figurar como autores de trabajos que no habían realizado 
Publicación reiterada, incluye:
Publicación duplicada
Publicación fragmentada   «salami publication» Como si fuera un embutido, de ahí el nombre, un trabajo de cierta entidad se corta en porciones menores que serán publicados como artículos independientes en diferentes revistas. Adaptando el término al castellano, se le podría llamar publicaciones chorizo aludiendo a nuestro embutido autóctono, y de paso a la catadura moral de sus practicantes. Los fragmentos en que se divide, o lo que se ha llamado unidad mínima publicable, no aportan aisladamente nada nuevo y se deberían publicar como el todo que fueron en el momento del estudio
Publicación
inflada «meat extender publication»
Siguiendo el símil gastronómico se incluyen aquí aquellas publicaciones que, a la manera de los aditivos que se emplean para dar volumen a la carne, se duplican artificialmente por la técnica de añadir resultados o casos clínicos a series previamente publicadas. Se publica un artículo con las mismas conclusiones que uno anterior al que únicamente se han añadido más datos o casos. Estos tipos de publicaciones fraudulentas tienen como denominador común el olvido intencionado al citar las publicaciones relacionadas y la falta de notificación a los directores de las revistas.  
Deben distinguirse de la publicación fraccionada de grandes estudios, las publicaciones preliminares de ensayos a largo plazo o la publicación paralela del mismo artículo en diferentes idiomas o para distintas audiencias.
AutoplagioCuando un autor alcanza cierta notoriedad en un tema, es a menudo invitado a escribir revisiones sobre el mismo, cayendo en la tentación de repetir parte de lo escrito anteriormente, se repite así el mismo contenido por parte del mismo autor, en una especie de autoplagio.  
OtrosIncorreción citas bibliográficasOmitir citas relevantes, copiar las listas de citas sin consultarlas y el exceso de auto- citas.
Sesgos de publicaciónLos sesgos de publicación de estudios con resultados positivos o aquellos que alcanzan una significación estadística alta, son casi una constante en la ciencia actual, y se convierte en una conducta punible cuando se hace de manera intencionada por autores o promotores de la investigación.
Publicidad resultados investigaciónOtra falta de ética científica es según algunos autores, dar a conocer los resultados de investigación de modo prematuro al público antes de su publicación en la revistas profesionales, o hacerlo de forma sensacionalista.

La mayoría de las revistas están de acuerdo en perseguir este tipo de prácticas, ya que malgastan el tiempo de los consejos editoriales, revisores y lectores, ocupan un espacio precioso y lo más grave, pueden sobrestimar la importancia de determinados resultados. Adicionalmente se incurre en violación de los derechos de reproducción o copyright, que en general, son cedidos por los autores a las revistas que publican sus artículos. 

Derechos de los autores 

La ética no solo concierne a los deberes de los autores, también a los derechos, que en general están en estrecha relación con los deberes de las otras partes del proceso editorial, directores de revista y revisores. Los autores tienen derecho a que la evaluación de sus originales sea justa e imparcial, que la revisión se haga en un tiempo razonable, y a ser tratados con corrección y respeto en la correspondencia con la revista. Los cambios solicitados previos a la publicación deben ser explícitos y claramente justificados. Durante el proceso editorial se debe mantener el secreto y la inalterabilidad del original sin el permiso de los autores. 

Como evitar las faltas éticas en la publicación de trabajos científicos 

Las revistas médicas se han declarado claramente contra estos hábitos, así las normas para los autores y los requisitos de uniformidad conocidos como «Estilo Vancouver» contienen directrices explícitas sobre temas como el concepto de autor, publicación duplicada o la pre-publicación de los resultados de la investigación. 

En los países punteros en investigación, ante la proliferación de estas malas prácticas, se han desarrollado soluciones que van desde la redacción de códigos de ética por parte de los organismos encargados de la investigación médica, hasta la imposición de sanciones. En nuestro país se consideran faltas deontológicas muchas de las prácticas mencionadas, aunque todavía las revistas e instituciones no han desarrollados normas que regulen las buenas prácticas en el campo de la publicación médica. 

Sobre el uso y mal uso de PRISMA

Mal uso

Hace ya muchos años en la librería universitaria de Tavistock Square,cerca de la sede de la BMA, mientras ojeaba libros sobre medicina y ciencia, mi vista se fijo en dos libros, expuestos lomo contra lomo: uno se titulaba How to read scientific papers y el otro How to writte scientific papers. La coincidencia y mi interés por el tema me llevo a hojear con fruición ambos libros. Las dos perspectivas deberían ser y eran distintas pero sus índices y los temas que trataban prácticamente coincidían punto por punto.

La Declaración PRISMA [acrónimo de Preferred Reporting Items of Systematic reviews and Meta-Analyses] en preprint desde septiembre del pasado año como ya anunciamos en su momento, es una especie de guía para la elaboración, remisión para publicación y/o comunicación de revisiones sistemáticas y metanálisis. Seria una adaptación al español de lo que se quiere expresar con el simple termino ingles reporting*.

Todavía se sigue reproduciendo una «misconception» o equivoco, no por frecuente menos importante, que tiene mucho que ver con mi anécdota londinense, la de confundir una reporting guidelines con una guía de lectura crítica o de como leer un artículo científico. Estos errores se ejemplifican cuando se equipara la declaración PRISMA con AMSTAR 2, una (autentica) herramienta de evaluación crítica para revisiones sistemáticas, cuando se dan recomendaciones, más o menos explicitas, del uso de esta la declaración como herramienta de lectura crítica, cuando se la utiliza como un instrumento de evaluación de la “calidad” o del riesgo de sesgos de los estudios individuales en una revisión, o cuando se considera una guía metodológica para el diseño y realización de revisiones sistemáticas, como se comenta en una editorial de la revista Revisiones Sistemáticas.

Como se dice en la reciente actualización, la declaración PRISMA 2020 no tiene la intención de guiar la realización de revisiones sistemáticas, para las cuales se encuentran disponibles otros recursos, tampoco debe utilizarse para evaluar la calidad metodológica de las revisiones sistemáticas; hay otras herramientas para este propósito. Además, PRISMA 2020 no tiene la intención de aconsejar el a publicación de protocolos de revisiones sistemáticas, para los cuales se encuentra disponible una declaración separada (PRISMA for Protocols (PRISMA-P) 2015 statement)

Uso

Pues bastaría con leerse detenidamente la declaración PRISMA 2020, para que se haga un correcto uso. Con ese motivo la he traducido al español, versión no oficial que se puede descargar aquí