Categoría: Investigación en medicina

Herramientas para la práctica médica en atención primaria

Tools for practice es una sección de la revista Canadian Family Physicians (CFP) que adapta artículos publicados en la web del Alberta College of Family Physicians (ACFP), en concreto en este repositorio, viejo conocido de los que nos dedicamos a estas cosas de la evidencia y sus recursos en atención primaria. Esta publicación secundaria resume la evidencia de la literatura médica, con un enfoque preferente sobre temas de actualidad e información que modifique la práctica habitual. Los resúmenes son revisados por pares y al menos uno de los coautores, es un médico de familia en ejercicio.

Destacamos los últimos publicados, uno en la revista CFP Targeting uric acid levels in treating gout (descargar aquí en español) y el otro: Virtual visits versus face-to-face: Diagnostic accuracy in primary care que traducimos a continuación y que proviene del repositorio de esta asociación, antes mencionado.


Traducción:

Pregunta clínica: ¿Cuál es la exactitud diagnóstica de los médicos de atención primaria que realizan visitas virtuales en comparación con las visitas presenciales para cuadros clínicos indiferenciados?

Lo esencial: Sobre la base de pruebas limitadas de nivel bajo, la validez diagnóstica de las visitas virtuales fue de entre el 71-91%, medida utilizando pacientes estandarizados o revisión de casos a los 3 meses. La validez/concordancia de diagnóstico de la atención virtual parece similar a las visitas presenciales. Estos estudios no abordan la continuidad de la atención, ni los resultados de los pacientes.

Evidencia:

  • Cohorte diagnóstica, 97 adultos, primera visita a la consulta de medicina general, de manera presencial seguida de videoconferencia con médicos diferentes.1  
    • Validez del diagnóstico (determinada por la revisión de la historia tres meses más tarde) no es significativamente diferente entre:
  • Presencial 83%, videoconferencia 80%.
  • Cuadros más frecuentes: respiratorias (22%), digestivos (19%), circulatorios (10%).
  • 57% afecciones agudas, 43% crónicas.
  • Limitaciones: siempre evaluado en persona primero, sin seguimiento a largo plazo.
  • Auditoría de 599 visitas virtuales, 67 pacientes estandarizados, uno de los seis cuadros, a saber: dolor de tobillo, faringitis viral o bacteriana, infección urinaria recurrente, rinosinusitis y dolor lumbar.2 
    • Variación en la exactitud diagnóstica dependiendo de:

                        • Cuadro clínico (71% para rinosinusitis, 91% para UTI).

  • No hay diferencia de precisión de diagnóstico con vídeo frente a teléfono.
  • Limitaciones: preocupaciones únicas limitadas, no pacientes reales.
  • Ensayo cruzado aleatorio, 175 adultos en atención primaria, aleatorizados para comparar videoconferencias con visitas presenciales o comparar dos visitas presenciales.

Ambas visitas fueron con diferentes médicos. 3 

  • Acuerdo de diagnóstico no significativamente diferente entre:
  • Videoconferencia y en persona: 84%.
  • Dos médicos diferentes en persona: 80%.
    • Limitaciones: pocos datos, tanto preocupaciones indiferenciadas como enfermedades crónicas.
  • Tenemos revisiones sistemáticas de atención virtual que aportan información sobre el acceso, la satisfacción, el costo y la carga clínica, sin embargo, la evidencia sobre la precisión diagnóstica es limitada.4,5

Contexto:

  • Las visitas virtuales se definen aquí como videoconferencia o llamadas telefónicas.
    • Las preocupaciones sobre las visitas virtuales incluyen: dificultad para construir una relación, riesgos en el seguimiento o en la continuidad de la atención. 6,7 
      • La continuidad de la atención se traduce en menores costos, hospitalizaciones y mortalidad a largo plazo. 8,9
  • El error de diagnóstico es difícil de evaluar. Los estudios observacionales10, incluidos los más largos estiman (incluidos los cánceres omitidos) una tasa del 5 %.
  • La mayoría de los diagnósticos “omitidos” fueron afecciones comunes en la atención primaria:
    • neumonía (6,7%), insuficiencia cardíaca (5,7%), insuficiencia renal aguda (5,3%) y cáncer (5,3%).11 

Autores:

Logan Gates, Jessica Kirkwood MD CCFP, Christina Korownyk MD CCFP

La versión en PDF traducida se pueden descargar aquí.

Bibliografía:

  1. Ohta M, Ohira Y, Uehara T, et al. How Accurate Are First Visit Diagnoses Using Synchronous Video Visits with Physicians?. Telemed J E Health. 2017 Feb; 23(2):119129.
  2. Schoenfeld AJ, Davies JM, Marafino BJ, et al. Variation in Quality of Urgent Health Care Provided During Commercial Virtual Visits. JAMA Intern Med. 2016; 176(5):635-42.
  3. Dixon RF, Stahl JE. A randomized trial of virtual visits in a general medicine practice. J Telemed Telecare. 2009; 15(3):115-7.
  4. Flodgren G, Rachas A, Farmer AJ, et al. Telemedicina interactiva: efectos sobre la práctica profesional y los resultados de la atención de la salud. Cochrane Database Syst Rev. 2015; 7(9):CD002098.
  5. Lake R, Georgiou A, Li J, et al. The quality, safety and governance of telephone triage and advice services – an overview of evidence from systematic reviews. BMC Health Serv Res. 2017; 17(1):614.
  6. Hammersley V, Donaghy E, Parker R, et al. Comparing the content and quality of video, telephone, and face-to-face consultations: a non-randomised, quasi-experimental, exploratory study in UK primary care. Br J Gen Pract. 2019; 69(686):e595-e604.
  7. Hardcastle L, Ubaka Ogbogu U. Healthcare Management Forum. July 2020. https://doi.org/10.1177/0840470420938818 Accessed August 31, 2020.
  8. Bazemore A, Petterson S, Peterson LE, et al. Higher Primary Care Physician Continuity is Associated With Lower Costs and Hospitalizations. Ann Fam Med. 2018; 16(6):492497.
  9. Pereira Gray DJ, Sidaway-Lee K, White E, et al. Continuity of care with doctors—a matter of life and death? A systematic review of continuity of care and mortality. BMJ Open. 2018; 8(6):e021161.
  10. Singh H, Meyer AN, Thomas EJ. The frequency of diagnostic errors in outpatient care: estimations from three large observational studies involving US adult populations. BMJ Qual Saf. 2014; 23(9):727-731 11.
  11. Singh H, Giardina TD, Meyer AN, et al. Types and Origins of Diagnostic Errors in Primary Care Settings. JAMA Intern Med. 2013; 173(6):418425.

PRISMA 2020

Como ya anunciamos se ha publicado la declaración PRISMA 2020: una guía actualizada para informar revisiones sistemáticas. Se puede consultar en formato preprint en: Page, Matthew J., et al. “The PRISMA 2020 Statement: An Updated Guideline for Reporting Systematic Reviews.” MetaArXiv, 14 Sept. 2020. Web MetaArXiv

Es la actualización de PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analyses) 2009 ·en español aquí· un conjunto mínimo de elementos o ítems seleccionados basándose ​​en la evidencia que sirven para establecer la mejor forma de mostrar la información que revisiones sistemáticas y metaanálisis deben proporcionar cuando se publican.

Necesitamos pruebas

Necesitamos mejores evidencias sobre las intervenciones no farmacológicas para el covid-19 por Margaret McCartney . 28 de agosto de 2020

Traducción libre de Margaret McCartney: We need better evidence on non-drug interventions for covid-19

Las intervenciones no farmacológicas deben basarse en la evidencia. Necesitamos generar estas pruebas para informar sobre el covid-19 y futuras pandemias.

Se han registrado casi 1300 ensayos controlados para intervenciones farmacológicas para el covid-19. Entre ellos, se han realizado grandes ensayos internacionales y de gran potencia que han evaluado la eficacia de tratamientos como la dexametasona y la hidroxicloroquina para el covid-19.

Pero, ¿por qué las intervenciones no farmacológicas no han sido sometidas al mismo interrogatorio? 

Actualmente se está desarrollando la Colaboración BESSI (Intervenciones de comportamiento, ambientales, sociales y de sistemas -para la preparación para una pandemia-). Pero hasta ahora solo se han registrado diez ensayos controlados de intervenciones no farmacológicas, y se han informado tres. Esto no tiene sentido. Las intervenciones farmacológicas generalmente están dirigidas a un grupo relativamente pequeño de personas que han sido infectadas y están enfermas. Las intervenciones no relacionadas con fármacos, como el distanciamiento físico, ponerse mascarillas o los patrones escolares de reapertura, están dirigidas a grupos de población enteros y, sin embargo, apenas se están probando.

Estas intervenciones afectan a más personas. En las primeras semanas de una pandemia, entiendo la necesidad de tomar decisiones urgentes utilizando el criterio más acertado. Pero con el tiempo, tenemos una amplia oportunidad para considerar qué intervenciones son efectivas, cuáles no lo son y cuáles tienen consecuencias no deseadas que superan los beneficios potenciales. Nos tomamos en serio los ensayos de medicamentos porque reconocemos la posibilidad de muertes por iatrogenia: buscamos la protección de un comité de seguimiento de datos y reconocemos que las buenas intenciones no son suficientes.

¿Por qué no es éste el caso de las estrategias sin fármacos? 

Es como si las intervenciones no farmacológicas no se consideraran capaces de causar daño, que sean consideradas demasiado difíciles de investigar o tan obviamente beneficiosas como para molestarse en hacer ensayos. Creo que esto es un error. Un análisis reciente en BMJ argumentó que las preocupaciones sobre la compensación de riesgos * eran un dead horse (asunto terminado) que “ahora necesita ser enterrado para tratar de prevenir la amenaza que representa desacelerar la adopción de intervenciones efectivas de salud pública”.

Usando el ejemplo de las mascarillas faciales, se citaron pruebas que no encontraron una reducción clara en el lavado de manos simultáneo con el uso de las mascarillas. Pero esta no es la única forma posible de compensación de riesgos. La pregunta fundamental es si las mascarillas reducen el daño a las personas de la población. Por ejemplo, ¿los supermercados confían en cubrirse la cara en lugar del distanciamiento físico y esto es perjudicial. ¿El uso de mascarillas da a las personas confianza para salir más de casa y correr más riesgos cuando están fuera? 

Hay grandes lagunas en nuestro conocimiento y, sin una evidencia clara sobre el uso de mascarillas de tela en la comunidad, podemos estar dando una falsa seguridad. La observación del uso de mascarillas faciales, en la vida real, encuentra que se usan incorrectamente de manera habitual. Tampoco hemos considerado suficientemente un impacto social más amplio. Las personas con antecedentes de trauma o que tienen dificultades auditivas se encuentran en desventaja. Los defensores de las mascarillas clasifican a los que no se cubren el rostro como desviados de la nueva normalidad. La ​​cohesión social se arriesga dividiendo, en lugar de comprender los comportamientos. Todos esto son daños. Tampoco tenemos una estrategia clara del fin. Necesitamos menos pánico y una investigación más práctica y pragmática.

¿Pero cómo? En los últimos días, el gobierno del Reino Unido ha cambiado de opinión sobre las mascarillas en las escuelas. Sería mucho más honesto y transparente que el gobierno explicara la dificultad de hacer recomendaciones sin evidencia y que los asesores médicos explicaran la necesidad de obtenerla. Sin subestimar el esfuerzo requerido, sería posible aleatorizar escuelas en áreas geográficas a “cuidados habituales” o “mascarillas suministradas”, dando a los niños recursos e instrucción sobre cómo usarlas, obteniendo datos sobre infecciones tanto en la escuela como en la comunidad. También serían posibles ensayos de cuña escalonada las pruebas de cuña escalonada. Saber qué funciona apoyará la implementación o asegurará que no desperdiciemos recursos. Si podemos hacer ensayos internacionales de medicamentos, deberíamos poder trabajar con las autoridades locales. Los departamentos de salud pública, con su profundo conocimiento de las regiones, podrían apoyar a los investigadores de la comunidad. El público del Reino Unido debe tener la oportunidad de contribuir, de acuerdo con el modelo de asociación entre pacientes y médicos que apoya el NHS. Si queremos la confianza del público, posiblemente lo más importante en el manejo de una pandemia, debemos ganarla. 

Otro argumento es que los ensayos a gran escala, digamos del uso de mascarillas en las escuelas, son imposibles, debido a la creencia de que todos los niños necesitarían un tutor para dar su consentimiento, lo que hace que el reclutamiento sea prácticamente imposible. Pero esto es profundamente problemático. Esto sugiere que el gobierno puede elegir e implementar cualquier política, sin requerir ningún consentimiento individual, siempre que no se llame ensayo.  Mientras se permita que este doble rasero persista, dando resultados menos poderosos e incertidumbre innecesaria, las personas pueden sufrir daños evitables. La información valiosa tampoco proviene solo de ensayos controlados aleatorios. Las intervenciones complejas requieren múltiples disciplinas y tipos de investigación para su evaluación. ¿Pero dónde están? 

Felicitaciones a los alemanes por el proyecto Restart19, que es un estudio que comprende varios subproyectos para evaluar el riesgo de realizar un gran evento deportivo o cultural en interiores. Chapeau a los daneses, que han organizado dos ensayos. El ensayo controlado aleatorizado DANMASK estudiará si las mascarillas protegen al usuario contra el covid-19. Otro grupo danés está realizando una prueba de máscaras de tela hechas por la comunidad en Guinea-Bissau. En Noruega, se planeó probar la apertura total versus la reapertura parcial en todas las escuelas primarias durante cuatro semanas, pero el gobierno retiró el apoyo. Sin embargo, los investigadores tienen la intención de preparar un ensayo similar para que pueda comenzar si aumentan las infecciones en Noruega. Además, están planeando un estudio prospectivo de estudiantes universitarios para evaluar si la enseñanza en el campus está asociada con un mayor riesgo de infección por covid-19 en comparación con el aprendizaje en línea. Este trabajo puede informar racionalmente lo que hacemos ahora y en el futuro. Además, la investigación detallada puede identificar las desigualdades en salud y generar información sobre cómo reducirlas.

Necesitamos ensayos porque no podemos suponer que las intervenciones no farmacológicas no harán daño ni desperdiciarán recursos, desviando así la atención y el dinero. Hay un ejemplo pasado sobre esto, en Australia se usaron simuladores de bebés para tratar de reducir el embarazo en la adolescencia. Un ensayo clínico aleatorizado encontró que, en cambio, aumentó. El programa “Scared Straight” se utilizó para tratar de disuadir a los jóvenes con alto riesgo de cometer actos delictivos, pero terminó incrementándolos a un alto costo. El consejo aparentemente sensato y bien intencionado del Dr. Spock de poner a los bebés boca abajo para dormir se asoció con al menos 50.000 muertes infantiles.

En Escocia, se abandonaron los arreglos para el aprendizaje combinado (una combinación de enseñanza en línea y en el aula) y se decidió que todos los niños regresaran a la escuela a tiempo completo después de que se hubieran hecho los preparativos. Sin embargo, esta habría sido una buena oportunidad para un ensayo, aleatorizando a través de áreas geográficas. Podría haber dado resultados rápidos y útiles, y la oportunidad de realizar una investigación cualitativa sobre los impactos sociales más amplios. Ensayos para colegios y universidades deben planificarse ahora mismo. Covid-19 no va a desaparecer pronto, y estamos desperdiciando la oportunidad de aprender sobre esta pandemia y la próxima.

Margaret McCartney es GP en Glasgow

* La compensación de riesgos es una teoría que sugiere que las personas suelen ajustar su comportamiento en respuesta al nivel de riesgo percibido, cada vez más cuidadosos cuando sienten un mayor riesgo y menos cuidadoso si se sienten más protegidos.Wikipedia

Del impacto de la ciencia médica

En estos días se ha publicado la nueva edición anual de los JCR o Journal Citation Reports que para quien no lo sepa, es donde se recopilan los factores de impacto (FI) de las revistas científicas.

¿qué es el factor de impacto? 

Como no podía ser de otra forma responsables de revistas y autores estaban muy excitados con el acontecimiento, al fin y al cabo, es como un examen anual de su trabajo. Un simple  cambio en el numerito puede lanzar una revista,o una carrera científica, o hundirla en el fango.

Siempre me ha sorprendido como la ciencia utilizaba para autoevaluarse una cosa tan poca científica como este índice bibliométrico. El FI no se recomienda para evaluar artículos y autores individuales pero a pesar de todo se sigue utilizando, incluso con soporte institucional. Esto ha llevado al nacimiento de un nuevo culto: la Impactolatria. En esta nueva secta los discípulos son los científicos que dependen de los presupuestos de universidades y gobiernos, es decir casi todos, los sumos sacerdotes se localizarían en las universidades, ANECA y la FECyT y su biblia es el JCR de Clarivate Analitycs, la salida de su número anual, que motiva este post. En los últimos años, el FI se ha sustituido por los famosos cuartiles. Un articulo y/o un autor estaría mas valorado si se publicará en las mejores revistas de su especialidad calificadas por cuartiles, aunque algo más justo es igualmente erróneo por persistir en dar propiedades a los artículos que corresponden , si acaso, a las revistas.

Si dividimos en 4 partes iguales un listado de revistas ordenadas de mayor a menor factor de impacto, cada una de estas partes será un cuartil. Las revistas con el factor de impacto más alto estarán el primer cuartil, los cuartiles medios serán el segundo y el tercero y el cuartil más bajo será el cuarto.

Aparte de su inutilidad para evaluar lo que no miden, también se ha señalado en numerosas ocasiones sus problemas para clasificar las revistas. Una de las ultimas fue un artículo de John Ioannidis, que ya comentamos en este blog,  donde se ponía de manifiesto “los trucos” que utilizan los directores de revistas médicas para aumentar el factor de impacto, bordeando en ocasiones los límites éticos de las publicaciones científicas.

En este artículo , se cita como mecanismos de inflaccion artificial del FI:  el Impulso de autocitación o el aumento porcentual del FI debido a las autocitaciones, asimetría e inflación no debida a artículos o porcentaje de inflación del FI vs la mediana de citas por articulo y artículos supercitados basados en expertos o la presencia de artículos como guías de práctica clínica elaboradas por expertos y artículos de consenso con definiciones o criterios de enfermedades. Entre los ejemplos que se utilizaban para ejemplificar estas práctica, se incluye la Revista Española de Cardiología que no queda muy bien parada al presentar un alto porcentaje de auto-citas.

Como hace mucho tiempo que no leo a fondo sobre este tema, no voy a hacer comentarios sobre los nuevos JCR, solo comentar dos anécdotas:

La primera tiene que ver con una revista española, en concreto la revista Adicciones que aparece en la lista de revistas canceladas en 2020 por Clarivate, ya que sus métricas muestran patrones de citas anómalos, en concreto un 33% de autocitas, que distorsionan significativamente el FI de la revista y el rango que ostenta la revista entre las de su especialidad. Adicciones está financiada por el (antiguo) Ministerio de sanidad, servicios sociales e igualdad (con la división en tres ministerios no sabemos en cual se habrá quedado) con lo que suponemos que alguien tomara cartas en el asunto.

El otro caso es internacional y se refiere a la revista que tiene el más alto factor de impacto, CA: A Cancer Journal for Clinicians una revista de la American Cancer Society y que según hace costar en su web publica información sobre la prevención, detección temprana y el tratamiento del cáncer, así como sobre nutrición, cuidados paliativos, supervivencia y otros temas de interés relacionados con el cuidado del cáncer. Sorprende que una revista clínica poco conocida, llegue tan alto en el ranking del FI ( el mayor FI de todas las revistas del SCI), la sorpresa acaba cuando vemos el listado de artículos destacados entre los que predominan auténticos blockbusters, tipo artículos de estadísticas del cáncer o guías de práctica clínica que atraen una gran cantidad de citas, sin que ese hecho tenga que ver con la (desmesurada) calidad de la revista. si nos atenemos al FI.

 

Gracias a Isidro Aguillo @isidroaguillo por sus expertos comentarios al borrador de esta entrada.

Sesgo con un final feliz

Jeffrey Aronson, farmacólogo clínico británico publica en el blog del BMJ una entrada titulada: “Cuando uso una palabra .….. Beneficios, daños y tres historias de retractaciones”

Cuenta tres historias sobre las retractación de tres artículos científicos publicados por los mismos y tristemente famosos autores, encabezados por el profesor Mandeep R Mehra. Dos son historias de beneficios (aparentes) y una de daño.

La primera de beneficio aparente se refiere al “pre-print” que aportaba los resultados de un estudio observacional de casos y controles que apoyaban a la ivermectina por su efecto beneficioso en la mortalidad hospitalaria.

La segunda historia, también de beneficio, es sobre un artículo publicado el 1º de mayo en la prestigiosa revista New England Journal of Medicine donde se describe un aparente efecto beneficioso de los inhibidores de la ECA en COVID-19 y ningún efecto pejudicial de los bloqueadores de los receptores de angiotensina (ARA). Hay que hacer notar que hasta entonces circulaba la idea de que estos fármacos podrían ser perjudiciales por afectar a la enzima conversora de angiotensina que el virus utilizaba para ejercer su acción. Estas conclusiones, eran por tanto una buena noticia.  El estudio se basaba en un registro obtenido de datos se habían reunido en una base de datos clínica internacional Surgical Outcomes Collaborative (Surgisphere)

Sin embargo, despues de un procedimiento de revisión, el 2 de junio, los cinco autores escribieron una carta a la revista, donde decían: “Debido a que no se les otorgó a todos los autores acceso a los datos en bruto y los datos en bruto no se pudieron poner a disposición de un auditor externo, no podemos validar las fuentes de datos primarias subyacentes a nuestro artículo. Por lo tanto, pedían que se retractara el artículo, como así se hizo.

La tercera y última historia se relaciona con el tristemente famoso artículo publicado en la revista Lancet que con los datos de 671 hospitales de todo el mundo en más de 96 000 pacientes con COVID-19, concluye que la mortalidad era mucho menor en los en pacientes que no recibieron ningún medicamento que en los que hidroxicloroquina y en estos también menor que a los que tomaba este medicamento con azitromicina o claritromicina. A pesar de su indudable valor informativo en ese momento, este articulo no era nada bueno, venía a decir que la estrategia seguida por casi todos los hospitales del mundo estaba equivoca y que incluso había provocado daño o perjuicio a los pacientes así tratados. Una estrategia terapéutica basada en unas pruebas muy muy débiles, por decir algo, y por esa mezcla de impulso a la acción y creencia en lo bondad de lo que hace, que impregna la mentalidad de los médicos.

Fue con este último artículo, cuando se desato la polémica. Los hospitales australianos informaron que no habían dado permiso para que se divulgara ningún dato, a estos le siguieron otros hospitales en distintas localizaciones les paso algo similar. Además, se hicieron notar otros problemas del estudio, como el pequeño número de autores para un estudio de base de datos tan grande y la falta de aprobación del comité de ética. Tras el inicio de una investigación por parte de la revista, tres de los autores retractaron el documento al “no poder responder por la veracidad de las fuentes primarias de datos”.

La imagen tiene un atributo ALT vacío; su nombre de archivo es retract2.png

La paradoja, como señala Aronson es que la respuesta a los dos primeros documentos fue cálida, a menudo entusiasta, con algunas, pocas, reservas escépticas. Las dudas surgieron solo cuando apareció el tercero que tenía una dirección distinta. Los dos primeros estudios mostraban un beneficio, cumpliendo las ilusiones de todos los que esperaban intervenciones efectivas. El tercero, sin embargo, describió perjuicios y ningún beneficio, desvaneciendo las esperanzas de todos aquellos que los esperaban. En nuestro científico interior hay un sesgo que nos convierte en alborotadores furibundos cuando cualquier estudio científico desafía nuestras creencias, nuestra esperanza o incluso nuestro medio de vida

Parece que estamos sesgados a creer, especialmente en esta desesperada pandemia, en buenos resultados y somos reticentes con los que contradicen nuestras esperanzas. En este caso nuestra inclinación ha procurado un final feliz – se ha desmontado una trampa- pero ¿y si no hubiera sido así?

Influencia de los determinantes sociales de la salud en la validez externa de los estudios clínicos

Hace unos pocos días y gracias a Twitter (si, sirve para algo más que para perder el tiempo) tuve noticia del trabajo fin de grado de un médico novel: David Serantes. El titulo era atractivo, las diapositivas resumen no tenían mala pinta, pero lo que más me cautivo, es la pregunta con la que resumía y explicaba su trabajo:

¿Cómo íbamos a pretender que fuesen eficaces fármacos contra la artrosis, enfermedades cardiovasculares, etc. en pacientes que no salían de su casa por las barreras físicas de sus viviendas?

En las prácticas de atención primaria en el distrito madrileño de Usera, David se había percatado de que muchas de las vistas domiciliarias que hacía con su tutor era a pisos altos, en edificios sin ascensor (si, en Madrid, sobre todo en barrios como Usera, todavía hay muchos edificios sin ascensor). Esta situación es para muchos ancianos o enfermos, más que una barrera arquitectónica, una auténtica muralla que los confina prácticamente para toda su vida a vivir, entre las cuatro paredes de su modesto piso. Muchos hemos sido testigos de esta situación, peor hace más de treinta años cuando empezamos a trabajar, muchos hemos pensado que esos pacientes necesitaban más un ascensor que cualquier otra intervención o medicina que le pudiéramos administrar. Muchos no fuimos ni siquiera capaces de sorprendernos hasta el punto de escribir algo sobre ello. David, si y fruto de esa inquietud este trabajo que nos deja reproducir en este blog, con el único objetivo de que se difunda.

Muchas gracias a David por su gran trabajo, las criticas y objeciones se las haremos otro día y en otro post.

Influencia de los determinantes sociales de la salud en la validez externa de los estudios clínicos comparativos

por David Serantes Gómez @davserantes

ResumenPresentación diapositivasTexto completo

Este trabajo nace de una idea que me rondaba desde hace tiempo y que, creo, mucha gente se ha planteado alguna vez: ¿podemos trasladar los hallazgos de estudios clínicos que se llevan a cabo, por ejemplo, en hospitales de Nueva York a una población como la de Granada sin esperar ver cambios en los resultados de la intervención ensayada cuando se aplique en nuestro contexto? Cuando uno se hace esta pregunta es probable que lo primero que le venga a la cabeza es ver en qué grado estas dos poblaciones pueden diferir en variables como la edad, el sexo o las comorbilidades. Pero vayamos un poco más allá.

Supongamos que te preguntan si crees posible aplicar en la población de tu cupo los resultados de un estudio realizado para determinar la eficacia (en términos de reducción del dolor y mejora de la capacidad funcional) de un nuevo AINE de aplicación tópica sobre la gonartrosis. El estudio se llevó a cabo en tres hospitales de California y la muestra de pacientes tenía una edad media de 67 años, sin criterios muy restrictivos en cuanto a comorbilidades. ¿Ahora tienes menos reparos para creer que en tu comunidad dicho fármaco podría dar resultados similares a los observados en el estudio? A priori, no tendrías por qué.

Supuestamente, la metodología de los ensayos clínicos permite atribuir los resultados a la intervención que se testa, gracias a diversos procesos, desde la asignación aleatoria de las intervenciones hasta el ciego, etc. Se busca, en definitiva, que los brazos no presenten grandes diferencias que dificultasen arrogar los hallazgos exclusivamente a los diferentes tratamientos recibidos. Si esto fuese así -en la práctica surgen, claro, muchas limitaciones a este objetivo-, ¿por qué deberíamos recelar de aplicar fármacos que han sido evaluados en ensayos sobre poblaciones muy diferentes a la nuestra?

Dejemos un momento a un lado esta pregunta y miremos desde un poco más arriba. Lo que buscaría, en términos amplios, el ensayo clínico imaginado es contrastar una hipótesis causal relativa a la eficacia del nuevo AINE en pacientes con gonartrosis. Pero, una vez validada -contrastada estadísticamente- dicha hipótesis, ¿podemos esperar que se mantenga en diferentes contextos? En la práctica a menudo tomamos un atajo epistemológico y nos saltamos esta pregunta. Razonamos inductivamente, trasladando la hipótesis que creemos validada a otros contextos, sin examinar si las modificaciones introducidas por estos en la estructura causal de la hipótesis pueden modificarla. Pero esta transferencia no se puede deducir sobre reglas lógicas, pues obvia el problema de la extrapolación. Los presupuestos epistemológicos que subyacen a la Medicina Basada en la Evidencia favorecen este razonamiento al primar, a través de las jerarquías de la evidencia, la validez interna sobre la validez externa como criterio de graduación de la calidad metodológica de los estudios.

Retomemos la pregunta. ¿Resultados similares al aplicar el AINE tópico en tu población? Tal vez dudas, pero, como acabas de leer esto, pongamos que te preguntas qué factores podrían afectar a la estructura causal de la hipótesis sobre la eficacia del AINE. Quizá la edad pueda mediar diferencias farmacocinéticas que hagan que el fármaco se metabolice peor en tu población, pero el estudio había incluido pacientes bastante mayores, por lo que a priori no cabría esperar diferencias por ahí. De momento no ves más limitaciones. Además, una compañera de tu centro te ha dado algunas muestras que le ha ofrecido un visitador que le presentó el fármaco ayer y que le convenció bastante de que puede ser efectivo. Casualmente, hoy tienes tres domicilios y una de las pacientes a las que vas a ver es Carmen, que, aunque está bastante bien para su edad, tiene una gonartrosis que hasta el momento no ha respondido a otros AINEs. De hecho, ha ido progresando en el último año hasta limitarle bastante para cocinar y hacer la casa. Para colmo, vive sola en un quinto sin ascensor en Usera y desde enero no sale de casa -no por el confinamiento, sino porque ya le duele tanto caminar que no le compensa-. Ha entrado en el círculo vicioso del dolor-no moverse-más dolor-moverse aún menos. ¿Qué menos que por probar el fármaco nuevo? Por poco que le pueda hacer… (dejamos la prevención cuaternaria para otro momento)

Un mes después vuelves a visitar a Carmen. Ya no estamos confinados, pero ella sigue sin salir de casa -también podríamos decir que la casa no le deja salir-. “¿Qué tal las rodillas, le duelen menos?” Pues bueno, la primera semana parecía que algo hacía la pomada esa, pero estoy igual. “Vaya, probaremos otra cosa entonces.” Y piensas: sabía que ese estudio debía tener alguna trampa; esta tarde le echo un vistazo.

Y el estudio no parece tener grandes fallos metodológicos. Además, la población era bastante similar en sus características de base a la tuya. En las que registraba, claro. Porque te pones a pensarlo y te acuerdas del post ese que leíste sobre la extrapolación. Lo relees a ver si encuentras algo, pero el texto no decía nada (no hemos llegado todavía) de qué condiciones podían afectar a la posibilidad de extrapolar la evidencia a otros contextos, más allá de edad, sexo y comorbilidades, que en el estudio eran similares a las de tu población. Oye, ¿y si a Carmen no le funciona el AINE porque requiere, para hacer efecto, que se mueva? Quizá la mejoría del dolor inicial, unida a la posibilidad de salir de casa, generó en la población del estudio una retroalimentación positiva que en algunos casos pudo romper un poco el círculo vicioso que antes describíamos. Quizá como Carmen apenas se mueve, en ella el fármaco no difunde bien y ni siquiera llega al lugar donde ejerce su efecto. ¿Qué parte del efecto de este fármaco -o de otra intervención terapéutica- cabe atribuir a la propia terapia y qué parte se debe a las sinergias y antagonismos entre el fármaco y las condiciones materiales de esa persona que afectan a su patología?

Dejamos planteada la pregunta: ¿podrían afectar las diferencias entre las condiciones socioeconómicas de la población de un estudio y las de la población donde se aplicarán las conclusiones de dicho estudio a la posibilidad de extrapolar la evidencia de un contexto a otro?

David Serantes Gómez

Teteras cósmicas y unicornios invisibles

Absence of evidence is not evidence of absence

Traducido de Teapots and unicorns: absence of evidence is not evidence of absence por Linda Ware

Ausencia de evidencia no es evidencia de la ausencia: nadie parece estar seguro de dónde proviene esta frase, aunque comúnmente se atribuye al astrónomo real, Martin Rees, un astrofísico y cosmólogo británico.

Captura en ocho palabras el importante mensaje de que es prácticamente imposible demostrar algo en negativo, es decir, que algo no existe.  

El filósofo y matemático Betrand Russell intervino en el argumento. Utilizó el ejemplo de una ‘tetera cósmica’ para ilustrar su punto. Dijo que, aunque no podía ser refutado, nadie debería creerle si afirmaba, sin pruebas, que una pequeña tetera orbitaba el sol entre la Tierra y Marte (Boncheck, 2016). De manera similar, Martin Burton, Director de Cochrane UK, escribió que un unicornio invisible había estado pastando en su oficina e invitó a los lectores a demostrar que estaba equivocado.

Un concepto importante

En el ámbito de la ciencia médica, este concepto es importante. Se afirma, no con poca frecuencia, que un tratamiento ‘no tiene efecto’ o que ‘no hay diferencia’ entre dos tratamientos. Estas afirmaciones se pueden encontrar no solo en los medios de comunicación, sino también en los artículos científicos de los que derivan los titulares periodísticos. Se nos hace creer que si no hay evidencia confiable que pruebe un efecto o una diferencia, entonces no existe. Esto está mal.

La evidencia puede no ser fiable por varias razones, tales como:

  • Los estudios pueden ser demasiado pequeños para detectar un efecto o una diferencia.
  • El efecto o la diferencia puede ser muy, muy pequeño.
  • Puede haber muy pocos datos o estudios insuficientes.
  • La evidencia puede ser de muy baja calidad.
  • Los estudios pueden haber sido mal diseñados

Perdido en la traducción: algunos ejemplos de los medios

    “Giving children full-fat milk will not make them obese, study finds.” [Un estudio halla que ‘darles a los niños leche entera no los hará obesos’] (Telegraph, March 2020)

Una declaración audaz y contradictoria de que la leche entera no está relacionada con la obesidad infantil. Esto puede ser cierto, pero la investigación indicó que no había evidencia de que la leche entera y los productos lácteos con su grasa condujeran a niños con sobrepeso. Siempre existe la posibilidad de que un efecto no se haya detectado o sea muy pequeño. No es posible demostrar de manera concluyente que algo no existe.

Y otro….

       “Using talcum powder does NOT raise the risk of ovarian cancer as study of 250000 women debunks fears after decades of uncertainty.” [‘El uso de polvos de talco NO aumenta el riesgo de cáncer de ovario, el estudio de 250000 mujeres desacredita los temores después de décadas de incertidumbre’. (Mail Online, January 2020)

Este titular proviene de una revisión de cuatro grandes estudios clínicos que analizan si el uso de talco en polvo en la vulva está relacionado con un aumento en los tumores de ovario. Aunque los hallazgos son tranquilizadores, los investigadores señalan que no pueden excluir la posibilidad de un aumento muy pequeño en el cáncer de ovario. Explican que el cáncer de ovario es un hallazgo relativamente raro y que los estudios pueden haber sido defectuosos.

Ausencia de evidencia: algunas revisiones Cochrane

Veamos ahora algunas revisiones Cochrane para dar dos ejemplos más.

Plasma convaleciente o inmunoglobulina hiperinmune para personas con COVID ‐ 19: una revisión rápida

Esta revisión sistemática importante y actual se acaba de publicar. Considera si administrar plasma de personas que se han recuperado de COVID-19 y que está lleno de anticuerpos contra el virus, ayuda a aquellos que están gravemente enfermos con la infección. Es una de las revisiones rápidas de Cochrane, que se han producido en respuesta a la pandemia.

La revisión analiza datos de ocho estudios muy pequeños, que incluyen solo 32 participantes. Los autores concluyen que no están seguros si el plasma convaleciente es efectivo para las personas ingresadas en el hospital con COVID-19. Hasta el momento no hay pruebas suficientes de alta certeza para conocer la respuesta a la pregunta. En otras palabras, no hay evidencia fiable de que ayude o perjudique. Hay 47 estudios en curso que se evaluarán a medida que se publiquen y sus datos se incluirán en la revisión. Con suerte, con el tiempo, será más claro si este es un tratamiento efectivo y seguro.

Intervenciones para controlar la halitosis (mal aliento)

Esta revisión considera diferentes formas de ayudar a la halitosis (mal aliento). Estos incluyen la limpieza mecánica (por ejemplo, limpiadores de lengua y cepillos de dientes), gomas de mascar, agentes desodorantes sistémicos (por ejemplo, extracto de hongos que usted come), agentes tópicos (como el gel que aplica), pastas dentales, enjuague bucal, tabletas, y la combinación de diferentes tratamientos. No está claro cuál, si alguno, funciona mejor para controlar el mal aliento. Esto no quiere decir que ninguno funcione, sino que no hay pruebas suficientes y de buena calidad para guiarnos.

Cuidado con las declaraciones audaces

Tenga cuidado con las declaraciones audaces de que algo no es efectivo, o no es diferente a otro tratamiento. Que no hay evidencia de un efecto o diferencia es muy diferente a decir que no hay efecto o diferencia.

Solo recuerda esa tetera cósmica y el unicornio invisible …

Diazepam Is No Better Than Placebo

En 2013 la European Medicines Agency (EMEA) a instancias del PRAC decidió las suspensión de comercialización del Tetrazepam, mas conocido  por su marca comercial de Myolastan. Hasta entonces, era un medicamento profusamente utilizado, sobre todo en lumbalgias y dolores cervicales, por su supuestos efectos en la contracturas musculares dolorosas que iban asociadas a estas condiciones. Las razones que motivaron esta suspensión fue la constatación de reacciones dermatológicas graves que hacían que el balance riesgo/beneficio, no fuera favorable. En la balanza, los beneficios se contabilizaban por su eficacia en las indicaciones para las que estaba aprobado (contracturas dolorosas en reumatología o espasticidad).

Sin embargo en la literatura revisada por la EMEA y el PRAC,  los estudios que mostraron la eficacia del tetrazepam para las contracturas dolorosas, eran solo dos pequeños ensayos clínicos doble ciego, controlados con placebo que mostraban una eficacia limitada.

Muerto el perro no acabó la rabia, la supuesta eficacia de esta clase de medicamentos en el tratamiento de lumbalgias y cervicalgias, aunque controvertida y escasa, impregnaba la mentalidad de los médicos, llegando incluso a las actuales generaciones de estudiantes y recién graduados que por su edad no llegaron a conocer el “famoso” myolastan. El consumo se desvió a otras benzodiazepinas, principalmente al diazepam y en la actualidad no es infrecuente leer informe de los servicios de urgencia donde al cóctel analgésico potente y variopinto, se añade el inefable diazepam. También ayuda, la anticuada ficha técnica de este medicamento que en concreto dice:

Indicaciones:

Sin embargo, la evidencia es terca y sigue sin apoyar esta desaforada afición por las benzodiacepinas que muestran los médicos que tratan procesos osteomusculares. Veamos….

El conocido UptoDate, dice con respecto a los relajantes musculares los siguiente:

Benzodiazepines should not be used because they are not effective in improving pain or functional outcome [33], and there is potential for abuse.

Una revisión sistemática Cochrane, publicada en 2003 que evaluaba el tratamiento con miorelajantes en las lumbalgias inespecíficas, determina con respecto a las benzodiazepinas que las pruebas de su eficacia en el dolor lumbar agudo no son muy convincentes. La única evidencia sólida provenía  del tetrazepam y se basaba en dos ensayos en lumbalgia crónica, que mostraban que el tetrazepam era más efectivo que el placebo en pacientes en el alivio del dolor a corto plazo y mejoría general. Estos estudios, parece que financiados por el laboratorio fabricante del Tetrazepam, uno de ellos publicado en una revista ya desaparecida no incluida en MEDLINE y otro en alemán, son de difícil acceso.

La revisión algo desordenada y con algunos errores en la referencias, publicada por la ACP en Annals of Internal Medicine en 2017 añade a los artículos encontrados en la revisión Cochrane un nuevo ensayo clínico en el que se evaluaba diazepam frente a placebo en caso de lumbalgia aguda con irradiación (ciática).En este ensayo el diazepam no mostró mejoría en ninguna de la variables evaluadas y algunas se encontraron diferencias beneficiosas para el grupo placebo

Por último constatar que en un ensayo clínico individual más reciente, muestra la falta de eficacia clínica del diazepam en lumbociatalgia aguda y subaguda. En este ensayo clínico, controlado y aleatorizado se compararon dos grupos de pacientes que acudieron a urgencias con dolor lumbar de no más de 2 semanas de duración. Un grupo recibió naproxeno + diazepam  y el otro naproxeno + placebo no encontrando diferencias significativas en la variables evaluadas (cambio de puntuación en escala de incapacidad física y dolor percibido a la semana y un mes)

En conclusión la prescripción de benzodiazepinas en lumbalgias, a pesar de su aparente lógica fisiopatológica [contractura en musculo -relajante muscular] no está soportada por la evidencia disponible. Su uso rutinario, como es la práctica habitual, debería ser evitado.

Para el dolor cervical , con incluso menos estudios disponibles, se podría llegar conclusiones similares.

La Declaración PRISMA

Las revisiones sistemáticas son una herramienta esencial para sintetizar la información científica disponible, incrementar la validez de las conclusiones de estudios individuales e identificar áreas de incertidumbre donde sea necesario realizar investigación. Se pueden definir como la aplicación de estrategias que limitan el sesgo en la compilación, evaluación crítica y síntesis de todos los estudios relevantes sobre un tema específico. Cuando se utilizan técnicas estadísticas para unir los datos de estudios comparables, hablamos de metaanálisis que conduce a un estimador resumen cuantitativo de los resultados agrupados. Desde su introducción en medicina a finales de los setenta, principios de los ochenta, y hasta la actualidad las revisiones sistemáticas han crecido de forma cuasi exponencial, no siempre para bien, y se han constituido en una herramienta fundamental en la toma de decisiones médicas

La percepción y demostración empírica en la calidad de los metaanálisis y revisiones sistemáticas llevó, a finales de los noventa, a un grupo internacional a desarrollar una especie de guía de publicación: la llamada Declaración QUOROM (QUality Of Reporting Of Meta-analyses Statement), dirigida sobre todo a la información de metaanálisis de ensayos clínicos controlados aleatorizados. Años más tarde, en 2009, esta guía se actualizo y se publicó con el nombre de PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analyses). Por esa época y concretamente en 2007, se publicaba la guia  AMSTAR (de las siglas en inglés: A MeaSurement Tool to Assess systematic Reviews) que mas que una lista de verificación como la anterior, es una herramienta de lectura crítica y evaluación de revisiones sistemáticas. Se ha actualizado a la version 2 hace un par de años.

PRISMA (en español aquí) es un conjunto mínimo de elementos seleccionados basándose ​​en la evidencia que sirven para establecer la mejor forma de mostrar la información que revisiones sistemáticas y metaanálisis deben contener cuando se publican. PRISMA también se centra en las revisiones que evalúan ensayos aleatorios, pero puede usarse como base para comunicar revisiones sistemáticas de otros tipos de investigación.

Diez años más tarde se lanza una nueva actualización, a la espera de publicarse se puede ver este video del fallido Coloquio Cohrane de este año.

y esta presentación en pdf

Mejor por la noche

La ingesta de medicamentos (≥1) por parte de pacientes hipertensos para reducir la presión sanguínea a la hora de acostarse, en lugar de al despertar, da como resultado un mejor control de la PA y sobre todo una disminución notable de eventos cardiovasculares.


El tratamiento de la hipertensión a la hora de acostarse mejora la reducción del riesgo cardiovascular: el ensayo de cronoterapia Hygia 

Ramón C Hermida, Juan J Crespo, Manuel Domínguez-Sardiña, Alfonso Otero, Ana Moyá, María T Ríos, Elvira Sineiro, María C Castiñeira, Pedro A Callejas, Lorenzo Pousa, José L. Salgado, Carmen Durán, Juan J. Sánchez, José R. Fernández, Artemio Mojón y Diana E. Ayala.

Publicado: 22 octubre 2019 – European Heart Journal

Comentado por Jorge Franco Herrero. Alumno 3º Medicina de la Universidad Complutense de Madrid


El Ensayo de Cronoterapia Hygia, realizado dentro del entorno de atención primaria clínica, fue diseñado con el fin de evaluar si la terapia de hipertensión suministrada a la hora de acostarse en comparación con la tradicional ingesta de fármacos al despertar ejercía una reducción del riesgo de enfermedad cardiovascular (ECV).

Métodos: El Proyecto Hygia está compuesto por una red de 40 centros de atención primaria dentro del Servicio Gallego de Seguridad Social (SERGAS), y gestionado por el Centro de Investigación y Coordinación (RCC) de la Universidad de Vigo (España), involucrando a 292 investigadores. Se diseñó como un estudio PROBE (prospectivo, aleatorizado, abierto, ciego) multicéntrico, controlado, con pacientes distribuidos en una proporción 1: 1 en dos grupos según el tiempo circadiano de tratamiento: ya sea ingestión de la dosis diaria completa de ≥1 medicamentos recetados para reducir la presión arterial de las principales clases terapéuticas (ARB, IECA, CCB, β-bloqueante y / o diurético) a la hora de acostarse o la ingesta de tales medicamentos al despertar.

Participaron 19.084 pacientes hipertensos (10.614 hombres / 8.470 mujeres, 60.5 ± 13.7 años de edad) ingiriendo la dosis diaria completa de ≥1 medicamentos para la hipertensión antes de acostarse (9.552) o al despertar (9.532). Durante la media de seguimiento de los pacientes (6,3 años) 1.752 de ellos experimentaron ECV (muerte por ECV, infarto de miocardio, revascularización coronaria, insuficiencia cardíaca o accidente cerebrovascular).  A los pacientes incluidos en el estudio se les realizó un seguimiento consistente en la monitorización ambulatoria de la presión arterial (MAPA). Tanto en el momento de la inclusión como en cada visita clínica programada (al menos una vez al año) durante el seguimiento, se entregaba al paciente un aparato que debía portar durante 48 h., de forma que cada 20 o 30 minutos la tensión del paciente era registrada. Es esta medición continuada lo que ha permitido a los investigadores identificar que el riesgo cardiovascular está asociado a la elevación de la presión arterial durante la noche y no cuando el paciente está despierto.

Resultados: Los pacientes que tomaban un antihipertensivo a la hora de acostarse, en comparación con los que lo tomaban únicamente al despertar, mostraron un hazard ratio (HR) significativamente menor, ajustada por características significativas como edad, sexo, diabetes tipo 2, enfermedad renal crónica, tabaquismo, colesterol HDL, presión arterial sistólica media durante el sueño, y disminución relativa de la PA sistólica en el tiempo de sueño,así como evento cardiovascular (ECV).  En el resultado primario de ECV el HR fue de 0.55 (IC 95% 0.50–0.61) y tambien fue significativo en cada uno de sus componentes individuales, es decir, muerte por ECV 0.44 (0.34–0.56), infarto de miocardio 0.66 (0.52–0.84), revascularización coronaria 0.60 (0.47–0.75), insuficiencia cardíaca 0.58 (0.49–0.70) y accidente cerebrovascular 0.51 ( 0.41–0.63).

Conclusión: La  toma rutinaria por parte de pacientes hipertensos de a al menos un medicamento antihipertensivo a la hora de acostarse, en lugar de al despertar, da como resultado un mejor control de la PA  y  lo más importante, la disminución notable de la ocurrencia de eventos importantes de ECV.

Entre las principales conclusiones obtenidas por los investigadores es confirmar que el riesgo cardiovascular está asociado con la elevación de la presión arterial durante el sueño, con independencia de que la presión media en la consulta o cuando el paciente esté despierto sea normal o alta. Este nuevo criterio diagnóstico de la hipertensión basado en la presión durante el sueño y el perfil circadiano abriría la puerta a una nueva forma de diagnóstico de la hipertensión. Además, y es sin duda los más importante, muestran que reducir la presión durante el sueño con tratamientos antihipertensivos se reduce de forma significativa el riesgo de eventos cardiovasculares.

Por tanto, los resultados del ensayo establecen, en primer lugar, un mayor control de presión arterial en pacientes del tratamiento a la hora de acostarse que en los del régimen de tratamiento de despertar. Las principales diferencias entre ambos se resumen en que con el tratamiento a la hora de acostarse se ha documentado que existe:

  • una media significativamente baja de la PA durante el sueño sin pérdida de la eficacia de la disminución de la PA durante la vigilia.
  • una mayor disminución relativa de la PA durante el sueño.

Estos efectos dependientes del tiempo de ingestión en el control de la PA dormida se han asociado con un riesgo de ECV sustancialmente atenuado. La disminución progresiva de la media de la PAS durante el sueño a lo largo de los 6,3 años de seguimiento medio fue el predictor más significativo de la disminución del riesgo de ECV, más allá del valor pronóstico de otros marcadores de riesgo convencionales asociados (edad avanzada, sexo masculino, colesterol HDL bajo, tabaquismo, diabetes tipo 2 y ERC).

Por último reseñar que este estudio como todo tiene limitaciones y fortalezas, la limitación principal presentada por el ensayo de cronoterapia de Hygia es que sus hallazgos todavía requieren validación y extrapolación a otros grupos étnicos. Además, de que el ensayo no asignó a los participantes clases específicas de medicamentos sino que el tratamiento fue elegido por cada facultativo participante respetando la práctica clínica actual.