|
El nivel o grado de evidencia clínica es un sistema jerarquizado, basado en las pruebas o estudios de investigación, que ayuda a los profesionales de la salud a valorar la fortaleza o solidez de la evidencia asociada a los resultados obtenidos de una estrategia terapéutica.
En función del rigor científico del diseño de los estudios pueden construirse escalas de lasificación jerárquica de la evidencia, a partir de las cuales pueden establecerse ecomendaciones respecto a la adopción de un determinado procedimiento o intervención sanitaria.
Aunque hay diferentes escalas de gradación de la calidad de la videncia científica, todas ellas son muy similares entre sí. Las clasificaciones más conocidas y utilizadas en nuestro medio son las siguientes:
Canadian Task Force on Preventive Health Care (CTFPHC)1,2
| Tabla 1. Grados de recomendación para las intervenciones específicas de prevención |
| A |
Existe buena evidencia para recomendar la intervención clínica de prevención |
| B |
Existe moderada evidencia para recomendar la intervención clínica de prevención |
| C |
La evidencia disponible es conflictiva y no permite hacer recomendaciones a favor o en contra de la intervención clínica preventiva; sin embargo, otros factores podrían influenciar en la decisión. |
| D |
Existe moderada evidencia para recomendar en contra de la intervención clínica de prevención |
| E |
Existe buena evidencia para recomendar en contra la intervención clínica de prevención |
| I |
Existe evidencia insuficiente (en cantidad y en cualidad) para hacer una recomendación; sin embargo, otros factores podrían influenciar en la decisión. |
|
| Tabla 2. Niveles de evidencia - Graduación de los diseños de estudio |
| I |
Evidencia a partir de ensayos clínicos aleatorizados |
| II-1 |
Evidencia a partir de ensayos clínicos sin aleatorización |
| II-2 |
Evidencia a partir de estudios de cohortes y casos y controles, preferiblemente realizados por más de un centro o grupo de investigación. |
| II-3 |
Evidencia a partir de comparaciones en el tiempo o entre sitios, con o sin la intervención; podrían incluirse resultados espectaculares provenientes de estudios no aleatorizados |
| III |
Opinión de expertos, basados en la experiencia clínica; estudios descriptivos o informes de comités de expertos |
|
| Tabla 3. Niveles de evidencia - Calidad de la graduación (validez interna) |
| Buena |
Un estudio (incluyendo el meta-análisis y la revisión sistemática) que cumple los criterios específicos de estudio bien diseñado* |
| Moderada |
Un estudio (incluyendo el meta-análisis y la revisión sistemática) que no cumple (o no está claro que cumpla) al menos uno de los criterios específicos de estudio bien diseñado*, aunque no tiene ’’defectos fatales’’. |
| Insuficiente |
Un estudio (incluyendo el meta-análisis y la revisión sistemática) que tiene en su diseño al menos un ’’defecto fatal’’ o no cumple (o no está claro que cumpla) al menos uno de los criterios específicos de estudio bien diseñado*, aunque no presenta’’errores fatales’’ o una acumulación de defectos menores que hagan que los resultados del estudio no permitan elaborar las recomendaciones. |
|
U.S. Preventive Services Task Force (USPSTF) 3,4
The U.S. Preventive Services Task Force (USPSTF) gradúa sus recomendaciones según una de estas cinco clasificaciones (A, B, C, D, I) reflejando la fuerza de la recomendación y la magnitud del beneficio neto (beneficio menos riesgo).
| Tabla 1. Fuerza de las recomendaciones |
| A |
La USPSTF recomienda claramente que los clínicos proporcionen la intervención a los pacientes que cumplan los criterios. La USPSTF ha encontrado buena evidencia de que la medida mejora de manera importante los resultados en salud y concluye que los beneficios superan ampliamente a los riesgos). |
| B |
La USPSTF recomienda que los clínicos proporcionen la intervención a los pacientes. La USPSTF ha encontrado evidencia moderada de que la medida mejora de manera importante los resultados en salud y concluye que los beneficios superan a los riesgos. |
| C |
La USPSTF no recomienda a favor o en contra de la intervención. La USPSTF ha encontrado al menos evidencia moderada de que la medida puede mejorar los resultados en salud, pero los beneficios son muy similares a los riesgos y no puede justificarse una recomendación general. |
| D |
La USPSTF recomienda en contra que los clínicos proporcionen la intervención a los pacientes asintómaticos. La USPSTF ha encontrado al menos evidencia moderada de que la medida es ineficaz o que los riesgos superan a los beneficios. |
| I |
La USPSTF concluye que la evidencia es insuficiente para recomendar a favor o en contra de la intervención. No existe evidencia de que la intervención es ineficaz, o de calidad insuficiente, o conflictiva y que el balance entre los riesgos y los beneficios no se puede determinar. |
|
| Tabla 2. Niveles de evidencia - Calidad de la evidencia |
| Buena |
La evidencia incluye resultados consistentes a partir de estudios bien diseñados y realizados en poblaciones representativas que directamente evalúan efectos sobre resultados de salud |
| Moderada |
La evidencia es suficiente para determinar efectos sobre resultados de salud, pero la fuerza de la evidencia es limitada por el número, la calidad, o la consistencia de los estudios individuales, la generalización a la práctica rutinaria, o la naturaleza indirecta de la evidencia sobre los resultados de salud. |
| Insuficiente |
La evidencia es insuficiente para evaluar los efectos sobre los resultados de salud debido al número limitado o al poder de estudios, defectos importantes en su diseño o realización, inconsistencias en la secuencia de la evidencia, o falta de información sobre resultados de salud importantes. |
|
Agency for Healthcare Research and Quality 5
| Tabla 1. Grados de recomendación |
| A |
Existe buena evidencia en base a la investigación para apoyar la recomendación |
| B |
Existe moderada evidencia en base a la investigación para apoyar la recomendación |
| C |
La recomendación se basa en la opinión de expertos o en un panel de consenso |
| X |
Existe evidencia de riesgo para esta intervención |
|
| Tabla 2. Clasificación de las recomendaciones en función del nivel de evidencia disponible |
| Ia |
La evidencia científica procede a partir de meta-análisis de ensayos clínicos controlados y aleatorizados |
| Ib |
La evidencia científica procede de al menos un ensayo clínico controlado y aleatorizado |
| IIa |
La evidencia científica procede de al menos un estudio prospectivo controlado, bien diseñado y sin aleatorizar |
| IIb |
La evidencia científica procede de al menos un estudio casi experimental, bien diseñado. |
| III |
La evidencia científica procede de estudios descriptivos no experimentales, bien diseñados como estudios comparativos, de correlación o de casos y controles |
| IV |
La evidencia científica procede de documentos u opiniones de expertos y/o experiencias clínicas de autoridades de prestigio |
| |
| A |
Recoge los niveles de evidencia científica Ia y Ib |
| B |
Recoge los niveles de evidencia científica IIa, IIb y IIII |
| A |
Recoge el nivel de evidencia IV |
|
Centre for Evidence-Based Medicine, Oxford 6
| Estudios sobre tratamiento, prevención, etiología y complicaciones |
| Grado de recomendación |
Nivel de evidencia |
Fuente |
| A |
1 a |
Revisión sistemática de ECA, con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección. |
| 1 b |
ECA individual (con intervalos de confianza estrechos) |
| 1 c |
Eficacia demostrada por la práctica clínica y no por la experimentación |
|
B
|
2 a |
Revisión sistemática de estudios de cohortes, con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección. |
| 2 b |
Estudio de cohortes individual y ensayos clínicos aleatorios de baja calidad (< 80% de seguimiento) |
| 2 c |
Investigación de resultados en salud |
| 3 a |
Revisión sistemática de estudios de casos y controles, con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección. |
| 3 b |
Estudios de casos y controles individuales |
| C |
4 |
Serie de casos y estudios de cohortes y casos y controles de baja calidad. |
|
*Si tenemos un único estudio con IC amplios o una revisión sistemática con heterogeneidad estadísticamente significativa, se indica añadiendo el signo (-) al nivel de evidencia que corresponda y la recomendación que se deriva es una D
|
|
| Estudios de historia natural y pronóstico |
| Grado de recomendación |
Nivel de evidencia |
Fuente |
| A |
1 a |
Revisión sistemática de estudios de cohortes, con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección y GPC validadas. |
| 1 b |
Estudios de cohortes individuales con > 80% de seguimiento |
| 1 c |
Resultados a partir de la efectividad y no de su eficacia demostrada a través de un estudio de cohortes |
| B |
2 a |
Revisión sistemática de estudios de cohorte retrospectiva o de grupos controles no tratados en un ECA, con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección. |
| 2 b |
Estudio de cohorte retrospectiva o seguimiento de controles no tratados en un ECA, o GPC no validadas. |
| 2 c |
Investigación de resultados en salud |
| C |
4 |
Serie de casos y estudios de cohortes de pronóstico de poca calidad |
|
*Si tenemos un único estudio con IC amplios o una revisión sistemática con heterogeneidad estadísticamente significativa, se indica añadiendo el signo (-) al nivel de evidencia que corresponda y la recomendación que se deriva es una D
|
|
| Grado de recomendación |
Nivel de evidencia |
Fuente |
| A |
1 a |
Revisión sistemática de estudios diagnósticos de nivel 1 (alta calidad), con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección y GPC validadas |
| 1 b |
Estudios de cohortes que validen la calidad de una prueba específica, con unos buenos estándares de referencia (independientes de la prueba) o a partir de algoritmos de estimación del pronóstico o de categorización del diagnóstico |
| 1 c |
Pruebas diagnósticas con especificidad tan alta que un resultado positivo confirma el diagnóstico y con sensibilidad tan alta que un resultado negativo descarta el diagnóstico. |
| B |
2 a |
Revisión sistemática de estudios diagnósticos de nivel 2 (mediana calidad) con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección |
| 2 b |
Estudios exploratorios que, a través de p. e. una regresión logística, determinan qué factores son significativos , y que sean validados con unos buenos estándares de referencia (independientes de la prueba), o a partir de algoritmos de estimación del pronóstico o de categorización del diagnóstico, o de validación de muestras separadas |
| 3 b |
Comparación cegada u objetiva de un espectro una cohorte de pacientes que podría normalmente ser examinado para un determinado trastorno, pero el estándar de referencia no se aplica a todos los pacientes del estudio |
| C |
4 |
- Los estándares de referencia no son objetivables, cegados o independientes.
- Las pruebas positivas y negativas son verificadas usando estándares de referencia diferentes
- El estudio compara pacientes con un trastorno determinado conocido con pacientes diagnosticados de otra condición. |
| D |
5 |
Opinión de expertos sin valoración crítica explícita, ni basada en fisiología, ni en investigación juiciosa ni en los principios fundamentales |
|
| Análisis económico y análisis de decisiones |
| Grado de recomendación |
Nivel de evidencia |
Fuente |
| A |
1 a |
Revisión sistemática de estudios económicos de nivel 1 (alta calidad), con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección |
| 1 b |
Análisis basados en los costes clínicos o en sus alternativas; revisiones sistemáticas de la evidencia; e inclusión de análisis de análisis de sensibilidad |
| 1 c |
Análisis en términos absolutos de riesgos y beneficios clínicos: claramente tan buenas o mejores, pero más baratas, claramente tan malas o peores pero más caras |
| B |
2 a |
Revisión sistemática de estudios económicos de nivel 2 (mediana calidad) con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma dirección. |
| 2 b |
Análisis basados en los costes clínicos o en sus alternativas; revisiones sistemáticas con evidencia limitada; estudios individuales; e inclusión de análisis de análisis de sensibilidad |
| 2 c |
Investigación de resultados en salud |
| 3 b |
Análisis sin medidas de coste precisas pero incluyendo un análisis de sensibilidad que incorpora variaciones clínicamente sensibles en las variables importantes |
| C |
4 |
Análisis que no incluye análisis de la sensibilidad |
| D |
5 |
Opinión de expertos sin valoración crítica explícita, ni basada en teorías económicas |
|
Scottish Intercollegiate Guidelines Network (SIGN) 7
| Tabla 1. Niveles de evidencia |
| 1++ |
Metaanálisis de gran calidad, revisiones sistemáticas de ensayos clínicos aleatorizados o ensayos clínicos aleatorizados con muy bajo riesgo de sesgos. |
| 1+ |
Metaanálisis de gran calidad, revisiones sistemáticas de ensayos clínicos aleatorizados o ensayos clínicos aleatorizados con bajo riesgo de sesgos. |
| 1- |
Metaanálisis de gran calidad, revisiones sistemáticas de ensayos clínicos aleatorizados o ensayos clínicos aleatorizados con alto riesgo de sesgos. |
| 2++ |
Revisiones sistemáticas de alta calidad de estudios de cohortes o de casos-controles, o estudios de cohortes o de casos-controles de alta calidad, con muy bajo riesgo de confusión, sesgos o azar y una alta probabilidad de que la relación sea causal. |
| 2+ |
Estudios de cohortes o de casos-controles bien realizados, con bajo riesgo de confusión, sesgos o azar y una moderada probabilidad de que la relación sea causal |
| 2- |
Estudios de cohortes o de casos y controles con alto riesgo de sesgo |
| 3 |
Estudios no analíticos, como informe de casos y series de casos |
| 4 |
Opinión de expertos |
|
| Tabla 2. Grados de Recomendación |
| A |
Al menos un metaanálisis, revisión sistemática o ensayo clínico aleatorizado calificado como 1++ y directamente aplicable a la población objeto, o una revisión sistemática de ensayos clínicos aleatorizados o un cuerpo de evidencia consistente principalmente en estudios calificados como 1+ directamente aplicables a la población objeto y que demuestren globalmente consistencia de los resultados. |
| B |
Un volumen de evidencia que incluya estudios calificados como 2++ directamente aplicables a la población objeto y que demuestren globalmente consistencia de los resultados, o extrapolación de estudios calificados como 1++ o 1+. |
| C |
Un volumen de evidencia que incluya estudios calificados como 2+ directamente aplicables a la población objeto y que demuestren globalmente consistencia de los resultados, o extrapolación de estudios calificados como 2++. |
| D |
Niveles de evidencia 3 o 4, o evidencia extrapolada desde estudios clasificados como 2+ |
|
National Institute for Clinical Excellence (NICE) 8
| Tabla 1. Niveles de evidencia para estudios de intervención |
| 1++ |
Metaanálisis de gran calidad, revisiones sistemáticas de ensayos clínicos aleatorizados o ensayos clínicos aleatorizados con muy bajo riesgo de sesgos. |
| 1+ |
Metaanálisis de gran calidad, revisiones sistemáticas de ensayos clínicos aleatorizados o ensayos clínicos aleatorizados con bajo riesgo de sesgos. |
| 1- |
Metaanálisis de gran calidad, revisiones sistemáticas de ensayos clínicos aleatorizados o ensayos clínicos aleatorizados con alto riesgo de sesgos*. |
| 2++ |
Revisiones sistemáticas de alta calidad de estudios de cohortes o de casos-controles, o estudios de cohortes o de casos-controles de alta calidad, con muy bajo riesgo de confusión, sesgos o azar y una alta probabilidad de que la relación sea causal. |
| 2+ |
Estudios de cohortes o de casos-controles bien realizados, con bajo riesgo de confusión, sesgos o azar y una moderada probabilidad de que la relación sea causal. |
| 2- |
Estudios de cohortes o de casos y controles con alto riesgo de sesgo* |
| 3 |
Estudios no analíticos, como informe de casos y series de casos |
| 4 |
Opinión de expertos |
| * Los estudios con un nivel de evidencia ‘–‘ no deberían utilizarse como base para elaborar una recomendación |
|
Adaptado de Scottish Intercollegiate Guidelines Network
|
|
| Tabla 2. Clasificación de las recomendaciones para estudios de intervención |
| A |
- Al menos un meta-análisis, o un ensayo clínico aleatorio categorizados como 1++, que sea directamente aplicable a la población diana, o
- Una revisión sistemática o un ensayo clínico aleatorio o un volumen de evidencia con estudios categorizados como 1+, que sea directamente aplicable a la población diana y demuestre consistencia de los resultados
- Evidencia a partir de la apreciación de NICE
|
| B |
- Un volumen de evidencia que incluya estudios calificados de 2++, que sean directamente aplicables a la población objeto y que demuestren globalmente consistencia de los resultados, o
- Extrapolación de estudios calificados como 1++ o 1+.
|
| C |
- Un volumen de evidencia que incluya estudios calificados de 2+, que sean directamente aplicables a la población objeto y que demuestren globalmente consistencia de los resultados, o
- Extrapolación de estudios calificados como 2++.
|
| D |
- Evidencia nivel 3 o 4, o
- Extrapolación de estudios calificados como 2+ o
- Consenso formal
|
| D (BPP) |
Un buen punto de práctica (BPP) es una recomendación para la mejor práctica basado en la experiencia del grupo que elabora la guía |
| IP |
Recomendación a partir del manual para procedimientos de intervención de NICE |
|
| Tabla 3. Niveles de evidencia para estudios de diagnóstico |
| Ia |
Revisión sistemática (con homogenidad)* de estudios de nivel 1† |
| Ib |
Estudios de nivel 1† |
| II |
Estudios de nivel 2 ‡ Revisiones sistemáticas de estudios de nivel 2 |
| III |
Estudios de nivel 3 § Revisiones sistemáticas de estudios de nivel 3 |
| IV |
Consenso, informes de comités de expertos o opiniones y /o experiencia clínica sin valoración crítica explícita; o en base a la psicología, difusión de la investigación o ‘principios básicos’ |
|
* Homogeneidad significa que no hay variaciones o estas son pequeñas en la dirección y grado de los resultados entre los estudios individuales que incluye la revisión sistemática.
† Estudios de nivel 1:
- aquellos que utilizan una comparación ciega de la prueba con un estándar de referencia validado (gold standard)
- en una muestra de pacientes que refleja a la población a quien se aplicaría la prueba.
‡ Estudios nivel 2 son aquellos que presentan una sola de esta características:
- población reducida (la muestra no refleja las características de la población a la que se le va a aplicar la prueba)
- utilizan un estándar de referencia pobre (definido como aquel donde la ‘prueba’ es incluida en la ‘referencia’, o aquel en que las ‘pruebas’ afectan a la ‘referencia’)
- la comparación entre la prueba y la referencia no está cegada
- Estudios de casos y controles.
§ Estudios de nivel 3 son aquellos que presentan al menos dos o tres de las características señaladas anteriormente.
|
|
Adaptado de The Oxford Centre for Evidence-based Medicine Levels of Evidence (2001) and the Centre for Reviews and Dissemination Report Number 4 (2001).
|
|
| Tabla 4. Clasificación de las recomendaciones para los estudios diagnóstico |
| A (ED) |
Estudios con un nivel de evidencia Ia o Ib |
| B (ED) |
Estudios con un nivel de evidencia II |
| C (ED) |
Estudios con un nivel de evidencia III |
| D (ED) |
Estudios con un nivel de evidencia IV |
|
ED = Estudios diagnósticos
|
|
 |
REFERENCIAS
- Canadian Task Force on Preventive Health Care. History and methods. Disponible en: http://www.ctfphc.org [acceso 24 de marzo del 2005]
- Canadian Task Force on Preventive Health Care. New grades for recommendations from the Canadian Task Force on Preventive Health Care. CMAJ 2003;169:207-8 [Medline] [Texto completo]
- Harris RP, Helfand M, Woolf SH, Lohr KN, Mulrow CD, Teutsch SM for the Methods Word Group, third U.S. et al. Preventive Services Task Force. Current methods of the U.S. Preventive Services Task Force: a review of the process. Am J Prev Med 2001;20(3S):21-35 [Medline]
- U.S. Preventive Services Task Force Ratings: Strength of Recommendations and Quality of Evidence. Guide to Clinical Preventive Services. [Internet] Third Edition: Periodic Updates, 2000-2003. Rockville : Agency for Healthcare Research and Quality. [acceso 24 de marzo de 2005]. Disponible en: http://www.ahrq.gov/clinic/3rduspstf/ratings.htm
- Agency for Healthcare Research and Quality (AHRQ). EPC Evidence Reports [Internet]. Rockville: AHRQ. [acceso 24 de marzo del 2005]Disponible en http://www.ahrq.gov/clinic/epcindex.htm#methodology
- Centre for Evidence-Based Medicine de Oxford . Levels of Evidence and Grades of Recommendation [Internet]. Oxford : Centre for Evidence-Based Medicine de Oxford [acceso 24 de marzo del 2005]. Disponible en http://www.cebm.net/levels_of_evidence.asp
- Scotish Intercollegiate Guidelines Network. A guideline developers´ handbook [Monografía en Internet]. Edinburgh : Scottish Intercollegiate Guidelines NetworK; February 2001, updated May 2004 [acceso 24 de marzo de 2005] Disponible en: http://www.show.scot.nhs.uk/sign/guidelines/fulltext/50/index.html
- National Institute for Clinical Excellence (NICE). Guidelines Development methods. Guideline Development Methods- Chapter 7: Reviewing and grading the evidence [Internet]. London: NICE; February 2004 (updated March 2005) [acceso 24 de marzo del 2005] Disponible en: http://www.nice.org.uk/pdf/GDM_Chapter7_0305.pdf
|
|