grade 實證醫學證據評比系統

GRADE證據等級與建議強度評比系統簡介

Introduction of The Grading of Recommendations

Assessment, Development and Evaluation

2014/10/4 (六) 14:00~15:00 @萬芳醫院

新光吳火獅紀念醫院劉人瑋藥師

請造訪

或加入nejs 粉絲團喔~

2

醫藥App醫療新知

實證醫學

nejs

搜尋

實證醫學步驟

實證醫學步驟 - 從問題到應用

3

提出問題將臨床問題改寫為「PICO」

檢索資料庫/

挑選文獻嚴格評讀文獻

決定證據等級/做出建議

如何評估證據等級

目前常見的證據等級評比系統

目前並沒有公認最佳評比系統，但GRADE逐漸受到採用

4

CEBM GRADE SIGN

考慮面向主要為研究設計研究設計、研究結果

研究設計與執行(考慮誤差風險)

評比結果數字 (1~5) 文字 (高~非常低) 數字 (1++~4)

對應建議強度

文字 (A~D) 文字 (強~弱) 文字 (A~D)

評比難度 ★★★★★ ★★★★★ ★★★★★

採用機構/

學會尚未被使用於制訂治療指引

ACCP、WHO、SCCM、Cochrane等

SIGN治療指引

Level of evidence

搜尋

背景資訊

GRADE = The Grading of Recommendations

Assessment, Development and Evaluation

[目的] 建立共通的、透明的、容易了解的證據等級及建議

強度評比系統

[方法] 自2000年起，結合各國實證醫學專家、臨床醫師、

臨床流行病學家陸續建立架構

[成果] 目前已有超過數十個國際組織採用GRADE作為臨

床執業指引 (CPG) 制定標準，包括WHO、CDC、AHRQ

、NICE等；另也被廣泛應用於系統性綜論中

5

GRADE working

搜尋

愛用者們

6

GRADE working

搜尋

該如何提供 (實證的)建議?

以方法評定證據等級

7

GRADE working

搜尋

好處與壞處

價值與偏好

費用/資源

證據等級(LOE)

試驗設計/執行

結果一致性

證據間接性

結果精準度

發表誤差

結果顯著

降低效果因子

劑量反應梯度

高

中

低

非常低

強烈建議

薄弱建議

薄弱反對

強烈反對

建議強度(SOR)

以RoB工具評估

GRADE流程

8

GRADE working

搜尋

擬定問題選擇適當指標/

決定重要性製作證據檔案

評比每個指標的證據品質

評比跨指標的證據品質

小組共識形成實證建議

(1) 證據等級(2) 好處/壞處(3) 價值與偏好(4) 費用/資源

(1) 關鍵(2) 重要(3) 不重要

P

I

C

O

高

中

低

非常低強烈建議

薄弱建議

薄弱反對

強烈反對

擬定問題

以「PICO-S」擬定關鍵臨床問題

- 使用抗生素的成人或兒童 (P)，補充益生菌 (I)，相較於未

補充 (C)，是否可以降低抗生素引起的腹瀉 (O)?

可能回答這個問題的研究設計: (S) 隨機分派對照研究

9

GRADE working

搜尋

(P) 使用抗生素的成人或兒童

(I) 補充益生菌

(C) 未補充

(O1) 抗生素引起的腹瀉

(O2) 不良反應

證據品質評比

證據評比方法

扣分項目 (5項): 研究計劃/執行不佳、結果不一致、間接證

據、估計值不精準、發表誤差

加分項目 (3項): 效果顯著、可信的影響因子降低效果、有

劑量反應梯度

10

評比隨機分派研究觀察性研究病例報告

高 (high) 0 2+

中等 (moderate) 1- 1+

低 (low) 2- 0

非常低 (very low) 3- 1- 0

GRADE working

搜尋

證據品質評比

證據評比方法扣分項目

- 研究設計/執行不佳 (study design/conduct)

- [狀況一] 隨機分派研究: Cochrane RoB工具

- [狀況二] 非隨機分派研究 (觀察性研究)

偏誤 (bias) 還是隨機誤差 (random error)

11

GRADE working

搜尋

偏誤 (bias) 隨機錯誤 (random error)

準確度高低

原因有確切原因無確切原因

再現性高低

證據品質評比


- 常見偏誤分類:

12

GRADE working

搜尋

偏誤 RoB工具對應項目

選擇性偏誤 (selection

bias)

順序產生方法 (sequence

generation)、分派隱匿 (allocation

concealment)

表現性偏誤(performance bias)

維持受試者與研究人員盲性(blinding of participants and

personnel)

偵測偏誤 (detection bias) 維持結果評估者盲性 (blinding of

outcome assessment)

削去偏誤 (attrition bias) 不完整報告數據 (incomplete

outcome data)

證據品質評比


- 常見偏誤分類 (續):

修改版與前一版差異:

- 將受試者、研究人員及結果評估者盲性要求分開

- 將「是、否、未知」改為「高風險、低風險、未知風險」

- 其他偏誤中，刪除提早結束研究，因為證據顯示，提早

結束研究不一定會導入偏誤

13

GRADE working

搜尋

偏誤 RoB工具對應項目

報告性偏誤 (reporting

bias)

選擇性通報 (selective outcome

reporting)

證據品質評比 -偏誤風險


- 研究設計/執行不佳 (study design/conduct)

- 隨機分派研究: Cochrane RoB工具

14

GRADE working

搜尋

證據品質評比 -結果不一致


- 研究之間結果不一致 (inconsistency)

- 評估為「不一致」的標準:

(1) 研究間，點估計值差異大

(2) 研究間，95%信賴區間些微重疊或未重疊

(3) 統計異質性達顯著水準 (P值或I2值)

GRADE工作小組表示，系統性綜論中常用的「I2值」容易受

到研究樣本數目影響 (個體研究樣本小，可能偵測不到統計

異質型，反之)，建議考慮使用不受樣本數目影響的「Τ2值」

15

GRADE working

搜尋

Note




- 因為「不一致」而需「扣分」的標準:

(1) 結果不一致

(2) 沒有不一致理由 (如有理由，不一定要扣分)

- 尋找造成不一致的理由:

(1) 次組分析 (subgroup analysis)

(2) 統合性迴歸 (meta-regression)

GRADE任務小組建議以正式條件評估次組分析之可信度

(credibility) BMJ 2010;340:c117 (http://goo.gl/EQ3ebL)

16

GRADE working

搜尋

Note




17

GRADE working

搜尋

證據品質評比 -間接證據


- 間接證據 (indirectness)

*CDAD = Clostridium difficile-associated diarrhea

18

項目範例間接性來源

間接族群 (P) 未服用或使用非抗生素的成人或兒童

發生腹瀉的風險與使用抗生素的族群不同

間接介入 (I) 非使用益生菌，而是間接調節腸內菌的藥品

以調節腸內菌的藥品療效外推使用益生菌效果

間接預後 (O) 以腸內益生菌數量作為間接指標，而非直接以腹瀉或CDAD作為預後指標

腸內益生菌數量與是否發生腹瀉有關，但並非直接指標

GRADE working

搜尋

證據品質評比 -間接證據


- 間接證據 (indirectness)

*CDAD = Clostridium difficile-associated diarrhea

19

GRADE working

搜尋

項目內容評比

P 使用抗生素的成人或兒童直接

I 任何菌株、劑量的益生菌直接

O 以糞便毒素檢驗或細菌培養確認之CDAD 直接

證據品質評比 -不精確


- 估計值不精確 (imprecision)

- 評估為「不精確」的標準:

(1) 樣本數目不足 (尤其是事件數目不足)

(2) 95%信賴區間過寬

- 評估方法:

(1) 點估計值之95%信賴區間是否橫跨建議與不建議的臨

床決策「閾值」之間，如果是 (橫跨)，扣分

(2) 決定「閾值」需考量: 指標重要性、不良反應、對病

人的負擔、資源/費用、偏好/價值等 (難)

(3) 考量最佳資訊量 (optimal information size; OIS)

20

GRADE working

搜尋




- 評估標準 (參考):

21

GRADE working

搜尋

RR (95% CI)

RR 0.75

風險下降達統計顯著差異且95% CI上限未跨越閾值

RR (95% CI)

RR 0.75

風險下降達統計顯著差異且95% CI上限但跨越閾值

精確 (precise) 不精確 (imprecise)

相對風險降低25%

設定為閾值




- 評估標準 (參考):

22

GRADE working

搜尋

RR (95% CI)

RR 0.75

風險下降未達統計顯著差異且95% CI下限未跨越閾值

RR (95% CI)

RR 0.75

風險下降未達統計顯著差異且95% CI上限但跨越閾值

精確 (precise) 不精確 (imprecise)

相對風險降低25%

設定為閾值




- 綜合20項隨機分派對照研究 (共3,818位受試者)，補充益

生菌顯著降低CDAD風險 RR 0.34 (0.24-0.49)

- 計算OIS:

- alpha = 0.05 beta = 0.8 RRR 30% 對照組事件發生率

中位數5% (設定type I error發生率5%、type II error發

生率20%)

23

GRADE working

搜尋




- OIS = 2,838 x 2 = 5,676位受試者

網站: http://www.stat.ubc.ca/~rollin/stats/ssize/b2.html

24

sample size

搜尋

證據品質評比 -發表誤差


- 發表誤差 (publication bias): 因為選擇性發表研究結果

導致效果被系統性高估/低估

- 如何檢視發表誤差:

- 搜尋資源

- 眼睛掃描漏斗圖 (funnel plot)

- 統計模式

「灰色文獻 (grey literature)」代表未經發表的研究結果，

例如廠商研究、小型研究或會議摘要等等

25

Note

GRADE working

搜尋

如何偵測發表誤差 (publication bias) [續]:

[視覺] 漏斗圖 (funnel plot) 是否對稱?

證據品質評比 -發表誤差

26

GRADE working

搜尋

RR 0.34

共20項隨機分派對照研究

不能降低CDAD風險能降低CDAD風險

樣本數目大

樣本數目小

證據品質評比 -效果顯著

證據評比方法加分項目

- 效果顯著

- 有其他可能降低效果的因子

- 有劑量反應梯度 (dose-response gradient)

27

效果大小效果估計證據等級

大 RR >2 或 RR <0.5，需至少兩項研究以上且結果一致

加1分

非常大 RR >5 或 RR <0.2，需為直接證據且沒有重大限制

加2分

GRADE working

搜尋

證據品質評比

證據評比方法

- 評比結果

28

研究類型加/扣分項目證據等級

隨機分派研究沒有重要限制高

有重要限制中

有非常嚴重限制低

有非常嚴重限制且結果不一非常低

觀察性研究效果顯著且沒有重要限制高

有劑量反應梯度且沒有重要限制中

沒有重要限制低

非系統性觀察 (包括病例報告) 非常低

GRADE working

搜尋

以「證據檔案 (evidence profile)」統整目前證據

- 益生菌用於降低CDAD風險之證據檔案

整合證據

29

GRADE working

搜尋

50/1,000 x RR 0.34 = 17/1,000 = 每1,000人減少33人發生CDAD

證據品質判定結果，因為不精確被降級 (高→中)

證據品質評比

對醫療人員:

“使用抗生素的成人或兒童，補充益生菌，相較不補充，每

1,000人約減少33人 (50人減少到17人) 發生CDAD”

“這項證據的等級是中 “

30

50人/1,000人 17人/1,000人

↓33人/1,000人

擬定建議強度

建議強度 (strength of recommendation) 代表的是我們

對這項介入好處多過於壞處的信心 (confidence)

- 好處 (desirable effects) = 降低死亡率、發病率或提升

生活品質等

- 壞處 (undesirable effects) = 對死亡率、發病率或生活

品質等具有負面影響的不良反應或增加費用

系統將建議強度分為:

- 強烈 (strong)

- 薄弱 (weak)

但是不是只能按讚，系統中包括「建議」與「反對」

31

擬定建議強度

系統中決定建議強度的主要因素

實務上，建議強度必須綜合考量上述因素後決定

32

主要因素描述

好處與壞處考量好處與壞處的重要性後，該介入的好處是否大於壞處

證據品質證據品質越高增加建議的信心，但不一定等同高建議強度

價值與偏好眾人 (專業人員、病人與決策者) 的共識，差異越小，建議強度越強

費用與資源費用越高影響接受的意願，但不一定等同低建議強度，而是要整體考量

Note

建議強度

擬定建議強度

33

證據強度

建議強度

證據強度高建議強度強

大部分情況下可應用於大部份患者

證據強度低建議強度強

可能隨著高品質證據發表而改變

證據強度高建議強度弱

證據強度低建議強度弱

應該考慮其他治療選擇

理想

現實

最好的決定視病患狀況與其他因素而有差異

GRADE working

搜尋

工具

GDT (guideline development tool)

- www.guidelinedevelopment.org/

- 線上雲端執行GRADE證據等級評比系統，也可儲存離線

使用，也可以匯入rm5或grd檔

34

GDT guideline

搜尋

grade 實證醫學 證據評比系統

Health & Medicine

grade 實證醫學證據評比系統