隨著口腔醫學的進展,新技術、新試驗、新產品、新材料層出不窮,我們正處在一個信息爆炸的時代。●不恰當的隨機方法如所謂的“半隨機”方法,依就診順序交替納入試驗組和對照組,以出生日期、入院日期的奇偶數決定患者被何組等。
隨著口腔醫學的進展,新技術、新試驗、新產品、新材料層出不窮,我們正處在一個信息爆炸的時代。繁忙的口腔臨床醫務人員如何能在從事繁忙的工作之時同時保持與時俱進?循證口腔醫學應運而生,其目的是應用目前最好的證據,結合口腔醫生的經驗和病人的具體情況為個體病員診療做出正確的決策。係統評價是獲取最佳證據的主要手段之一。口腔醫務人員應當熟悉其評價和製作過程。
係統評價的方法是由英國著名流行病學家Archie Cochrane首先提出的,早在20世紀70年代他就倡導,臨床醫師需使用已被證明有明顯效果的醫療保健措施以應付衛生資源的短缺。而臨床隨機對照試驗所獲取的結果是可靠的證據,他建議應當將特定病種、同種療法的所有隨機對照試驗結果合並成為說服力比單個試驗更強的證據,並在新的臨床試驗結果出現時予以更新,保證證據更加真實可靠。
疾病防治性係統評價是在篩選並嚴格評估相關研究的基礎上,收集並合並數據,進而對某一防治性問題得出明確的結論。Meta-分析是整合數據的一種統計學方法。運用了Meta-分析的係統評價可以稱為定量係統評價,未使用Meta-分析的係統評價為定性係統評價。
係統評價已廣泛地應用於病因、診斷、治療、預防和預後研究中,在口腔醫學中的發展也日益壯大。目前Cochrane協作網口腔衛生組已發表係統評價全文99篇,計劃書72篇,注冊題目41個(2010年第3期);在其他相關雜誌上發表的口腔專業類係統評價的數量更多。雖然係統評價為口腔臨床實踐提供了一定真實可靠的證據,但是這些證據的數量以及論證強度還遠遠不能滿足口腔醫學的要求。因此亟待更多的口腔臨床工作者深入參與,以便生產出更多高質量的係統評價。
本文通信作者曾於2003年在Cochrane圖書館第一期上發表了一篇名為透明質酸鈉治療顳下頜關節紊亂病(Hyaluronate for temporomandibular joint disorders)的係統評價,並在最近對其進行了更新。為了敘述方便,本文便依此係統評價的製作過程,簡述防治性係統評價的基本製作方法、步驟及常見問題的解決方法。
1. 明確研究目的,確立係統評價題目
像任何其他科學研究一樣,在開始進行係統評價之前應有明確的目的。實際上,口腔醫學臨床實踐中目前還沒有解決的、需要密切關注的問題甚多。任何熱切為患者提供最佳診治方案、關注學科發展的口腔醫生都應該善於提出臨床問題,緊抓問題深入思考。進行係統評價,這也是解決臨床問題的重要途徑。一個關於疾病防治的完整的臨床問題應具備四個要素PICOS,即:①涉及什麼樣的患者(Participants),②涉及何種幹預措施(Intervention),③涉及何種比較方法(Comparisons),④涉及何種療效指標(Outcome),⑤采用何種研究手段(Study design)。
如在製作透明質酸鈉治療顳下頜關節紊亂病療效評價的係統評價時,該臨床問題就包括:“對顳下頜關節紊亂病患者(患者),采用關節腔內注射透明質酸鈉治療其顳下頜關節紊亂病(幹預措施),在與安慰劑或皮質激素的關節注射進行隨機對照試驗比較時(比較方法、研究手段),以臨床症狀和體征的變化作為評價指標(療效指標),其療效和安全性如何?”
係統評價的題目是其研究目的的簡要體現,可以突出“幹預措施”和靶向疾病“患者”兩個要素。製作口腔衛生領域的Cochrane係統評價的第一步是向Cochrane Health Group申請一個title,即研究題目,口腔衛生組專家將根據其研究價值和臨床意義,以前是否有類似題目等做出取舍。假若研究題目符合前一個要求,但已經有其他作者發表或正在製作,則不會被批準,以免浪費申請者的精力和資源。
2. 確定納入與排除標準
在國內外文獻中,涉及待探討問題的研究可能有很多。要解決該臨床問題顯然不能漏掉相關的重要文獻,但是也不需要納入無關文獻浪費寶貴的時間和精力。因此必須設定明確的文獻納入與排除標準。
2.1 研究類型 一般情況下,防治性研究的係統評價應該納入臨床隨機對照試驗(randommized controlled trial, RCT),有時可納入半隨機對照試驗(quasi-RCT)。如果這兩者數量很少或缺如,非隨機的臨床試驗也可納入。
2.2 研究對象 患者的年齡、性別等人口學特征,疾病種類與嚴重程度須符合研究目的。如本例中,對研究對象的規定即為“任何性別,年齡大於18歲,通過影像學和臨床指標診斷為顳下頜關節紊亂病或風濕性關節炎的患者,無論其種族、社會經濟地位和居住地區如何均可納入”。
2.3 幹預措施 應限製待研究的幹預措施,但其對照方式可以有多種形式。如與安慰劑的對照,對照組僅接受與治療組等同的基礎治療;與已知有效藥物或處理的有效對照;不同劑量或不同給藥方式之間的對照。試驗組與對照組除了幹預措施不同,其他的處理措施應保持一致。
2.4 結局指標 結局指標應當是在廣泛閱讀相關文獻以及臨床經驗的基礎上確立。結局指標分為主要指標和次要指標。前者為臨床上最常用的、足以敏感反映主要療效變化的指標,也是分析結果時的主要參考指標,數目盡量不超過3個,最好包含反映藥物不良反應或不良事件的指標。次要指標是指與主要指標連帶相關的有一定臨床及社會意義的的其他指標,如生命質量的變化及臨床經濟學指標等。不同研究中治療時間長短不一時,可依隨訪時間的長短,將結局指標分為短期、中期及長期指標分別進行評價。如本例中,我們以3個月為界點,將指標劃分成長期與短期,這樣對透明質酸鈉的治療效果評價更為準確。
3. 撰寫計劃書
完成上述步驟後,可以著手撰寫計劃書。Cochrane協作網要求所有的Cochrane係統評價在其title的申請被批準後,在一定時間段內需完成計劃書protocol。對準備發表到其他專業雜誌上的係統評價而言,通過撰寫計劃書可以理清思路,為完成係統評價做好準備工作,也方便其他專家評議及提出建議。我們的體會是,計劃書的撰寫有助於減少評價過程中發生嚴重偏倚的可能性,從而影響到結論的論證強度。因此,無論是進行何種係統評價,計劃書的撰寫都很有必要。計劃書中要詳述研究目的、文獻納入排除標準、係統評價各個步驟的具體實施方案及如何避免或減少偏倚因素的影響等。Cochrane口腔衛生組對計劃書有嚴格的內部專家評審製度和外部專家評審製度。申請者需要回答專家的詢問,並按專家提出的問題和建議修改計劃書,修改稿通過評審後將發表在國際循證醫學協作組的光盤版和網絡版雜誌Cochrane Library(按月出版)上。下一步的工作原則上須遵照計劃書所製定的步驟進行。
4. 構造檢索策略,檢索文獻
係統評價需要進行全麵而係統的文獻檢索,主要包括電子檢索、手工檢索、向作者查詢補充信息,了解有無未發表的文章等情況,向相關領域的專家學者及藥品等的生產廠家了解有關幹預措施的更多信息。為避免發表偏倚及語言偏倚,檢索結果應當盡可能全麵,並且對文獻的發表語言及、進行國家和發表時間等不宜有過多的限製。
電子檢索包括檢索Medline、PubMed、EMbase、中文的CBM等數據庫。可以采用主題詞和自由詞相結合的形式構造檢索策略。檢索RCT時,可以將自擬的檢索式同Cochrane協作網推薦用以篩查RCT的檢索式(詳見Cochrane協作網出版的係統評價者手冊5.0.1第6章)相結合,最終形成完整的檢索策略。
除以上數據庫外,還應檢索Cochraene Library、Cochrane口腔衛生臨床試驗注冊庫及世界衛生組織國際臨床試驗注冊平台(WHO ICTRP)等,以便了解是否有正在進行的相關臨床試驗,可否獲取未發表的臨床試驗的結果。
電子檢索的全部信息都需保存完善,以供複查。
手工檢索即是通過閱讀專業雜誌、會議論文摘要等,查找符合納入標準的文獻。手工檢索可補充電子檢索的疏漏,應引起重視。
從已納入文獻的參考文獻中檢索也是重要的手段。高質量的論文一般會引用豐富的相關研究文獻,其中可能含有電子檢索和手工檢索都未能檢出的有價值的文獻。
5. 確定納入文獻
文獻的納入須根據已製定的納入與排除標準,由至少兩位研究者獨立地進行。通過對檢出文獻的標題、摘要及全文依次閱讀,可逐步排除一些不相關的文獻,而對可能納入的文獻,務必在閱讀全文時重視其材料與方法部分的評判。兩位研究者在確定是否納入的意見上不一致時,需分析原因,如係原文描述不清,可與原文作者聯係以獲悉相關資料,並與第三位研究者進行討論。二者的一致性程度可通過Kappa檢驗計算。在納入過程中,應去除重複的研究,否則會影響Meta-分析的結果。對於某些可能為同一研究的文獻,應當向作者發信以確認。
6. 偏倚風險和方法學質量的評價
偏倚(bias)是指由於方法學的缺陷導致的試驗結果與真實值之間的差異。在係統評價中,對文獻的偏倚風險或方法學質量的評價十分必要,因為它會對係統評價結論的質量以及可信程度產生較大的影響。
對於研究結論的真實性,用偏倚風險來評估似乎比方法學質量(methodological quality)或報告質量(reporting bias)更為準確。例如比較不同外科方法治療顳下頜關節疾病的係統評價中,因為納入的隨機對照試驗未能采取雙盲的方法,就簡單地認為這類臨床試驗“方法學質量低”顯然是欠準確的,但也不能肯定此文“無偏倚風險”;同樣,一篇“報告質量不高”的文章,其結論仍可能具有一定真實性,而偏倚風險較高的文獻其結論的真實性則一定會大打折扣。由此可見,偏倚風險對文獻結果甚至係統評價結果的真實性影響更大。
臨床隨機對照試驗的設計、實施、分析及報告過程中可能存在下列偏倚:選擇性偏倚、無應答偏倚、信息偏倚(測量偏倚)、報告偏倚以及混雜偏倚等。文獻報道中評價偏倚風險的方法有多種,常用的有基於過程的評價表(domain-based evaluation),Jadad量表,改良Jadad量表等。報告質量的評價方法則以Consort聲明最為著名。本文將著重介紹domain-based evaluation。
文獻偏倚風險的評價應該由至少兩名研究者采用統一的標準獨立進行,當意見不一致時可引入第三位研究者討論確定。研究者需分別對隨機方法、隨機隱藏、盲法、結果完整性、選擇性報告以及其他偏倚進行評價。
6.1 隨機方法
●恰當的隨機方法 絕不是隨便冠以“隨機”二字,作者需明確描述隨機分配患者的方法。隨機方案的產生隻是受機遇的影響,不能人為預測,因而能使試驗組和對照組的基線水平處於一致。盡管簡單的隨機方法如擲骰子、抽簽也可達到隨機目的,但由於不易控製試驗組和對照組樣本大小,故不能很好地用於臨床隨機對照試驗;隨機數字表或統計學軟件產生區組隨機方案更為可行。
●不恰當的隨機方法如所謂的“半隨機”方法,依就診順序交替納入試驗組和對照組,以出生日期、入院日期的奇偶數決定患者被何組等。
●隨機方法不明確:未明確描述患者分配的方法。
6.2 隨機隱藏
●隨機方案妥善保管且在分配患者之前不為患者和試驗實施者所知,如中心隨機,試驗前由第三者利用外形相同的容器存放試驗藥或對照藥,試驗者按序號分配給順序納入的病例;
●不恰當的隨機隱藏如開放式的隨機分配方案,實際上是隨意分配並且不可能做到隱藏。
●當作者未能說明隨機隱藏的方法時則記為不清楚。
6.3 盲法
●包括對患者、幹預實施者以及檢查者的盲法設置。
●恰當的盲法 如三盲或雙盲,若采用單盲或不盲則必須說明理由,並且證明其未引起結果偏倚;
●不恰當的盲法 即當一方不盲時會對試驗結果的評估造成偏倚(如某研究報道了最大張口度這一測量指標,若僅有患者被設盲,觀察者可能會誇大試驗組的測量結果);
作者對盲法未明確描述則記為不清楚。
分析基線水平、隨訪情況對文獻評價也很重要。當然,統計學方法的評價也不容忽視,統計學方法若是選擇和運用不當的話同樣會導致錯誤的結論。
7. 數據提取
數據的提取是進行Meta-分析以及對結果指標予以係統評價的基礎工作,需采用根據具體研究特點設計製作的數據提取表。其基本項目應包括被納入文獻的設計和試驗方法、患者情況、幹預措施及結局指標等一係列內容。數據提取表格基本項目見表1,供讀者參考。
表1. 係統評價數據提取表基本項目
提取結果數據時會遇到多種情況,原則上應能詳盡而準確地反映原始資料情況,特別是原文作者已經進行了統計分析時,應記錄其分析結果,如95%可信區間、假設檢驗的統計量及其對應的P值等。若存在多個時間點重複測量的結果,可根據數據合並的需要選取能合並比較的時間點錄入資料。如在測量透明質酸鈉短期效果和長期效果時,我們隻選取了1個月和6個月的數據。必要時可向作者致函以明確其采用的測量方法及相應具體數據。
8. 數據分析
數據分析是定量係統評價的重要環節,主要是運用Meta-分析將多個研究中相同變量的結果合並。目前用於Meta-分析的數據合並軟件主要有RevMan、Stata、Comprehensive Meta Analysis等。Cochrane協作網推薦使用的RevMan軟件界麵友好,菜單式選擇分析方法,輸入數據後即可直接得出結果及相應的森林圖。
8.1異質性分析 文獻間的異質性主要表現為三個方麵:臨床異質性、方法學異質性和統計學異質性。臨床異質性即各研究在所納入患者的基線情況、幹預情況之間的差異;方法學異質性則指各研究所采用的隨機方法、盲法、結局指標及其測量方法等的差異;統計學異質性就是各試驗治療效果之間的差異。
臨床異質性和方法學異質性的分析為描述性的,若各研究間的兩種異質性較大,則應排除對異質性影響最大的的文獻。RevMan中,對統計學異質性的分析默認采用卡方檢驗,多用I2統計量表示分析結果。當I2為0~40%,表示各研究間的統計學異質性可以忽略; I2為30%~60%時,說明各研究之間可能存在一定的異質性; I2為50%~90%時,可認為各研究之間有較明顯的異質性; I2大於75%時就可以認為各研究之間有相當大的統計學異質性。當產生明顯的異質性時,可運用以下方法分析和處理:(1)分析異質性的來源,針對原因尋求解決辦法;(2)檢查提取與輸入數據的環節是否存在錯誤;(3)當研究存在臨床或方法學的異質性時,可分別對不同臨床情況進行亞組分析。如本實例中,7個研究比較了透明質酸鈉與安慰劑關節腔內注射對患者臨床體征的改善情況。然而其中僅有4個研究采取單純的關節腔內藥物注射,另外3個則使用關節灌洗配合關節腔內注射,研究間存在明顯的臨床異質性。因此,我們將單純關節腔內注射和關節灌洗配合關節腔內注射作為兩個亞組給予亞組分析;(4)采用隨機效應模型,並與固定效應模型結果相比較;(5)排除造成過大異質性的文獻;(6)取消Meta-分析。
8.2 Meta-分析 Meta-分析是將納入的多個研究進行數據合並,有效增大樣本含量及結果精確度的統計學方法,一般采用固定效應模型或隨機效應模型進行。固定效應模型主要用於各研究之間異質性較小的情況(I2≤50%,P≥0.10),隨機效應模型則主要用於各研究之間有明顯異質性的情況(I2>50%,P<0.10)。不同類型的研究資料,選擇的合並統計量不盡相同,例如:
8.2.1 二分類變量 二分類變量多采用相對危險度(relative risk,RR)、比值比(odds ratio,OR)和危險度差值(risk difference,RD)等作為合並統計量,其中應用RR較多,如研究事件在試驗組和對照組中發生率<20%,則使用OR作為效應量估計值,而研究事件在試驗組或對照組中發生率為0時考慮使用RD。
8.2.2 連續性變量 合並連續性數據時,多采用加權均數差(weighted mean difference,WMD)和標準化均數差(standard mean difference,SMD)作為合並統計量。當各研究對於同一變量采取相同或相似的測量方法和單位時,應采用WMD作為合並統計量;如若采取了不同測量單位,或者各研究之間的均值差異較大時,則可以使用SMD。
文獻同時報道試驗組和對照組在基線時及試驗完成時的兩組數據時,若各組基線指標相對一致,可直接輸入試驗完成時的均值及標準差,也可計算幹預前後相應變量變化的差值及其標準差輸入。
8.2.3 合並連續性變量與二分類變量 對同一變量的測量,有的研究可能采用二分類變量,而有的則采用連續性變量。在一定情況下,可以將SMD與OR進行轉換,進而將連續性變量與二分類變量合並。例如以SMD作為合並統計量時,二分類變量可通過下述公式轉換為SMD表達:
8.3 敏感性分析 Meta-分析結果的穩定性和可靠性可借助敏感性分析的方法推斷。若敏感性分析結果與Meta-分析結果無顯著差異,則可推論Meta-分析的結果穩定,可信度高; 反之,則表明該Meta-分析結果穩定性差,可靠性較低,給出結論時應當謹慎。可對影響結果真實性與穩定性的主要因素予以敏感性分析,分析方法如排除偏倚影響較大、方法學質量較低的文獻後進行Meta-分析,應用不同的研究模型進行分析,以及不同臨床情況的亞組分析等。
8.4 森林圖的閱讀與解釋 Meta-分析可用森林圖表示結果。完整的森林圖包括標題、結果名稱、研究名稱、比較的數據、權重、統計量、森林圖形和假設檢驗結果等。各研究所對應圖形的中點即為所選統計量的均值,其麵積大小表示該研究在Meta-分析中的權重,橫線長度表示95%可信區間(95%CI)的大小。圖形中的垂線又稱無效線,代表95%CI範圍的橫線與其相交時,說明該研究結果無統計學意義。下方的菱形代表各研究合並統計量的均值及其95%CI範圍。橫坐標表示統計量大小,在橫坐標線下方無效線的一側注明“有利於治療措施”,另一側則標注“有利於對照措施”。
圖1為透明質酸鈉與安慰劑比較治療顳下頜關節紊亂病在改善臨床體征Meta-分析的森林圖。從圖中可知,納入的3篇研究中僅Hepgular 2002顯示關節腔內注射透明質酸鈉能夠明顯改善患者的臨床體征,而其餘研究並不能說明此問題。該森林圖Meta-分析的結果中菱形與中線相交,表示尚無充分證據說明透明質酸鈉能明顯降低臨床體征指數。
8.5 發表偏倚的衡量
發表偏倚(publication bias)是指那些不具有統計學意義的陰性結果的研究,相較於有顯著性意義的陽性結果的研究更難或沒有機會獲得發表。在係統評價中,當分析某一結局指標時納入了數量較多(≥10篇)的文獻時,應該用統計學方法評價是否存在發表偏倚。Cochrane協作網係統評價手冊建議,通過觀察不同研究結果在漏鬥圖上是否對稱性分布來判定Meta-分析中的發表偏倚。
9. 係統評價的更新
全世界每年都在進行大量的臨床隨機對照試驗,因此有必要定期對係統評價進行更新,否則其結果將在3~5年甚至更短的時間內失去價值。有研究顯示,約38% 的Cochrane 係統評價每2年完成更新,而其他刊物上發表的係統評價2 年內更新率隻有3%。
更新係統評價不僅需要重新設計檢索式,增加納入文獻,及時補充相關信息,而且還應該根據最新的方法學進展對係統評價的方法學進行修改,不斷完善係統評價。
10. 係統評價的質量評價
10.1 係統評價的報告質量評價 為規範日益增加的係統評價的報告質量,QUOROM小組在1996年製定並於1999年發表了Meta-分析報告質量評價表(The Quality of Reporting of Meta-analysis,QUOROM),並由Cochrane協作網在2005年給予更新,其後又在2009年再次更新並重命名為PRISMA(Preferred Reporting Items for Systematic reviews and Meta-Analyses)。PRISMA由一個分成5階段的流程圖(圖2)和一份含27項條目的清單(表2)組成,有助於研究者評估納入隨機對照試驗的係統評價的報告質量。在撰寫係統評價時應嚴格遵照PRISMA聲明的要求進行。
表2 係統評價與Meta-分析報告質量評價表(李春潔、呂俊翻譯,史宗道審校)
10.2 係統評價作為證據的質量評價 在計劃運用某一係統評價提供的證據時,應對其質量進行嚴格評價,對其外部真實性進行評估,判斷其結論是否可行。關鍵是看其作者在設計、製作以及分析的過程中是否將偏倚降至最小。表2條目強調是否清晰完整地報告了係統評價結果,對其質量進行評價時則強調條目涉及的內容是否高質量完成了。如可以通過提出並回答下列問題進行評價:如提出的問題是否明確?檢索策略是否完善?納入和排除標準是否清晰恰當?對原始研究的真實性是否進行了恰當評估? 從原始研究提取數據的過程是否透明?原始研究的特點是否一目了然?是否檢驗了原始研究間的異質性,檢查了存在異質性的原因?數據定量合成是否恰當應用了Meta分析?提出的結論及其應用價值的發現是否符合邏輯,實事求是? 另外,還可采納證據質量分級標準評價證據質量。2004年推出的證據質量分級和推薦強度係統(Grading of Recommendations Assessment, Development and Evaluation, GRADE)已在2006年和2008年先後予以更新。GRADE標準將證據質量分級為高、中、低和極低4個水平,將推薦強度分為強和弱2個級別,並可通過相應軟件GRADEprofiler軟件也是協助評估證據質量的工具之一,研究者可以采用表3提供的判定依據為係統評價的證據質量評分。
希望通過本文的敘述,能使更多的口腔醫務人員學習撰寫口腔疾病防治性係統評價的方法,為口腔循證醫學的殿堂添磚加瓦。
參考文獻
1. 史宗道,主編.循證口腔醫學[M].第2版.北京:人民衛生出版社,2008.
2. 李幼平,主編.循證醫學[M].北京:高等教育出版社,2004.
3. 倪宗瓚,主編.醫學統計學[M].北京:高等教育出版社,2003.
4. Higgins JPT,Green S (editors).Cochrane Handbook for Systematic Reviews of Interventions[M]. Version 5.0.1 [updated September 2008] .The Cochrane Collaboration,2008.
5. Moher D,Tetzlaff J,Tricco AC,et al.Epidemiology and reporting characteristics of systematic reviews[J].PLoS Med,2007,4(3):e78.
6. Shojania KG,Sampson M,Ansari MT,et al.How quickly do systematic reviews go out of date? A survival analysis[J].Ann Intern Med,2007,147(4):224-233.
7. 陳耀龍,王夢書,張文娟,等.如何閱讀係統評價[J].中國循證醫學雜誌,2009,9(9):1010-1017.
8. 李靜,秦莉,劉鳴.係統評價的基本方法[J].中國循證醫學雜誌,2001,1(1):34-38.
9. 文靜,李幼平.Meta-分析中效應尺度指標的選擇[J].中國循證醫學雜誌,2007,7(8):606-613.
10. Shi Z,Guo C,Awad M.Hyaluronate for temporomandibular joint disorders[J].Cochrane Database Syst Rev. 2003;(1):CD002970. Review.
11. Liberati A,Altman DG,Tetzlaff J,et al.The PRISMA Statement for Reporting Systematic Reviews and Meta-Analyses of Studies That Evaluate Health Care Interventions: Explanation and Elaboration[J].PLoS Med,2009,6(7):e1000097.
12. GRADE Working Group.Grading quality of evidence and strength of recommendations[J].BMJ,2004,328:1490-1494.
您可以跳轉到結束位置並留下回複。當前不允許發送引用通告。
觀點評論·學術爭鳴
您必須 登錄 後才可以發表評論。
copyright©醫學論壇網 版權所有,未經許可不得複製、轉載或鏡像
京ICP證120392號 京公網安備110105007198 京ICP備10215607號-1 (京)網藥械信息備字(2022)第00160號