一、什麼是系統性文獻綜述?
系統性文獻綜述是一種高標準、結構嚴謹的文獻綜述方式。它旨在全面、客觀、可重複地收集、評估和綜合所有與一個明確界定的研究問題相關的高質量文獻。
它的核心特徵在於“系統性”,即整個過程像一項科學研究一樣,有預先設定的、透明的計劃和方法,以最大限度地減少偏差。
SLR的標準步驟通常包括:
- 提出明確的研究問題:通常使用PICO/PICOS/PCC/SPICE/EPICOT/SPIDER等框架來精確定義困難
- 制定詳細的檢索策略:明確説明在哪些數據庫(如PubMed, Web of Science, Scopus等)中進行了檢索,使用哪些關鍵詞及其組合,並附上完整的檢索式。
- 設定嚴格的文獻納入與排除標準:預先規定要納入的研究類型(如隨機對照試驗RCT)、研究對象、發表語言、發表時間、文獻類型(Article/Conference/Book/Gray literature)等。
- 系統性地篩選文獻:通常由兩位或以上的評審員獨立根據標準進行篩選(標題/摘要篩選、全文篩選),並對分歧進行討論消除,以保證客觀性。
- 嚴格的質量評價:使用標準化的質量評價程序(如 Cochrane Risk of Bias Tool)對納入研究的偏倚風險和方法學質量進行評估。
- 數據提取與綜合:啓用預先設計好的表格提取數據,然後對數據進行定性(描述性)綜合,倘若研究足夠同質,還會進行定量綜合,即Meta分析。
- 結果報告與解釋:清晰、透明地報告整個流程和發現,包括檢索到的文獻量、納入的研究、質量評價結果、綜合結果等。
二、SLR與其他常見綜述類型的區別
- 傳統(敍述性)文獻綜述
- 特點:這是最常見但也最寬泛的綜述類型。作者通常不遵循嚴格的系統性方法,而是基於自己的知識和興趣,選擇性地回顧和討論某一領域的文獻。
- 目的:獻出對一個領域的廣泛概述,介紹歷史發展、理論框架、當前現狀和未來方向。常用於學位論文的第二章或教科書中的章節。
- 缺點:容易受作者個人觀點和選擇偏倚的影響,缺乏透明度和可重複性。
- 範圍綜述
- 特點:它的方法與SLR極其相似,也遵循系統性的流程,但其核心目的不是回答一個具體的、需要證據質量評估的問題,而是“描繪”一個領域的研究範圍和規模。
- 目的:探討一個領域已經做了哪些研究,識別關鍵概念、證據類型和研究空白。常用於為後續的SLR確定研究困難,或者在概念尚不明確、研究設計多樣的新興領域進行探索。
- 與SLR的區別:通常不含有對納入研究的嚴格質量評價步驟。
- Meta分析
- 需要強調的是:Meta分析不是一種獨立的綜述類型,而是一種統計技術。它通常是SLR的一個組成部分。
- 特點:運用統計學方法對多個獨立但主題相似的研究結果進行定量合併,從而得出一個更具普適性的綜合結論(如合併後的效應量)。
- 目的:增加統計功效,處理單個研究間的爭議,提供更精確的效應估計。
- Umbrella Review
- 特點:又稱為“綜述的綜述”。
- 目的:綜合針對同一健康問題但不同干預措施或不同結局的多個SLR的結論,從更宏觀的層面提供證據概覽。
- 批判性綜述
- 特點:側重於對現有文獻進行深入的、批判性的分析和評價,強調理論貢獻、方法論優缺點,並指出矛盾和有爭議的地方。
- 目的:推動理論發展,挑戰現有範式,通常出現在社會科學和人文領域。
* SLR與其他綜述類型的核心區別 (如下表)
三、SLR的Research Question構建框架
①PICO / PICOS (及其變體)醫學和健康科學領域最經典、最常用的框架,尤其適用於干預性/療效研究。
P (Population/Patient): 感興趣的患者或人羣。定義其關鍵特徵(如疾病、年齡、性別、病情嚴重程度)。
I (Intervention/Exposure): 要評估的治療、干預措施或暴露因素。
C (Comparison/Control): 用於比較的干預措施(如另一種治療、安慰劑、空白對照)。
O (Outcome): 希望測量的結果(如死亡率、症狀改善、生活質量、副作用)。
S (Study design): (可選但推薦)優先考慮的研究設計類型(如隨機對照試驗RCT)。
②PCC - 適用於範圍綜述(Scoping Review)和方法學綜述,範圍綜述旨在釐清關鍵概念和證據範圍,而非直接回答療效問題。
P (Population): 目標人羣。
C (Concept): 需要釐清的核心概念、定義或領域。
C (Context): 研究所處的環境、背景或設置(如國家、文化、醫療系統)
③SPICE - 適用於服務評估、社會科學和政策研究,強調在特定背景下評估某項行動或服務。
S (Setting): 環境或背景。
P (Perspective): 相關用户、患者或利益相關者的觀點。
I (Intervention/Exposure): 被評估的行動、項目或服務。
C (Comparison): 與什麼進行比較(可選)。
E (Evaluation): 評估的指標或結果。
④EPICOT - 適用於識別未來研究方向的綜述,常用於綜述的討論部分,提出研究建議。
E (Evidence): 當前已有的證據。
P (Population): 目標人羣。
I (Intervention): 干預措施。
C (Comparison): 對照。
O (Outcome): 結果指標。
T (Time stamp): 建議的時間框架和研究設計。
⑤SPIDER - 適用於定性研究或混合方式綜述,當綜述包含定性證據時,PICO不夠靈活,SPIDER更適用。
S (Sample): 研究的參與者。
PI (Phenomenon of Interest): 感興趣的現象、行為或經驗。
D (Design): 研究設計(通常更寬泛,如定性研究、現象學研究)。
E (Evaluation): 測量的結果(通常是主題、觀點、體驗,而非量化指標)。
R (Research type): 研究類型(定性、定量或混合方法)
四、SLR必須有的“一表一圖”——文獻篩選流程
① 文獻篩選條件
② 文獻篩選流程與數目統計
五、SLR數據處理與分析
整個流程可以分為三個核心階段:1. 信息提取 -> 2. 數據分析與綜合 -> 3. 結果呈現與解釋
第一階段:數據提取——構建分析的基礎——系統性地從納入的文獻中捕獲信息
1. 設計並填寫標準化的數據提取表:
- 目的:確保從每篇文獻中收集的信息是一致的、可比較的。
- 內容(需根據您的研究問題定製):
- 文獻主要信息:作者、年份、標題、期刊、研究類型(RCT, 案例研究等)。
- 以PICOS框架為例收集要素:
- P:研究對象
- I:干預措施或核心現象
- C:對照措施或比較對象
- O:結果指標
- S:研究背景/環境
- 研究方法學特徵:樣本量、隨訪時間、測量工具、數據分析辦法。
- 關鍵發現/結果:包括主要的定量結果(如效應值、均值)和定性主題。
- *注意記錄key findings中的conflicting, inconsistency, doubts和potential gaps
2. 進行預提取:
- 由2-3名評審員獨立對少量(如5-10篇)文獻進行數據提取,然後比較結果,解決分歧,完善提取表的設計和定義,確保一致性。
第二階段:數據分析與綜合——您的挑戰核心
層次一:描述性分析——描繪“地圖”
- 目的:整體把握所納入研究的特徵。
- 內容:
- 研究分佈:發表年份趨勢、國家/地區分佈、學科分佈。這直接對應了您提到的“emerging trends”。
- 研究方法譜系:各種研究設計(如實驗、調查、質性研究)的比例。這揭示了領域的成熟度和主流範式。
- 研究對象與情境:研究主要集中在哪些人羣、哪些環境中?這行幫忙識別“potential gaps”(例如,某個特定人羣被忽略了)。
層次二:主題綜合與內容分析——挖掘“模式與關係”
- 目的:識別、分析和整合研究的具體內容。
- 內容:
- 定性研究:常用主題綜合。藉助反覆閲讀、編碼,將多個研究的發現歸納為一系列連貫的、有層次的主題。這些主題及其之間的關係即“patterns and relationships between various elements”。
- 定量/混合研究:可以進行內容分析通過,對研究結果進行分類和計數。例如,能夠統計“影響用户採納的因素”被多少篇文獻提及,並排序。
- 跨案例比較:將每項研究視為一個“案例”,系統比較不同案例間的異同,從而解釋為什麼在某些情況下會出現特定結果。
層次三:批判性評估——評估“證據強度”
- 這是您提到且至關重要的部分,需要系統化執行。
- 方法:
- 採用標準化工具:根據研究類型選擇相應的評估工具。
- RCT:Cochrane偏倚風險評估設備。
- 觀察性研究:NOS量表。
- 質性研究:CASP清單。
- 評估維度:包括選擇偏倚、實施偏倚、測量偏倚、損耗偏倚等。
- 結果運用:
- 敏感性分析:在元分析中,排除低質量研究,看結果是否穩健。
- 為發現獻出背景:在綜合結果時,明確指出某個強有力的結論主要來自高質量研究,而某個不確定的結論可能源於方法學有缺陷的研究。這也有助於迴應的“key findings (conflicting, inconsistency, doubts)”——不一致的結果有時正是由於研究質量的巨大差異造成的。
層次四:解釋性綜合——回答“So What?”
- 目的:超越簡單的總結,構建一個更高級別的解釋框架。
- 內容:
- 構建概念模型:基於前面的分析,提出一個能解釋各要素之間關係的模型。例如,“A通過B的中介作用影響C,而這個過程受到D的調節”。
- 解釋矛盾對就是:主動探討為什麼研究會得出相互矛盾的結論?是人羣差異、干預劑量不同、還是測量工具不一?這“key findings (conflicting)”的深度挖掘。
- 證據分級與結論強度:使用如GRADE等技巧,對每個主要發現的證據強度進行評級(高、中、低、極低)。這讓讀者一目瞭然地知道該對哪個結論抱有更多信心。
層次五:研究進展的綜合評述——綜合之綜合+提防燈下黑
- 理論/概念框架的演變:領域內使用的核心理論是否發生了變化?是否有新的理論被提出?
- 方法學的演進與反思:研究方式的嚴謹性是否在提高?是否存在普遍的方法論缺陷?
- 劑量-反應關係:在干預研究中,不同“劑量”的干預是否導致不同的結果?
- 未報告的結果:注意“發表偏倚”,那些不顯著或負面的結果可能沒有被髮表,但這本身就是一個重要的發現。