中醫藥治療中風研究文獻的質量評價
佚名
摘要:目的:對中風的中醫藥臨床治療性文獻進行科研設計質量的分析。方法:按照臨床流行病學/DME原則,制訂《中風中醫藥臨床研究文獻評價表》,經測試其重復性較好(主要條目Kappa值為0.46~0.48,中度一致);用其對1992~1996年間的中風中醫藥臨床治療性文獻進行評價。結果:28.4%的研究采用了隨機對照方法,但隨機的質量和可信度較差;盲法極少被采用;其他需要注意的問題還有組間基線均衡性的比較、結局指標的選擇、發表性偏倚等方面。并對中風病結局指標的選擇、中醫藥臨床研究在方法學上的難點與解決方法進行了討論。
Quality Analysis of Literature of Traditional Chinese Medicine on Clinical Study of Stroke
Abstract:To evaluate the quality of TCM literature on clinical study of stroke,the evaluating scale for TCM literature on clinical study of stroke with good reproducibility was designed (Kappa of the main item varies from 0.46 to 0.48) and was used to evaluate TCM literature on clinical study of stroke from 1992 to 1996.Randomized controlled clinical trial was adopted in 28.4%,but the quality and credibility of randomization was relatively poor.Blinded methods were seldom u sed and some problems were noticed in the baseline comparison,the choice of the outcome indicator,publishing bias,etc.The choice of the outcome indicator of stroke and the methodological difficulties of TCM clinical study,and its possible resolutions were also discussed.
Key words:STROKE/TCM therapy;STROKE/TCD therapy;STROKE/TCM-WM therapy;MED PHARMACOL LITERATURE TCM;QUALITY,ACQUIREMENT,EVLVATION;@EVIDENCE-BASED MEDICINE
醫學文獻的系統分析(Systematic Reviews)是建立在臨床流行病學(Clinical Epidemiology)和循證醫學(Evidence_Based Medicine)基礎上的新的醫學科研方法。近20年來,發達國家醫學界越來越重視這一工作在臨床科研中的應用。系統分析不同于傳統的醫學文獻綜述即描述性綜述(Traditional Narrative Review),它是對某一課題或項目所有的研究論文進行全面、系統的質量評估的定性分析,對符合條件的研究論文再進行定量的Meta分析,以較全面準確地掌握該項研究的現狀、臨床療效的真實程度及其可應用性,以指導臨床決策。
中風是嚴重威脅人類健康的疾病之一,中醫藥用于治療中風的臨床研究近年來比較多,也取得了不少成績,但應該指出的是,中醫藥學的臨床研究對方法學的應用仍不夠重視,臨床試驗的規范性亦較差,在一定程度上影響了研究結論的真實性,研究結果難以得醫學界的承認,導致研究結果難以推廣、應用。為了全面了解中風中醫藥臨床研究中科研方法學的應用狀況、存在問題,對研究質量的總體水平作出評估;并在此基礎上,對中醫藥和西醫結合">中西醫結合治療中風病的有效性作出較客觀的評估,我們做了以下研究。
1資料與方法
1.1研究對象的選擇本次研究文獻的納入標準為:1992~1996年發表在國內各種醫學期刊上的中醫藥療法或中西醫結合療法治療中風病急性期、恢復期的隨機對照臨床研究文獻。為力求全面覆蓋各種文獻,我們選擇了國內醫學界較為權威的中國生物醫學文獻光盤數據庫(中國醫學科學院情報所,CBMdisk)和中醫藥領域國內較權威的中國中醫藥科技文獻數據庫(中國中醫研究院圖書情報研究所,TCMLRS),檢索人均為中醫藥信息情報領域具有高級職稱的專家。兩庫各檢出題錄623條、516條,所有題錄進行合并剔除重復部分及后遺癥、中風先兆、綜述、經驗總結、理論探討等部分后,得到初步納入的文獻題錄數為480條,實際獲取原文數為464篇,資料占有率為97%(464/480)。經初步研讀,再一次剔除文摘/短文型、合并癥(以中風合并癥為主要治療目的)、病例數小于10例的文獻(更宜稱為病例報告)共165篇,初步納入研究文獻為299篇,在其中首先選出有對照組的臨床研究文獻,共130篇,占全部納入臨床研究文獻的43%;其中隨機對照臨床試驗(Randomized Clinical Trials,RCT,按Cochrane Collaboration的標準[1],凡文章中寫到“隨機分配病人”的均視為RCT)共有85篇,占28.4%,與詹思延等報道的《中國中西醫結合雜志》1991~1996年間全文型RCT所占的比例(24.5%)大致相當[2]。
1.2評價方法、工具和內容
1.2.1評價方法按照臨床流行病學/DME方法學的原則和方法,組織數名臨床流行病學專家和接受過DME培訓的臨床醫生進行集體討論,經過數次的試用及改編,編制了統一、規范的《中風中醫藥臨床研究文獻評價表》(簡稱《評價表》),對其進行評定者間的一致性檢驗,經證實其具有較好的信度(重復性)后,由一位主要評價人員用其對85篇隨機對照文獻進行評價。
1.2.2《評價表》的主要內容及其信度內容共分9個部分,87個條目,包括了臨床科研設計的重要原則及根據中風病特點所制訂的特異性問題,如疾病的一般情況、納入排除標準、對照的情況、樣本含量、組間均衡性及對照藥使用情況、隨機的情況、盲法運用的情況、統計學方法的使用、受試因素的標準化、療效判定標準、退出與失訪病例的分析、不良反應的記錄及分析、結論推導及其合理性等。正式進行評價前先由項目負責人選出10篇具有代表性的文獻,由兩名評價者獨立進行評價后,進行各條目的一致性評價。結果:主要條目的一致率為76.6%,隨機、對照、統計學評價部分條目一致性評價的Kappa值及加權Kappa值為0.46~0.48,根據Landis和Koch[3,4]提出的一致性強度的判斷原則,可以認為本評價表對評價中風臨床試驗的科研設計質量重復性較好(中度一致)。
1.3統計分析方法用dbase IV建立數據庫,進行數據的錄入和管理;用Epi Info 6.04中的EPITABLE模塊進行一致性檢驗Kappa值的計算,加權Kappa值的計算按公式(Module 16:Clinical Disagreement.Phase Ⅱ Training Program of Department of Clinical Epidemiology: Clinical Epidemiology Course.華西醫科大學翻印,1997)手工進行。
2結果
2.1一般情況臨床研究80篇,臨床加實驗(指動物實驗)研究5篇,有實驗室指標的研究占42%(36/85)。研究單位以省市級以上醫院及研究院所(包括各醫藥院校及附院)為主(79%);縣區級醫院及其他基層單位占 21%;未見臨床多中心協作研究的報道。58%的文章無
2.2所研究疾病的情況單純研究缺血性中風的占53%(45/85),單純研究出血性中風的占20%(17/85),二者都有的占23.5%(20/85),未明確區分二者的占3.5%(3/85);絕大部分研究(83%)未能明確病因分類,能明確病因的只有16%(14/85),其中高血壓性5篇,動脈硬化性6篇,兩種兼有的3篇;有臨床分期說明的占79%(67/85),其中研究急性期中風的有49篇(72%),急性期和恢復期都有的有18篇(28%),沒有單獨研究恢復期中風的文獻。在研究腦出血的38篇文獻中,有出血部位說明的占53%(20/85),有出血量多少的占 37%(14/38);在研究缺血性中風的68篇文獻中,有梗塞部位說明的僅有11篇(占16%),有梗塞面積大小說明的更少(5/68,占7%)。
66%的文獻(58/85)未說明中醫病類,27篇有此說明的文獻中單純研究中經絡的有5篇(18.5%),單純研究中臟腑的有5篇(18.5%),二者均進行研究的有17篇(63%);在中醫證型的說明中,小部分文獻進行了中醫證型的說明(28/85,34%),其中研究單一證型的占21%(6/28),研究多證型的占79%(22/28)。
2.3診斷、納入和排除標準
2.3.1診斷標準絕大部分研究有統一的診斷標準(81/85),單純應用西醫診斷標準的占53%,遠遠超過單純用中醫診斷標準的20%和中西醫標準都用的27%。有2篇應用的是自訂的中醫診斷標準。
65篇有說明西醫診斷標準的文獻中,使用國際標準1篇,國家標準43篇(43/65,66%),其他標準(如地方標準、臨床診斷加CT核實)的有21篇(21/65,32%)。
2.3.2納入和排除標準80% 的文章(67/85)未說明納入與排除標準。
2.4療效判定標準89%(76/85)的文獻有療效判定標準,其中采用國家級學會標準的最多,有52篇,占68%;其次就是自訂的標準,有21篇,占28%;10.5%(9/85)的研究無明確的療效判定標準。
2.5科研方案設計的質量
2.5.1對照70%(60/85)的研究采用的是標準對照;30%采用的是實驗/復合對照。
2.5.2樣本含量多數研究的樣本含量在30~60例之間。其中試驗組樣本例數為10~30、31~60、61~100及100以上的研究分別為16、38、13和18個,各占總數的19%、45%、15%和21%。
2.5.3組間均衡性比較雖然87%(75/85)的研究簡單陳述了各組的情況,也羅列了一些數據(如各組的平均年齡、平均病程等),但很難講他們進行了組間均衡性的比較,因為其中只有24%(18/75)的作者明確說明了“有可比性”等字樣。
2.5.4隨機化的質量只有極少數的文獻(7篇,占8%)對隨機化方法進行了簡單描述,其中只有4篇簡單地描述了隨機的具體步驟;在這7篇文章中,基本正確地運用了隨機化的方法的只有1篇,其余6篇要么不是真正的隨機化(如文中寫著“按就診先后順序”、“采用單雙號隨機分配方法選擇病例”、“按其性別、年齡、病情輕重,隨機分為三組”),要么是兩組樣本例數相差過大,讓人難以相信是真正隨機化的結果(兩組例數分別為42∶23、172∶60、40∶14)。“隨機化方法基本正確”的一篇也只是在簡述隨機化方法時簡單地寫明“采用隨機表法”。
2.5.5盲法的運用運用盲法的文獻只有4篇(5%),其中單盲、雙盲各2篇。
2.5.6所研究的療法研究中醫藥療法的有60篇,中西醫結合療法的有25篇。在試驗用藥的標準化方面,我們從方藥組成、劑型、用量、用法、療程等幾個方面進行了評價,初步認為標準化較好的占64%(54/85),標準化一般的為25%(21/85),標準化差的為11%(10/85)。
19%采用的中醫藥療法為對照。在西醫藥治療的具體療法上,按應用的頻率高低,依次為:防治腦水腫(33)、對證處理(30)、血液稀釋療法(25)、腦代謝活化劑(18)、血管擴張劑(17)、止血劑(14)、抗血小板藥物(4)、鈣拮抗劑(2)。
2.5.7統計學方法98%的文獻(83/85)對數據進行了統計學處理,未進行統計學處理的有2篇(2%)。所用的方法有卡方檢驗、t檢驗、Ridit分析和秩和檢驗等。可能由于篇幅或專業的原因,對數據的描述、分析過少(如數據類型、分布類型、是否方差齊等),大部分(49/83,59%)未能從文章中判斷統計方法的正確與否;據我們的判斷,其他34篇(41%)的統計學方法使用基本正確。81%的研究給出了統計所需的原始數據,但只有23%的研究給出了檢驗統計量值,僅有一篇給出了具體的P值。
2.5.8退出與失訪病例的記錄與分析只有1篇文獻報告了退出、失訪或剔除病例,但也只報告了病例數,未能進一步對退出失訪原因進行分析、無基線特征的分析、無追蹤,在統計學處理和研究結論的推導時也未能用意想治療分析法(Intention_to_treat Analysis,國內有譯預期分析、意圖分析、實效分析等)分析其可能造成的影響(靈敏度分析)。
2.5.9不良反應(ADR)的記錄有24%(20/85)的研究提到了不良反應的觀察問題,其中5篇全部給出了具體報告,2篇給出了部分具體報告,全部20篇中有65%的研究(13/20)報告未發現不良反應。
3討論
近些年來臨床流行病學/DME方法學在中醫臨床、科研人員中的推廣與普及取得了很大的成效,中醫界臨床科研的質量也有了很大的改善。本研究結果顯示,已經有越來越多的人在進行臨床科研時采用論證強度最高的隨機對照臨床試驗(RCT),但仍有不少問題存在,主要有隨機化的實施、結局指標的選擇、組間基線均衡性的比較等方面。&nb sp;
本次文獻分析中,我們發現最大的問題是隨機化的問題。隨機化分配病人到治療組和對照組,在臨床科研設計中,是一個極為重要的問題,這一點在過去的DME培訓與推廣中被一再強調,表面上這一點已經較為研究者所重視(66%有對照的臨床研究都采用了RCT),但隨機化的可信度及其質量確實令人憂慮。基線水平均衡這個重要問題也面臨著同樣的境況。看來真正令每位臨床醫生和臨床科研人員都掌握扎實的DME方法,還有待進一步努力。
終點指標的選擇也是目前一個重要和爭議較多的問題。曾有國外學者指出:中國的學術雜志發表的臨床研究99%有效,針灸的臨床研究更是100%有效,并對此提出了較尖銳的批評[5]。雖然我們尚未對此現象進行深層次的分析,但結局指標選擇的不同可能是其中一個原因。以中風為例,國外的主要判效指標(終點指標)是早期病死率、遠期病死率、神經功能缺損計分和日常生活活動能力(ADL),以及新近采用的生存質量(QOL)等,一般有1年以上的隨訪期,在分析時采用意想治療(Intention_to_treat)分析法,故其臨床研究極少有陽性結果的報道;而國內主要采用的是中西醫兩個學會制訂的標準,將神經功能、生活能力等幾個方面綜合起來,評為痊愈、顯效、有效、無效、惡化等。尚有一部分研究采用自訂標準;在功能評價方面,ADL尚較少采用等。究竟應該采用什么樣的結局指標才科學、客觀,現行療效評價指標體系有哪些缺陷,都需要進一步的研究。
發表性偏倚也是一個應該引起重視的問題。陽性結果的研究容易被編輯采納和發表,稱為發表性偏倚(Publication Bias)。我們對采用清開靈注射液治療急性期中風的7篇文獻(含1992年前1篇)的療效進行了漏斗圖分析,結果亦提示:此類研究存在著較明顯的發表性偏倚。這與其他學者的類似報道一致[2]。
國內臨床試驗往往忽略退出與失訪病例的記錄與分析,這一點與國外存在較大的差距,需引起足夠的重視。
中醫臨床研究有一定的特殊性,如以湯劑為主的治療很難實現雙盲,一方到底的單方研究難以符合辨證論治精神,治療方案標準化與辨證施治、靈活變化相矛盾等等。這也給臨床科研方法學提出了一些新的課題。但只要在研究方法學上下功夫,還是可以找出既適合中醫特色,又具有較高科學性的方法的。如中醫以湯劑為主的治療盲法的采用,可以在療效評價時采用不知情的人員獨立進行盲法的療效評價等。
[1]李靜,羅德成,方芳,等譯.Cochrane Collaboration Handbook.中國Cochrane中心培訓教材[M].華西醫科大學,1998.10
[2]詹思延,唐金陵,謝立亞,等.中醫藥學術期刊隨機對照臨床試驗文章評閱及建議[J].中國中西醫結合雜志,1999,19(9):568
[3]王家良主編.臨床流行病學[M].上海:上海科技出版社,1992.137
[4]Landis J R,Koch G G.The measurement of observer agreement for categorical datas[M].Biometrics,1977,33:159
[5]Vickers A,Goyal N,Harland R,et al.Do certain countries produce only positive results? A systematic review of controlled trials[J].Controlled Clin Trials,1998,19:159