綜合主成分分析用于黃芪藥材的質量評價
楊銘
【摘要】 目的: 探討綜合主成分分析用于黃芪藥材的質量評價的可行性。方法: 選擇3種有效成分的含量為指標,對不同產地的黃芪藥材建立了綜合主成分評價模型。結果:提出的綜合主成分評價較全面的反映了藥材樣本的信息,評價結果具有一定的客觀性,與系統聚類法結果一致。結論: 綜合主成分分析可用于中藥多指標的質量評價。
【關鍵詞】 主成分分析 綜合評價指標 黃芪
Abstract Object: To explore the feasibility of comprehensive principal components analysis on quality evaluation of Radix astragali. Methods: Quality evaluation on Radix astragali which were from different localities in gansu performed by comprehensive principal components analysis with contents of three components. Results: The application shows that the propoed method can comprehensively reflect the samples.The results were objective,which showed no difference with that of hierarchical cluster. Conclusion: Comprehensive principal components analysis on quality evaluation of traditional chinese medicine was promising.
Key words principal components analysis; comprehensive assessment indexes; radix astragali
現代分析技術可以為中藥質量控制研究提供大量的信息,如何根據這些信息對多種成分進行定性定量分析及對樣品進行整體的準確評價,發展了多種分析測量數值的理論分析方法,它們可以應用于中藥質量控制的研究中。中藥研究工作者在這方面己經進行了大量有價值的研究工作,他們采用多種化學計量學的方法用于中藥的鑒別和質量品質研究,其中主成分分析是化學計量學中的基礎方法,目前主成分分析主要用于對中藥樣品的整體分析鑒別及分類,而要對中藥樣品質量優劣進行綜合評價,目前國內還沒有一個比較完善的方法。
隨著現代分析技術的發展,已經能夠對中藥中的某些具有藥理活性的組分進行定量,一般地,中藥樣品質量的優劣通常取決于這些具有藥理活性的組分的含量。因此,對中藥樣品質量優劣進行綜合評價實際上屬于多指標評價問題,各指標權重的不確定性及某些指標間存在的相關性將給綜合評價帶來困難。主成分分析就可以在不損失或盡量少損失原有指標信息的情況下,將多個具有相關性的指標轉換成少數幾個互相獨立的綜合指標(即主成分)。綜合主成分評價模型已廣泛應用于社會經濟學領域[1,2],使之成為一種比較有效的綜合評價方法。本文嘗試將綜合主成分分析法應用于中藥樣品質量優劣的綜合評價,目前,國內尚未見相關報道,希望能與同行共同探討以豐富中藥質量綜合評價的方法。
1 綜合主成分分析算法的原理及實現
綜合主成分評價的思想是:在對樣本(各個評價指標)進行變換后,可求得m個主成分方程,代入相關數據后即可求得各個樣本主成分值的大小。然后計算前g個主成分的累計方差貢獻率,根據方差貢獻率的大小,確定所需要的能反映樣本綜合信息的前q個主成分。取前q個主成分計算綜合主成分得分。根據綜合主成分得分大小對各個樣本進行排序。具體實現步驟如下:
假定有n個待評價樣本,每個樣本均測得p個有效成分的含量指標,記為X1,X2,…Xp通過測定,獲得的數據矩陣X為:X=X11 X12 X1pX21 X22 X2p… … …Xn1 Xn2 Xnp
1.1 評價指標的標準化處理:為了消除由于量綱的不同可能帶來的影響,往往經常采用變量標準化的方法。 Zij=Xij-xj Sj
其中Zij為Xij的標準化值,xj 、Sj 為第j個指標的均值與標準差。
1.2 計算已作標準化處理的評價指標Zij的相關系數矩陣R,R=r11 r12 r1pr21 r22 r2p… … …rp1 rp2 rpp ,其中rjk為指標Xj與指標Xk的相關系數。
1.3 計算R的特征根和特征向量,并得到相應的主成分。將R的所有特征根按降序排列,記作 λ1,λ2 …λm ,且與其相對應的特征向量記為αk =(αk1 ,αk2 … αkm)。并計算各主成分的貢獻率及得分,ηq =∑q i=1λi ∑k j=1λj 為前q(q≤ k)個主成分的累計方差貢獻率,通常以累計方差貢獻率大于85%[2]來確定主成分的個數q。各主成分得分為:fq= α1*Z1+α2 *Z2+… αq*Zp ,其中Zi(i=1,2…p)為標準化處理后的指標。
1.4 構造綜合主成分:以貢獻率為權數,將所求得的q個主成分進行線性組合,即可構造出所謂的綜合主成分F,其計算公式為:F=λ1*f1+λ2*f2+…λq*fq)/ ∑q i=1λi 計算各樣本在綜合主成分上的得分,記為Fi ( i=1,2,… ,n)。一般地,有效組分的含量越高質量越好,因此,綜合主成分得分越高,相應的評價樣本就越優。
2 中藥黃芪藥材的質量綜合評價
為了全面了解甘肅黃芪藥材的質量,胡芳弟等[3]采用高效液相色譜法研究了甘肅不同產區12個蒙古黃芪樣品的指紋圖譜,并測定了黃芪甲苷、毛蕊異黃酮及芒柄花素的含量,樣品來源及測定結果見表1。據文獻[4,5]報道黃芪皂苷及異黃酮類具有相當的藥理活性,因此,可以用以上三個成分的含量作為指標來評價黃芪藥材的質量優劣,本文嘗試使用綜合主成分分析對其進行綜合評價,算法實現語言為MATLAB,程序自編。
首先對數據進行標準化處理后,計算各指標成分的相關系數 R(只列出下三角部分):R=1-0.54 1-0.52 0.94 1 對相關系數矩陣R進行特征值分解,求滿足V*D=R*V的特征向量矩陣V與特征值矩陣D,再根據特征值計算各主成分的貢獻率,編制程序計算的結果見表2。可見,當提取的主成分數為2時,累計的方差貢獻率已達98.14%,基本保留了原樣本的信息。按照公式,可以求出第一、第二主成分為:
Y1=-0.4837*x′1 +0.6210*x′2 +0.6167*x′3 ;
Y2=-0.8749x′1* -0.3253*x′2 -0.3587*x′3
其中,x′ 是經標準化變換得到的標準化變量。由各主成分的表達式可以看到,第一主成分的各系數相差不大,說明第一主成分能基本反映各指標的綜合情況,第二主成分x′1 的系數權值較高,因此第二主成分主要反映了黃芪甲苷的含量。最后根據特征值計算由第一、第二主成分構造的綜合主成分F值,并對F值進行排序,其結果也是對黃芪藥材質量綜合評價的結果,見表3。表1 黃芪樣本含量測定結果(略)表2 特征根、特征向量(α )、各主成分的貢獻率(略)表3 綜合主成分評價結果(略)
3 聚類分析驗證
為了驗證綜合主成分分析結果的可靠性及客觀性,采用系統聚類法對其進行驗證。對原始樣本數據標準化處理后進行系統聚類分析,采用歐氏距離最短距離法進行聚類分析的結果見圖1,再用綜合主成分F值作為單變量用同法對原始樣本進行聚類分析結果見圖2。 可見兩者的聚類結果基本一致,說明綜合主成分較全面地表征了原始樣本的信息。12個黃芪藥材基本可以分為兩類,即較優品與一般品:其中1、5、9號樣品聚為一類,在綜合主成分排序中分別占了第2、1、3位,黃芪對照藥材排在第2位,質量較優,所以為較優品;在剩下的一般品中還可以分為兩類,即3、7、11號樣品聚為一類,在綜合主成分排序中分別占了第11、10、12位,質量較差,所以為采集樣本中的較差品。文獻[3]對12個黃芪藥材的指紋圖譜進行了相似度評價,結果都在0.90以上,本研究的評價結果顯示5、9號樣品的品質最接近1號對照藥材。
4 結論
綜合主成分評價法是在主成分分析的基礎上,在不損失或盡量少損失原有指標信息的情況下,將多個具有相關性的指標轉換成一個綜合指標來進行綜合評價,還可以具此對多個評價指標的樣本進行排序,評價其優劣。中藥指紋圖譜的相似性評價是中藥質量控制的良好手段,但當所有的樣本都具有良好的相似性的時候,再從中選出較優品就比較困難了。綜合主成分評價為中藥的多指標綜合評價提供了新的手段,本研究的結果顯示,綜合主成分評價結果與系統聚類法一致,質量排序結果具有一定的客觀性,值得中藥研究工作者參考。
【參考文獻】 1 朱艷科,楊輝耀. 中國城市現代化水平的綜合評價. 商業研究,2002,259:64~67. 2 袁海鋒,徐國盛. 主成分分析法在油氣開發方案技術經濟評價中的應用. 國土資源科技管理,2005,80:80~84. 3 胡芳弟,趙健雄,封士蘭,等. 黃芪的高效液相色譜指紋圖譜及主成分含量測定. 中藥材,2004,27(11):831~834. 4 宋瑞霞,余靜,梁連生,等. 甘肅黃芪異黃酮化合物對血管內皮細胞凋亡的影響. 蘭州大學學報醫學版,2007,33(11):43~47. 5 周耘,張衛東. 芒柄花素氨基醚衍生物的合成及體外促兔成骨細胞生長的作用. 中國醫藥工業雜志,2001,32(1):9~12.