基于加權模糊識別的中藥材質量評估及產地分析模型
蘭繼斌 林健 宋玉風
【摘要】 研究通過采集藥材HPLC指紋圖譜數據,運用加權模糊模式識別方法評估中藥材的質量及其產地分布情況,得到了很好的分辨率。最后通過一個實例說明了此模型實際應用的可行性與優越性。
【關鍵詞】 指紋圖譜; 模糊模式識別; 加權; 閥值
Abstract As the quality of the medicines on the market varies greatly, based on the weighted fuzzy pattern recognition of quality assessment and origin analysis model of Chinese herbal medicines, a method using HPLC fingerprint of the medicines is presented to assess the quality and origin in this paper . The numerical experiments show that the method has good resolution .By an example, it is verified that this model is more feasible and effective than the previous model in practice.
Key words fingerprint; fuzzy pattern recognition; weighted; threshold
我國是中草藥資源豐富的國家,對中藥材的藥性、成分等方面的研究也有著優良的傳統。中藥指紋圖譜[1,2]就是在對中藥系統的不斷深入研究中發展起來的,是表征中藥所含成分與其質量關系的有效手段。目前,在應用中藥指紋圖譜研究藥材成分的過程中,得到了許多不錯的結果[3,4]。特別是與交叉學科的相互滲透方面[5,6],其研究水平和應用范圍也在不斷擴大。由于氣候及產地等因素的影響,中藥材的成分和質量等級也有著差異性。鑒于此,我們有必要探詢一種有效的藥材質量評估方式,來識別其等級及產地分布情況。
1 儀器及分析條件[7]
1.1 儀器與試劑
島津LC-10ATVP高效液相色譜儀;島津SPD10AVP紫外檢測器;TB328B型電光分析天平(上海天平儀器廠);HH-2型電子恒溫水浴鍋(金壇市新航儀器廠);RE-52AA型旋轉蒸發儀(上海亞榮生化儀器廠)。甲醇為色譜純,水為重蒸水,其余試劑為分析純。
1.2 色譜條件
色譜柱:島津ULTRONVX-ODS(4.6mm250mm,5μl)柱;流動相:甲醇-水-冰乙酸(60:40:1);流速:0.8ml/min;檢測波長:254nm;柱溫:室溫;進樣量:20μl。
2 模型的建立
Step1. 設所考慮的對象為A藥材,取m種已知質量等級并有代表性的該藥材A1(產地1),A2(產地2),…,Am(產地m),它們相應的等級評價為“一等、二等、…、m等”。測定不同產地此藥材的HPLC指紋圖譜,采集各等級藥材在實驗中的指紋圖譜的保留時間和峰面積。
Step2. 選擇t個共有色譜峰作為指紋圖譜的特征峰,其中藥材Aj觀測到的第i個特征峰的保留時間為aji,峰面積為bji,i=1,2,…,t, j=1,2,…,m。建立表征指紋圖譜中保留時間及峰面積的信息矩陣Hj=aj1 aj2 … ajtbj1 bj2 … bjt,并對矩陣Hj每行分別應用公式rji=aji ∑t i=1aji,Rji=bji ∑t i=1bji歸一化得:hj=rj1 rj2 … rjt Rj1 Rj2 … Rjt。
Step3. 將藥材Aj歸一化后的信息矩陣hj轉化成信息向量:Yj=(rj1 rj2 … rjt Rj1 Rj2 … Rjt), j=1,2,…,m。
Step4. 在同樣實驗條件下,對一未知質量等級的待測A藥材Aα進行觀測,得到t個共有色譜峰的保留時間aαi和峰面積bαi,i=1,2,…,t。建立表征指紋圖譜中保留時間及峰面積的信息矩陣Hα=aα1 aα2 … aαtbα1 bα2 … bαt,對矩陣Hα的每一行分別應用公式rαi=aαi ∑t i=1aαi,Rαi=bαi ∑t i=1bαi歸一化得:hα=rα1 rα2 … rαt Rα1 Rα2 … Rαt。
Step5. 將藥材Aα歸一化后的信息矩陣hα轉化成信息向量:Xα=(rα1 rα2 … rαt Rα1 Rα2 … Rαt)。
Step6. 根據藥材中各成分所對應色譜峰面積的大小,以及該成分對藥效的重要程度,綜合考慮給出1~t號峰所對應的一個權重向量w=(w1,w2,…,wt)。并根據實驗中保留時間的穩定性優于峰面積的穩定性這一事實,考察兩者穩定性的相對程度,給出指紋圖譜中保留時間和峰面積的權重指標ω=(ω1,ω2)。
Step7. 利用綜合加權最小平均貼近度公式 N(Xα,Yj)=ω1∑t i=1wi(rαi∧rji)+ω2∑t i=1wi(Rαi∧Rji) 1 2[ω1∑t i=1wi(rαi+rji)+ω2∑t i=1wi(Rαi+Rji)] 計算N(Xα,Y1),N(Xα,Y2),…,N(Xα,Ym)的值,其中“∧”為取小算子。
Step8. 計算N(Xα,Yj0)=max{N(Xα,Y1),N(Xα,Y2),…,N(Xα,Ym)},考察實驗中不同產地該藥材的差異性程度,設置閥值λ。當N(Xα,Yj0)≥λ時,則認為Xα與Yj0最貼近。由擇近原則[8],最后判斷Xα與Yj0為一類。當N(Xα,Yj0)<λ時,則判斷Xα的質量不合格。
3 實例分析
白芷在我國生長區域分布十分廣泛,其主要產于浙江A1(一等品)、河南A2(二等品)、四川綿陽A3(三等品)、湖北A4(四等品)、湖南A5(五等品),建立HPLC法測定上述各產地何首烏的HPLC指紋圖譜,如圖1所示,并采集各等級白芷在實驗中指紋圖譜的保留時間和峰面積[7]。
3.1 選擇10個共有色譜峰作為指紋圖譜的特征峰,其中藥材Aj觀測到的第i個特征峰的保留時間為aji,峰面積為bji,i=1,2,…,10,j=1,2,…5。
3.2 建立表征指紋圖譜中保留時間及峰面積的信息矩陣,并對該矩陣每行分別歸一化并轉化成信息向量:Yj=(rj1 rj2 … rj10 Rj1 Rj2 … Rj10),rj1 、Rj1具體數值分別如表1、表2所示,i=1,2,…10,j=1,2,…5。表1 1~10號峰保留時間歸一化后數值(略)表2 1~10號峰峰面積歸一化后數值(略)
3.3 現有一個等待定級的白芷樣本Aα,在同樣實驗條件下,得到10個共有色譜峰的保留時間aαi和峰面積bαi,i=1,2,…,10。建立表征指紋圖譜中保留時間及峰面積的信息矩陣并對每行分別歸一化得: hα=0.0177 0.0303 0.0429 0.0591 0.0735 0.0857 0.0998 0.1372 0.1776 0.2762 0.1936 0.0235 0.1168 0.0286 0.0029 0.0325 0.0449 0.3183 0.1225 0.1165
按上述公式轉化成信息向量Xα=(rα Rα),其中:
rα=(0.0177 0.0303 0.0429 0.0591 0.0735 0.0857 0.0998 0.1372 0.1776 0.2762 )
Rα=( 0.1936 0.0235 0.1168 0.0286 0.0029 0.0325 0.0449 0.3183 0.1225 0.1165)
3.4 根據白芷各成分所對應色譜峰面積的大小,以及該成分對藥效的重要程度,綜合考慮給出1~10號峰所對應的一個權重向量w=(0.16,0.04,0.12,0.04,0.04,0.08,0.08,0.20,0.12,0.12)。并根據實驗中保留時間的穩定性優于峰面積的穩定性這一事實,考察兩者穩定性的相對程度,給出白芷指紋圖譜中保留時間和峰面積的權重指標ω=(0.6,0.4)。 3.5 利用綜合加權最小平均貼近度公式計算得:N(Xα,Y1)=96.782%,N(Xα,Y2)=94.804%,N(Xα,Y3)=97.645%,N(Xα,Y4)=91.634%,N(Xα,Y5)=96.790%。
根據白芷的成分組成以及評估人員對藥材質量的要求,給出閥值λ=0.85。
最后有:N(Xα,Y3)=max{N(Xα,Y1),N(Xα,Y2),…,N(Xα,Y5)}=0.97645>0.85
綜上可知該待測白芷樣品為三等品,其產于四川一帶。
4 結束語
本研究通過采集中藥材HPLC指紋圖譜數據,建立符合藥材特征的數學模型,分析待測藥材的質量等級及產地分布,得到了很好的辨別效果,該模型可以廣泛應用于各種中藥材的分析和評估。