萊森光學(xué):基于LIBS的山藥飲片產(chǎn)地溯源研究
基于LIBS的山藥飲片產(chǎn)地溯源研究
一、引言
激光誘導(dǎo)擊穿光譜作為一種新興的基于原子發(fā)射光譜的元素分析技術(shù),憑借樣品前處理簡單、微損甚至無損、在線原位檢測等優(yōu)點,已被廣泛應(yīng)用于地質(zhì)勘探、工業(yè)監(jiān)測、醫(yī)學(xué)檢測等方面,是一種極具應(yīng)用前景的成分分析技術(shù)。近年來,LIBS在中藥成分檢測領(lǐng)域逐漸興起。運用LIBS信號強度變化率結(jié)合移動窗標(biāo)準(zhǔn)差法快速評價朱砂和雄黃混合過程,結(jié)果證明了LIBS在監(jiān)測中藥制藥生產(chǎn)方面的潛力。采用LIBS技術(shù)測定了18種波蘭草藥中鈣、鉀和鎂等其他金屬元素(鈉、銅、鐵、錳、鋅等),并對其中的鈣、鉀和鎂進(jìn)行定量分析,結(jié)果與一致。將近紅外光譜與LIBS光譜相結(jié)合來區(qū)分國產(chǎn)和進(jìn)口黃芪,使用近紅外光譜的SVR系數(shù)與35個LIBS譜峰值進(jìn)行識別準(zhǔn)確率達(dá)95.8%,與單獨使用近紅外光譜(91.5%)相比,準(zhǔn)確率提高了4.3%。以上研究證明了LIBS技術(shù)在中藥成分檢測中的可行性。然而,基于LIBS技術(shù)的中藥產(chǎn)地溯源研究較少,仍處于起步階段,目前的研究都存在藥材產(chǎn)地數(shù)量少,識別準(zhǔn)確率較低等問題。因此,基于LIBS技術(shù)結(jié)合人工智能算法對不同產(chǎn)地的山藥進(jìn)行系統(tǒng)性研究。我們搭建LIBS試驗系統(tǒng)并結(jié)合多元散射矯正-改進(jìn)遺傳算法-支持模型來識別8種不同產(chǎn)地的山藥飲片。八種產(chǎn)地的山藥飲片磨粉過篩后制成粉末壓片,通過采集山藥飲片的LIBS光譜,分別使用單一分類器與光譜預(yù)處理、特征提取及模式識別算法的模型對光譜的識別結(jié)果進(jìn)行對比。結(jié)果顯示,LIBS技術(shù)結(jié)合模型可以準(zhǔn)確且快速識別山藥產(chǎn)地。
2.實驗部分
2.1 儀器
所用的LIBS實驗裝置如圖1所示
2.2 樣品制備
用八類不同產(chǎn)地的山藥飲片,如表1所示,由于山藥飲片產(chǎn)地、炮制工藝以及價格各不相同,導(dǎo)致它們藥用價值存在差異。實驗中樣本的處理流程如圖2所示。首先,使用研缽將飲片研磨成粉過100目篩。然后,使用電子天平稱量9g硼酸粉末和1g樣品粉末,在壓樣機(jī)30t壓力下將待測樣品壓制成直徑為40mm的圓餅狀壓片。每種產(chǎn)地的山藥飲片使用3個重復(fù)樣本,共制備24個壓片。
表1實驗所用藥材飲片
3.結(jié)果與討論
3.1 光譜分析
各類藥材飲片(S1-S8)的平均光譜及典型峰值如圖3所示。各類藥材的平均光譜整體趨勢一致,所含譜峰基本相同,但峰強度各不相同,分析認(rèn)為不同產(chǎn)地的山藥富集能力存在差異,道地山藥對一些金屬元素的富集能力大于非道地產(chǎn)區(qū)山藥。圖中,譜峰**的金屬元素有K,Na,Ca,Mg,Al等,非金屬元素有C,H,O及C-N鍵等。其中,K元素特征譜線(769.90nm)的峰值**強,即山藥飲片中K元素含量**多,相關(guān)研究表明山藥根莖對K元素的富集能力**強。為剔除光譜中大量的冗余信息,觀察圖3并選擇峰值較為明顯的35條特征譜線作為特征提取的預(yù)選譜線,如表2所示。
圖2藥材飲片的平均光譜
表2所選特征譜線
3.2 單一分類器產(chǎn)地溯源
對八種產(chǎn)地山藥飲片24565維的原始光譜進(jìn)行產(chǎn)地溯源,使用SVM,KNN和EML三種模式識別方法的分類結(jié)果如圖4所示。圖中顯示,三種模型的交叉驗證集和測試集準(zhǔn)確率均在90%以上,SVM模型的分類效果比較好,交叉驗證集準(zhǔn)確率為93.50%,測試集準(zhǔn)確率為96.43%。由于山藥飲片產(chǎn)地種類多、光譜維度高,原始信號數(shù)據(jù)量大且包含噪聲和冗余特征,致使分類耗時長且分類準(zhǔn)確率低,因此有必要對原始光譜進(jìn)行數(shù)據(jù)預(yù)處理和特征提取。
圖4原信號產(chǎn)地溯源結(jié)果
3.3 模型改進(jìn)
首先,使用三種預(yù)處理方法對八種產(chǎn)地山藥飲片的原始光譜進(jìn)行處理。在SG卷積平滑法中,選用5,7,9和11的窗口寬度進(jìn)行參數(shù)優(yōu)化,通過比較識別準(zhǔn)確率,確定本研究中所用窗口寬度為5。在WT預(yù)處理過程中,小波函數(shù)采用常用的db2,db4,db8,sym2,sym5和sym8,分解層數(shù)采用1-9層,**終確定選用db2函數(shù)2層小波分解為WT的比較好參數(shù)。經(jīng)過預(yù)處理后,各類光譜的CV均值和標(biāo)準(zhǔn)差如圖5所示。圖5顯示,無預(yù)處理時光譜的波動性比較大,各類光譜的CV均值為12.54%,經(jīng)過三種預(yù)處理后CV均值明顯下降,光譜的穩(wěn)定性明顯提升。MSC和WT的CV均值較為接近且小于SG卷積平滑法的CV均值,表明MSC和WT對光譜穩(wěn)定性的提升效果好于SG卷積平滑法。WT的CV均值小于MSC,但WT各類光譜CV的標(biāo)準(zhǔn)差較大,即各類光譜的波動差距較大,而MSC各類光譜的波動差距較小,MSC在減小光譜波動性方面整體表現(xiàn)較好。
圖5各產(chǎn)地山藥光譜CV均值和標(biāo)準(zhǔn)差
對預(yù)處理后的光譜數(shù)據(jù)進(jìn)行特征提取。按表2選出35條特征譜線后,分別使用PCA和IGA進(jìn)行特征提取。不同光譜預(yù)處理下PCA選擇的主成分?jǐn)?shù)量與累積貢獻(xiàn)率的關(guān)系如圖6所示。當(dāng)累積貢獻(xiàn)率達(dá)到99%以上時,MSC、SG卷積平滑、WT三種預(yù)處理方式下各選擇6,5和5個主成分,其累積貢獻(xiàn)率分別為99.23%(黑線)、99.03%(紅線)、99.07%(藍(lán)線)。針對不同預(yù)處理和模式識別方法處理的光譜,使用IGA提取的特征數(shù)量如表3所示。
圖6成分累積貢獻(xiàn)
表3在各方法下IGA提取的特征數(shù)量
表4各模型分類結(jié)果排序
表4顯示,排名**的模型中接近一半的模型使用了MSC預(yù)處理方法,接近一半的模型使用了SVM模式識別方法。結(jié)果表明,MSC預(yù)處理方法和SVM模式識別方法有助于準(zhǔn)確識別山藥飲片產(chǎn)地。測試集準(zhǔn)確率排名**的模型均使用了IGA進(jìn)行特征提取,在識別種類多、識別難度大的情況下,IGA比PCA更能清楚辨別光譜中的非線性關(guān)系,同時受噪聲的影響更小。MSC-IGA-SVM模型的產(chǎn)地溯源效果比較好。MSC-IGA-SVM模型的交叉驗證集準(zhǔn)確率為96.9%,測試集的準(zhǔn)確率為97.32%,與直接使用原信號建立的比較好模型SVM(96.43%)相比,測試集準(zhǔn)確率提高了0.87%。同時,MSC-IGA-SVM模型將輸入變量的維度減少了99.93%。
MSC-IGA-SVM模型對八種山藥飲片產(chǎn)地溯源的混淆矩陣如圖7所示,除了S4和S7有錯誤分類現(xiàn)象外,其他類別均能正確識別。S1和S2雖然產(chǎn)地相同,但兩批山藥飲片炮制工藝不同,價格相差較遠(yuǎn),因此品質(zhì)存在差異,能進(jìn)行精確分類。而對于S4和S7,兩種產(chǎn)地山藥產(chǎn)地雖然不同,但存在錯分現(xiàn)象。10.7%的S4錯分為S7,同時10.7%的S7錯分為S10。
為進(jìn)一步探究錯誤分類原因,對IGA選取的特征進(jìn)行三維成像,如圖8所示,S4與S7存在重疊區(qū)域,其數(shù)據(jù)存在相似性。S4為廣西南寧無硫高溫烘焙的價值為31元/500g的山藥飲片,S7為安徽池州無硫低溫烘焙的價值為18.5元/500g的山藥飲片。兩者產(chǎn)地相差較遠(yuǎn),且炮制工藝不同,難以辨別的原因推測是山藥種植品種、種植條件等方面存在共性。
圖7MSC-IGA-SVM模型分類結(jié)果的混淆矩陣
圖8MSC-IGA數(shù)據(jù)圖
(a):**個特征;(b):次三個特征
四、總結(jié)
針對山藥飲片的產(chǎn)地溯源問題,使用LIBS技術(shù)結(jié)合MSC-IGA-SVM模型對產(chǎn)地識別的準(zhǔn)確度進(jìn)行了改善。使用KNN、SVM和EML分類器對八類光譜直接使用原信號進(jìn)行分類,SVM模型具有較強魯棒性,效果比較好,其準(zhǔn)確率為96.43%。使用預(yù)處理(MSC、SG卷積平滑、WT)、特征提取(PCA和IGA)的方法對模型改進(jìn),MSC-IGS-SCM模型的識別效果比較好,其能有效降低光譜波動性,同時輸入變量維度降低了99.93%,將測試集準(zhǔn)確率提升為97.30%。結(jié)果表明,LIBS技術(shù)結(jié)合MSC-IGA-SVM模型能夠準(zhǔn)確且快速對山藥飲片進(jìn)行產(chǎn)地溯源。
推薦:
激光誘導(dǎo)擊穿光譜技術(shù)在低碳鋼鐵冶金行業(yè)的應(yīng)用
LlBS激光誘導(dǎo)擊穿光譜系統(tǒng)是該技術(shù)通過超短脈沖激光聚焦樣品表面形成等離子體,利用光譜儀對等離子體發(fā)射光譜進(jìn)行分析,識別樣品中的元素組成成分,可以進(jìn)行材料的識別、分類、定性以及定量分析。