1、材料與方法
1.1試驗(yàn)材料
試驗(yàn)研究對(duì)象為正常膠囊和重金屬鉻嚴(yán)重超標(biāo)的膠囊殼。各類樣本用密封的容器保存。根據(jù)目前的資料,沒有發(fā)現(xiàn)顏色與重金屬之間的相關(guān)性分析,因此暫不考慮顏色對(duì)光譜之間的影響。
1.2高光譜成像系統(tǒng)
高光譜可采用杭州彩譜科技有限公司產(chǎn)品FS13進(jìn)行相關(guān)研究。光譜范圍在400-1000nm,波長(zhǎng)分辨率優(yōu)于2.5nm,可達(dá)1200個(gè)光譜通道。采集速度全譜段可達(dá)128FPS,波段選擇后最高3300Hz(支持多區(qū)域波段選擇)。為了避免周圍環(huán)境光源的干擾,視覺系統(tǒng)置于表面為黑漆的密閉柜中。
2、高光譜圖像主成分分析
由于高光譜數(shù)據(jù)由多個(gè)波段圖像組成,可把每一幅圖像看作一個(gè)特征,若對(duì)高光譜數(shù)據(jù)進(jìn)行降維,將會(huì)使得原始數(shù)據(jù)變化到一個(gè)新的坐標(biāo)系統(tǒng),以使圖像數(shù)據(jù)的差異達(dá)到最大,所得到的結(jié)果將會(huì)與原來圖像相差很大。這一技術(shù)對(duì)于增強(qiáng)信息含量,隔離噪聲及減少數(shù)據(jù)維數(shù)非常有效。對(duì)高光譜圖像進(jìn)行PCA降維后所得到的前4個(gè)主成分見圖1。
經(jīng)過PCA變換后的高光譜數(shù)據(jù),雖然第1主成分的圖像包含的信息最多,第2主成分信息量次之,但2種膠囊之間的對(duì)比并不明顯,反而第3主成分更能凸顯兩種不同的膠囊。但這種方法所表現(xiàn)出來的特征有可能是基于膠囊不同顏色所得的結(jié)果,因?yàn)橹挥心z囊帽在PC3(principalcomponent 3)中比較明顯。因此,通過PCA方法對(duì)“毒膠囊”和正常膠囊進(jìn)行檢測(cè)可作為參考,要對(duì)高光譜數(shù)據(jù)進(jìn)行全面分析還需考慮光譜數(shù)據(jù),這也是高光譜的優(yōu)勢(shì)所在。
3、光譜分析
高光譜圖像的優(yōu)勢(shì)之處在于不但有圖像信息,而且有光譜信息。要得到光譜信息,先對(duì)每個(gè)樣本選擇感興趣區(qū)域,每個(gè)感興趣區(qū)域有其光譜響應(yīng)曲線。由于膠囊帽和膠囊體二者之間的顏色不同,為了消除顏色對(duì)結(jié)果的影響,每個(gè)膠囊選擇2個(gè)感興趣區(qū)域(膠囊帽和膠囊體上各選擇一個(gè)感興趣區(qū)域),感興趣區(qū)域可在膠囊的高光譜圖像上隨機(jī)選取,每個(gè)區(qū)域的像素?cái)?shù)范圍為2~6,最終感興趣區(qū)域的光譜數(shù)據(jù)計(jì)算區(qū)域內(nèi)所有像素的平均值。4種不同區(qū)域(分別為正常膠囊和“毒膠囊”的膠囊體和膠囊帽)的光譜曲線見圖2。
從圖2中可以看出,“毒膠囊”的膠囊帽和正常膠囊的膠囊體在光譜曲線走向上比較雜亂,正常膠囊和“毒膠囊”的膠囊帽光譜曲線差異比較大,在620 nm左右時(shí)有交叉;兩種膠囊的膠囊體光譜曲線在550 nm和700 nm左右有交叉。但僅通過光譜曲線難以正確區(qū)分出“毒膠囊”和正常膠囊,須對(duì)光譜區(qū)間進(jìn)行綜合分析,找出能區(qū)分二者之間最有效的光譜特征數(shù)據(jù),最終進(jìn)行判別分析。
由于每個(gè)樣本的光譜特征也有大量的數(shù)據(jù)(該數(shù)據(jù)個(gè)數(shù)與高光譜的圖像數(shù)一致),要得出光譜內(nèi)的有效特征,也須通過相應(yīng)特征提取算法進(jìn)行處理,本文用PLS對(duì)該數(shù)據(jù)進(jìn)行降維,可得到每個(gè)的PLS算子的貢獻(xiàn)率,從高到低的排序見表1。每個(gè)PLS算子又稱決定潛在變量,決定PLS個(gè)數(shù)的最簡(jiǎn)單方法是誤差均方根表示的方法主要有交叉驗(yàn)證均方根差和矯正均方根差。LV是特征在PLS降維后的組合特征,通常情況下LV對(duì)整體特征的貢獻(xiàn)率不斷下降,當(dāng)前幾個(gè)LV作為輸入特征得到的準(zhǔn)確率達(dá)到要求且滿足一定的推廣性時(shí),選中的LV個(gè)數(shù)作為最佳特征。
建模時(shí)采用60%的樣本作為訓(xùn)練集,剩余40%的作為測(cè)試集。對(duì)于“毒膠囊”和正常膠囊的RMSECV和RMSEC的值15與選擇LV個(gè)數(shù)的關(guān)系見圖3。從圖3中可以看出,正常膠囊和“毒膠囊”所得到的RMSECV和RMSEC的值在LV個(gè)數(shù)為1到6之間時(shí),值的下降趨勢(shì)明顯;當(dāng)LV的個(gè)數(shù)大于6時(shí),二者的值變化非常緩慢,從該圖的曲線走向可認(rèn)為選擇6個(gè)LV作為輸入特征較為合適。在得到LV的貢獻(xiàn)率、RMSECV和RMSEC的同時(shí),還須考慮測(cè)試集中的正確分類準(zhǔn)確率、相關(guān)系數(shù)2等,見表1。
當(dāng)取4個(gè)LV作為輸入特征時(shí),交叉驗(yàn)證(CV)和預(yù)測(cè)(Pr)的相關(guān)系數(shù)r2都能達(dá)到0.9以上,這比選取3個(gè)LV有顯著的增加,同時(shí)分類的錯(cuò)誤率為0。與此同時(shí),所有的指標(biāo)參數(shù)并沒有顯著的增加,因此,在本文中選擇4個(gè)LV是合適的。
4、結(jié)語(yǔ)
在450~900 nm的高光譜數(shù)據(jù)中,通過選擇感興趣區(qū)域得到正常膠囊和“毒膠囊”的光譜數(shù)據(jù),先對(duì)其進(jìn)行歸一化處理,再通過PLS-DA對(duì)數(shù)據(jù)降維及判別分析,當(dāng)選擇4個(gè)PLS算子作為輸入特征時(shí),正常膠囊和“毒膠囊”的識(shí)別率達(dá)到100%,特異度和敏感度也為100%;由此可知,可用PLS-DA判別方法對(duì)正常膠囊和“毒膠囊”進(jìn)行區(qū)分。利用高光譜圖像技術(shù)對(duì)“毒膠囊”檢測(cè),可以大大降低傳統(tǒng)方法的復(fù)雜度。
除此之外,若要提高可信度,還須用更寬波段的光譜對(duì)樣本進(jìn)行檢測(cè),例如在熒光或者紫外波段。在對(duì)“毒膠囊”進(jìn)行定性的同時(shí),還需要對(duì)其進(jìn)行定量研究,定量時(shí)可考慮制作不同含鉻量的明膠模板,找出模板含鉻量與光譜數(shù)據(jù)的相關(guān)模型,并以此模型來預(yù)測(cè)未知“毒膠囊”的重金屬鉻含量。鑒于“毒膠囊”事件的后續(xù)影響,樣本比較難找,但為了提高檢測(cè)的有效性,還需要用多種鉻含量的膠囊樣本做試驗(yàn)。
地址:浙江省杭州市錢塘新區(qū)文淵北路166號(hào)6F南
電話:13858065387(資深專家24h在線)
郵箱:yuankun@colorspec.cn
銷售直撥:13858065387
固定電話:13858065387