高光譜成像與深度學(xué)習(xí)構(gòu)建三文魚品質(zhì) “防偽墻”(上)
應(yīng)用方向
在該研究中,高光譜成像技術(shù)(HSI)主要應(yīng)用于三文魚地理來源溯源及真實(shí)性檢測。通過分析光譜和紋理數(shù)據(jù),結(jié)合深度學(xué)習(xí)與數(shù)據(jù)融合策略,HSI成功實(shí)現(xiàn)了不同產(chǎn)地三文魚的精準(zhǔn)分類,并有效檢測出摻假現(xiàn)象,為水產(chǎn)品真實(shí)性鑒定提供了快速、無損且高效的解決方案。此外,研究開發(fā)了一種基于HSI數(shù)據(jù)的智能云平臺,實(shí)現(xiàn)了實(shí)時分類,展示了該技術(shù)在食品溯源中的實(shí)際應(yīng)用潛力和擴(kuò)展性。這些成果凸顯了HSI在食品質(zhì)量檢測與多維數(shù)據(jù)分析領(lǐng)域的廣泛前景。
背景
三文魚因其富含氨基酸、蛋白質(zhì)、不飽和脂肪酸等營養(yǎng)成分,在全球備受歡迎。然而,由于不同地區(qū)的地理環(huán)境和生長條件存在差異,不同產(chǎn)地的三文魚質(zhì)量和價格差異顯著,這使得其地理來源成為潛在的欺詐目標(biāo)。傳統(tǒng)的三文魚產(chǎn)地識別方法多依賴于對外觀(形狀、紋理和顏色)的人工觀察,但這種方法效率低下且耗時耗力。目前,農(nóng)產(chǎn)品溯源領(lǐng)域常用的方法包括穩(wěn)定同位素分析、感應(yīng)耦合等離子體質(zhì)譜法和多元素分析,但這些方法通常存在實(shí)驗(yàn)復(fù)雜、成本高昂以及對樣品造成不可逆損傷等問題。因此,亟需探索一種快速、準(zhǔn)確且無損的三文魚地理來源識別方法。
高光譜成像(HSI)是一種快速且無損的檢測技術(shù),能夠結(jié)合光譜和圖像數(shù)據(jù)進(jìn)行樣本分類,具有較高的分辨率和魯棒性。本研究基于HSI技術(shù)結(jié)合信息融合策略與深度學(xué)習(xí)模型,旨在解決三文魚的地理來源溯源問題,為市場穩(wěn)定和食品**提供技術(shù)支持。
實(shí)驗(yàn)設(shè)計
1.1材料與方法
本研究中四種新鮮的三文魚樣本來自中國的劉家峽地區(qū)、法羅群島的Bakkafrost以及成都通威三文魚有限公司。這些三文魚在捕獲后立即被去內(nèi)臟、放血并冷凍,使用無菌刀具去除頭部、尾部、皮膚和骨骼進(jìn)行處理。然后,每種三文魚被切成500份,每份尺寸為40×50×15 mm,重量為40±5 g。
本研究中,三文魚片的高光譜圖像是使用江蘇雙利合譜科技有限公司的“Gaia”高光譜分選機(jī)獲取。該系統(tǒng)包括一個Image-λ “Spectrum”系列高光譜相機(jī)(Image-λ-V10E-PS),兩套200W的鎢鹵燈光源,一個電動控制的移動平臺?!癎aia”高光譜分選機(jī)的光譜范圍從388-1036 nm,光譜分辨率為2.8 nm,每個像素點(diǎn)共有256個波段。在實(shí)驗(yàn)過程中,每種三文魚獲得了500張高光譜圖像。在采集樣本之前分別獲取高光譜圖像的黑白幀,以便對高光譜圖像進(jìn)行黑白校正。使用分析軟處理收集到的高光譜圖像以提取ROI獲取各樣本平均光譜值,采用二階統(tǒng)計方法從樣本中提取紋理信息。
為了從光譜數(shù)據(jù)中去除噪聲并防止數(shù)據(jù)失真,本實(shí)驗(yàn)采用了Savitzky-Golay平滑作為一種預(yù)處理方法,基于一系列實(shí)驗(yàn)和經(jīng)驗(yàn)考慮,將窗口大小設(shè)置為17。在本研究中,采用了LightGBM和GBDT算法來消除冗余和無關(guān)信息以提高模型效果。然后對集成機(jī)器學(xué)習(xí)模型(隨機(jī)森林、LightGBM和GBDT)、CNN-BiGRU深度學(xué)習(xí)模型、深度學(xué)習(xí)模型(MSADBO、CNN和BiGRU)三種模型結(jié)果進(jìn)行對比,得出*優(yōu)模型。同時,設(shè)計了一個自建的物聯(lián)網(wǎng)云平臺,以實(shí)現(xiàn)對不同三文魚地理來源的實(shí)時檢測。
1.2.結(jié)果
(1)不同類別三文魚片的光譜特性
使用HSI獲取了包括挪威三文魚、法羅群島三文魚、淡水彩虹鱒魚和智利三文魚四個類別三文魚樣本的光譜。圖1展示了這四種三文魚類別的平均光譜,可以觀察到這四種三文魚類別的整體光譜趨勢大致相似,但反射率值有所不同。然而,在大多數(shù)情況下,僅憑視覺是無法準(zhǔn)確區(qū)分三文魚類別的。因此,進(jìn)行有效的波段分析以提取相關(guān)信息,用于分類模型是必要的。
圖1. 四類三文魚的平均光譜
此外,還識別出幾個與不同官能團(tuán)相對應(yīng)的常見吸收峰。在可見光至近紅外光譜范圍(400-1000 nm)內(nèi),光譜顯示出明顯的峰值和谷值,觀察到的吸收信息主要與樣本中有機(jī)大分子官能團(tuán)的基本振動相關(guān)(例如,C-H、N-H、O-H和S-H)。在可見光區(qū)域(400-760 nm),在450 nm左右觀察到一個顯著的吸收峰,歸因于肌紅蛋白和總色素的吸收。在650-700 nm,觀察到高反射率,反映了三文魚的紅色光譜特征。在近紅外區(qū)域(700-1000 nm),在760 nm出現(xiàn)吸收峰,對應(yīng)于O-H伸縮振動的第三泛音。此外,在980 nm觀察到輕微的下降,對應(yīng)于O-H伸縮振動的**泛音。這些觀察表明,樣本中光譜反射率的變化可以歸因于它們化學(xué)性質(zhì)的變化。換句話說,不同品種的三文魚由于化學(xué)性質(zhì)的差異而表現(xiàn)出不同的反射率。總之,400-1000 nm可以表征三文魚肉質(zhì)的特性,為后續(xù)三文魚來源的追溯提供了理論基礎(chǔ)。
(2)特征變量貢獻(xiàn)分析
在全波段建模計算中,LGB和GBDT模型始終產(chǎn)生*穩(wěn)定的結(jié)果。因此,本研究僅通過LGB和GBDT模型選擇重要波長進(jìn)行分類。LGB和GBDT算法被用來對光譜和紋理融合模型的2133個變量進(jìn)行特征選擇,每個算法提取的前30個貢獻(xiàn)*大的特征變量被分別用于分析(見圖2)。對特征變量重要性的分析顯示,兩個模型的光譜特征變量更集中于650 nm,而紋理特征更集中于400-450 nm和700-800 nm的單波段灰度圖像。特別值得注意的是,在640-670 nm的光譜區(qū)域觀察到*高的貢獻(xiàn)率。從圖1可以看出,這些光譜區(qū)域主要與色素、蛋白質(zhì)和水分有關(guān),導(dǎo)致三文魚片中高反射率,并突出了三文魚的光譜特性。
圖2.特征重要性分析結(jié)果:(a) LGB模型TOP30特征變量貢獻(xiàn);(b) GBDT模型TOP30特征變量貢獻(xiàn)
(3)光譜建模分析
使用237個連續(xù)波段的光譜數(shù)據(jù)和傳統(tǒng)機(jī)器學(xué)習(xí)(ML)算法建立了三文魚溯源模型。數(shù)據(jù)預(yù)處理采用了SG平滑方法,窗口點(diǎn)數(shù)設(shè)置為17。利用LGB、RF、GBDT和STACK四種監(jiān)督模式識別方法對三文魚的地理來源進(jìn)行了區(qū)分。預(yù)測結(jié)果如圖3所示。
圖3.光譜模型的模擬結(jié)果。(a)原始數(shù)據(jù)ML算法的譜模型結(jié)果;(b)原始數(shù)據(jù)深度學(xué)習(xí)算法的光譜建模結(jié)果;(c)SG平滑后ML算法的光譜建模結(jié)果;(d)SG平滑算法的譜模型結(jié)果后深度學(xué)習(xí)算法的譜模型結(jié)果
從模型結(jié)果可以看出,傳統(tǒng)的ML模型、集成學(xué)習(xí)模型和深度學(xué)習(xí)模型在測試集上的分類準(zhǔn)確率表現(xiàn)出令人滿意的穩(wěn)定性,結(jié)果保持在87%到93%之間。此外,經(jīng)過SG平滑處理后,所有模型的準(zhǔn)確率都有所提高,在訓(xùn)練集上提高了0.1%到3.2%,在測試集上提高了0.2%到4.3%。這一現(xiàn)象可以歸因于SG平滑有效地糾正了原始光譜中的曲率和偏移。另一方面,在CNN-BiGRU模型中,改進(jìn)的正弦算法注入了強(qiáng)大的全局探索和局部開發(fā)能力,顯著提升了模型的分類性能,整體準(zhǔn)確率比優(yōu)化前提高了0.5%到4.3%。值得注意的是,在基于光譜數(shù)據(jù)的ML模型結(jié)果中,集成學(xué)習(xí)模型表現(xiàn)突出,以訓(xùn)練集95.8%和測試集93%的準(zhǔn)確率展示了*佳的分類性能。然而,與ML模型相比,深度學(xué)習(xí)模型在基于光譜數(shù)據(jù)的分類任務(wù)中表現(xiàn)不佳。這是因?yàn)樯疃葘W(xué)習(xí)需要大量數(shù)據(jù)進(jìn)行訓(xùn)練,但在處理低維數(shù)據(jù)時更容易出現(xiàn)過擬合。