應(yīng)用方向:
該論文在高光譜成像技術(shù)(HSI)上的應(yīng)用方向主要集中在茶葉質(zhì)量的非破壞性檢測(cè)與評(píng)估。通過(guò)結(jié)合高光譜成像和化學(xué)計(jì)量學(xué)方法,研究實(shí)現(xiàn)了對(duì)藏茶中關(guān)鍵質(zhì)量參數(shù)(如總酚類(lèi)物質(zhì)(TPs)和游離氨基酸(FAAs))的快速、精準(zhǔn)預(yù)測(cè)和分級(jí)研究。該研究能推動(dòng)藏茶質(zhì)量控制和標(biāo)準(zhǔn)化管理,提高了產(chǎn)業(yè)效率,并為其他食品領(lǐng)域提供了新的非破壞性檢測(cè)思路。
背景:
隨著藏茶產(chǎn)業(yè)的逐步發(fā)展,準(zhǔn)確、快速地評(píng)估其質(zhì)量成為了一個(gè)重要問(wèn)題。傳統(tǒng)的茶葉質(zhì)量評(píng)估方法主要依賴(lài)于感官評(píng)定和化學(xué)分析,這些方法不僅具有主觀性,還存在一定的破壞性。為了克服這些限制,研究者開(kāi)始探索了基于現(xiàn)代技術(shù)的非破壞性檢測(cè)方法。
近年來(lái),HSI在食品質(zhì)量檢測(cè)中得到了廣泛應(yīng)用,因其能夠提供豐富的光譜信息并進(jìn)行非破壞性檢測(cè)。高光譜成像結(jié)合多變量分析技術(shù)能夠有效提取樣品的化學(xué)成分和物理特征,從而實(shí)現(xiàn)快速、準(zhǔn)確的質(zhì)量評(píng)估。
本研究聚焦于藏茶的質(zhì)量檢測(cè),旨在利用高光譜成像技術(shù)和化學(xué)計(jì)量學(xué)方法(如多變量分析)對(duì)藏茶的主要質(zhì)量指標(biāo)(TPs和FAAs)進(jìn)行定量分析以及對(duì)藏茶進(jìn)行分級(jí)研究。該研究提供一種新的茶葉質(zhì)量評(píng)估方式,以滿(mǎn)足日益增長(zhǎng)的藏茶產(chǎn)業(yè)對(duì)高效、精準(zhǔn)檢測(cè)技術(shù)的需求。
實(shí)驗(yàn)設(shè)計(jì)
1.1材料與方法
(1)樣品制備
從四川雅安茶廠有限公司購(gòu)買(mǎi)了三個(gè)等級(jí)的藏茶。藏茶的等級(jí)主要取決于茶葉的厚度。**為毛尖,選用*嫩的茶葉;二級(jí)為雅西,通常是一芽一葉或一芽?jī)扇~;三級(jí)為金尖,通常每芽有三葉或四葉。茶葉被分為106個(gè)樣本,其中**樣本33個(gè),二級(jí)樣本35個(gè),三級(jí)樣本38個(gè),每個(gè)樣本重6克。根據(jù)國(guó)家標(biāo)準(zhǔn)茶葉感官評(píng)價(jià)方法GB/T 23776-2018,邀請(qǐng)了專(zhuān)業(yè)茶葉評(píng)審員對(duì)茶葉等級(jí)進(jìn)行感官評(píng)定。在確認(rèn)樣本后,實(shí)驗(yàn)分為兩個(gè)步驟。**步是將茶葉樣本均勻地放入一個(gè)方形容器中(6.5 × 6.5 cm2),獲取高光譜圖像,并在圖像采集后迅速將茶葉樣本封裝入密封袋。**步是將樣本送至四川農(nóng)業(yè)大學(xué)茶葉專(zhuān)業(yè)實(shí)驗(yàn)室,進(jìn)行TPs和FAAs的檢測(cè)。圖1為藏茶檢測(cè)流程圖。
圖1.藏茶的檢測(cè)流程圖
(2)高光譜成像采集
高光譜圖像由江蘇雙利合譜科技有限公司生產(chǎn)的Gaia Sorter高光譜分選儀獲得。高光譜系統(tǒng)由成像光譜儀和CCD相機(jī)組成。該系統(tǒng)的光譜采集范圍為387 ~ 1035 nm,光譜分辨率為2.8 nm,具有256個(gè)光譜通道。由于光譜采集開(kāi)始和結(jié)束時(shí)暗電流的影響,僅保留420~1010 nm波段的信息作為原始光譜數(shù)據(jù)。所有茶葉樣品都測(cè)量了3次。采樣臺(tái)移動(dòng)速度設(shè)置為4.0 mm/s,采樣距離設(shè)置為170 mm,相機(jī)曝光時(shí)間設(shè)置為16 ms。通過(guò)高光譜相機(jī)獲取圖像后,對(duì)獲取的圖像進(jìn)行黑白校正。
采集圖像后,通過(guò)分析軟件從圖像中提取光譜數(shù)據(jù)。該軟件選擇一個(gè)矩形(面積為100 × 100像素)作為感興趣的區(qū)域。然后提取感興趣區(qū)域每個(gè)像元的光譜數(shù)據(jù),并計(jì)算所有像元的平均光譜作為樣本的代表性光譜。
(3)化學(xué)成分測(cè)定
TPs的含量采用國(guó)家標(biāo)準(zhǔn)GB/T 8313-2018中的Folin-Ciocalteu比色法進(jìn)行測(cè)定。FAAs的測(cè)定方法參照GB/T 8314-2013,采用茚三酮比色法。
(4)統(tǒng)計(jì)分析
所有實(shí)驗(yàn)均進(jìn)行三次重復(fù),并以均值 ± 標(biāo)準(zhǔn)差的形式呈現(xiàn)。統(tǒng)計(jì)分析使用SPSS軟件進(jìn)行,采用單因素方差分析加事后Duncan檢驗(yàn),P < 0.05被定義為具有統(tǒng)計(jì)學(xué)顯著性。使用Origin 軟件進(jìn)行繪圖。
(5)光譜預(yù)處理
除了樣本的化學(xué)成分信息外,高光譜數(shù)據(jù)還包含一些**影響,包括樣本、工作環(huán)境和設(shè)備引起的隨機(jī)噪聲干擾,這些因素與研究對(duì)象無(wú)關(guān),但可能影響模型的評(píng)估指標(biāo)。因此,在建立模型之前,使用了Savitzky-Golay(SG)、SG-乘法散射校正(MSC)和SG-標(biāo)準(zhǔn)正態(tài)變量(SNV)方法進(jìn)行預(yù)處理,以減少干擾信息的影響。
(6)特征提取
光譜共有256個(gè)波段,可能存在大量冗余信息,在一定程度上增加了數(shù)據(jù)處理時(shí)間,不利于建模。采用PCA算法對(duì)原始和預(yù)處理的光譜數(shù)據(jù)進(jìn)行主成分分析,提取關(guān)鍵特征。
(7)機(jī)器學(xué)習(xí)建模
在藏茶含量預(yù)測(cè)中,采用AdaBoost、梯度增強(qiáng)決策樹(shù)(Gradient Boosting Decision Tree,GBDT)和Extratree模型檢測(cè)藏茶中TPs和FAAs含量。使用決策樹(shù)(DT)、隨機(jī)森林分類(lèi)器(RFC)、K近鄰(KNN)和支持向量機(jī)(SVM)等分類(lèi)算法建立分類(lèi)模型。
通過(guò)準(zhǔn)確度、精密度和召回率來(lái)評(píng)估分類(lèi)模型的性能,計(jì)算決定系數(shù)(R2)、均方根誤差(RMSE)和殘差預(yù)測(cè)偏差(RPD)來(lái)評(píng)估回歸模型的性能。
1.2.結(jié)果與討論
(1)統(tǒng)計(jì)結(jié)果
圖2(a、b)為藏茶中TPs和FAAs的分布。TPs和FAAs的中位數(shù)和范圍值因等級(jí)而異。TPs和FAAs的含量通常隨著茶葉等級(jí)的增加而增加,因此,茶葉等級(jí)中TPs和FAAs的差異有統(tǒng)計(jì)學(xué)意義(P < 0.05)。雖然G1和G2在TPs分布圖上的差異很小,但中位數(shù)不同。G1的TPs含量為8.42±0.61%,F(xiàn)AAs含量為1.4±0.36%。G2的TPs含量為8.22±0.48%,F(xiàn)AAs含量為1.05±0.17%。G3的TPs含量為4.99±0.51%,F(xiàn)AAs含量為0.36±0.09%。不同品級(jí)的藏茶內(nèi)部成分差異顯著。這些含量可以作為評(píng)價(jià)藏茶品級(jí)的可靠依據(jù)。
圖2.(a)不同等級(jí)的TPs值(%);(b)不同等級(jí)的FAAs值(%)。圖中G1、G2、G3分別代表茶葉的三個(gè)等級(jí)
(2)光譜數(shù)據(jù)特征描述、樣本劃分和數(shù)據(jù)降維
圖3(a)為茶葉樣品的原始光譜,圖3(b-d)為各種預(yù)處理方法后的光譜。圖3(e)顯示了三個(gè)等級(jí)茶葉的平均光譜。采用SG和聯(lián)合預(yù)處理方法處理后的光譜數(shù)據(jù)更加平滑,并且減少了噪聲和來(lái)自環(huán)境和高光譜系統(tǒng)的某些不確定干擾。根據(jù)平均光譜,發(fā)現(xiàn)三個(gè)等級(jí)茶葉的光譜不相交,等級(jí)越高(G1為*高等級(jí)),茶葉的光譜反射越低。
圖3.茶葉樣品的光譜,(a)原始光譜;(b) SG后的光譜;(c) SG-MSC后的光譜;(d) SG-SNV后的光譜;(e)三個(gè)等級(jí)茶葉的平均光譜
不同品級(jí)的茶葉樣品屬于同一種,化學(xué)成分相同,因此在不同波長(zhǎng)區(qū)域之間具有相似的光譜趨勢(shì)。茶葉樣品的光譜趨勢(shì)相似,但不同等級(jí)茶葉樣品的反射率不同,茶葉的等級(jí)越好,光譜反射率越低。前面部分的統(tǒng)計(jì)分析結(jié)果表明,茶葉等級(jí)越高(G1為*高等級(jí)),茶葉中TPs和FAAs的含量越高,因此茶葉中這兩種成分的含量與之前的光譜反射率呈反比關(guān)系,也為使用HSI來(lái)區(qū)分藏茶的等級(jí),為后續(xù)的建模和分析提供依據(jù)。
獲得的高光譜圖像波長(zhǎng)范圍為420 ~ 1010 nm。光譜區(qū)域的變化與有機(jī)分子中含氫基團(tuán)(如C-H、N-H、O-H和S-H)的振動(dòng)頻率與不同水平的乘法吸收區(qū)域的組合一致。690 nm處的吸收峰較低,茶葉在該波段吸收紅光較多,綠光較少,這可能與茶葉的葉綠素含量有關(guān)。在700-1010 nm范圍內(nèi),由于葉片對(duì)近紅外波段吸收較少,光譜上升明顯,該波段差異較大可能是由于不同等級(jí)的內(nèi)部成分差異較大。
PCA在模型中起到特征降維的作用,將原始光譜壓縮為低維數(shù)據(jù),壓縮后的數(shù)據(jù)相互獨(dú)立、正交。圖4為三個(gè)等級(jí)(G1、G2、G3)的三維PCA分布圖。圖4(a),對(duì)應(yīng)原始數(shù)據(jù)集的PCA得分,其中PC1占94.37%,PC2占4.44%,PC3占0.96%。累積信息方差貢獻(xiàn)達(dá)到99.77%,表明新數(shù)據(jù)在保證譜所含信息量可靠有效的前提下,可以*大限度地發(fā)揮原始數(shù)據(jù)的特征,也減少了后續(xù)模型構(gòu)建的輸入量。此外,G2和G3之間存在重疊。根據(jù)以上分析,PCA無(wú)法完全分離數(shù)據(jù)集,這可能是由于兩種等級(jí)的茶葉之間存在細(xì)微的差異。圖4(b)是訓(xùn)練集和測(cè)試集隨機(jī)分割數(shù)據(jù)集的PCA分布圖。數(shù)據(jù)集的分布非常均勻,訓(xùn)練集和測(cè)試集的分布重疊,并且測(cè)試集中的樣本包含了所有訓(xùn)練集樣本的特征,從而保證了樣本預(yù)測(cè)的可能性。
圖4. 三維PCA散點(diǎn)圖,(a)三個(gè)不同等級(jí)的劃分;(b)訓(xùn)練集和測(cè)試集的劃分
(3)TPs和FAAs的定量測(cè)定
為了預(yù)測(cè)藏茶中的TPs和FAAs以及建立藏茶等級(jí)的判別模型,將樣本按2:1的比例隨機(jī)分為訓(xùn)練集和測(cè)試集。表1(a、b)顯示了三種回歸方法結(jié)合不同預(yù)處理方法對(duì)TPs和FAAs的預(yù)測(cè)結(jié)果,并對(duì)所有數(shù)據(jù)進(jìn)行PCA降維處理。
在TPs預(yù)測(cè)中,測(cè)試集中的Rp2都在0.9左右,RMSEP在0.43到0.58之間。在所有模型中,Extratree在訓(xùn)練集上的R2*高,Rc2 = 1, RMSEC= 0表明該模型能夠準(zhǔn)確預(yù)測(cè),模型具有較高的學(xué)習(xí)能力。在FAAs預(yù)測(cè)中,測(cè)試集的Rp2范圍為0.79 ~ 0.87,模型的RMSEP范圍為0.16 ~ 0.20。所有模型的RPD均大于2,具有較高的信度,可用于模型分析。在保證訓(xùn)練集上的訓(xùn)練情況后,經(jīng)過(guò)組合預(yù)處理,發(fā)現(xiàn)模型在測(cè)試集上得到了改進(jìn)。SG- SNV-Extratree對(duì)TPs的預(yù)測(cè)Rp2 = 0.9248,RMSEP= 0.4842,RPD= 3.646,優(yōu)于單一預(yù)處理SG的評(píng)價(jià)指標(biāo)。在預(yù)測(cè)FAAs時(shí),Adaboost、GBDT和Extratree中Rp2和RMSEP在聯(lián)合預(yù)處理后的作用大多大于單一預(yù)處理方法。與Extratree相比,SG-MSC和SG-SNV的Rp2分別為0.8736和0.8565。結(jié)果表明,預(yù)處理方法的結(jié)合有助于提高模型的預(yù)測(cè)能力。
圖5為T(mén)Ps和FAAs預(yù)測(cè)模型的散點(diǎn)圖。Extratree能提供較好的預(yù)測(cè)結(jié)果。TPs含量預(yù)測(cè)的*大誤差為1%,F(xiàn)AAs含量預(yù)測(cè)的*大誤差約為0.25%。SG-SNV-PCA-Extratree對(duì)TPs的預(yù)測(cè)效果*好。模型具有較高的R2、RPD和較低的RMSE (Rc2 =1,RMSEC=0,Rp2 =0.9248,RMSEP=0.4842,RPD=3.6460)。在FAAs的預(yù)測(cè)中,SG-MSCPCA-Extratree的預(yù)測(cè)效果*好,Rc2 = 1,RMSEC= 0,Rp2 = 0.8736, RMSEP= 0.1590,RPD= 2.8130。
圖5. 用于茶葉樣品的預(yù)測(cè)的模型散點(diǎn)圖(a)為T(mén)Ps的預(yù)測(cè)結(jié)果;(b)為FAAs預(yù)測(cè)結(jié)果
(4)檢測(cè)茶葉等級(jí)分類(lèi)模型的結(jié)果
在建立模型時(shí),關(guān)鍵因素是選擇*優(yōu)的分類(lèi)模型。在確定分類(lèi)器之后,我們優(yōu)化了參數(shù),以獲得*佳的分類(lèi)模型。通過(guò)比較原始光譜和結(jié)合了三種預(yù)處理方法與PCA的模型,以及表2中的四種分類(lèi)模型,*終得出了分類(lèi)結(jié)果。
關(guān)于預(yù)處理方法,在沒(méi)有預(yù)處理的分類(lèi)方法中,結(jié)果并不理想。SG-SNV和SG-MSC結(jié)合PCA-SVM的結(jié)果優(yōu)于單獨(dú)使用SG。這表明,預(yù)處理模型的組合不僅使光譜更加平滑,而且改善了訓(xùn)練效果,更有利于建模。
關(guān)于分類(lèi)模型。RFC和SVM下的測(cè)試結(jié)果優(yōu)于DT和KNN。為了確定*優(yōu)參數(shù),采用遺傳算法確定SVM中的參數(shù)值。結(jié)果表明,SVM的*佳參數(shù),選擇核函數(shù)的RBF,gamma= 0.6952, degree = 1,C= 1.2341。在此基礎(chǔ)上,得到了基于*優(yōu)參數(shù)的分類(lèi)結(jié)果。SG-SNV-PCA-SVM模型效果*好,訓(xùn)練集和測(cè)試集的準(zhǔn)確率、查全率和精密度均為100%,能夠準(zhǔn)確預(yù)測(cè)藏茶的品級(jí)。
結(jié)論
本研究通過(guò)化學(xué)計(jì)量學(xué)方法確定了藏茶中的TPs和FAAs,并通過(guò)高光譜成像(HSI)和多變量分析對(duì)其進(jìn)行了預(yù)測(cè)。結(jié)果表明,藏茶中的TPs和FAAs含量存在顯著差異(p < 0.05)。研究表明,HSI能夠?qū)崿F(xiàn)茶葉質(zhì)量參數(shù)的非破壞性檢測(cè)。本研究將茶葉檢測(cè)從外部特征的評(píng)估轉(zhuǎn)變?yōu)橥獠亢蛢?nèi)部特征的綜合評(píng)估,這將有助于提高藏茶行業(yè)的檢測(cè)效率,促進(jìn)雅安藏茶產(chǎn)業(yè)的發(fā)展,推動(dòng)藏茶經(jīng)濟(jì)的增長(zhǎng),并為其他食品領(lǐng)域提供一種快速、非破壞性的檢測(cè)方法。
參考文獻(xiàn)
論文引用自二區(qū)文章:Yan Hu , Peng Huang , Yuchao Wang , Jie Sun , Youli Wu , Zhiliang Kang. Determination of Tibetan tea quality by hyperspectral imaging technology and multivariate analysis. Journal of Food Composition and Analysis 117. (2023) 105136 https://doi.org/10.1016/j.jfca.2023.105136