高光譜特征提取在葉片生物量監(jiān)測(cè)中的應(yīng)用探索:新方法與思路
本論文的應(yīng)用方向集中于農(nóng)業(yè)中作物葉片生物量的精準(zhǔn)監(jiān)測(cè)及高光譜數(shù)據(jù)的特征提取。通過提出的SIPLS-SPA方法,有效提取小麥葉片生物量的敏感光譜特征,用于構(gòu)建準(zhǔn)確、穩(wěn)定的預(yù)測(cè)模型,支持農(nóng)田精準(zhǔn)管理、資源優(yōu)化及作物育種。同時(shí),該方法適用于植物性狀的快速檢測(cè),為生態(tài)環(huán)境監(jiān)測(cè)中的碳循環(huán)評(píng)估和農(nóng)業(yè)信息化提供新思路。這一成果可廣泛應(yīng)用于未來農(nóng)業(yè)和生態(tài)系統(tǒng)的相關(guān)研究中。
背景
葉片生物量不僅是反映作物生長(zhǎng)狀況的關(guān)鍵參數(shù),還能有效指示氣候變化、食品**及施肥狀況。傳統(tǒng)的地面采樣方法雖然**,但具有破壞性,且耗時(shí)費(fèi)力,難以在大范圍內(nèi)實(shí)現(xiàn)快速、有效的空間和時(shí)間監(jiān)測(cè)。相比之下,遙感技術(shù)提供了非破壞性、快速且準(zhǔn)確的解決方案,而高光譜遙感通過獲取連續(xù)的光譜信息,能更加**地反映作物特性。然而,完整波段的高光譜數(shù)據(jù)中包含大量冗余信息和噪聲,這不僅增加了數(shù)據(jù)處理的負(fù)擔(dān),還會(huì)影響模型的精度和穩(wěn)定性。因此,選擇少量敏感特征波段,提取主要信息,成為提升監(jiān)測(cè)效率和精度的關(guān)鍵步驟。
為克服這些缺點(diǎn)并提升高光譜數(shù)據(jù)的特征選擇效果,作者提出了一種新的混合方法SIPLS-SPA。具體而言,將所選擇的*佳光譜特征確定為目標(biāo)變量,用于建立更準(zhǔn)確且穩(wěn)定的模型,以監(jiān)測(cè)小麥葉片生物量。同時(shí),作者將該方法的性能與SIPLS、SPA及全波段方法分別進(jìn)行了比較。精度、可靠性和實(shí)用性被用作評(píng)價(jià)所選特征及構(gòu)建混合模型的性能指標(biāo)。該研究結(jié)果將為今后農(nóng)業(yè)中作物性狀檢測(cè)的相關(guān)研究提供有效的實(shí)證參考。
實(shí)驗(yàn)設(shè)計(jì)
1.1.材料與方法
(1)麥田試驗(yàn)
本研究在中國(guó)東部江蘇省如皋(32°15′N,120°38′E)開展了兩項(xiàng)田間試驗(yàn)。每個(gè)試驗(yàn)均設(shè)置了不同的施氮量、品種和冬小麥種植密度(即行距)處理,采用完全隨機(jī)區(qū)組設(shè)計(jì),設(shè)3個(gè)重復(fù),共36個(gè)小區(qū)。每個(gè)地塊面積為5m×6m。所有處理均在播種前施用足量的磷酸鈣和氯化鉀。使用試驗(yàn)田2的標(biāo)定數(shù)據(jù)對(duì)葉片生物量估算模型進(jìn)行校準(zhǔn),利用試驗(yàn)田1的驗(yàn)證數(shù)據(jù)對(duì)混合模型的靈敏度和準(zhǔn)確性進(jìn)行評(píng)估。
(2)高光譜圖像的獲取
所有高光譜數(shù)據(jù)均由高光譜成像系統(tǒng)(GaiaField-V10E,四川雙利合譜光譜成像技術(shù)有限公司)采集。該系統(tǒng)由成像光譜儀探測(cè)器V10E和控制模塊組成。該光譜儀由一個(gè)CCD相機(jī)和一個(gè)可見光-近紅外(NIR)光譜儀組成,光譜范圍為380~1030nm??刂颇K由帶數(shù)據(jù)采集軟件的計(jì)算機(jī)和電動(dòng)位移平臺(tái)構(gòu)成。數(shù)據(jù)采集時(shí)間為北京時(shí)間10:00至14:00,選擇在小麥關(guān)鍵生育期的晴天條件下進(jìn)行,采集高度為冠層上方1.0m(圖1)。
圖1.在小麥重要生長(zhǎng)階段采集的圖像示例
(3)高光譜圖像數(shù)據(jù)預(yù)處理
圖像預(yù)處理流程如圖2所示。首先,利用標(biāo)準(zhǔn)光強(qiáng)圖像對(duì)天氣引起的光強(qiáng)變化進(jìn)行校正。然后,為了降低反射噪聲,使用了*小噪聲分?jǐn)?shù)旋轉(zhuǎn)(MNF)。*后,應(yīng)用支持向量機(jī)方法(SVM)提取小麥感興趣區(qū)域(ROI)。ROI的平均反射率定義為植被光譜。
圖2.用于高光譜圖像數(shù)據(jù)的預(yù)處理步驟
(4)小麥葉片生物量的測(cè)定
在測(cè)量了冠層反射率后,收集30株小麥植株,立即帶到實(shí)驗(yàn)室測(cè)定每個(gè)地塊的葉片生物量(kg/m2)。將所有樣品的綠葉與莖分離,然后在105°C下干燥30分鐘,在80°C下干燥48小時(shí)至恒重。同時(shí),對(duì)所有地塊每平方米(m2)的分蘗數(shù)進(jìn)行了統(tǒng)計(jì)。小麥葉片生物量(kg/m2)通過每株植物的葉片生物量乘以每平方米測(cè)得的分蘗數(shù)計(jì)算得出。
(5)利用SIPLS-SPA方法提取小麥葉片生物量相關(guān)的高光譜特征
首先,利用SIPLS-SPA從全波長(zhǎng)提取敏感光譜區(qū)間,然后,確定敏感光譜區(qū)間的*優(yōu)變量。具體步驟如下:
①將全波段(400–1000nm)劃分為P個(gè)等間隔(25–50)。例如:如果將波段400–1000nm分為6個(gè)區(qū)間,則每個(gè)區(qū)間分別為:400–500nm、501–600nm、601–700nm、701–800nm、801–900nm和901–1000nm。
②構(gòu)建結(jié)合Q(Q=2,3,4)個(gè)區(qū)間與葉片生物量的PLSR模型。
③重復(fù)步驟(1)和(2),通過*小的RMSECV(交叉驗(yàn)證均方根誤差)確定P和Q的值。
④根據(jù)確定的P和Q得到敏感特征的光譜矩陣,設(shè)為X(N*J,其中N為樣本個(gè)數(shù),J為光譜變量個(gè)數(shù))。
⑤隨機(jī)選取一列作為Xj;其余的定義為S。
⑥分別計(jì)算Xj到S的投影。S的*大投影表示*小相關(guān)性,其對(duì)應(yīng)的列定義為Xi。
⑦設(shè)Xi代替Xj,重復(fù)步驟⑤、⑥,直到所選變量的個(gè)數(shù)達(dá)到M的設(shè)定值(M為迭代范圍,M≤J)。M的值是通過對(duì)數(shù)據(jù)進(jìn)行多次計(jì)算而確定的。在這項(xiàng)研究中,M等于20。
⑧用所選變量和相應(yīng)生物量擬合多元線性回歸(MLR)模型。*后,根據(jù)多變量回歸的*小驗(yàn)證均方根誤差(RMSEv)選擇*優(yōu)變量。
(6)SIPLS-SPA的評(píng)價(jià)及選取的變量
通過將敏感光譜作為輸入變量構(gòu)建生物量模型,評(píng)估變量選擇方法SIPLS-SPA的性能以及所選敏感特征的有效性。模型性能從精度、可靠性和實(shí)用性三個(gè)方面進(jìn)行評(píng)估(見下表)。為了比較精度和可靠性,我們分別在校準(zhǔn)和驗(yàn)證數(shù)據(jù)集中使用了決定系數(shù)(Rc2,Rv2)、均方根誤差(RMSEc,RMSEv)以及相對(duì)均方根誤差(RRMSEc,RRMSEv)。模型的實(shí)用性包括運(yùn)行時(shí)間(秒)、參數(shù)數(shù)量、復(fù)雜性水平和計(jì)算復(fù)雜度。
1.2.結(jié)果
(1)不同施氮量下小麥冠層反射率的變化及其與葉片生物量的關(guān)系
以Exp.2中不同施氮量下的“生選6號(hào)”數(shù)據(jù)為例,分析了冠層反射率的變化(圖3A)。結(jié)果顯示,冠層反射率受氮肥用量的顯著影響。具體而言,隨著氮肥施用量的增加,由于色素吸收增加,可見光區(qū)域的反射率降低;然而,由于水分和冠層結(jié)構(gòu)的影響,近紅外區(qū)域的反射率上升。進(jìn)一步分析了小麥葉片生物量與冠層反射率的關(guān)系,如圖3B所示。在可見光區(qū)域(480–720nm),冠層反射率與葉片生物量呈負(fù)相關(guān),而在近紅外區(qū)域(720–900nm),反射率呈正相關(guān),表現(xiàn)為具有較高相關(guān)系數(shù)(*大相關(guān)系數(shù)為0.6)的平緩曲線。
圖3.(A)Exp.2中在拔節(jié)期“生選6號(hào)”在三種施氮水平下的冠層反射率;(B)小麥葉片生物量與冠層反射率的線性相關(guān)系數(shù)
(2)SIPLS-SPA參數(shù)確定
采用SIPLS-SPA方法提取小麥葉片生物量的敏感性特征。首先,將全譜劃分為*多50個(gè)區(qū)間,然后對(duì)每個(gè)病例在Q(Q=2,3,4)區(qū)間上構(gòu)建PLSR模型。通過運(yùn)行2.4節(jié)中的步驟①-④,成功地獲得了每個(gè)PLSR模型的RMSECV。結(jié)果表明,在P=37和Q=4條件下,獲得了RMSECV*低的*佳PLSR模型(圖4)。這意味著當(dāng)整個(gè)光譜區(qū)域平均劃分為37個(gè)區(qū)間時(shí),以22、24、30和37這四個(gè)區(qū)間構(gòu)建的PLSR模型表現(xiàn)*佳。
圖4.不同P和Q值下SIPLS模型的RMSEcv
(3)SIPLS-SPA篩選小麥葉片生物量敏感性特征
SIPLS選取的4個(gè)區(qū)間對(duì)應(yīng)的光譜區(qū)域分別為694~706nm、722~734nm、806~816nm和890~900nm,共44個(gè)波長(zhǎng)變量。然后通過反復(fù)測(cè)試,確定M的值為20。*后,再次運(yùn)行步驟⑤-⑧,確定*佳高光譜變量為706、724、734、806、808、810、812和816nm(圖5)。這些波段被命名為小麥葉片生物量的“*佳高光譜特征”。
圖5. SIPLS-SPA提取小麥的*佳光譜變量為706、724、734、806、808、810、812和816nm
(4)基于*優(yōu)高光譜特征的生物質(zhì)模型標(biāo)定與驗(yàn)證
利用SIPLS-SPA選擇的輸入變量,建立小麥5個(gè)生長(zhǎng)階段葉片生物量的標(biāo)定模型(圖6A)。然后用獨(dú)立的Exp1數(shù)據(jù)集對(duì)模型進(jìn)行驗(yàn)證。圖6B顯示了Exp.2中6個(gè)重要生育期小麥葉片生物量實(shí)測(cè)值與預(yù)測(cè)值的散點(diǎn)圖。
圖6.在校準(zhǔn)(A)和驗(yàn)證(B)中,SIPLS-SPA估算的小麥葉片生物量與預(yù)測(cè)值之間的擬合關(guān)系為1:1
(5)與其他特征選擇方法的比較
通過與傳統(tǒng)的SIPLS和SPA方法進(jìn)行比較,評(píng)估了新開發(fā)的SIPLS-SPA方法的有效性。此外,根據(jù)精度、可靠性和實(shí)用性(包括變量數(shù)量、訓(xùn)練時(shí)間、復(fù)雜性水平和計(jì)算復(fù)雜度)對(duì)基于這些算法提取的不同數(shù)量敏感特征的PLSR模型進(jìn)行了評(píng)估。
下表顯示了從與SIPLS-SPA相同的數(shù)據(jù)集中由SPA和SIPLS提取的敏感變量。結(jié)果表明,SIPLS為小麥葉片生物量選擇的敏感特征波段為694–706、722–734、806–816和890–900 nm,而SPA選擇的敏感特征為726、744、758、816和830 nm??偟膩碚f,SIPLS選擇的敏感特征多于SPA和SIPLS-SPA。
利用SPA、SIPLS和SPA-SIPLS選擇的敏感特征作為輸入變量,構(gòu)建小麥葉片生物量的PLSR模型。下表總結(jié)了它們各自的準(zhǔn)確性和可靠性。結(jié)果表明,SIPLS模型和全波長(zhǎng)模型的Rc2*大(0.84),SPA和SIPLS-SPA次之。而SIPLS-SPA模型的Rv2值*大(Rv2=0.67),SIPLS模型的Rv2值*小。此外,利用SIPLS-SPA選擇的敏感特征構(gòu)建的模型獲得了*低的RMSEv(0.059kg/m2)和RRMSEv(38.55%)。
采用時(shí)間、復(fù)雜度和計(jì)算復(fù)雜度三個(gè)指標(biāo)評(píng)價(jià)具有不同敏感特征的PLSR模型的實(shí)用性(見下表)。結(jié)果表明,SPA模式運(yùn)行時(shí)間*短,SIPLS-SPA次之,全波長(zhǎng)模式運(yùn)行時(shí)間*長(zhǎng)。SPA和SIPLS-SPA的矩陣復(fù)雜度和計(jì)算復(fù)雜度基本相同,但全波長(zhǎng)模型的矩陣復(fù)雜度和計(jì)算復(fù)雜度在所有估計(jì)模型中*高。
結(jié)論
本研究提出了一種新的計(jì)算方法SIPLS-SPA,將SIPLS和SPA兩種方法結(jié)合用于從高光譜圖像中提取敏感特征,以檢測(cè)小麥葉片生物量。通過SIPLS-SPA方法篩選出的8個(gè)波段(706、724、734、806、808、810、812和816 nm)被認(rèn)為是*佳的高光譜特征,作為輸入變量構(gòu)建PLSR模型以估算冬小麥的葉片生物量。與其他先進(jìn)的特征選擇技術(shù)相比,所選特征和構(gòu)建的生物量模型在去除不相關(guān)、共線性、簡(jiǎn)單變量方面表現(xiàn)更優(yōu),且具有較低復(fù)雜度、降低的計(jì)算復(fù)雜性和更短的運(yùn)行時(shí)間??傮w而言,結(jié)果表明SIPLS-SPA是一種強(qiáng)大的高光譜特征選擇方法,可用于農(nóng)業(yè)應(yīng)用中植物性狀的估算。
推薦產(chǎn)品
GaiaField-V10E
作者簡(jiǎn)介
通訊作者:姚霞,南京農(nóng)業(yè)大學(xué),博導(dǎo)
參考文獻(xiàn)
論文引用自一區(qū)文章:Min Jia, Wei Li, Kangkang Wang, Chen Zhou, Tao Cheng, YongChao Tian, Yan Zhu, Weixing Cao, Xia Yao. A newly developed method to extract the optimal hyperspectral feature for monitoring leaf biomass in wheat. Computers and Electronics in Agriculture. Volume 165, 2019, 104942. https://doi.org/10.1016/j.compag.2019.104942.