利用無人機(jī)高光譜數(shù)據(jù)的冬小麥SPAD聚類回歸估測
背景:
SPAD(Soil plant analysis development)即葉片綠度,反映葉片中葉綠素的相對含量。葉綠素是作物光合作用*重要的色素,其濃度變化直接影響作物的健康狀況。傳統(tǒng)葉綠素體外測量方法不適合大面積的實(shí)時(shí)監(jiān)測。近年來,遙感技術(shù)已成為作物生長監(jiān)測的重要工具。特別是基于無人機(jī)的低空遙感探測技術(shù),具有操作方便、快速靈活、效率高、空間分辨率理想等優(yōu)點(diǎn),在**農(nóng)業(yè)中得到了廣泛應(yīng)用。搭載在無人機(jī)中的高光譜傳感器具有較高的光譜分辨率和較強(qiáng)的波段連續(xù)性,可以準(zhǔn)確獲取冬小麥的光譜信息。
前人研究中,可以通過植被指數(shù)提取小麥生長信息,或者采用支持向量回歸、隨機(jī)森林、反向傳播神經(jīng)網(wǎng)絡(luò)等方法監(jiān)測農(nóng)學(xué)參數(shù)。但是現(xiàn)有算法基于全局建模思想,無法*大限度地提高不同土壤肥力條件下小麥光譜特征差異。此外,在同一生育期,不同施肥處理下的冬小麥光譜特征也存在顯著差異。因此,為了更好地探索不同土壤肥力條件下的冬小麥SPAD濃度,必須使用聚類神經(jīng)網(wǎng)絡(luò)等差異化模型或地理加權(quán)回歸模型等局部模型。差異化模型的目標(biāo)是根據(jù)光譜角距離(Spectral angle distance, SAD)對小麥光譜進(jìn)行聚類,以區(qū)分不同肥力下的小麥光譜,然后對每個(gè)光譜聚類建立回歸模型。
因此,本研究采用K-means作為聚類方法,采用兩種集成學(xué)習(xí)算法作為回歸方法:基于Boosting集成策略的**梯度提升(XGBoost),以及基于Bagging集成策略的隨機(jī)森林(RF)。比較了非聚類回歸模型(RF、XGBoost)和聚類回歸模型(cluster-RF、cluster-XGBoost)的性能,評估了土壤有機(jī)質(zhì)(OM)和土壤全氮(TN)對小麥SPAD遙感估算的影響。
試驗(yàn)設(shè)計(jì)
安徽省農(nóng)業(yè)科學(xué)院花可可副研究員團(tuán)隊(duì)利用搭載有GaiaSky-mini2-VN高光譜相機(jī)(江蘇雙利合譜公司)的DJI M600無人機(jī)平臺,獲取了不同施肥處理下的小麥冠層高光譜影像。高光譜傳感器的波段范圍為400 ~ 1000 nm,光譜分辨率為3.5 nm,包含176個(gè)波段。獲取對應(yīng)采樣點(diǎn)的SPAD值以及土壤OM和TN。
研究中選擇的聚類方法為K-means,回歸算法為RF和XGBoost。整個(gè)算法流程分為兩步,**步:使用K-means將小麥光譜劃分為不同的簇。對176個(gè)波段的光譜反射率進(jìn)行綜合劃分,并將SAD作為算法的判別距離。簇的*大數(shù)量設(shè)置為30,*終選擇的簇?cái)?shù)為2。圖1和2顯示了6個(gè)案例的實(shí)驗(yàn)流程圖,6個(gè)案例的設(shè)置如表1所示。**步:針對小麥光譜的每個(gè)聚類,分別建立每個(gè)光譜聚類的回歸模型,并基于RF和XGBoost算法估測SPAD值。因此,每個(gè)光譜聚類都有相應(yīng)的回歸模型。
圖1 冬小麥SPAD估測流程圖
圖2 案例5和6的SPAD估測流程圖。
表1 試驗(yàn)設(shè)計(jì)
結(jié)論
與RF相比,XGBoost模型在所有田塊中表現(xiàn)出更好的估測性能(圖3)。RF模型和XGBoost模型的R2值分別為0.763和0.781,XGBoost的RMSE和MAPE均低于RF模型(表2)。RMSE和MAPE評價(jià)指標(biāo)表明,模型估計(jì)誤差較小且不顯著。
圖3 非聚類RF(a)和非聚類XGBoost(b)模型的預(yù)測散點(diǎn)圖
表2 非聚類回歸模型的準(zhǔn)確性
從圖4可以看出,無人機(jī)高光譜技術(shù)可以實(shí)現(xiàn)田塊尺度的SPA監(jiān)測。XGBoost和RF估測模型的估測結(jié)果相似,SPAD空間分布基本相似。XGBoost預(yù)測的SPAD值比RF分布更廣,并且XGBoost預(yù)測的SPAD平均值更接近于實(shí)測值。但兩種模型確定的標(biāo)準(zhǔn)差與真實(shí)數(shù)據(jù)略有差異。因此,有必要引入局部建模,如聚類回歸模型,以進(jìn)一步提高估測性能。
圖4 基于RF(a)和XGBoost(b)的SPAD空間分布
圖5為聚類后的小麥光譜。將小麥光譜聚為兩類,兩類光譜存在顯著差異,因此聚類結(jié)果是合理的。當(dāng)波長小于732 nm時(shí),Cluster1的平均光譜反射率低于Cluster2;當(dāng)波長大于732 nm時(shí),Cluster1的平均光譜反射率高于Cluster2。
圖5 高光譜反射率光譜曲線聚類結(jié)果
圖6顯示了聚類回歸模型預(yù)測的SPAD值與實(shí)測值之間的散點(diǎn)圖。cluster-XGBoost模型總體上優(yōu)于cluster-RF。cluster-XGBoost的R2(0.925)高于cluster-RF(0.901),RMSE(1.444)比cluster-RF(1.813)低0.369,MAPE比cluster-RF低25%。cluster-XGBoost比cluster-RF預(yù)測的SPAD范圍更大,并且cluster-XGBoost具有更高的標(biāo)準(zhǔn)差。兩種聚類回歸模型預(yù)測SPAD的空間分布如圖7所示,兩者表現(xiàn)出相似的分布。
圖6 cluster-RF(a)和cluster-XGBoost(b)模型的預(yù)測散點(diǎn)圖
圖7 基于cluster-RF(a)和cluster-XGBoost(b)的SPAD空間分布
前人研究表明,長期施肥處理后土壤養(yǎng)分的變化會影響小麥的生長,包括小麥葉綠素含量。如圖8所示,光譜反射率與小麥SPAD高度相關(guān),176個(gè)波段的相關(guān)系數(shù)**值均大于0.68,說明利用光譜信息可以建立小麥SPAD估測模型。土壤有機(jī)質(zhì)和全氮與小麥SPAD呈顯著正相關(guān),相關(guān)系數(shù)分別為0.44和0.45。因此,可將土壤有機(jī)質(zhì)和全氮引入小麥SPAD遙感估測。如表3所示,通過添加土壤OM和TN,RF和XGBoost模型的精度都得到了提高。對于RF,R2提高9.95%,RMSE降低4.25%,MAPE降低4.66%;對于XGBoost,R2提高14.23%,RMSE降低21.74%,MAPE降低13.43%。因此,結(jié)合土壤養(yǎng)分和光譜信息估測小麥SPAD比單獨(dú)使用光譜信息更準(zhǔn)確。此外,RF和XGBoost模型均能利用光譜和土壤信息準(zhǔn)確檢測SPAD,且XGBoost模型在施用有機(jī)肥的田中表現(xiàn)優(yōu)于RF模型。
圖8 光譜反射率與小麥SPAD的相關(guān)系數(shù)
表3 RF和XGBoost模型的精度(包括土壤養(yǎng)分)
作者信息
花可可,博士,安徽省農(nóng)業(yè)科學(xué)院土壤肥料研究所副研究員。
主要研究方向:土壤有機(jī)質(zhì)提升過程與調(diào)控機(jī)制、活性氮污染與阻控技術(shù)。
參考文獻(xiàn):
Yang, X., Yang, R., Ye, Y., Yuan, Z.R., Wang, D.Z., & Hua, K.K. (2021). Winter wheat SPAD estimation from UAV hyperspectral data using cluster-regression methods. International Journal of Applied Earth Observations and Geoinformation, 105, 102618.
https://doi.org/10.1016/j.jag.2021.102618