en
×

分享给微信好友或者朋友圈

使用微信“扫一扫”功能。
作者简介:

王韦燕(1997-),硕士研究生,研究方向为精准养分管理。E-mail:wwy15624277708@163.com。

通讯作者:

张云贵,E-mail:zhangyungui@caas.cn。

参考文献 1
丁希斌,刘飞,张初,等.基于高光谱成像技术的油菜叶片SPAD值检测[J].光谱学与光谱分析,2015,35(2):486-491.
参考文献 2
Hunt E R,Doraiswamy P C,Mcmurtrey J E,et al.A visible band index for remote sensing leaf chlorophyll content at the canopy scale[J].International Journal of Applied Earth Observations & Geoinformation,2013,21(1):103-112.
参考文献 3
Sonobe R,Sano T,Horie H.Using spectral reflectance to estimate leaf chlorophyll content of tea with shading treatments[J]. Biosystems Engineering,2018,175:168-182.
参考文献 4
郭建华,赵春江,王秀,等.作物氮素营养诊断方法的研究现状及进展[J].中国土壤与肥料,2008(4):10-14.
参考文献 5
Li C C,Ma C Y,Chen P,et al.Machine learning-based estimation of potato chlorophyll content at different growth stageusing UAV hyperspectral data[J].Zemdirbyste-Agriculture,2021,108(2):181-190.
参考文献 6
第五鹏瑶,卞希慧,王姿方,等.光谱预处理方法选择研究 [J].光谱学与光谱分析,2019,39(9):2800-2806.
参考文献 7
郑煜,常庆瑞,王婷婷,等.基于连续统去除和偏最小二乘回归的油菜SPAD高光谱估算[J].西北农林科技大学学报(自然科学版),2019,47(8):37-45.
参考文献 8
王丽爱,马昌,周旭东,等.基于随机森林回归算法的小麦叶片SPAD值遥感估算[J].农业机械学报,2015,46(1):259-265.
参考文献 9
李媛媛,常庆瑞,刘秀英,等.基于高光谱和BP神经网络的玉米叶片SPAD值遥感估算[J].农业工程学报,2016,32(16):135-142.
参考文献 10
张黎黎,吕霞.基于PROSPECT模型的水稻叶片叶绿素含量估测方法研究[J].农业科技与装备,2021(5):23-25.
参考文献 11
张子晗,晏磊,刘思远,等.基于偏振反射模型和随机森林回归的叶片氮含量反演[J].光谱学与光谱分析,2021,41(9):2911-2917.
参考文献 12
Xin Y,Rui Y C,Yin Y,et al.Winter wheat SPAD estimation from UAV hyperspectral data using cluster-regression methods [J].International Journal of Applied Earth Observation and Geoinformation,2021,105:102618.
参考文献 13
赵琨,王珺珂,王楚锋,等.基于高光谱成像技术的油菜SPAD值空间分布预测及最佳测量叶位[J].华中农业大学学报,2018,37(4):78-84.
参考文献 14
Xue L,Yang L.Deriving leaf chlorophyll content of green-leafy vegetables from hyperspectral reflectance[J].ISPRS Journal of Photogrammetry and Remote Sensing,2009,64(1):97-106.
参考文献 15
Liu B,Yue Y M,Li R,et al.Plant leaf chlorophyll content retrieval based on a field imaging spectroscopy system[J]. Sensors,2014,14(10):19910-19925.
参考文献 16
沈花玉,王兆霞,高成耀,等.BP 神经网络隐含层单元数的确定[J].天津理工大学学报,2008(5):13-15.
参考文献 17
李海萍,杜佳琪,唐浩竣.基于随机森林的县域土壤有机碳密度及储量估算[J].中国土壤与肥料,2021(3):1-8.
参考文献 18
Biau G.Analysis of a random forests model[J].The Journal of Machine Learing Research,2012,13(1):1063-1095.
参考文献 19
Wu X,Kumar V,Quinlan J R,et al.Top 10 algorithms in data mining[J].Knowledge and Information Systems,2008,14(1):1-37.
参考文献 20
陈春玲,金彦,曹英丽,等.基于 GA-BP 神经网络高光谱反演模型分析玉米叶片叶绿素含量[J].沈阳农业大学学报,2018,49(5):626-632.
参考文献 21
Zhang J,Tian H,Wang D,et al.A novel spectral index for estimation of relative chlorophyll content of sugar beet[J]. Computers and Electronics in Agriculture,2021,184(4):106088.
参考文献 22
王克晓,周蕊,李波,等.基于高光谱的油菜叶片SPAD值估测模型比较[J].福建农业学报,2021,36(11):8.
参考文献 23
Geladi P D,Macdougall D B,Martens H.Linearization andscatter-correction for near-infrared reflectance spectra of meat[J]. Applied Spectroscopy,1985,39(3):491-500.
参考文献 24
Zhao N,Wu Z,Cheng Y,et al.MDL and RMSEP assessment of spectral pretreatments by adding different noises in calibration/validation datasets[J].Spectrochimica Acta Part A Molecular & Biomolecular Spectroscopy,2016,163:20-27.
参考文献 25
王璐,李伟凯,关海鸥,等.基于多维度光谱特征波长提取大豆冠层SPAD值估算模型[J].江苏大学学报(自然科学版),2020,41(3):334-338,372.
参考文献 26
吴静珠,李慧,王克栋,等.光谱预处理在农产品近红外模型优化中的应用研究[J].农机化研究,2011,33(3):4.
目录contents

    摘要

    叶绿素是作物进行光合作用合成有机物的主要色素,实时监测烤烟叶片叶绿素含量对跟踪烟株氮素营养状况和判别烟叶成熟度具有重要的指导作用。基于对烤烟叶片光谱特征的分析,以不同供氮水平下实测的烟叶高光谱数据及叶绿素相对含量(SPAD)为数据源,采用一阶导数(1st Der)、多元散射校正(MSC)、标准正态变量(SNV)和 SG 平滑(SG)对原始光谱数据进行预处理,先采用连续投影法(SPA)挑选出每个预处理条件下的特征波长,后将各特征波段下的光谱反射率作为模型的输入变量,利用反向传播神经网络(BPNN)、随机森林(RF)和支持向量机(SVM)3 种机器学习的方法分别构建烤烟叶片叶绿素含量估测模型。使用决定系数(R2 )、均方根误差(RMSE)和平均绝对值误差(MAE)对每个机器学习模型的性能进行了评估和比较。结果表明:3 种机器学习方法训练出的模型相比较,RF 模型的预测准确率最高;烤烟叶片原始光谱经 MSC 和 SNV 预处理后的光谱信息作为输入变量,经 RF 算法建模具有较高的精度和良好的预测能力,模型为 MSC-SPA-RF(R2 =0.96,RMSE=1.15,MAE=0.94)和 SNV-SPA-RF(R2 =0.96, RMSE=1.14,MAE=0.94)。说明基于机器学习利用高光谱数据估算烤烟叶片叶绿素含量具有可行性,这为实时、精确地监控烤烟生长过程中叶片叶绿素含量变化状况以及合理科学的进行田间管理提供了一定的理论基础

    Abstract

    Chlorophyll is the main pigment in photosynthesis of crops to synthesize organic matter.Real-time monitoring of chlorophyll content in flue-cured tobacco leaf plays an important guiding role in tracking nitrogen nutrition status of tobacco and distinguishing the maturity of tobacco leaves. Based on the analysis of spectral characteristics of flue-cured tobacco leaves,the measured hyperspectral data and chlorophyll relative content(SPAD)of tobacco leaves under different nitrogen levels were used as data sources.The raw spectral data were preprocessed by first derivative(1st Der),multiple scattering correction(MSC),standard normal variable(SNV)and Savitzky-Golay smoothing(SG). First,the successive projection algorithm(SPA)was used to select characteristic wavelengths under the different preprocessing conditions,and then the spectral reflectance of the extracted characteristic wavelengths was used as input variable of back propagation neural network(BPNN),random forests(RF)and support vector machine(SVM)modeling.Three machine learning methods were used to construct estimation models of chlorophyll content in inverted three leaves of flue-cured tobacco,respectively. The performance of each machine learning model was evaluated and compared using the coefficient of determination(R2), root mean square error(RMSE)and mean absolute error(MAE). The results showed that:Compared with the models trained by the three machine learning methods,the RF model achieved the best prediction result.In this study,the raw spectral data of flue-cured tobacco leaves pretreated by MSC and SNV were used as the input variables of the model,and then the model was established by RF algorithm which had obtained the best prediction results.The three models were as follows: MSC-SPA-RF(R2 =0.96,RMSE=1.15,MAE=0.94)and SNV-SPA-RF(R2 =0.96,RMSE=1.14,MAE = 0.94). It is feasible to estimate chlorophyll content of flue-cured tobacco leaves using hyperspectral data based on machine learning.This provides a theoretical basis for monitoring real-time and accurate change of chlorophyll content in flue-cured tobacco leaf and for reasonable and scientific field management.

  • 叶绿素是植物进行光合作用的载体,其含量是评估作物长势状况和预测产量潜力的重要指标。在实际的研究和应用中,常采用 SPAD 值来表征作物的叶绿素含量[1]。作物叶片的叶绿素含量在一定程度上可以反映土壤肥力和作物的氮素营养状况[2],在烤烟生育期内及时、准确地预测烟叶叶绿素含量,指导后期合理精准追氮和田间管理对烤烟的增产提质生产具有重要意义。

  • SPAD 值是一个相对叶绿素含量,国内外大量研究已证明,SPAD 值能够准确预测作物的叶绿素含量。以往大部分研究获取作物 SPAD 值的主要方式是采用 SPAD 仪,测量原理是利用作物叶片在 LED 光源发射的 650 nm 红光和 940 nm 红外线的透光系来确定叶片的相对叶绿素含量。其需要人工对叶片进行反复测量,且只能反应作物个体水平,监测作物群体长势时费时费力。相比之下,通过测量叶片的反射率对作物叶绿素含量进行监测,具有快速、无损、精确等优点。目前,运用遥感技术辅助精准农业已经发展为一种趋势,高光谱遥感具有窄而连续的光谱带,且对于作物的氮含量状况、冠层生物量和叶绿素含量等特性敏感[3-5]。但由于高光谱信息中除含有作物特征信息外,光谱数据还易受到杂散光、噪声、基线漂移等因素的干扰,从而会影响建模效果[6],因此在建模前对光谱数据进行预处理。找到最佳的预处理方法,对于提高模型精度具有重要的意义。本研究尝试了几种比较常见的预处理方法:一阶导数(1st Der)、多元散射校正(MSC)、标准正态变量(SNV)和 SG 平滑(SG),并根据建模性能的优劣对光谱预处理方法进行反向选择,筛选出最优的光谱预处理方法。

  • 利用光谱数据对作物叶绿素含量进行反演的算法大致可以分为 3 类:一是线性统计建模方法,如逐步线性拟合回归(SMLR)和偏最小二乘回归(PLSR);如郑煜等[7] 运用连续统去除光谱特征波段结合最优吸收特征参数构建的 PLSR 估算模型,预测不同生育期油菜叶片叶绿素相对含量。二是非线性统计方法(以机器学习方法为代表),如反向传播神经网络(BPNN)、随机森林(RF)和支持向量机(SVM)等算法;如王丽爱等[8]基于 RF 回归算法估算小麦叶片 SPAD 值,李媛媛等[9]基于 BPNN 估算玉米叶片 SPAD 值。三是植被叶片辐射传输模型法,如张黎黎等[10]利用 Gram-Schmidt 对高光谱数据进行降维,以 PROSPECT 模型为基础,实现水稻叶片叶绿素含量估测。其中,机器学习算法属于遥感领域和计算机领域学科交叉的范畴,具有极大的精度优势[11]

  • 基于光谱技术利用机器学习算法测定作物叶片 SPAD 值的方法逐渐成为了叶绿素含量定量诊断的有效手段,被广泛应用于小麦、油菜、玉米和水稻等作物[12-13],并取得了一定的成果。本文在前人研究基础上,利用光谱预处理方法和机器学习算法,对烤烟叶绿素估算模型进行优化,以期提高模型预测精度。因此,本研究主要有两个目的:(1)探索不同光谱预处理条件下反演烤烟叶片 SPAD 值的潜力大小,筛选出较优的光谱预处理方法。(2)比较 3 种先进机器学习技术 BPNN、RF 和 SVM 在反演烤烟叶片 SPAD 值方面的性能。

  • 1 材料与方法

  • 1.1 研究区概况

  • 试验于 2021 年 4~9 月在四川省凉山彝族自治州冕宁县(28°05′~29°02′N,101°38′~102°25′E)进行。研究区内年平均气温 16.32℃,年均日照时数 1957.2 h,年均降水量 1106.8 mm,海拔高度 1842 m。供试土壤为典型红壤冲积的泥沙土,pH 值 5.48,有机质 13.7 g·kg-1,碱解氮 56.4 mg·kg-1,有效磷 43.8 mg·kg-1,速效钾 210.1 mg·kg-1

  • 供试烤烟品种为云烟 87。试验小区共占地 0.21 hm2,共 21 个小区。设置 7 个氮水平,分别为 N0 (不含氮)、N1(30 kg·hm-2)、N2(60 kg·hm-2)、 N3(90 kg·hm-2)、N4(120 kg·hm-2)、N5 (150 kg·hm-2)、N6(180 kg·hm-2),每个小区3 个重复且随机分布。试验小区位置及分布如图1 所示。

  • 图1 试验小区位置和分布

  • 1.2 样本采集与提取

  • 于 2021 年 5 月 15 日至 6 月 26 日(移栽后 60 d 内)进行烤烟倒三叶(从上往下大于 5 cm 的第 5 片烟叶)取样。每周每试验小区选取代表性烟株两株,采集健康叶片(倒三叶),共取样 6 次。采样后立即回实验室进行 SPAD 值测定和高光谱扫描。

  • 使用基于液晶可调谐滤波器(LCFF)的凝视型高光谱相机(SHIS-V220 型)采集光谱数据,光谱范围 450~950 nm。每次光谱测量前,先进行一次标准白板校正,观测时传感器垂直向下,探头距离被扫描叶片 100 cm,视场角为 5°。为保证光谱采集的外部环境不变,采集光谱时在暗室内进行,高光谱连续采集的设置波长范围为 450~950 nm。

  • 与高光谱测量同步,采集完光谱的叶片立即采用日本 Minolta Camera 公司生产的手持式叶绿素仪(SPAD-502Plus)测定烤烟倒三叶叶尖、叶中、叶基部位的 SPAD 值。为减小误差,在每片叶子的不同部位随机选取 3 个点测定其 SPAD 值(避开叶脉),取其平均值作为该叶片该部位的 SPAD 值,将 3 个部位的平均值作为该叶片的 SPAD 值。

  • 试验获取烤烟移栽后 60 d 内烤烟倒三叶高光谱数据和 SPAD 值有效样本共 210 个。移栽后 60 d 内叶片 SPAD 值最小值为 17.50,最大值为 49.27,平均值为 32.49。将样本数据依据烟叶叶片 SPAD 实测值的大小进行排序,按照 2∶1 抽取 140 个样本作为建模集,70 个样本作为验证集。总样、建模集和预测集的烤烟叶片 SPAD 值的样本数、范围、均值和标准差参见表1。

  • 表1 烤烟烟叶 SPAD 值的描述性统计

  • 1.3 光谱预处理

  • 使用 ENVI 在每个叶片样本的高光谱图像中,于主叶脉两侧选取 50×60 像素的矩形作为感兴趣区域(ROI),提取感兴趣区内的平均光谱曲线。210 个烤烟烟叶样本在 450~950 nm 光谱范围内的平均原始光谱曲线如图2 所示,210 条样本曲线的走势虽基本一致,但在 500~600 和 850~900 nm 波长范围内存在较大的光谱反射率差异。前人研究表明,植物在 490 至 775 nm 处的一阶导数反射率与植物的叶绿素含量之间存在很强的相关性[14-15]。去掉全光谱数据中 450~500 和 900~950 nm 的首尾噪声,截取 500~900 nm 范围内的平均光谱曲线,供下一步的分析研究使用。

  • 图2 烤烟叶片反射率

  • 基于叶片尺度提取的光谱信息,可以减少冠层结构、土壤背景和大气等因素的干扰,但仍易受到杂散光、噪声、基线漂移等因素的干扰[6]。因此,需要在建模前对光谱数据进行预处理。本文借助 R 语言中的 Prospectr 包尝试了几种比较常见的预处理方法:一阶导数(1st Der)、SG 平滑(SG)、多元散射校正(MSC)和标准正态变量(SNV)。如图3 所示,为光谱预处理后的结果。

  • 1.4 模型构建

  • 原始光谱数据通过预处理后,使用连续投影法 (SPA)挑选出各自的特征波段,将各特征波段下的光谱反射率作为输入变量运用不同的机器学习算法对建模集进行建模。本研究所有机器学习模型的训练和测试均在 R 语言环境下完成。

  • 反向传播神经网络(BPNN)的主要思想是通过神经网络正向传播输出结果,通过反向传播方式传递误差,并对网络中的参数进行优化,以训练出一个神经网络。该模型在 neuralnet 程序包下构建。神经网络隐藏层节点数 q 在根据经验式(1)[16]给定范围的基础上,利用程序包 caret 中的 train 函数进行确定,选择 RMSE 最小时对应的隐藏节点数,最终确定 Raw-BPNN、1st Der-BPNN 和 MSCBPNN 模型的最佳节点数为 2,SG-BPNN 模型的最佳节点数为 5,SNV-BPNN 模型的最佳节点数为 3。

  • q=k+m+α
    (1)
  • 式中,k 为输入层单元个数,m 为输出层单元个数,α[110]之间的常数。

  • 随机森林(RF)是一种基于多个决策树的集成学习方法,它结合了 Breiman 的“袋装”思想和随机选择的特征[17-18]。RF 模型在 randomForest 程序包下构建,各不同预处理条件下作为 RF 模型的输入变量时,在 ntree=200 的条件下已趋于稳定,所以规定随机森林内包含的决策树数目为 200。对于最优竞争变量数目根据 OOB 误差计算最优的 mtry 值。选择 OOB 误差最小时所对应的最优竞争变量数目。

  • 支持向量机(SVM)是一种监督学习算法,主要思想是建立一个最优决策超平面,使得该平面两侧距平面最近的两类样本之间的距离最大化[19]。模型在 e1071 程序包下构建,类型为 eps-regression,其原理是将优化的超平面拟合到一组输入特征,以在 n 维输入变量和一维目标变量之间建立线性依赖关系。在构建模型时,选取的核函数为径向基核函数。其中,利用 tune.svm 函数计算获取最佳惩罚因子 c 的取值。原始光谱与 SNV 条件下 c 参数为 10,一阶导数、SG 平滑与 MSC 条件下 c 为 1。

  • 1.5 模型评估

  • 将训练集和预测集分别通过不同机器学习模型得出的估测结果与实测 SPAD 值进行回归拟合,评价不同预处理条件下不同机器学习模型的预测能力。为对所建模型进行客观评价,共采用 3 类指标进行评价:决定系数(R2)、均方根误差(RMSE) 和平均绝对值误差(MAE),其计算方法如式 (2)、(3)、(4)所示。

  • R2=i=1n y^i-y-2i=1n yi-y-2
    (2)
  • RMSE=1ni=1n yi-y^i2
    (3)
  • MAE=1ni=1n y^i-yi
    (4)
  • 式中,yi 为烤烟倒三叶 SPAD 实测值,y^i为基于烤烟倒三叶 SPAD 诊断模型的预测值,y-为烤烟倒三叶实测 SPAD 的均值。

  • 2 结果与分析

  • 2.1 基于 SPA 算法特征波段提取

  • 为了降低光谱数据的冗余度,提高模型的稳定性和准确性,借助于 Python 软件,采用连续投影算法(SPA)分别对不同预处理条件下的光谱数据进行特征波长筛选。首先将不同预处理条件下的光谱数据作为输入变量,利用向量的投影分析,建立所有候选子集的多元线性回归分析模型,得到模型集交互验证的 RMSE,不同的 RMSE 值对应不同的候选子集。选取对应最小 RMSE 值的最优子集,最优子集中的变量数即为含有最少冗余信息及最小共线性的变量组合,即特征波长组合,不同预处理条件下的特征波长组合如表2 所示。

  • 表2 基于 SPA 的预处理特征波长

  • 2.2 模型评价

  • 为评价不同建模方法对于烤烟叶片 SPAD 值的预测能力,以 R2RMSE MAE 作为模型的评价依据,对于 3 种不同的机器学习方法在不同预处理条件下的学习能力进行比较,结果如表3 所示。

  • 表3 烤烟叶片 SPAD 值预测模型比较

  • 结果表明,对于 BPNN 算法,通过一阶导数、 MSC 和 SNV 预处理后,相比于原始光谱数据作为输入变量,其建模后的 R2RMSE MAE 均有所改善。其中,原始光谱信息经过 SNV 预处理后建模,其验证集中的实测值与预测值的拟合决定系数最高,为 0.81;且 RMSEMAE 分别为 2.08 和 1.91,均小于其他预处理方法下的 RMSEMAE,模型的准确度高,误差的离散程度小,表明 BPNN 算法建模,选用 SNV 的预处理方法,相比于其他 4 种预处理方法,可以较好地预测烟叶 SPAD 值。对 RF 算法而言,在不同预处理条件下构造 RF 模型推算得到的预测值和实测值回归拟合的 R2 均大于 0.90,原始光谱和经 MSC、SNV 预处理后的光谱数据作为输入变量其 R2 达 0.95 以上;其中,MSC 和 SNV 所对应的 RMSE 均小于 1.15,MAE 均小于 0.94,说明经 MSC 和 SNV 预处理后的 RF 模型预测精度高。对于 SVM 算法,经一阶导数和 MSC 处理后的 SVM 模型优于原始光谱对应的 SVM 模型,一阶导数预处理后,SVM 模型得到的验证集中实测值与预测值的 R2RMSEMAE 分别为 0.80、2.45 和 1.95,相比于原始光谱和其他预处理方法作为输入变量建模后的预测效果最佳。

  • 3 种机器学习算法中,随机森林模型在不同光谱预处理条件下均表现出最强的学习能力,其 R2 均在 0.90 水平以上,并且 RF 模型的 RMSE MAE 值明显优于 BPNN 和 SVM 模型,其 RMSE 均在 1.67 水平以下,且 MAE 均小于 1.38。综合比较,由 RF 模型反演烤烟叶片 SPAD 值为最佳选择。图4 为不同预处理条件下,RF 模型对预测集的估测 SPAD 值与实测值进行回归拟合的具体结果。

  • 3 讨论

  • 3.1 不同预处理差异分析

  • 植物叶片光谱特征与叶绿素含量关系密切,陈春玲等[20]利用 535 nm 处的一阶微分值、蓝边内最大一阶微分值 Db、蓝边面积 SDb 作为输入变量,构建 BP 神经网络(BPNN)和遗传算法优化的 BP 神经网络(GA-BPNN)反演模型,研究结果表明模型的稳定性和预测能力均表现良好。Zhang 等[21] 通过利用 390~990 nm 范围内所有可能的光谱组合优化归一化植被指数(NDVI)和叶绿素指数 (CI),并建立偏最小二乘(PLS)回归模型,研究表明 MCI(R747 R839)、MCI(R861 R884)和 MCI (R931 R770)是最好的甜菜 SPAD 值预测精度的验证集,其 R2 分别为 0.83、0.70 和 0.75,RMSE 分别为 2.37、3.11 和 2.78。王克晓等[22]在分析光谱反射特征和光谱参数与油菜叶片 SPAD 值相关性的基础上,利用光谱特征参数优选并构建预测模型,研究结果表明,基于机器学习的非线性估计模型相比于线性统计模型具有较高的稳定性和预测能力,其 DNN 模型决定系数 R2 达 0.93,RPD 为 3.92,具有较好的预测能力。以上研究证明了高光谱预测叶片叶绿素含量的可行性,多着重于比较基于不同光谱参数条件下模型的预测效果,然而,鲜见比较不同光谱预处理方法与机器学习算法对模型预测性能的影响。为提高建模精度,本研究选用 4 种不同的光谱预处理方法对原始光谱信息进行处理,并结合 3 种机器学习算法对烟叶 SPAD 值进行预测。结果表明,通过一阶导数、多元散射校正和标准正态变量预处理后的光谱信息作为模型的输入变量在一定程度上可以有效地提高建模精度。目前,大部分研究在植被光谱预处理分析中多使用微分技术。大量研究也表明,微分光谱较原始光谱在敏感波段与植物生理生化参数的相关性更好[914]。一阶微分可以消除光谱中的基线平移,使某些未分辨开的重叠光谱分辨开来,提高光谱分辨率和信噪比[6]。在本研究中,采用 BPNN 算法建模时,预测集原始光谱作为输入变量,拟合方程 R2RMSE MAE 分别为 0.74、2.77 和 2.27,而将原始光谱经过一阶微分处理后作为输入变量建模得到的 R2RMSEMAE 分别为 0.77、2.62 和 1.93,预测模型精度得到改善。SVM 模型同理。通过比较可以看出,利用一阶微分处理光谱信息后利用 BPNN 和 SVM 算法进行建模,可以提高建模精度。MSC 是由 Geladi 等[23]首先提出,用于分离散射介质光谱中物理光散射信息和化学光吸收信息,然后对不同光谱之间的物理散射信息差异进行消除。Zhao 等[24]提出 MSC 和 SNV 校正后的光谱信息是线性相关的,可用来消除由于颗粒分布不均匀及颗粒大小不同产生的散射对光谱的影响。在本研究中,原始光谱信息通过 MSC 和 SNV 两种预处理后结合 RF 算法建模可得到较为精确的反演结果,其模型的训练集和预测集回归拟合的 R2 均在 0.96 以上,RMSE 均在 1.16 以下,同时 MAE 都小于 0.95。王璐等[25]在大豆冠层 SPAD值估算模型的研究中表明,在大豆冠层原始近红外光谱曲线中,优选多元散射校正预处理,并通过 CARS-MLR 模型试验效果较好,模型校正样本和预测样本 SPAD 值的均方根误差分别为 5.67 和 5.94,平均值约为 5.81。赵琨等[13]研究表明,基于标准正态变量预处理方法,最小二乘-支持向量机算法进行建模可准确预测油菜叶片 SPAD 值的空间分布和可视化结果,且其结果优于偏最小二乘模型的建模效果。

  • 图4 不同预处理条件下 RF 模型

  • 注:a 图为原始光谱;b 图为一阶导数;c 图为 SG 平滑;d 图为多元散射标正;e 图为标准正态变量变换。

  • 除了上述 3 种预处理方法,本文还采用了 SG 平滑处理原始光谱信息,SG 平滑法是利用多项式对原始光谱的移动窗口内的数据进行多项式分解并用最小二乘法进行数据拟合,其实质是一种加权平均法。但相比于将原始光谱信息作为模型输入变量,采用 3 种机器学习算法建模,其模型精度均有所下降。已有的研究结果表明,光谱预处理方法直接影响模型的预测效果,不恰当的预处理方法可能会导致模型质量下降[26]。因此,选用恰当的光谱预处理方法非常重要。

  • 3.2 RF 模型优势分析

  • 在光谱遥感监测作物的模型建立过程中,算法的选择是非常关键的步骤,选择一种适宜的算法,可以有效提高模型的预测精度。本文在前人研究的基础上,将 BPNN、RF 和 SVM 3 种机器学习算法的学习性能进行了对比,结果表明,采用 RF 回归算法可取得比 BPNN 和 SVM 算法更为精确的反演结果,这得益于 RF 算法中 2 个随机性的引入,即每棵树的训练样本是随机的、每棵树的训练特征集合也是随机从所有特征中抽取的,使得 RF 具有较好的抗噪声能力,且不易过度拟合。BPNN 在训练的过程中可能存在因网络结构由经验选定,网络结构选择过大,训练中效率不高,出现过拟合现象,网络学习了过多的样本细节导致学习出的模型已不能反映样本内含的规律。SVM 算法的核心问题是确定核函数和相关参数,由于核函数和惩罚因子等参数选择的限制,使其应用和模型精度受到了一定的限制[8],导致模型预测精度下降。

  • 4 结论

  • 本文利用 3 种不同机器学习的算法以不同预处理条件下的烤烟烟叶高光谱信息为模型输入变量训练模型,得到的训练结果与同期测定的烟叶 SPAD 实测值进行拟合比较,最终确定以经 MSC 和 SNV 预处理后的光谱信息作为输入变量,通过连续投影算法筛选出敏感波段,并采用随机森林算法进行建模的模型效果最优。模型为:MSC-SPARF(R2 =0.96,RMSE=1.15,MAE=0.94)和 SNV-SPARF(R2 =0.96,RMSE=1.14,MAE=0.94)。与反向传播神经网络和支持向量机回归算法相比,由随机森林算法构建的模型具有更高的精度。该结果为实现烤烟田间精准化管理提供了理论支撑,也对于监测烤烟长势、预估产量等方面具有重要的意义。

  • 参考文献

    • [1] 丁希斌,刘飞,张初,等.基于高光谱成像技术的油菜叶片SPAD值检测[J].光谱学与光谱分析,2015,35(2):486-491.

    • [2] Hunt E R,Doraiswamy P C,Mcmurtrey J E,et al.A visible band index for remote sensing leaf chlorophyll content at the canopy scale[J].International Journal of Applied Earth Observations & Geoinformation,2013,21(1):103-112.

    • [3] Sonobe R,Sano T,Horie H.Using spectral reflectance to estimate leaf chlorophyll content of tea with shading treatments[J]. Biosystems Engineering,2018,175:168-182.

    • [4] 郭建华,赵春江,王秀,等.作物氮素营养诊断方法的研究现状及进展[J].中国土壤与肥料,2008(4):10-14.

    • [5] Li C C,Ma C Y,Chen P,et al.Machine learning-based estimation of potato chlorophyll content at different growth stageusing UAV hyperspectral data[J].Zemdirbyste-Agriculture,2021,108(2):181-190.

    • [6] 第五鹏瑶,卞希慧,王姿方,等.光谱预处理方法选择研究 [J].光谱学与光谱分析,2019,39(9):2800-2806.

    • [7] 郑煜,常庆瑞,王婷婷,等.基于连续统去除和偏最小二乘回归的油菜SPAD高光谱估算[J].西北农林科技大学学报(自然科学版),2019,47(8):37-45.

    • [8] 王丽爱,马昌,周旭东,等.基于随机森林回归算法的小麦叶片SPAD值遥感估算[J].农业机械学报,2015,46(1):259-265.

    • [9] 李媛媛,常庆瑞,刘秀英,等.基于高光谱和BP神经网络的玉米叶片SPAD值遥感估算[J].农业工程学报,2016,32(16):135-142.

    • [10] 张黎黎,吕霞.基于PROSPECT模型的水稻叶片叶绿素含量估测方法研究[J].农业科技与装备,2021(5):23-25.

    • [11] 张子晗,晏磊,刘思远,等.基于偏振反射模型和随机森林回归的叶片氮含量反演[J].光谱学与光谱分析,2021,41(9):2911-2917.

    • [12] Xin Y,Rui Y C,Yin Y,et al.Winter wheat SPAD estimation from UAV hyperspectral data using cluster-regression methods [J].International Journal of Applied Earth Observation and Geoinformation,2021,105:102618.

    • [13] 赵琨,王珺珂,王楚锋,等.基于高光谱成像技术的油菜SPAD值空间分布预测及最佳测量叶位[J].华中农业大学学报,2018,37(4):78-84.

    • [14] Xue L,Yang L.Deriving leaf chlorophyll content of green-leafy vegetables from hyperspectral reflectance[J].ISPRS Journal of Photogrammetry and Remote Sensing,2009,64(1):97-106.

    • [15] Liu B,Yue Y M,Li R,et al.Plant leaf chlorophyll content retrieval based on a field imaging spectroscopy system[J]. Sensors,2014,14(10):19910-19925.

    • [16] 沈花玉,王兆霞,高成耀,等.BP 神经网络隐含层单元数的确定[J].天津理工大学学报,2008(5):13-15.

    • [17] 李海萍,杜佳琪,唐浩竣.基于随机森林的县域土壤有机碳密度及储量估算[J].中国土壤与肥料,2021(3):1-8.

    • [18] Biau G.Analysis of a random forests model[J].The Journal of Machine Learing Research,2012,13(1):1063-1095.

    • [19] Wu X,Kumar V,Quinlan J R,et al.Top 10 algorithms in data mining[J].Knowledge and Information Systems,2008,14(1):1-37.

    • [20] 陈春玲,金彦,曹英丽,等.基于 GA-BP 神经网络高光谱反演模型分析玉米叶片叶绿素含量[J].沈阳农业大学学报,2018,49(5):626-632.

    • [21] Zhang J,Tian H,Wang D,et al.A novel spectral index for estimation of relative chlorophyll content of sugar beet[J]. Computers and Electronics in Agriculture,2021,184(4):106088.

    • [22] 王克晓,周蕊,李波,等.基于高光谱的油菜叶片SPAD值估测模型比较[J].福建农业学报,2021,36(11):8.

    • [23] Geladi P D,Macdougall D B,Martens H.Linearization andscatter-correction for near-infrared reflectance spectra of meat[J]. Applied Spectroscopy,1985,39(3):491-500.

    • [24] Zhao N,Wu Z,Cheng Y,et al.MDL and RMSEP assessment of spectral pretreatments by adding different noises in calibration/validation datasets[J].Spectrochimica Acta Part A Molecular & Biomolecular Spectroscopy,2016,163:20-27.

    • [25] 王璐,李伟凯,关海鸥,等.基于多维度光谱特征波长提取大豆冠层SPAD值估算模型[J].江苏大学学报(自然科学版),2020,41(3):334-338,372.

    • [26] 吴静珠,李慧,王克栋,等.光谱预处理在农产品近红外模型优化中的应用研究[J].农机化研究,2011,33(3):4.

  • 参考文献

    • [1] 丁希斌,刘飞,张初,等.基于高光谱成像技术的油菜叶片SPAD值检测[J].光谱学与光谱分析,2015,35(2):486-491.

    • [2] Hunt E R,Doraiswamy P C,Mcmurtrey J E,et al.A visible band index for remote sensing leaf chlorophyll content at the canopy scale[J].International Journal of Applied Earth Observations & Geoinformation,2013,21(1):103-112.

    • [3] Sonobe R,Sano T,Horie H.Using spectral reflectance to estimate leaf chlorophyll content of tea with shading treatments[J]. Biosystems Engineering,2018,175:168-182.

    • [4] 郭建华,赵春江,王秀,等.作物氮素营养诊断方法的研究现状及进展[J].中国土壤与肥料,2008(4):10-14.

    • [5] Li C C,Ma C Y,Chen P,et al.Machine learning-based estimation of potato chlorophyll content at different growth stageusing UAV hyperspectral data[J].Zemdirbyste-Agriculture,2021,108(2):181-190.

    • [6] 第五鹏瑶,卞希慧,王姿方,等.光谱预处理方法选择研究 [J].光谱学与光谱分析,2019,39(9):2800-2806.

    • [7] 郑煜,常庆瑞,王婷婷,等.基于连续统去除和偏最小二乘回归的油菜SPAD高光谱估算[J].西北农林科技大学学报(自然科学版),2019,47(8):37-45.

    • [8] 王丽爱,马昌,周旭东,等.基于随机森林回归算法的小麦叶片SPAD值遥感估算[J].农业机械学报,2015,46(1):259-265.

    • [9] 李媛媛,常庆瑞,刘秀英,等.基于高光谱和BP神经网络的玉米叶片SPAD值遥感估算[J].农业工程学报,2016,32(16):135-142.

    • [10] 张黎黎,吕霞.基于PROSPECT模型的水稻叶片叶绿素含量估测方法研究[J].农业科技与装备,2021(5):23-25.

    • [11] 张子晗,晏磊,刘思远,等.基于偏振反射模型和随机森林回归的叶片氮含量反演[J].光谱学与光谱分析,2021,41(9):2911-2917.

    • [12] Xin Y,Rui Y C,Yin Y,et al.Winter wheat SPAD estimation from UAV hyperspectral data using cluster-regression methods [J].International Journal of Applied Earth Observation and Geoinformation,2021,105:102618.

    • [13] 赵琨,王珺珂,王楚锋,等.基于高光谱成像技术的油菜SPAD值空间分布预测及最佳测量叶位[J].华中农业大学学报,2018,37(4):78-84.

    • [14] Xue L,Yang L.Deriving leaf chlorophyll content of green-leafy vegetables from hyperspectral reflectance[J].ISPRS Journal of Photogrammetry and Remote Sensing,2009,64(1):97-106.

    • [15] Liu B,Yue Y M,Li R,et al.Plant leaf chlorophyll content retrieval based on a field imaging spectroscopy system[J]. Sensors,2014,14(10):19910-19925.

    • [16] 沈花玉,王兆霞,高成耀,等.BP 神经网络隐含层单元数的确定[J].天津理工大学学报,2008(5):13-15.

    • [17] 李海萍,杜佳琪,唐浩竣.基于随机森林的县域土壤有机碳密度及储量估算[J].中国土壤与肥料,2021(3):1-8.

    • [18] Biau G.Analysis of a random forests model[J].The Journal of Machine Learing Research,2012,13(1):1063-1095.

    • [19] Wu X,Kumar V,Quinlan J R,et al.Top 10 algorithms in data mining[J].Knowledge and Information Systems,2008,14(1):1-37.

    • [20] 陈春玲,金彦,曹英丽,等.基于 GA-BP 神经网络高光谱反演模型分析玉米叶片叶绿素含量[J].沈阳农业大学学报,2018,49(5):626-632.

    • [21] Zhang J,Tian H,Wang D,et al.A novel spectral index for estimation of relative chlorophyll content of sugar beet[J]. Computers and Electronics in Agriculture,2021,184(4):106088.

    • [22] 王克晓,周蕊,李波,等.基于高光谱的油菜叶片SPAD值估测模型比较[J].福建农业学报,2021,36(11):8.

    • [23] Geladi P D,Macdougall D B,Martens H.Linearization andscatter-correction for near-infrared reflectance spectra of meat[J]. Applied Spectroscopy,1985,39(3):491-500.

    • [24] Zhao N,Wu Z,Cheng Y,et al.MDL and RMSEP assessment of spectral pretreatments by adding different noises in calibration/validation datasets[J].Spectrochimica Acta Part A Molecular & Biomolecular Spectroscopy,2016,163:20-27.

    • [25] 王璐,李伟凯,关海鸥,等.基于多维度光谱特征波长提取大豆冠层SPAD值估算模型[J].江苏大学学报(自然科学版),2020,41(3):334-338,372.

    • [26] 吴静珠,李慧,王克栋,等.光谱预处理在农产品近红外模型优化中的应用研究[J].农机化研究,2011,33(3):4.

  • 《中国土壤与肥料》招聘启事
    关闭