-
土壤电导率反映在一定水分条件下土壤盐分的实际状况,且包含土壤水分及离子组成等丰富信息[1-2]。土壤电导率是衡量土壤盐渍化的重要指标,与土壤盐分含量有极显著的相关关系,土壤电导率的测定更加简单快捷[3-4],对高光谱信息的反应比含盐量更敏感[5-6]。因此利用土壤电导率快速、准确地获取土壤盐分信息在土壤开发利用和土壤盐渍化防治等方面具有重要的意义[7]。随着高光谱遥感技术的产生与发展,高光谱遥感凭借其分辨率高使得不同地物之间较细微的特征差异被区分和识别出来[8-9]。因此,在进行土壤性质的定量半定量研究中,使用光谱特征进行相关研究成为众多学者关注的热点并取得了重要的成果[10-12]。利用土壤电导率和土壤盐分含量建立高光谱数据的偏最小二乘回归(PLSR)模型发现,构建土壤电导率模型的决定系数和均方根差都优于土壤盐分含量[13]。基于盐碱地的基本土壤性质数据集,采用自适应遗传算法确定支持向量机(SVM)模型的最优自由参数。结果表明,与基于线性和Sigmoid的模型相比,采用径向基核函数(RBF)模型的SVM具有更高的精度[14]。不同区域的盐渍化土壤在反射率和光谱曲线形态上均存在明显差异,但优化光谱指数法有效地克服了盐渍化土壤高光谱特征的区域异质性,与盐渍化土壤高光谱特征的相关性一直较好[15]。利用两波段优化算法对简化光谱指数进行波段优化,优化光谱指数对土壤电导率的敏感程度更强[16]。张文文等[17]利用分数阶微分与铜的相关性分析中,发现分数阶微分可以扩大特征波段的选择空间。以博斯腾湖西岸湖滨绿洲为研究区,运用5种数学变换(分数阶微分、平方根、对数、对数倒数、倒数)预处理土壤高光谱数据,并采用不同预处理方式优化4种光谱指数筛选特征波段,利用PLSR和SVM构建土壤电导率和土壤高光谱数据估算模型。
-
1 材料与方法
-
1.1 研究区概况
-
博斯腾湖湖滨绿洲行政区隶属于新疆博湖县,位于新疆焉耆盆地东南部,地理位置介于E 86°15′~86°55′,N 41°45′~42°10′。其是典型的人工绿洲和自然绿洲混合的山前湖泊绿洲,面积为1360km2。湖滨绿洲受到博斯腾湖水域的调节,年平均气温8.2~11.5℃,无霜期175.8~211.3d,年蒸发量1880.0~2785.8mm,年降水量47.7~68.1mm,蒸降比高达40∶1。研究区内土壤类型主要有草甸土、沼泽地、灌耕潮土、盐土、风沙土、棕漠土等,地下水埋深1.0~2.5m,矿化度0.1~10g/L[18]。湖滨植物有芦苇、柽柳等。由于独特的地理位置,干旱的气候荒漠条件,活跃的地表水以及地下水补给,研究区土壤盐分平均含量为2.84g/kg[19]。
-
图1 研究区示意图
-
1.2 土壤样品采集及测定
-
土壤采样时间为2019年5月8日,根据研究区土壤类型的现状,结合研究区的土壤盐分状况,采用GPS定位技术,使采样点尽可能遍及研究区范围内的主要土地利用类型,考虑采样点的水文地貌条件、植被覆盖类型以及土壤盐渍化程度等因素,选取11个样点进行土壤采集,每个样点采用分层随机取样的方法,每1层随机采集,3次重复,对0~50cm的土壤进行人工分层,每个样本点按10cm为1层,共采集165个样本。将每层重复的样本进行混合,共有55个样本,利用55个样本进行不同深度的模型构建。将土壤样品带回实验室经过前期处理自然风干后除去枯枝、残叶等杂质,磨碎过2mm网筛后,分装自封袋,用于后续土壤电导率测定和光谱采集,土壤电导率测定按照5∶1的水土浸提液比例进行配置,并用电导仪测定浸提液25℃时的电导率(EC,mS/cm)。从55个代表性的土壤样品中按照土壤电导率值大小的顺序先选3个为建模数据,下一个为验证数据,以此类推,共选取41个样本作为建模集,剩下14个样本作为验证集,如表1所示。
-
土壤光谱测定采用ASD FieldSpec3便携式地物光谱仪,波段范围为350~2500nm,光谱采样间隔在350~1000、1000~2500nm波段分别为1.38、2nm,光谱仪最后数据重采样间隔为1nm。野外测量需要选择晴朗无风的天气,采集光谱前对光谱仪白板校正,且校正间隔控制在5min[20],每个土壤样品重复测量20条光谱曲线,取其平均值作为此样本的光谱数据。对均值处理后的光谱曲线去除水分吸收带波段,对去除干扰波段的光谱曲线用Savitzky-Golay滤波方法进行平滑处理。
-
1.3 数据处理与研究方法
-
1.3.1 分数阶微分
-
分数阶微分是将整数阶微分的阶数扩展至任意阶。目前,Grünwald-Letnikov[21-23]定义的分数阶微分较为常用,主要是应用一元函数差分来实现,表达式为:
-
式中 V—阶数,Γ()—Gamma函数,λ—对应的值,n—微分上下限之差。
-
1.3.2 偏最小二乘回归
-
采用偏最小二乘回归(PLSR)方法进行建模及验证,PLSR方法融合主成分分析、典型相关分析和多元线性回归分析[18]。在多元线性回归里采用逐步回归,逐步分解输入变量矩阵和输出变量矩阵,并综合考虑提取的主成分对输入变量矩阵和输出变量矩阵的解释能力,直到满足性能要求为止。建模和验证的精度分别用决定系数RC 2、RV 2,均方根误差RMSEC、RMSEV [24]体现。决定系数用来判定建模的稳定程度,越接近1说明模型越稳定;RMSE用来说明模型的准确度,值越小表示模型的精度越高[25]。
-
1.3.3 支持向量机
-
支持向量机(SVM) 是Cortes和Vapnik于1995年首先提出来的用于解决函数拟合的问题, SVM一般用于分类和回归两种情况[26]。SVM应用于回归拟合时,是寻找一个最优分类面使得所有训练样本离该最优分类面的误差最小,控制SVM回归的参数主要有惩罚参数c、不灵敏损失参数 ε、核函数类型和核函数参数[27]。已有学者研究表明,径向基核函数在土壤盐渍化反演模型中效果更好[28]。因此,本研究基于高光谱数据的土壤电导率估算模型进行回归分析,选择径向基作为核函数,采用训练交叉验证进行参数寻优。
-
1.3.4 光谱指数
-
根据研究区土壤盐分离子状况结合前人的研究结果,采用比值盐分指数(RSI,Ratio salt indices)、差值光谱指数(DSI,Difference spectral indices)、亮度光谱指数(BSI,Brightness spectral indices)、归一化光谱指数(NDSI,Normalized difference spectral indices)[16]进行研究分析。Ri 和Rj 是土壤盐分离子在第i波段和第j波段的土壤光谱反射率。根据全光谱第i波段和第j波段的所有组合计算二维相关系数,绘制形成光谱系数矩阵图。光谱指数计算公式:
-
2 结果与分析
-
2.1 分数阶微分光谱反射率与土壤电导率的相关性
-
由图2可知,通过分数阶微分光谱反射率与土壤电导率进行P=0.01极显著性检验的相关性分析。0.6~0.8阶波段通过极显著性检验的波段数从7增加到95个;1~2阶特征波段与土壤电导率的相关性在正负值之间波动,特征波段分布较相似。0~0.4阶波段相关性值在350~750和1450~1600nm波段随着阶数的增加,相关系数有逐渐增加的趋势,0.4阶只有2个波段通过极显著性检验,相关系数分别为-0.48、-0.36;0~0.2阶没有通过极显著性检验的波段。
-
图2 0~2阶分数阶微分变换下的光谱反射率与土壤电导率的相关性分析
-
统计0~2阶微分通过P=0.01极显著检验的相关系数绝对值最大值及其对应波段,由表2可知,0.4~2阶通过0.01显著性水平的分数阶微分中,2阶的特征波段数量最多,为335。相关性值随着阶数的增加,特征波段数量呈现增加的趋势。相关系数绝对值最大值随着阶数的增加,呈现增加-减少-增加的趋势,2阶的相关系数绝对值最大,为0.64。0.4~2阶的相关系数绝对值对应的特征波段分布为1402、2402、2182、 1937nm。
-
2.2 基于分数阶微分-光谱指数的土壤电导率筛选特征波段
-
采用分数阶微分-光谱指数筛选特征波段,防止数据冗余,以0阶( 原始数据)、0.8阶为例(图3和图4)。随着阶数的增加,光谱矩阵系数图中黑色分布范围越大,表明相关系数在正负值之间波动较大。在0阶NDSI的相关系数绝对值最大为0.64;在0.2阶NDSI的相关系数绝对值最大为0.67;在0.4阶NDSI的相关系数绝对值最大为0.68;在0.6阶的NDSI的相关系数绝对值最大为0.71;在0.8阶DSI的相关系数绝对值最大为0.75;在1阶NDSI的相关系数绝对值最大为0.74; 在1.2阶的DSI的相关系数绝对值最大为0.74;在1.4阶RSI的相关系数绝对值最大为0.73; 在1.6阶DSI的相关系数绝对值最大为0.74;在1.8阶的DSI的相关系数绝对值最大为0.73;在2阶DSI的相关系数绝对值最大为0.74。筛选出4种高光谱数据变化相关性光谱指数较高的光谱矩阵系数图(图5),平方根在DSI的相关系数绝对值最大为0.64;对数(lgR)在DSI的相关系数绝对值最大为0.64;对数倒数(1/lgR)在NDSI的相关系数绝对值最大为0.62;倒数(1/R)在NDSI的相关系数绝对值最大为0.64。可见,0~2阶分数阶微分的相关系数绝对值最大值比4种高光谱数据变化的相关系数绝对值最大值大0.11,可见,分数阶微分能更好地挖掘波段信息。
-
图3 电导率与光谱反射率的0阶光谱矩阵系数图
-
图4 电导率与光谱反射率的0.8阶光谱矩阵系数图
-
图5 土壤电导率与不同高光谱数据变化下的光谱矩阵系数图
-
利用原始数据及5种高光谱数据变化与土壤电导率经过光谱指数筛选出较好的相关性,由表3可知, 0.8阶微分、平方根、对数的最优光谱指数是DSI; 原始数据、对数倒数、倒数的最优光谱指数是NDSI,其相关性绝对值最大值大小对应变换顺序为0.8阶微分> 原始数据> 平方根> 对数> 倒数> 对数倒数,因此,分数阶微分预处理对于提高优化光谱指数与土壤电导率的相关性具有一定作用。相关系数绝对值最大值对应波段组合,0.8阶微分波段集中在可见光部分;平方根波段集中在1830nm;原始数据、对数、对数倒数、倒数的波段集中在2000~2100nm。
-
注:R,原始数据;0.8Order,0.8阶微分;,平方根;lgR,对数; 1/lgR,对数倒数;1/R,倒数。下同。
-
2.3 基于分数阶微分-光谱指数的土壤电导率模型构建
-
采用PLSR和SVM对土壤电导率高光谱数据进行建模。由表4可知,建模集误差相对较大的是原数据和对数,分别达到7.38和9.58,建模集较优的是0.8阶微分和对数倒数,模型精度RC 2=0.83和0.85;验证集较优的是对数RV 2=0.96,RMSEV=1.12,通过分析建模集和验证集的精度和误差,发现基于0.8阶微分光谱变换和DSI进行波段优化运算后,筛选的优化指数[x1=DSI(634,673)、x2=DSI(634,682)、 x3=DSI(1996,2011)、x4=DSI(1997,2001)、 x5=DSI(1998,2001)、x6=DSI(634,2228)、 x7=DSI(593,2253)、x8=DSI(595,2253)、x9=DSI(596,2253)、x10=DSI(598,2253)、 x11=DSI(599,2253)、x12=DSI(600,2253)、 x13=DSI(601,2253)、x14=DSI(606,2253)、 x15=DSI(607,2253)、x16=DSI(609,2253)、 x17=DSI(602,2253)、x18=DSI(604,2253)、 x19=DSI(579,2253)] 为自变量建立的模型最佳,模型公式为:Y=3.05-6571.58x1-5126.74x2+ 2757.50x3+3654.55x4+761.07x5-7553.53x6-5850.75x7-38.34x8+8862.43x9+9427.01x10+33987.79x11-7853.02x12-22900.3x13-3513.78x14+1741.29x15-1931.01x16+2788.85x17-4108.78x18+3656.37x19。由表5可知,利用SVM构建的土壤电导率估算模型中,建模集较优的是0.8阶微分和lgR,建模精度分别为RC 2=0.89和RC 2=0.91;验证集模型精度最佳的是0.8阶微分,建模精度为RV 2=0.80。分析验证集和建模集可知,0.8阶微分和DSI筛选的特征波段构建的SVM模型效果较优。
-
3 讨论
-
博斯腾湖西岸湖滨绿洲土壤高光谱分析已有大量研究,涉及到不同盐渍化程度的光谱反射分析[19],采用MSR和PLSR对土壤盐分含量进行建模[11],芦苇地土壤盐分特征高光谱分析[29]等方面,但是基于土壤电导率和土壤高光谱数据,利用分数阶微分优化光谱指数进行特征波段筛选的分析鲜有报道。分数阶微分对于高光谱波段数量多、信息量大的数据,能够较好地挖掘潜在信息,本文中0.8阶微分,通过PLSR和SVM建立的模型都优于其他数据变化建立的模型,此研究结果与亚森江·喀哈尔等[16]研究结果基本一致。从分数阶微分的一维相关性和二维光谱指数的相关性分析,发现分数阶微分的Pearson相关性随着阶数的增加,通过显著性检验的特征波段数量增加,相关系数值也增加,分数阶微分优化光谱指数发现与采用一维相关性展现相似现象,且二维的相关系数绝对值最大值大于一维的相关性值,此研究结果与吾木提·艾山江等[30]研究结果基本一致。采用合适的数学变换对高光谱数据进行预处理,在一定程度上能提高其相关性,分数阶微分凭借其记忆性和非局部性,总体上优于传统预处理方法,并且采用光谱指数和分数阶微分筛选特征波段较传统方法更具有明显的优势[10,30]。利用分数阶微分优化光谱指数构建的土壤电导率估算模型在干旱区绿洲的适用性,有待进一步研究。
-
4 结论
-
分数阶微分的高光谱数据与土壤电导率的相关性:2阶的特征波段数量最多为335,相关系数绝对值最大值为0.64。0~2阶相关系数绝对值最大值对应的特征波段分布在1402、2402、2182、 1937nm。
-
基于分数阶微分优化光谱指数与土壤电导率之间的显著相关性,0.8阶DSI的相关系数绝对值最大为0.75,0阶相关系数绝对值最大值为0.64。随着分数阶微分阶数的增加,光谱矩阵系数图中黑色分布范围越大,表明相关系数在正负值之间波动较大; 4种不同数学变化相关性提升效果不明显,平方根、对数、倒数的相关系数绝对值最大为0.64。
-
利用PLSR和SVM构建土壤电导率估算模型,基于0.8阶微分和DSI筛选的特征波段构建的土壤电导率估算效果较好,PLSR估算模型表达式为:Y=3.05-6571.58x1-5126.74x2+2757.50x3+ 3654.55x4+761.07x5-7553.53x6-5850.75x7-38.34x8+8862.43x9+9427.01x10+33987.79x11-7853.02x12-22900.3x13-3513.78x14+1741.29x15-1931.01x16+2788.85x17-4108.78x18+3656.37x19,模型精度为RPLSRc 2=0.83,RMSEPLSRc=1.95,RPLSRv 2=0.78, RMSEPLSRv=2.57;SVM估算模型精度为RSVMc 2=0.89, RMSESVMc=0.03,RSVMv 2=0.80,RMSESVMv=1.12;SVM构建的土壤电导率估算模型最优。
-
参考文献
-
[1] 王彤,封超年,靳瑞萍,等.苏北滨海盐碱土壤盐碱化特征 [J].江苏农业科学,2018,46(19):339-343.
-
[2] Terry N,Day-Lewis F D,Werkema D,et al.MoisturEC:A new R program for moisture content estimation from electrical conductivity data[J].Groundwater,2018,56(5):823-831.
-
[3] 樊会敏,张蓉蓉,许明祥,等.渭北地区土壤剖面电导率年内动态变化及影响因素[J].西北农林科技大学学报(自然科学版),2018,46(8):107-115.
-
[4] 许尔琪,张红旗,许咏梅.伊犁新垦区土壤全盐量和电导率定量关系探讨[J].资源科学,2012,34(6):1119-1124.
-
[5] 李相,丁建丽,侯艳军,等.干旱半干旱区土壤含盐量和电导率高光谱估算[J].冰川冻土,2015,37(4):1050-1058.
-
[6] 王涛,喻彩丽,张楠楠,等.基于去包络线和连续投影算法的枣园土壤电导率光谱检测研究[J].干旱地区农业研究,2019,37(5):193-199,217.
-
[7] Jin P B,Li P H,Wang Q,et al.Developing and applying novel spectral feature parameters for classifying soil salt types in arid land[J].Ecological Indicators,2015,54:116-123.
-
[8] Srivastava R,Sethi M,Yadav R K,et al.Visible-near infrared reflectance spectroscopy for rapid characterization of salt-affected soil in the Indo-Gangetic Plains of Haryana,India[J].Journal of the Indian Society of Remote Sensing,2017,45(2):307-315.
-
[9] 朱赟,申广荣,王紫君,等.土壤修复过程中盐含量及其光谱特征分析研究[J].光谱学与光谱分析,2017,37(5):1507-1513.
-
[10] 张贤龙,张飞,张海威,等.基于光谱变换的高光谱指数土壤盐分反演模型优选[J].农业工程学报,2018,34(1):110-117.
-
[11] 李志,李新国,刘彬,等.博斯腾湖西岸湖滨带土壤盐分高光谱反演[J].扬州大学学报(农业与生命科学版),2019,40(2):33-39.
-
[12] 陈思明,邹双全,毛艳玲,等.土壤光谱重建的湿地土壤有机质含量多光谱反演[J].光谱学与光谱分析,2018,38(3):912-917.
-
[13] 李娟,陈超,王昭.基于不同变换形式的干旱区土壤盐分高光谱特征反演[J].水土保持研究,2018,25(1):197-201.
-
[14] Elbisy M S.Support vector machine and regression analysis to predict the field hydraulic conductivity of sandy soil[J].KSCE Journal of Civil Engineering,2015,19(7):2307-2316.
-
[15] Nawar S,Buddenbaum H,Hill J.Estimation of soil salinity using three quantitative methods based on visible and near-infrared reflectance spectroscopy:a case study from Egypt[J].Arabian Journal of Geosciences,2015,8(7):5127-5140.
-
[16] 亚森江·喀哈尔,杨胜天,尼格拉·塔什甫拉提,等.基于分数阶微分优化光谱指数的土壤电导率高光谱估算[J].生态学报,2019,39(19):7237-7248.
-
[17] 张文文,杨可明,夏天,等.光谱分数阶微分与玉米叶片重金属铜含量的相关性分析[J].科学技术与工程,2017,17(25):33-38.
-
[18] 李志,李新国,毛东雷,等.博斯腾湖西岸湖滨带不同植被类型土壤剖面盐分特征分析[J].西北农业学报,2018,27(2):260-268.
-
[19] 李新国,李和平,任云霞,等.开都河流域下游绿洲土壤盐渍化特征及其光谱分析[J].土壤通报,2012,43(1):166-171.
-
[20] 刘克,赵文吉,郭逍宇,等.基于地面实测光谱的湿地植物全氮含量估算研究[J].光谱学与光谱分析,2012,32(2):465-471.
-
[21] 林世敏,许传炬.分数阶微分方程的理论和数值方法研究 [J].计算数学,2016,38(1):1-24.
-
[22] 张绍阳,解源源,张鑫,等.基于分数阶微分的模糊交通视频图像增强[J].光学精密工程,2014,22(3):779-786.
-
[23] Tarasov V E.On chain rule for fractional derivatives[J]. Communications in Nonlinear Science and Numerical Simulation,2016,30(1-3):1-4.
-
[24] 王圆圆,贵才,张立军,等.利用偏最小二乘回归从冬小麦冠层光谱提取叶片含水量[J].光谱学与光谱分析,2010,30(4):1070-1074.
-
[25] Song L,Jian J,Tan D J,et al.Estimate of heavy metals in soil and streams using combined geochemistry and field spectroscopy in Wan-sheng mining area,Chongqing,China[J].International Journal of Applied Earth Observation and Geoinformation,2015,34:1-9.
-
[26] Chang C C,Lin C J.Training v-support vector regression:theory and algorithms[J].Neural Computation,2002,14(8):1959-1977.
-
[27] Shahraiyni H,Ghafouri M,Shouraki S,et al.Comparison between active learning method and support vector machine for runoff modeling[J].Journal of Hydrology and Hydromechanics,2012,60(1):16-32.
-
[28] 池涛,曹广溥,李丙春,等.基于高光谱数据和SVM方法的土壤盐渍度反演[J].山东农业大学学报(自然科学版),2018,49(4):585-590.
-
[29] 宋梦洁,李新国.博斯腾湖西岸湖滨绿洲芦苇地土壤盐分特征高光谱分析[J].扬州大学学报(农业与生命科学版),2016,37(1):75-81.
-
[30] 吾木提·艾山江,买买提·沙吾提,马春玥.基于分数阶微分和连续投影算法-反向传播神经网络的小麦叶片含水量高光谱估算[J].激光与光电子学进展,2019,56(15):251-259.
-
摘要
以博斯腾湖湖滨绿洲为研究区,采用分数阶微分对光谱指数进行波段优化,筛选高光谱数据的特征波段,利用偏最小二乘回归(PLSR)和支持向量机(SVM)构建土壤电导率高光谱数据的估算模型。研究结果表明:(1)分数阶微分的高光谱数据与土壤电导率的相关性:随着分数阶微分阶数的增加,特征波段数呈现逐渐增加的趋势,2 阶是特征波段数量最多的阶数,特征波段数量为 335(P=0.01),相关系数绝对值最大为 0.64。(2)分数阶微分优化光谱指数的高光谱数据:随着分数阶微分阶数的增加,光谱矩阵图表现为相关系数在正负值之间波动较大,0.8 阶在光谱指数 DSI 的相关系数绝对值最大为 0.75;平方根、对数、倒数的相关系数绝对值最大为 0.64。(3)基于 PLSR 和 SVM 构建土壤电导率估算模型:基于 0.8 阶微分和光谱指数 DSI 筛选的特征波段建立的估算模型估算效果较好,其中 SVM 构建的估算模型最优,模型精度为 RSVMc 2 =0.89, RMSESVMc=0.03,RSVMv 2 =0.80,RMSESVMv=1.12。利用 SVM 估算模型可以有效地对研究区土壤电导率进行定量估算。
Abstract
Taking the oasis of lake Bosten Lake as the research area,the spectral index was optimized by fractional differential,the characteristic bands of the hyperspectral data were screened,and the estimation model of the soil conductivity hyperspectral data was constructed by partial least square regression(PLSR)and support vector machine (SVM).The results show that:(1)The correlation between the fractional-order differential hyperspectral data and soil conductivity showed that as the fractional-order differential order increased,the number of characteristic bands gradually increased.The second order was the order with the largest number of characteristic bands,the number of characteristic bands is 335(P=0.01),and the maximum absolute value of the correlation coefficient was 0.64.(2)The hyperspectral data of the fractional differential optimtzation spectral index shows that with the increase of the fractional-order differential order,the spectral matrix chart showed that the correlation coefficient fluctuated greatly between positive and negative values,and the absolute value of the correlation coefficient of the 0.8 order the spectral index DSI was the maximum 0.75.The maximum absolute value of the correlation coefficient of the square root,the logarithm,and the reciprocal was 0.64.(3)The soil conductivity estimation model was constructed based on PLSR and SVM.The estimation model based on characteristic bands selected by the 0.8 order differential and spectral index DSI had a good estimation effect.The estimation model constructed by SVM was the best,and the model accuracy was RSVMc 2 =0.89,RMSESVMc=0.03,RSVMv 2 =0.80, RMSESVMv=1.12.The SVM estimation model could be used to quantitatively estimate the soil conductivity in the study area.