-
土壤盐分是土壤盐渍化程度的重要指标,快速、准确地获取盐渍化土壤的盐分信息,对于资源的合理利用和可持续发展都具有重要意义[1-3]。西北地区干旱少雨和强烈的蒸散发,使土壤中的易溶性盐分随地表水向上运移到土壤表层积累而形成大面积盐渍化区域,影响着绿洲农业的发展[4-5]。目前国内外众多学者利用高光谱技术研究分析土壤理化参数,已经取得一定进展[6-8]。Dehaan等[9]利用土壤和植被的光谱信息研究土壤盐渍化的空间分布特征。也有研究通过选取特征波段建立统计分析模型和机器学习模型反演土壤盐分含量,并取得良好的估算效果[10-13]。瞿明凯等[14]通过地理加权回归(Geographically weighted regression,GWR) 在土壤和环境科学上的应用,表明GWR模型将数据空间位置嵌入线性回归模型中,可以探测空间关系的非平稳性,应用前景广泛。赵明松等[15]使用GWR模型对土壤有机质进行空间建模,结果表明GWR模型要优于普通克里格插值法。袁婕等[16]使用GWR模型结合高光谱数据进行盐生植物叶片盐离子含量的反演,结果表明盐离子含量估算具有较高精度。使用传统的建模方法时,默认每个取样点的环境因素与反射率的影响相同,即建模系数相同[17-18]。基于空间要素构建基于GWR模型的土壤表层盐分含量定量反演,阐明土壤盐分含量与光谱参数间的相关关系,可以为区域土壤盐分监测与估算、土壤资源的可持续利用提供方法支撑。
-
1 研究区概况
-
博斯腾湖湖滨绿洲位于新疆焉耆盆地东南部,行政区划隶属于新疆博湖县,地理范围为41°45′~42°10′N,86°15′~86°55′E,是自然绿洲和人工绿洲之间的过渡区域,为典型山前湖泊绿洲,面积1360km2[19]。年平均气温达9.0℃,无霜期约为200d,年均蒸发量高于2000mm,年均降水量83.5mm,蒸降比最高可达40∶1[20]。研究区的土壤类型主要为沼泽土、灌耕潮土、草甸土、棕漠土、风沙土以及盐土,自然植被主要有芦苇、杨树、柽柳等,地下水平均埋深超过2.0m。由于其地理位置独特,地表蒸发强烈且降水稀少,地表水活跃以及地下水的补给,土壤母质富含盐分,土壤盐分平均含量为2.84g·kg-1,土壤盐分类型主要为硫酸盐型和氯化物型[21-22]。
-
2 数据采集与处理
-
2.1 土样采集与预处理
-
根据研究区土壤盐分状况,采用GPS定位技术,结合研究区土壤类型和土地利用现状以及植被覆盖类型等因素布设采样点,在每一采样点采集5份表层土壤(0~10cm),采用五点法采样并混合均匀后,将样品装袋,共采集32个样点,土壤样品采集于2019年5月4日,利用手持GPS记录采样点坐标。将土壤样品带回实验室在室温条件下自然风干,剔除土壤杂质,物理研磨后过2mm孔径筛,分装自封袋中用于土壤盐分测定和土壤高光谱采集。
-
图1 研究区采样点示意图
-
将预处理后的土样按水土比为5∶1配置成土壤溶液,采用残渣烘干法测定土壤盐分含量[23],最终获得32个土壤含盐量数据样本。将32个数据样本按照土壤含盐量高低排列,采用等距抽样,每间隔3个选取1个数据作为检验样本,共选取8个样本作为检验集,其余24个样本作为建模集。从表1可知,土壤样品盐分含量平均值为7.535g·kg-1,变异系数为56.674%,呈中等变异性。
-
采用ASD FieldSpec3地物光谱仪进行光谱采集,仪器波长范围为350~2500nm,在350~1000、1000~2500nm范围内光谱采样间隔分别为1.38和2nm。选择晴朗无风的天气,在12: 00~14:00进行光谱测量,将光谱仪探测头垂直放置在土样上方约15cm处,每个土样测量10次,每间隔5min进行一次暗电流采集,每间隔10min参照白板优化定标[24]。
-
2.2 光谱变换与盐分指数构建
-
取均值后的光谱曲线去除水分吸收带波段1351~1420、1801~1975、2451~2500nm[25],对去除干扰波段的光谱曲线用Savitzky-Golay滤波方法进行平滑处理。赵振亮等[26]采用原始光谱反射数据的17种变换结合相关分析,构建土壤pH和EC的快速预测方程。丁建丽等[27]以新疆渭干河-库车河三角洲绿洲为研究区监测土壤盐渍化,结果表明采用比值型指数、归一化型指数、差值型指数可以准确提取土壤状况信息。本文将土壤高光谱反射率R进行17种数学光谱变换,变换形式如图2。土壤高光谱反射率R构建两类差值型盐分指数 (Difference salinity index,DSI),为两个波段之和 (DSI1)与两个波段之差(DSI2)、比值型盐分指数(Ratio salinity index,RSI)、归一化型盐分指数 (Normalized difference salinity index,NDSI)、3种盐分指数选取特征波段[16,25,27]。
-
式中,和为波段p和q获取的反射率。
-
图2 光谱变换
-
2.3 模型方法
-
地理加权回归模型(GWR)是对普通线性回归模型(OLR)进行空间扩展,将样点数据的地理位置嵌入到回归模型参数中,使得参数可以进行局部估计[14]。模型函数表示为:
-
式中,为样点的因变量;为回归的常数项,为第个样点的经纬度坐标;为第个样点的第个回归参数;为第个样点上第个变量的观测值;是第个样点的随机误差。
-
为了使接近位置的观察数据比远离的数据对估计有更多的影响,利用加权最小二乘法来估计参数,得:
-
式中,是的估计值,为的空间权重矩阵,m为在样点 i 局部回归中的观测值数量,X 为自变量矩阵,Y 为因变量矩阵。
-
空间权重矩阵是地理加权回归模型(RWG)的核心,本文选择高斯(Gauss)函数法,可以克服空间权函数不连续的缺点,函数形式如下:
-
式中,Wij 为已知点 j 估计待测点 i 时的权重,dij 为估算点 i 与样点 j 间的欧氏距离,h 为带宽。其中,带宽 h 越小,权重随着距离的增加衰减越快;带宽 h 越大,权重随着距离的增加衰减越慢,由最小赤池信息量准则(AIC)进行确定[28]。
-
3 结果与分析
-
3.1 光谱变换特征波段选择
-
由图2可知,R、、lgR 3种变换与土壤盐分含量的相关系数曲线整体变化趋势相似,根据简便性原则,仅从R中选取特征波段进行建模;由于(lgR)′与[lg(1/R)]′、(lgR)″与[lg(1/R)]″ 互为相反数,为避免数据冗余,这里仅从(lgR)′ 和(lgR)″选取特征波段进行建模。波段选取原则为:在32个样本、置信水平为0.01的条件下,相关系数大于0.449能够通过相关性显著检验,因此,选取相关系数大于0.449的最优4条波段。1/R光谱变换与土壤盐分的相关系数未达到0.449,将不再继续对1/R光谱变换进行讨论。
-
从表2可知,一阶、二阶微分变换的特征波段主要集中在466~482、1669~1728、 1979~2371nm;一阶、二阶微分的相关系数整体高于光谱反射率R,说明光谱变换对土壤表层盐分含量与光谱相关性有提高作用。
-
3.2 盐分指数特征波段选择
-
二维相关系数图能够将土壤盐分含量和光谱数据之间的相关性进行可视化表达。利用DSI、RSI、 NDSI分别建立光谱反射率与土壤盐分含量的二维相关系数图,选择相关系数最优的两条波段为特征波段,进行模型构建选择。
-
从图3和表3可知,构建盐分指数选取特征波段时,特征波段主要集中在1700~1728、1992~2014、2375~2405nm的近红外区域,相关系数绝对值最大为0.824。
-
3.3 GWR建模对比分析
-
通过光谱变换、构建盐分指数与盐分的相关性,选取相关系数最高的4条特征波段,建立GWR模型,并与偏最小二乘回归模型(Partial least squares regression,PLSR) 的判定系数(R2) 和均方根误差(RMSE)进行对比,R 2越大,RMSE 越小,模型的精度越高; 反之,模型越不稳定。另外,PLSR模型用 RPD 检测模型的预测能力,RPD ≥ 2表明模型具有极好的预测能力, 1.4 ≤ RPD<2表明模型对样本可进行粗略估计, RPD<1.4则表明模型无法估计样本[29]。
-
由表4和图4可知,采用GWR模型构建盐分指数DSI1优选特征波段建立的估算模型,R 2=0.934,光谱反射率R的 R 2=0.621,说明利用盐分指数选取特征波段可以提高GWR模型的建模精度。使用PLSR模型光谱变换R′的 R 2=0.778,RPD=1.910,光谱反射率R的 R 2=0.495,且RPD<1.400,说明光谱变换可以提高PLSR模型的建模精度。
-
从图5可知,采用GWR模型进行检验,DSI1选取的特征波段建立的估算模型 R 2=0.915,盐分指数选取特征波段建立的估算模型效果更佳;RSI、R″和DSI2建立的估算模型 R 2均大于0.800,拟合效果良好。从图6可知,对于PLSR模型,NDSI选取的特征波段建立的估算模型 R 2最大为0.790,RPD 为1.873。
-
图3 土壤盐分含量与盐分指数二维相关系数
-
续表
-
图4 基于不同模型的建模集土壤盐分实测值和估算值
-
图5 基于GWR模型的最优实测值与估算值检验
-
图6 基于PLSR模型的最优实测值与估算值检验
-
4 讨论
-
已有大量的利用高光谱估算土壤盐分研究,采用分数阶微分建立偏最小二乘回归模型[19],基于光谱变换的高光谱指数进行偏相关关系分析[25],建立多元线性回归和主成分回归的土壤含盐量高光谱反演[30]等。本文将土壤表层含盐量高光谱反射率采用17种数学光谱变换和构建盐分指数优选特征波段,建立GWR模型估算土壤盐分含量。光谱变换后与土壤盐分在近红外波段的相关性大于其他波段,这与Zhang等[31]研究新疆渭干河绿洲的地表盐渍化土壤,发现近红外波段与土壤盐分含量相关性最大的结果基本一致。光谱变换和构建盐分指数优选特征波段可以提高模型建模集和检验集精度,与张贤龙等[25]基于光谱变换的高光谱指数土壤盐分反演的研究结果基本一致。考虑到地理要素的差异和空间异质性,GWR模型将不同取样点代入相应系数即加入空间坐标信息进行分析,采用GWR模型对研究区进行高光谱定量估算土壤表层盐分含量取得较好的效果。由于样本数量不够多,可能影响模型精度;此外,样本是物理研磨后过2mm孔径筛,再进行光谱测量,与实地土壤环境存在差异。可尝试进行实地光谱测量,构建土壤含盐量估算的GWR模型,进一步研究该模型在不同样本数量、不同条件下的普适性。
-
5 结论
-
土壤盐分含量平均值为7.535g·kg-1,变异系数为56.674%,呈中等变异性。土壤高光谱变换优选特征波段主要集中在466~482、1669~1728、 1979~2371nm;构建3种盐分指数优选的特征波段集中在1700~1728、1992~2014、 2375~2405nm。
-
采用PLSR模型,盐分指数RSI的R2=0.823, RPD=2.166,光谱变换R′的 R 2=0.778,RPD=1.910,光谱反射率R的 R 2 仅为0.495,且RPD<1.400; 采用GWR模型,盐分指数DSI1的 R 2=0.934,光谱变换R′的 R 2=0.865,光谱反射率R的 R 2 仅为0.621。
-
盐分指数DSI1优选特征波段建立GWR模型为最优模型,建模精度 R 2 为0.934,RMSE 为1.186; 检验精度 R 2 为0.915,RMSE 为0.917。
-
参考文献
-
[1] 丁建丽,王飞.干旱区大尺度土壤盐度信息环境建模:以新疆天山南北中低海拔冲积平原为例[J].地理学报,2017,72(1):64-78.
-
[2] 李二焕,胡海波,鲁小珍,等.苏北滨海盐土区土壤盐分剖面特征及其理化特性[J].水土保持研究,2016,23(4):116-119,127.
-
[3] 李娟,陈超,王昭.基于不同变换形式的干旱区土壤盐分高光谱特征反演[J].水土保持研究,2018,25(1):197-201.
-
[4] Wang Y G,Deng C Y,Liu Y,et al.Identifying change in spatial accumulation of soil salinity in an inland river watershed,China[J].Science of the Total Environment,2018,621:177-185.
-
[5] 刘丽娟,李小玉.干旱区土壤盐分积累过程研究进展[J]. 生态学杂志,2019,38(3):891-898.
-
[6] 徐明星.江苏沿海滩涂地区典型剖面土壤性质演化及其高光谱响应研究[D].南京:南京大学,2011.
-
[7] 王昶,黄驰超,余光辉,等.近红外光谱结合偏最小二乘法快速评估土壤质量[J].土壤学报,2013,50(5):881-890.
-
[8] Srivastava R,Sethi M,Yadav R K,et al.Visible-near infrared reflectance spectroscopy for rapid characterization of salt-affected soil in the Indo-Gangetic Plains of Haryana,India[J].Journal of the Indian Society of Remote Sensing,2017,45(2):307-315.
-
[9] Dehaan R L,Taylor G R.Field-derived spectra of salinized soils and vegetation as indicators of irrigation-induced soil salinization [J].Remote Sensing of Environment,2002,80(3):406-417.
-
[10] 朱赟,申广荣,项巧巧,等.基于不同光谱变换的土壤盐含量光谱特征分析[J].土壤通报,2017,48(3):560-568.
-
[11] 李晓明,王曙光,韩霁昌.基于PLSR的陕北土壤盐分高光谱反演[J].国土资源遥感,2014,26(3):113-116.
-
[12] 李志,李新国,刘彬,等.博斯腾湖西岸湖滨带土壤盐分高光谱反演[J].扬州大学学报(农业与生命科学版),2019,40(2):33-39.
-
[13] 厉彦玲,赵庚星,常春艳,等.OLI 与HSI影像融合的土壤盐分反演模型[J].农业工程学报,2017,33(21):173-180.
-
[14] 瞿明凯,李卫东,张传荣,等.地理加权回归及其在土壤和环境科学上的应用前景[J].土壤,2014,46(1):15-22.
-
[15] 赵明松,刘斌寅,卢宏亮,等.基于地理加权回归的地形平缓区土壤有机质空间建模[J].农业工程学报,2019,35(20):102-110.
-
[16] 袁婕,张飞,葛翔宇,等.地理加权回归模型结合高光谱反演盐生植物叶片盐离子含量[J].农业工程学报,2019,35(10):115-124.
-
[17] 江振蓝,杨玉盛,沙晋明.GWR 模型在土壤重金属高光谱预测中的应用[J].地理学报,2017,72(3):533-544.
-
[18] Fotheringham A S,Charlton M,Brunsdon C.The geography of parameter space:an investigation of spatial non-stationarity[J]. Geographical Information Systems,1996,10(5):605-627.
-
[19] 赵慧,李新国,靳万贵,等.博斯腾湖西岸湖滨绿洲土壤含盐量高光谱估算[J].中山大学学报(自然科学版),2020,59(4):56-63.
-
[20] 李新国,李和平,任云霞,等.开都河流域下游绿洲土壤盐渍化特征及其光谱分析[J].土壤通报,2012,43(1):166-170.
-
[21] 梁东,李新国,阿斯耶姆·图尔迪,等.博斯腾湖西岸湖滨带土壤剖面盐分特征分析[J].干旱地区农业研究,2014,32(4):151-158.
-
[22] 李新国,樊自立,李会志,等.开都河下游灌区土壤盐渍化特征分析[J].干旱地区农业研究,2011,29(2):147-151,158.
-
[23] 鲁如坤.土壤农业化学分析方法[M].北京:中国农业科学技术出版社,2002.
-
[24] 刘克,赵文吉,郭逍宇,等.基于地面实测光谱的湿地植物全氮含量估算研究[J].光谱学与光谱分析,2012,32(2):465-471.
-
[25] 张贤龙,张飞,张海威,等.基于光谱变换的高光谱指数土壤盐分反演模型优选[J].农业工程学报,2018,34(1):110-117.
-
[26] 赵振亮,西甫拉提·特依拜,丁建丽,等.新疆典型绿洲土壤电导率和pH值的光谱响应特征[J].中国沙漠,2013,33(5):1413-1419.
-
[27] 丁建丽,伍漫春,刘海霞,等.基于综合高光谱指数的区域土壤盐渍化监测研究[J].光谱学与光谱分析,2012,32(7):1918-1922
-
[28] 覃文忠.地理加权回归基本理论与应用研究[D].上海:同济大学,2007.
-
[29] 于雷,洪永胜,周勇,等.高光谱估算土壤有机质含量的波长变量筛选方法[J].农业工程学报,2016,32(13):95-102.
-
[30] 彭杰,王家强,向红英,等.土壤含盐量与电导率的高光谱反演精度对比研究[J].光谱学与光谱分析,2014,34(2):510-514.
-
[31] Zhang F,Tiyip T,Ding J L,et al.Spectral reflectance properties of major objects in desert oasis:a case study of the Weigan-Kuqa river delta oasis in Xinjiang,China[J]. Environmental Monitoring & Assessment,2012,184(8):5105-5119.
-
摘要
以博斯腾湖湖滨绿洲为研究区,对土壤高光谱反射率 R 进行数学光谱变换,并计算其差值型、比值型、归一化型 3 种盐分指数,通过显著性检验优选特征波段,结合土壤表层盐分实验数据,构建基于地理加权回归模型的土壤表层盐分含量估算模型。研究结果表明:1)土壤表层盐分含量平均值为 7.535 g·kg-1,其光谱变换建模选取的特征波段集中在 466 ~ 482、1669 ~ 1728、1979 ~ 2371 nm,其中对数倒数的一阶微分(1/lgR)′相关性较好,相关系数绝对值为 0.672;2)构建 3 种盐分指数优选的特征波段集中在 1700 ~ 1728、1992 ~ 2014、2375 ~ 2405 nm, 建立的模型决定系数均大于 0.870,光谱反射率 R 的决定系数仅为 0.621;3)差值型盐分指数优选特征波段建立的地理加权回归模型为最优模型,建模集与检验集的决定系数R 2 分别为 0.934 和 0.915,RMSE 分别为 1.186 和 0.917。
Abstract
Talking Bosten Lake lakeside oasis in Xinjiang,China as the study area,spectral transforms and construction of differential salinity index,ratio salinity index,and normalized salinity index were performed on the hyperspectral reflectance of soil samples,and the characteristic bands were selected preferentially by significance test to construct a geographically weighted regression-based soil salinity content estimation model based on the measured surface salinity data. The results showed that:1)Soil surface salt content averaged 7.535 g·kg-1,and the feature bands selected for spectral transformation modeling were concentrated in 466 ~ 482,1669 ~ 1728 and 1979 ~ 2371 nm,where the logarithmic reciprocal first-order differential(1/lgR)′correlation was good and the absolute value of the correlation coefficient was 0.672; 2)The characteristic bands for the construction of the three salt indices were concentrated in 1700 ~ 1728,1992 ~ 2014 and 2375 ~ 2405 nm,and the determination coefficients of the established models were all greater than 0.870,while the determination coefficient of the spectral reflectance R was only 0.621;3)The model of the differential salt index which preferred eigenband was the best model,with the R 2 of 0.934 and 0.915 for the modeling set and the test set,respectively, and the RMSE of 1.186 and 0.917,respectively.