湖泊科学   2024, Vol. 36 Issue (3): 951-962.  DOI: 10.18307/2024.0346
0

研究论文——流域水文与水资源安全

引用本文 [复制中英文]

褚江东, 粟晓玲, 张特, 雷逸甦, 姜田亮, 吴海江, 王芊予, 基于随机森林模型的GRACE数据3种空间降尺度对比. 湖泊科学, 2024, 36(3): 951-962. DOI: 10.18307/2024.0346
[复制中文]
Chu Jiangdong, Su Xiaoling, Zhang Te, Lei Yisu, Jiang Tianliang, Wu Haijiang, Wang Qianyu. Comparison of three spatial downscaling concepts of GRACE data using random forest model. Journal of Lake Sciences, 2024, 36(3): 951-962. DOI: 10.18307/2024.0346
[复制英文]

基金项目

国家重点研发计划项目(2022YFD1900501)、水利部重大科技项目(SKS-2022018)和国家自然科学基金项目(52079111, 51879222)联合资助

通信作者

粟晓玲, E-mail: xiaolingsu@nwafu.edu.cn

文章历史

2023-09-17 收稿
2023-10-23 收修改稿

码上扫一扫

基于随机森林模型的GRACE数据3种空间降尺度对比
褚江东1,2 , 粟晓玲1,2 , 张特1,2 , 雷逸甦1,2 , 姜田亮3,4 , 吴海江1,2 , 王芊予1,2     
(1: 西北农林科技大学旱区农业水土工程教育部重点实验室, 杨凌 712100)
(2: 西北农林科技大学水利与建筑工程学院, 杨凌 712100)
(3: 中国水利水电科学研究院防洪抗旱减灾研究所, 北京 100038)
(4: 水利部防洪抗旱减灾工程技术研究中心, 北京 100038)
摘要:陆地水储量是赋存在陆地上各种形式水的综合体现, 研究其时空变化对认识区域水循环过程和水资源调控等具有重要意义。然而现有陆地水储量变化数据实际分辨率较低, 限制了其在中小流域或地区中的应用。针对这一问题, 本文基于GRACE重力卫星和其后续卫星GRACE-FO反演的陆地水储量变化数据, 首先采用随机森林模型, 分别基于格点、区域(流域)和区域(全国)3种空间降尺度思路将GRACE数据降尺度至0.25°×0.25°, 后结合GLDAS模型数据, 基于水量平衡原理计算得到地下水储量变化数据, 最后基于降尺度模型模拟效果和实测地下水位数据评估3种降尺度思路在全国的适用性。结果表明: 随机森林模型能够较好地模拟驱动数据(降水、气温、植被条件指数和土壤水储量)与GRACE数据的统计关系, 验证期格点降尺度思路的平均相关系数总体在0.6左右, 区域降尺度思路的平均纳什效率系数、相关系数和均方根误差分别>0.5、>0.75和 < 6.6 cm, 3种空间降尺度思路的模拟精度均满足基本要求; 2003—2021年间, GRACE数据、格点降尺度、区域降尺度(流域)和区域降尺度(全国)得到的我国陆地水储量亏缺量分别约为119.5×108、62.4×108、121.1×108和121.8×108 m3/a, 地下水储量亏缺量分别约为230.0×108、171.8×108、235.6×108和236.4×108 m3/a, 受制于样本数较少等原因, 格点降尺度结果精度较差; 两种区域降尺度思路得到的水储量变化速率均和原始GRACE数据基本一致, 模拟结果均优于格点降尺度, 且细化到流域的区域降尺度对地下水储量变化验证精度有一定的改善。区域降尺度具有适用性强、模拟精度高、计算效率高的优势, 研究结果可为流域水资源可持续利用以及水资源规划等提供精细化的水储量变化数据。
关键词水储量变化    GRACE    随机森林模型    统计降尺度    中国    
Comparison of three spatial downscaling concepts of GRACE data using random forest model
Chu Jiangdong1,2 , Su Xiaoling1,2 , Zhang Te1,2 , Lei Yisu1,2 , Jiang Tianliang3,4 , Wu Haijiang1,2 , Wang Qianyu1,2     
(1: Key Laboratory for Agricultural Soil and Water Engineering in Arid and Semiarid Areas of Ministry of Education, Northwest A & F University, Yangling 712100, P. R. China)
(2: College of Water Resources and Architectural Engineering, Northwest A & F University, Yangling 712100, P. R. China)
(3: China Institute of Water Resources and Hydropower Research, Beijing 100038, P. R. China)
(4: Research Center on Flood and Drought Disaster Reduction of the Ministry of Water Resources, Beijing 100038, P. R. China)
Abstract: Terrestrial water storage is a comprehensive manifestation of land water. Analyzing the spatio-temporal changes of terrestrial water storage is vital for improving the understanding of hydrological processes and water resource management. However, the low spatial resolution of existing terrestrial water storage anomalies derived from GRACE limits their applications in small and medium basins. To improve their spatial resolution, the random forest models were utilized to downscale terrestrial water storage anomalies data derived from GRACE satellites and its follow-up mission GRACE-follow on into 0.25°×0.25° spatial resolution at three spatial scales, including grid cell, regional (basin) and regional (China). Groundwater storage anomalies were calculated by combining the vertical water budget and GLDAS model output. The performance of the downscaling data was evaluated based on models' indicators and in-situ groundwater levels across China. Results show that random forest model can accurately establish the statistical relationship between input variables (precipitation, temperature, vegetation condition index, and soil water storage) and GRACE data. The average correlation coefficient of the grid cell downscaling method during the validation period is generally around 0.6. The average Nash efficiency coefficient, correlation coefficient and root mean square error of the regional downscaling method are greater than 0.5, 0.75 and less than 6.6 cm, respectively. Overall, the accuracy of different downscaled data was promising. From 2003 to 2021, the deficit of China's terrestrial water storage from original, grid cell downscaling-based, regional downscaling-based (basin) and regional downscaling-based (China) GRACE data were about 119.5×108, 62.4×108, 121.1×108 and 121.8×108 m3/a, respectively. The storage of groundwater storage was approximately 230.0×108, 171.8×108, 235.6×108 and 236.4×108 m3/a, respectively. The simulation accuracy of the grid cell downscaling results is relatively poor due to the small sample size. Change rates of water storage obtained by the regional downscaling methods were generally consistent with the original GRACE data, indicating that the regional downscaling methods were better than the grid-cell downscaling method. Compared with the grid-cell downscaling method, results obtained by the regional downscaling method were smoother in space, and the regional downscaling (basin) refined to the basin could improve the accuracy of groundwater storage anomalies. Regional downscaling has the advantages of strong applicability, high simulation accuracy and high computational efficiency than grid cell downscaling. Findings of this study can provide refined water storage anomalies data for sustainable utilization and water resources planning at basin-scale.
Keywords: Water storage anomalies    GRACE    random forest model    statistical downscaling    China    

陆地水储量(terrestrial water storage)是赋存在陆地上各种形式水的综合体现[1],研究其时空变化对认识区域水循环过程和水资源调控等具有重要意义。2002年3月GRACE(gravity recovery and climate experiment)重力卫星发射升空[2],从时变重力场的视角实现了对逐月陆地水储量时空变化的定量观测。GRACE数据具有连续性强、覆盖范围广、反演精度高等特点,被广泛应用于监测陆地水储量变化(terrestrial water storage anomalies)[1, 3-4]、地下水储量变化[5]、干旱演变[6-8]、实际蒸散发[9]、冰川冰盖融化[10]和海平面变化[11]等研究中。然而,GRACE数据的原始分辨率约为300~400 km,限制了其在中、小区域中的应用,因此,有必要结合降尺度方法深入了解水储量变化的时空分布特征。

降尺度是获取区域高分辨率数据的重要途径[12],其中,有关GRACE数据降尺度的研究主要是借助于统计降尺度方法。统计降尺度方法的思路是建立高分辨率观测数据与待降尺度数据之间的统计关系,计算相对简便,在GRACE数据的降尺度研究中得到广泛应用,其中,部分研究[13-16]借助机器学习方法来构建两者的统计关系。统计降尺度方法中主要从格点或区域两种思路展开。格点降尺度假设基于粗格点构建得到的统计关系模型适用于粗格点内的所有细格点,以各格点为研究对象进行降尺度建模,例如Ali等[13]、Zuo等[14]、Chen等[15]、Zhang等[16]研究均是借助多种高分辨率数据,在格点尺度上训练统计关系模型,进而对GRACE数据进行降尺度;也有部分研究借助某一高分辨率数据(如global land data assimilation system,GLDAS)模型的土壤水储量数据[17]、PCR-GLOBWB(pcraster global water balance model)模型的陆地水储量变化数据[18]、多种模型的蒸发数据[19]等或水量平衡方程[20],利用加权、乘权降尺度等思路,在格点尺度上构建统计关系,其实质是将高分辨率数据的空间分布按照一定准则嵌入到GRACE数据中。然而经格点降尺度后,数据在空间上存在突变现象,不满足水储量空间分布的连续性特征。而区域降尺度则假设构建得到的统计关系模型适用于该月整个区域所有格点[21],将某月的区域数据视为整体,对该区域各月格点数据分别构建统计关系模型,并把研究区格点划分为率定期格点和验证期格点进行精度评价,进而达到降尺度的目的。相较格点降尺度,区域降尺度思路在大尺度区域研究中计算次数少、运算效率高。但目前实际应用较少,有一定的研究潜力。Yin等[21-22]探讨了基于格点降尺度和区域降尺度在海河流域GRACE数据上的适用性,认为格点降尺度方法精度更高,但降尺度后格点之间存在明显的突变现象。以上研究多以中小流域为研究区,且缺乏不同空间降尺度思路之间的对比分析,尚无研究讨论尺度效应对区域降尺度的影响。

本文选用随机森林模型为降尺度方法,将其应用至3种空间尺度(格点、流域、全国),对我国2002年4月-2021年12月的陆地水储量变化数据进行空间降尺度,然后结合水量平衡原理和GLDAS模型数据得到高分辨率的地下水储量变化数据,最后与实测地下水位数据进行验证,以评估不同空间降尺度思路的适用性,研究结果可为我国水资源管理和地下水可持续利用提供参考。

1 数据来源及研究方法 1.1 研究区概况

中国位于3°51′N~53°33′N、73°33′E~135°05′E之间,地处亚欧大陆东南部,领土总面积约为960万km2。受湿热季风的影响,降水主要集中在夏、秋两季,时空分布不均,总体呈现东南多西北少的格局。降水作为陆地水储量的重要补给来源,显著影响着陆地水储量的时空演变情势。由于人类活动加剧,加之不合理的水资源开发利用,部分地区(例如华北平原[5]、石羊河流域[23]、塔里木河流域[17]等)已出现河道断流、地下水枯竭、生态环境恶化等现象。按照中华人民共和国水利部的流域划分,我国可以划分为九大流域(图 1),分别为东南诸河、内陆河、松辽流域、海河流域、淮河流域、珠江流域、西南诸河、长江流域和黄河流域。其中,台湾省属东南诸河,后续采用的气象数据未包含台湾省,因此在后续的降尺度计算中暂不考虑。

图 1 研究区流域划分和地下水位站点分布(该图基于自然资源部标准地图服务网站下载的审图号为GS(2019)1822号的标准地图制作,底图无修改) Fig.1 Watershed delineation and groundwater level station distribution of the research area
1.2 数据来源 1.2.1 GRACE数据

本文采用美国德克萨斯大学空间研究中心提供的2002年4月-2021年12月质量块(Mascons)数据(https://www2.csr.utexas.edu/grace/RL06_mascons.html)。该数据已替换C20项和地心改正项,并扣除冰川均衡调整(GIA)的影响,以2004年1月-2009年12月均值为基准作距平处理,具有高分辨率、高信噪比、泄漏误差小等特点。受数据划分方法和呈现形式的影响,该数据的空间分辨率为0.25°×0.25°,但实际分辨率约为1°×1°,本文将采用随机森林模型对该数据的实际分辨率空间降尺度至0.25°×0.25°。其中,GRACE的间断期(2017年7月-2018年5月)数据采用褚江东等[3]插补的结果,其余因卫星技术原因导致的短期数据缺失采用时间线性插值方法补充。

1.2.2 实测地下水位数据

实测地下水位数据来自2005—2017年的《中国地质环境监测地下水位年鉴》[24],时间尺度为逐月,空间分布如图 1所示,并根据以下条件筛选和处理站点数据:(1)舍弃观测月份数少于一半(78个月)的观测站点;(2)缺测期小于等于3个月的时间序列通过时间线性插值进行插补,大于4个月的缺测序列不进行插补。经统计分析,共有效摘录510个地下水位数据站点,其中地下水类型分为5种:潜水(241个)、承压水(270个)、岩溶水(14个)、裂隙水(2个)和潜水-承压水(12个)。

1.2.3 其他数据

采用GLDAS水文模型中Noah陆面模型提供的0~200 cm土壤水储量、雪水当量、冠层水储量的逐月数据,空间分辨率均为0.25°×0.25°。为与GRACE数据保持一致,以上数据需以2004年1月-2009年12月均值为基准得到逐月变化值。月降水量和平均气温数据采用基于全国2400多个气象站点实测资料插值而成的CN05.1数据集,是当前全国区域格点化近地面气象场最精确的数据集,空间分辨率为0.25°×0.25°[25]。植被条件指数(vegetation condition index, VCI)采用美国国家海洋和大气管理局(national oceanic and atmospheric administration,NOAA)卫星应用和研究中心(center for satellite applications and research,STAR)提供的全球植被健康产品数据集(https://www.star.nesdis.noaa.gov/smcd/emb/vci/VH/vh_ftp.php),时间和空间分辨率分别为7天和16 km×16 km,部分缺失值采用时间线性插值补充。为与其他数据时空分辨率保持一致,采用最邻近分配法将其重采样至0.25°×0.25°,并将时间尺度提升到月尺度。以上数据的时间范围均为2002年4月-2021年12月。

1.3 研究方法 1.3.1 地下水储量变化的计算

陆地水包括地表水、地下水、土壤水、雪水、冰川、生物水、冠层水等。其中生物水、地表水、冰川等难以量测,且相对土壤水储量和地下水储量变化在大部分地区可忽略不计[4],因此可通过简化的公式[3]得出地下水储量变化:

$ G W S A=T W S A-S M S A-S W E S A-C W S A $ (1)

式中,GWSATWSASMSASWESACWSA分别为地下水储量变化、陆地水储量变化、土壤水储量变化、雪水当量变化和冠层水储量变化,cm。其中,此处的“变化”实为距平值。由于忽略了地表水和冰川储量,基于式(1)得到的地下水储量变化在湿润半湿润地区和冰川覆盖地区可能存在一定误差[26]

1.3.2 降尺度思路

随机森林(random forest)模型是一种自助抽样技术,通过随机抽取样本和特征,通过Bagging算法建立多棵互不关联的决策树,最后对决策树的建模结果投票得到预测结果。该模型易于实现,计算量小,且模拟精度较高,在水文模拟和预测、图像识别等研究中得到了广泛的应用[15-16, 27-29]。本文采用随机森林模型对陆地水储量变化数据进行统计降尺度。其中,随机森林模型ntree、nleaf、mtry的值分别设定为100、5和2。

本研究共设置了基于3种空间尺度的统计降尺度思路:(1)以低分辨率格点为整体,时间序列为样本,核心思路为基于随机森林模型建立低分辨率的已知变量与目标变量的统计关系,后基于该关系和高分辨率的已知变量反演得到高分辨率结果,并与残差相加即得到降尺度结果1,具体的计算过程可参照Chen等[15]的研究;(2)分别以我国和九大流域的逐月数据为整体,对各月数据分别构建关系模型,以空间上的所有格点为样本数量,由此得到高分辨率的降尺度结果2和3。3种降尺度思路均按照率定期80% 和验证期20% 的样本训练模型,其中,格点降尺度思路的样本是在时间序列上划分,而区域降尺度思路的样本是在某一时间点的网格数量上进行比例划分。采用交叉验证方法中的随机子采样方法随机取样50次,以纳什效率系数(Nash-Sutcliffe efficiency coefficient,NSE)最大为准则选取最优模拟模型和数据。3种降尺度思路的流程图如图 2所示。

图 2 空间降尺度流程图 Fig.2 Spatial downscaling flowchart

统计降尺度的效果主要依靠高分辨率数据与GRACE数据的对应关系。例如,降水是陆地水的主要补给来源[15, 17],气温是表征蒸散发水平的重要指标[30],两者均为影响陆地水储量的重要气象因素;土壤水储量是陆地水储量的主要组成部分,研究[3, 30]表明其变化与陆地水储量变化密切相关;VCI可表征当地植被生长状态和下垫面状况,而植被与水储量之间相互联系,互馈机制较为复杂[31]。考虑到气象和下垫面因素对水储量变化的影响,参照相关研究,3种降尺度思路的驱动数据均选取逐月的降水、平均气温、土壤水储量和VCI数据,以上数据均为水循环的主要组成部分或驱动因素。最后,采用常用的评价指标NSE、相关系数(correlation coefficient,r)、均方根误差(root mean square error,RMSE)来评价模型的性能。

2 结果与讨论 2.1 降尺度方法的精度评价

图 3为全国区域基于格点降尺度思路的交叉验证平均值r的空间分布。由于模型模拟值后续将以残差校正,因此仅以r来评估格点降尺度的模拟精度。由此可看出,基于随机森林模型的格点降尺度思路, 在率定期r大多在0.8以上,但在验证期r下降至0.6左右,表明该模型在率定期能够较好地训练驱动数据和GRACE数据之间的关系,但受制于样本数较少、部分地区驱动数据代表性较差、受人类活动影响等原因,部分地区(例如干旱半干旱地区、三峡库区)验证期验证情况较差,泛化能力较弱,这与现有基于机器学习模型的GRACE数据插补重建研究结果[32]一致。其中,验证期分别有62.1% 和66.4% 的格点通过了α为0.05和0.01的显著性检验(对应的显著性水平分别为0.288和0.372)。因此,虽然在部分地区精度不佳,但基于格点降尺度思路的模拟效果总体可信,可用于下一步的对比分析中。

图 3 基于格点降尺度的交叉验证平均值相关系数空间分布(台湾省数据暂缺)(该图基于自然资源部标准地图服务网站下载的审图号为GS(2019)1822号的标准地图制作,底图无修改) Fig.3 Spatial distribution of cross-validated mean correlation coefficients using grid cell downscaling

表 1为分别以全国和流域为整体的区域降尺度结果在验证期的评价指标值,其中最大值、平均值和最小值均为交叉验证精度指标的各月均值。由表 1可知,两种区域降尺度方法的模拟精度均较好,NSE平均值均在0.58以上,r平均值均在0.76以上,RMSE平均值多在4 cm以下。其中,松辽流域、长江流域、淮河流域、珠江流域、西南诸河的流域降尺度精度比以全国为整体的区域降尺度精度更高。但由于藏南地区和华北平原水储量变化较为剧烈且呈下降趋势[3, 33],导致西南诸河和海河流域的RMSE较高;内陆河降水稀少,地下水埋深较深,地表水资源缺乏,水储量变化与驱动数据的相关关系相对较差[34],因此各项指标稍差,但总体模拟精度仍较高,这也进一步说明了随机森林模型应用于陆地水储量空间降尺度的稳健性。

表 1 两种区域降尺度的验证期性能评价指标 Tab. 1 Performance assessment between two regional downscaling methods for the validation period
2.2 水储量变化速率的时空分布

图 4为采用Theil-Sen斜率法得到的2003-2021年基于GRACE数据和不同降尺度思路的我国陆地水储量变化速率空间分布情况。由于CN05.1数据集未包括我国台湾省的数据,因此以下降尺度结果均未包含台湾省。如图 4所示,GRACE数据和不同降尺度结果对应的陆地水储量变化具有较强的空间一致性,未改变原有的空间分布格局,但3种降尺度思路在陆地水储量下降趋势明显的地区(例如天山山脉、藏南地区、华北平原等地)均有所高估,在上升趋势明显的地区(例如小兴安岭、柴达木盆地、三峡库区等地)有所低估。一方面,这是由于降尺度后的结果相对原始GRACE数据在空间上更为光滑,从而起到了“削峰”作用,另一方面,由于极值样本数较少,机器学习方法可能会将极值作为噪声点进行平滑化,从而导致极值区模拟精度不佳。对于格点降尺度和区域降尺度(流域)而言,分别以低分辨率格点和流域为整体构建统计关系模型,得到的降尺度结果中格点(流域)之间存在一定的突变现象,这与降尺度模型是基于该格点(流域)数据建立有关,忽略了格点(流域)间的影响。从图中可看出,格点降尺度的空间光滑程度较差。区域降尺度(全国)是基于我国所有的格点数据构建而得,格点之间不存在突变现象,而一般认为水文序列在时间和空间上是连续的,该方法得到的结果更符合水文序列的连续性特征。从表 2可知,GRACE数据、格点降尺度、区域降尺度(全国)和区域降尺度(流域)得到的陆地水储量变化速率分别为-0.12、-0.07、-0.13和-0.13 cm/a,折合水量亏缺约分别为119.5×108、62.4×108、121.1×108和121.8×108 m3/a,这说明相对于格点降尺度,两种区域降尺度思路能够较好地保证数据的精度。

图 4 GRACE数据和不同降尺度得到的我国全国陆地水储量变化速率空间分布(台湾省数据暂缺)(该图基于自然资源部标准地图服务网站下载的审图号为GS(2019)1822号的标准地图制作,底图无修改) Fig.4 Spatial distribution of change rate of terrestrial water storage obtained from GRACE data and different downscaling results
表 2 GRACE数据和不同降尺度得到的我国九大流域水储量变化速率对比结果* Tab. 2 Comparison results of change rate of water storage obtained from GRACE data and different downscaling results in nine basins over China

图 5为GRACE数据和不同降尺度思路得到的典型地区陆地水储量时间变化序列,受人类活动、气候变化等因素影响,这些地区水储量变化较为剧烈(在图 4a中标出)。可以看出,3种降尺度思路的模拟结果基本一致。天山山脉在2010年前两种区域降尺度模拟结果更接近GRACE数据,但在2010年后格点降尺度模拟结果更好。柴达木盆地2002—2010年格点降尺度模拟结果较差,在后期模拟结果与GRACE数据基本一致。总体而言,3种降尺度思路均能够在时间序列上较好地保留GRACE原始数据的特征。综合图 4,可看出相较于格点降尺度思路,两种区域降尺度思路在时空分布格局上的整体降尺度效果更佳。

图 5 GRACE数据和不同降尺度思路得到的典型地区陆地水储量时间变化 Fig.5 Temporal variation of terrestrial water storage in typical areas obtained from GRACE data and different downscaling ideas

结合式(1)即可得到地下水储量变化量。图 6为采用Theil-Sen斜率法的2003—2021年基于GRACE数据、不同降尺度思路和GLDAS模型数据得到的地下水储量变化速率空间分布情况。从图 6可知,地下水储量变化速率与陆地水储量变化速率的空间分布情况基本一致,也进一步说明了陆地水储量变化主要由地下水储量变化引起,这与褚江东等[3]的研究结论一致。但是,由于式(1)未考虑到冰川水储量变化的影响,西北地区天山山脉和藏东南地区地下水储量的亏损信号实为冰川消融引起[35]。由表 2可知,GRACE数据、格点降尺度、区域降尺度(全国)和区域降尺度(流域)得到的地下水储量变化速率分别为-0.24、-0.18、-0.25和-0.25 cm/a,折合水量亏缺约分别为230.0×108、171.8×108、235.6×108和236.4×108 m3/a。区域降尺度(流域)结果与GRACE数据基本一致。结合九大流域的陆地水和地下水储量变化速率可以看出,区域降尺度(流域)的数据精度明显高于其他两种降尺度结果。

图 6 GRACE数据和不同降尺度得到的地下水储量变化速率(台湾省数据暂缺)(该图基于自然资源部标准地图服务网站下载的审图号为GS(2019)1822号的标准地图制作,底图无修改) Fig.6 Change rate of groundwater storage obtained from GRACE data and different downscaling results
2.3 结果验证

国内众多学者已将GRACE数据反演的水储量变化应用至华北地区[5, 18, 21]、西北地区[6, 17]、长江流域[36]、珠江流域[37]乃至全国[16]等,并结合水文模型、当地水资源公报、实测地下水位或历史干旱事件进行了有效的精度验证,均表明GRACE数据反演的水储量变化在全国具有较好的适用性。因此,下文将着重探讨不同降尺度思路得到的结果与GRACE数据的验证精度差异。

地下水位变化量乘以给水度可以得到地下水储量变化[6],而给水度的空间分布情况难以获取,因此仅将两者进行相关性分析。图 7表 3分别为实测地下水位数据与GRACE数据和不同降尺度得到的地下水储量变化的相关性结果和显著性水平统计。其中GRACE数据、格点降尺度、区域降尺度(全国)和区域降尺度(流域)分别有211、182、205和222个站点通过了α = 0.05的显著性检验,且分别有186、160、180、196个站点通过了α = 0.01的显著性检验,说明两种区域降尺度得到的结果相对于GRACE数据而言,在提高空间精度的前提下没有显著降低数据精度,甚至区域降尺度(流域)的结果在局部地区精度有所提升。格点降尺度表现相对较差,这可能与各模型的训练样本数过少(仅237个月),且未考虑空间的异质性,导致模型学习不充分有一定关系,而区域降尺度中,面积最小的淮河流域的模型样本数为501个格点。在样本数足够的情况下,机器学习模型模拟效果更佳。同时也可以看出GRACE数据反演的地下水储量变化在部分站点验证效果较差,一方面是受数据的可获得性所限,以及式(1)未考虑到部分水储量(如河流、湖泊、冰川等)的变化情况,加之GRACE数据和GLDAS-Noah模型数据的观测和模拟误差,这将各项误差均归之地下水储量变化一项,进而影响到地下水储量变化的估算精度,今后可结合多源遥感数据或观测数据对式(1)改进补充;另一方面是受制于GRACE数据的原始分辨率,虽然能较好地保证在大尺度(300~400 km)上的精度[2],但由于地形、含水层位置、灌溉抽水等原因,即使降尺度也可能在局部区域的刻画效果不佳,这与Zhang等[16]在全国得到的验证结果基本一致。目前在全国有很多建成和管理的地下水监测站点,但观测数据获取仍存在较大困难[38]。在本文中,可供验证利用的全国实测地下水位站点数量不足、地下水位站点的空间分布可能不具代表性,以及站点时间长度较短均可对验证结果产生一定的影响。总之,通过与实测地下水位数据对比,进一步验证了区域降尺度在GRACE数据降尺度上的适用性。

图 7 实测地下水位数据与地下水储量变化的相关性空间分布(该图基于自然资源部标准地图服务网站下载的审图号为GS(2019)1822号的标准地图制作,底图无修改) Fig.7 Spatial distribution of correlation coefficient between in-situ groundwater level data and groundwater storage anomalies
表 3 实测地下水位数据与地下水储量变化的显著性水平面积比例统计 Tab. 3 Statistics on the ratio of the area of the significance level of in-situ groundwater level to groundwater storage anomalies

从以上结果可以看出,无论是空间连续性还是精度验证情况,区域降尺度的适用性相对格点降尺度更好。不可否认,该方法也有一定的局限性。区域选择过大时,下垫面和气候条件较为复杂,构建的单一模型较难有效综合区域的整体情况,难以反映不同区域的局部规律,尤其是极值区模拟精度会受到一定程度的影响;区域选择过小时,由于GRACE数据的实际分辨率较粗,GRACE数据的有效样本数过少会使模型构建时难以捕捉到驱动数据与GRACE数据的关系,从而导致降尺度结果仍会有格点间突变的现象。因此,在进行GRACE数据降尺度时有必要结合多种降尺度方法进行对比分析和讨论,选择最适合该区域的空间降尺度方法。基于实测地下水位数据的验证中,GRACE数据在部分地区验证效果不佳,后续可以借助实测数据进行偏差校正的研究。另外,后续研究可以采用更高空间分辨率的模型驱动数据,并对驱动数据进行优选,进而提高GRACE数据的实际分辨率和精度。

3 结论

GRACE数据的粗分辨率限制了对区域水循环过程的探索。本文采用了基于随机森林模型的3种不同空间尺度的降尺度思路,将我国2002年4月-2021年12月陆地水储量变化逐月数据的实际分辨率从1°×1°降低至0.25°×0.25°,结合水量平衡原理和GLDAS模型数据得到了高分辨率的地下水储量变化数据,基于Theil-Sen斜率分析了我国九大流域降尺度前后的陆地水储量变化和地下水储量变化情况,并基于实测地下水位数据和模型精度评价指标进一步评估了不同降尺度思路的适用性。获得以下主要结论:

1) 随机森林模型能够较好地构建高分辨率驱动数据与GRACE数据的统计关系,3种降尺度思路的模拟精度均满足基本要求,能够在保留GRACE数据特征的同时得到精细化的水储量变化情况;

2) GRACE数据、格点降尺度、区域降尺度(流域)和区域降尺度(全国)得到的我国陆地水量亏缺约分别为119.5×108、62.4×108、121.1×108和121.8×108 m3/a,地下水量亏缺约分别为230.0×108、171.8×108、235.6×108和236.4×108 m3/a,区域降尺度方法得到的水储量变化与原始GRACE数据基本一致,这表明区域降尺度在区域整体上的模拟结果优于格点降尺度;

3) 相较于格点降尺度,区域降尺度得到的结果空间更为平滑,在实测地下水位数据验证方面相对于GRACE原始数据能够较好地保证数据精度,其中,基于流域的区域降尺度可以提高地下水储量变化的验证精度。区域降尺度具有适用性强、模拟精度高、计算效率高的优势,在基于GRACE数据的降尺度研究中具有一定的应用潜力,可在今后研究中进一步推广使用。

4 参考文献

[1]
Nie N, Zhang WC, Chen H et al. Temporal variation characteristics and attribution analysis of terrestrial water storage change in the Yangtze River Basin. Advances in Water Science, 2021, 32(3): 396-407. [聂宁, 张万昌, 陈豪等. 长江流域水储量变化的时间变化特征及归因分析. 水科学进展, 2021, 32(3): 396-407.]
[2]
Tapley BD, Bettadpur S, Ries JC et al. GRACE measurements of mass variability in the Earth system. Science, 2004, 305(5683): 503-505. DOI:10.1126/science.1099192
[3]
Chu JD, Su XL, Wu HJ et al. Analysis of terrestrial water storage and its component changes in China from 2002 to 2021. Water Resources Protection, 2023, 39(3): 170-178. [褚江东, 粟晓玲, 吴海江等. 2002—2021年中国陆地水储量及其组分变化分析. 水资源保护, 2023, 39(3): 170-178.]
[4]
Long D, Li XY, Li XD et al. Remote sensing retrieval of water storage changes and underlying climatic mechanisms over the Tibetan Plateau during 2000-2020. Advances in Water Science, 2022, 33(3): 375-389. [龙笛, 李雪莹, 李兴东等. 遥感反演2000—2020年青藏高原水储量变化及其驱动机制. 水科学进展, 2022, 33(3): 375-389.]
[5]
Long D, Yang WT, Sun ZL et al. GRACE satellite-based estimation of groundwater storage changes and water balance analysis for the Haihe River Basin. Journal of Hydraulic Engineering, 2023, 54(3): 255-267. [龙笛, 杨文婷, 孙章丽等. 海河平原地下水储量变化的重力卫星反演和流域水量平衡. 水利学报, 2023, 54(3): 255-267.]
[6]
Su XL, Chu JD, Zhang T et al. Spatio-temporal evolution trend of groundwater drought and its dynamic response to meteorological drought in Northwest China. Water Resources Protection, 2022, 38(1): 34-42. [粟晓玲, 褚江东, 张特等. 西北地区地下水干旱时空演变趋势及对气象干旱的动态响应. 水资源保护, 2022, 38(1): 34-42.]
[7]
Deng ZF, Wu XS, Wang ZL et al. Drought monitoring based on GRACE data in the Pearl River Basin, China. Transactions of the CSAE, 2020, 36(20): 179-187. [邓梓锋, 吴旭树, 王赵礼等. 基于GRACE重力卫星数据的珠江流域干旱监测. 农业工程学报, 2020, 36(20): 179-187. DOI:10.11975/j.issn.1002-6819.2020.20.021]
[8]
Wang ZL, Wen J, Li ZC et al. Evaluation of suitability using typical drought index in source region of the Yellow River. Transactions of the CSAE, 2019, 35(21): 186-195. [王作亮, 文军, 李振朝等. 典型干旱指数在黄河源区的适宜性评估. 农业工程学报, 2019, 35(21): 186-195. DOI:10.11975/j.issn.1002-6819.2019.21.022]
[9]
Yun ZD, Hu QF, Wang YT et al. Accuracy validation of remote sensing and reanalysis evapotranspiration data: A comparative study based on GRACE and monthly water balance model. Journal of Hydraulic Engineering, 2023, 54(1): 117-127. [云兆得, 胡庆芳, 王银堂等. 遥感和再分析蒸散发数据精度评估: 基于GRACE和流域月水量平衡模型的比较研究. 水利学报, 2023, 54(1): 117-127.]
[10]
Mu YQ, Wei YQ, Wu JK et al. Variations of mass balance of the Greenland ice sheet from 2002 to 2019. Remote Sensing, 2020, 12(16): 2609. DOI:10.3390/rs12162609
[11]
Raj R, Andersen O, Johannessen J et al. Arctic Sea level budget assessment during the GRACE/Argo time period. Remote Sensing, 2020, 12(17): 2837. DOI:10.3390/rs12172837
[12]
Xu ZF, Han Y, Yang ZL. Dynamical downscaling of regional climate: A review of methods and limitations. Science China Earth Sciences, 2019, 49(3): 487-498. [徐忠峰, 韩瑛, 杨宗良. 区域气候动力降尺度方法研究综述. 中国科学: 地球科学, 2019, 49(3): 487-498.]
[13]
Ali S, Liu D, Fu Q et al. Constructing high-resolution groundwater drought at spatio-temporal scale using GRACE satellite data based on machine learning in the Indus Basin. Journal of Hydrology, 2022, 612: 128295. DOI:10.1016/j.jhydrol.2022.128295
[14]
Zuo JP, Xu JH, Chen YN et al. Downscaling simulation of groundwater storage in the Tarim River Basin in northwest China based on GRACE data. Physics and Chemistry of the Earth, 2022, 123: 103402. DOI:10.1016/j.pce.2021.103042
[15]
Chen L, He QS, Liu K et al. Downscaling of GRACE-derived groundwater storage based on the random forest model. Remote Sensing, 2019, 11(24): 2979. DOI:10.3390/rs11242979
[16]
Zhang JX, Liu K, Wang M. Downscaling groundwater storage data in China to a 1-km resolution using machine learning methods. Remote Sensing, 2021, 13(3): 523. DOI:10.3390/rs13030523
[17]
Wei GH, Yang P, Zhou HY et al. 2020. An analysis of the drought characteristics and driving factors of Tarim River Basin based on downscaled terrestrial water storage from GRACE. China Rural Water and Hydropower, 2020(7): 12-19, 25. [魏光辉, 杨鹏, 周海鹰等. 基于GRACE陆地水储量降尺度的塔里木河流域干旱特征及驱动因子分析. 中国农村水利水电, 2020(7): 12-19, 25.]
[18]
Liu HL, Zhang GQ, Zhang DS et al. Improving the spatial resolution of GRACE satellites based on high-resolution hydrological simulations. Bulletin of Surveying and Mapping, 2022(8): 41-47. [刘红亮, 张刚强, 张大胜等. 利用高分辨率水文模型提高GRACE卫星的空间分辨率. 测绘通报, 2022(8): 41-47.]
[19]
Yin WJ, Hu LT, Zhang ML et al. Statistical downscaling of GRACE-derived groundwater storage using ET data in the North China plain. Journal of Geophysical Research: Atmospheres, 2018, 123(11): 5973-5987. DOI:10.1029/2017jd027468
[20]
Wang J, Bian YH, Liu JJ et al. Downscaling analysis of GRACE terrestrial water storage changes based on GLDAS in China. Water Resources and Power, 2020, 38(2): 31-35. [王洁, 边宇晗, 刘俊杰等. 基于同化数据的GRACE卫星反演中国陆地水储量变化降尺度分析. 水电能源科学, 2020, 38(2): 31-35.]
[21]
Yin WJ, Zhang GQ, Han SC et al. Improving the resolution of GRACE-based water storage estimates based on machine learning downscaling schemes. Journal of Hydrology, 2022, 613: 128447. DOI:10.1016/j.jhydrol.2022.128447
[22]
Yin WJ, Zhang GQ, Liu FT et al. Improving the spatial resolution of GRACE-based groundwater storage estimates using a machine learning algorithm and hydrological model. Hydrogeology Journal, 2022, 30(3): 947-963. DOI:10.1007/s10040-021-02447-4
[23]
Lei YS, Su XL, Chu JD et al. Calculation method and application of ecological water demand threshold for vegetation in arid areas based on ecosystem resilience. J Lake Sci, 2024, 36(2): 645-656. [雷逸甦, 粟晓玲, 褚江东等. 基于生态系统恢复力的干旱区植被生态需水阈值计算方法与应用. 湖泊科学, 2024, 36(2): 645-656. DOI:10.18307/2024.0246]
[24]
中国地质环境监测院. 中国地质环境监测地下水位年鉴·2017. 北京: 中国大地出版社, 2020.
[25]
Wu J, Gao XJ. A gridded daily observation dataset over China region and comparison with the other datasets. Chinese Journal of Geophysics, 2013, 56(4): 1102-1111. [吴佳, 高学杰. 一套格点化的中国区域逐日观测资料及与其他资料的对比. 地球物理学报, 2013, 56(4): 1102-1111.]
[26]
Chu JD, Su XL, Jiang TL et al. Application status and prospect of water storage and drought monitoring based GRACE data. Remote Sensing Technology and Application, 2023, 38(5): 1-14. [褚江东, 粟晓玲, 姜田亮等. GRACE数据反演水储量及监测干旱的应用现状与展望. 遥感技术与应用, 2023, 38(5): 1-14.]
[27]
Wu ZM, Li JC, Wang R et al. Estimation of CDOM concentration in inland lake based on random forest using Sentinel-3A OLCI. J Lake Sci, 2018, 30(4): 979-991. [吴志明, 李建超, 王睿等. 基于随机森林的内陆湖泊水体有色可溶性有机物(CDOM)浓度遥感估算. 湖泊科学, 2018, 30(4): 979-991. DOI:10.18307/2018.0411]
[28]
Wu HJ, Su XL, Qi JX et al. Prediction and application of monthly streamflow based on Vine Copula coupled Bayesian model averaging. Transactions of the CSAE, 2022, 38(24): 73-82. [吴海江, 粟晓玲, 祁继霞等. Vine Copula与贝叶斯模型平均结合的月径流预测及应用. 农业工程学报, 2022, 38(24): 73-82.]
[29]
Luo XC, Hang X, Cao Y et al. Dominant meteorological factors affecting cyanobacterial blooms under eutrophication in Lake Taihu. J Lake Sci, 2019, 31(5): 1248-1258. [罗晓春, 杭鑫, 曹云等. 太湖富营养化条件下影响蓝藻水华的主导气象因子. 湖泊科学, 2019, 31(5): 1248-1258. DOI:10.18307/2019.0512]
[30]
Sun ZL, Long D, Yang WT et al. Reconstruction of GRACE data on changes in total water storage over the global land surface and 60 basins. Water Resources Research, 2020, 56(4). DOI:10.1029/2019wr026250
[31]
姜田亮. 西北地区生态干旱时空演变特征及其对气象干旱和地下水干旱的响应[学位论文]. 杨凌: 西北农林科技大学, 2022.
[32]
Xiong JH, Yin JB, Guo SL et al. Continuity of terrestrial water storage variability and trends across China's mainland monitored by the GRACE and GRACE-Follow on satellites. Journal of Hydrology, 2021, 599: 126308. DOI:10.1016/j.jhydrol.2021.126308
[33]
Liu L, Wang XX, Niu QK et al. Evolution characteristic of terrestrial water storage change and its attribution analysis over the Yarlung Zangbo River Basin. Transactions of the CSAE, 2021, 37(14): 135-144. [刘浏, 王宣宣, 牛乾坤等. 雅鲁藏布江流域陆地水储量变化特征及归因. 农业工程学报, 2021, 37(14): 135-144.]
[34]
Chu JD, Su XL, Jiang TL et al. Filling the gap between GRACE and GRACE-FO data using a model integrating variational mode decomposition and long short-term memory: A case study of Northwest China. Environmental Earth Sciences, 2023, 82: 38. DOI: 10.1007/s12665-022-10716-y.
[35]
Zhao FY, Long D, Li XD et al. Rapid glacier mass loss in the Southeastern Tibetan Plateau since the year 2000 from satellite observations. Remote Sensing of Environment, 2022, 270: 112853. DOI:10.1016/j.rse.2021.112853
[36]
Ran YH, Zhong M, Chen W et al. Monitoring the extreme drought in the middle and lower reaches of the Yangtze River in 2019 from GRACE-FO satellites. Chinese Science Bulletin, 2021, 66: 107-117. [冉艳红, 钟敏, 陈威等. 利用GRACE-FO重力卫星探测2019年长江中下游极端干旱. 科学通报, 2021, 66: 107-117.]
[37]
Chen ZW, Zhang XF, Ran JJ et al. Terrestrial water storage changes in Pearl River region derived from the latest release temporal gravity field models. Journal of Geodesy and Geodynamics, 2020, 40(3): 305-310. [陈智伟, 张兴福, 冉将军等. 利用新版GRACE时变模型反演珠江流域陆地水储量变化. 大地测量与地球动力学, 2020, 40(3): 305-310. DOI:10.14075/j.jgg.2020.03.016]
[38]
Lin JY, Bryan BA, Zhou XD et al. Making China's water data accessible, usable and shareable. Nature Water, 2023, 1(4): 328-335. DOI:10.1038/s44221-023-00039-y