摘要
样品重复数设计是环境DNA(eDNA)监测技术标准化中最靠前的一个关键环节,对特定站位或断面进行eDNA监测,采样中应该设置多少个样品重复先前已有研究探讨,而这种小时空尺度的样品重复应该是在空间上设置系列样点,还是在时间上设置连续采样尚未有研究仔细探讨,但这对于eDNA监测实践十分重要。为解决大型河流eDNA监测中重复采样策略的优化问题,本研究在长江武汉段设计了以样品重复方式为单一变量的对照实验,通过比较不同重复方案下eDNA监测检出的物种组成差异,提出适用于小时空尺度eDNA监测的采样建议。结果显示,细菌和后生动物的eDNA监测空间序列样品比时间序列样品所检出的累计物种数多,所检出物种组成的空间异质性比时间异质性大,而真菌、真核藻类、原生动物3个细分类群相反。因此,建议在大型河流小时空尺度的eDNA监测中,监测细菌和后生动物时,样品重复的设计优先关注空间重复采样;监测真菌、真核藻类、原生动物时,样品重复的设计优先关注时间重复采样,考虑到可能存在的河流特异性、断面特异性、时间特异性,本结论可能需要进行异时异地验证。特别强调,采取空间重复采样应注意采样时间的选择,采取时间重复采样应注意采样点位的选择,针对细分类群的监测采样应注意保证样品重复数量。
Abstract
The design of duplicated samples constitutes the primary stage in the standardisation of eDNA monitoring processes. A plethora of studies have hitherto investigated the optimal number of duplicated samples required for the purpose of ascertaining the precise eDNA information at a given sampling site or transection. However, the question of whether duplicated samples should be collected at a series of sites or in continuous moments remains unresolved in the context of eDNA monitoring at this scale. This issue is of particular significance for the practice of eDNA monitoring. To optimize the sampling strategy of duplicated samples in eDNA monitoring of large rivers, the present study employed a single-variable controlled experiment in the Wuhan section of the Yangtze River. A total of 16 eDNA samples were obtained from 27 June to 14 July 2022 on a daily basis (temporal group samples) and 16 eDNA samples were collected across the Yangtze River on 28 June and 12 July 2022 (spatial group samples). The composition of the detected species and OTUs in each eDNA sample was then analyzed. The following steps were taken in order to provide suitable suggestions for how to set duplicated samples in a small spatiotemporal scale eDNA monitoring practice in a large river. Firstly, the species and OTU compositions, temporal heterogeneity of temporal group samples, and the species and OTU compositions, spatial heterogeneity of spatial group samples, were quantified. The findings demonstrated that, for bacteria and metazoa, the total number of species detected in spatial group eDNA samples exceeded that detected in temporal group eDNA samples. Furthermore, the spatial heterogeneity of species detected in eDNA monitoring was found to be greater than the temporal heterogeneity of the same. In contrast, an antithetical status was observed for the three taxonomies of fungi, algae and protozoa. In essence, the study proposed that in the context of monitoring environmental bacteria and aquatic metazoa within a specified sampling site or transection of a substantial river, the implementation of spatial duplicated sampling of eDNA monitoring should be accorded priority in the design of duplicated samples. With regard to the monitoring of fungi, algae and protozoa, the implementation of temporal duplicated sampling of eDNA monitoring should be prioritised within the framework of duplicated samples design. It is evident that the conclusions drawn must be subject to verification, given the potential variations in the community structure of aquatic organisms across different rivers, sections and temporal periods. It is imperative to emphasise that particular attention must be allocated to the selection of sampling time when implementing spatial duplicated sampling, and the selection of sampling point when executing temporal duplicated sampling. Furthermore, it may be necessary to consider the replication of samples when the focus is on the monitoring of a subdivision taxonomy.
eDNA监测通过从环境样品(水体、土壤、沉积物、空气、混合物等)中提取DNA混合物,用物种特异性引物或特定DNA meta-barcoding引物对DNA进行扩增测序、分类学分析、相对丰度分析、功能预测等,来监测环境中是否存在某特定物种,或者获得环境样品中物种组成、群落结构、生态功能等相关信息[1-4],在国内外都已得到广泛的探索性应用[5-8],具有广阔的应用前景[7-10],虽然当前还存在诸如参考序列数据库不完善、部分特定类群广泛漏检、径流输移导致假阳性、不同物种eDNA释放降解不同步等一系列问题[11]。为了推动eDNA监测的常态化,当前亟需推进其技术标准化[12-17],主要包括样品重复数设计、采样时间设计、采样点设计、采样方法设计、样品前处理、样品保存、扩增引物选择、样品提取-扩增-测序-分析程序、序列比对注释、监测结果后评估等[4]。
在针对特定时段特定站位或断面的生物多样性eDNA监测中,需要尽可能全面地检出该监测时段监测站位或断面所具有的eDNA信息组成,其中样品重复数量的设计和样品重复方式的设计是关键的前置要素。一方面,eDNA监测样品重复数越多,所检出信息种类数也越多(同时,检出的信息相对丰度结构也越稳定),这种增加与传统物种调查类似[18-19],遵循物种积累曲线的幂函数增长规则;另一方面,eDNA监测样品重复数所对应的检出信息种类数增长也受抽样库内eDNA所包含的信息种类的小尺度时空差异影响,小尺度时空差异越大,各样品所检出的信息种类的样品间差异越大,所需要的样品重复数越大。理论上来讲,在针对特定监测站位或断面的单次监测中,存在样品重复数有限的现实约束,如果小尺度的空间差异比时间差异大,样品重复宜重点关注空间重复;如果小尺度的时间差异比空间差异大,样品重复宜重点关注时间重复。
实践上来讲,在针对特定监测站位或断面的单次eDNA监测的采样中究竟是应该优先关注空间重复,还是优先关注时间重复,尚未有相关研究仔细探讨。当前在针对特定站位或断面进行eDNA监测的采样设计中,有关样品重复的设计具有一定的随意性,即在一个监测站位或监测断面方便开展连续监测的时候,往往倾向于在采样中选择时间重复,在一个监测站位或监测断面不方便开展连续监测的时候,往往倾向于在采样中选择空间重复,而这种样品重复的选择也通常缺少监测工作的前评估和监测结果的后评估,其对结果的影响也未知。样品重复方式如何进行选择,亟待研究。
本研究以大型河流——长江干流武汉段为研究区域,在丰水期,对样品数量、采样方式、处理方式、测序方式、分析方式等进行一致性控制,以样品重复方式为单变量,量化研究对比横跨长江的eDNA信息空间差异和连续半个月的eDNA信息时间差异,分析的生物类群包括细菌(用16S rRNA基因检出)、真核生物(用线粒体COI(细胞色素c氧化酶亚基I基因,Cytochrome c oxidase subunit I gene)基因检出)及其特定细分类群,对比的内容为小时空尺度内eDNA信息检出的时间差异与空间差异的大小,以回答大型河流小时空尺度eDNA监测宜多天采样还是宜多点采样的科学问题,为大型河流开展相应类群eDNA监测重复采样设计提供参考。
1 研究区域与方法
为了回答针对特定站位或断面进行的eDNA监测中宜多天采样还是宜多点采样的科学问题,本研究以长江武汉段为研究区域,以样品重复方式差异为单变量,设置时间序列组和空间序列组,分析对比时间序列组内的eDNA信息检出差异和空间序列组内的eDNA信息检出差异的大小,以及哪种重复方式能够检出更多的eDNA信息。其中时间序列组和空间序列组的样品数一致、各样品的采集方法一致、各样品的处理方法一致、各样品的测序方法一致、各样品的序列分析方法一致、各组内差异度的计算方法一致,各方法的内在特征或局限性不影响结论的可信度。
2022年6月27日-7月14日期间,在武汉渔政码头附近开展了16 d的eDNA监测,并在其中2天(6月28日和7月12日)各开展了横跨长江左右岸的断面监测(断面上近似平均地设置8个采样点,采样点间隔100 m左右)(图1,表1)。监测期间,水温在26.6~29.6℃间(趋势性上升),参考水文站汉口站的监测水位在22.96~24.65 m之间(趋势性下降),监测流量在32800~40200 m3/s之间(趋势性下降)(表1)。

图1eDNA监测采样点示意(S为14次日常采集的采样点;A~H为2次断面采集的采样点)
Fig.1Sampling sites of eDNA monitoring
用无菌采样瓶采集上层水(离水面30~50 cm)水样1.5 L。在正式采集水样并封装之前,用水样涮洗3次。水样在冰浴中暂存,在实验室中用0.2 μm孔径滤膜进行抽滤(采样后6 h内处理完毕,以纯净水为空白对照),获得存留了eDNA的滤膜,放入50 mL无菌离心管,自封袋装好,-80℃冰箱保存,泡沫箱干冰浴运输。委托上海美吉生物医药科技有限公司进行eDNA提取、线粒体COI基因的宏条形码引物(mlCOIintF/jgHCO2198R)和16S rRNA基因的宏条形码引物(338F/806R)PCR 扩增测序,具体提取、扩增、测序方法参照文献进行[20],测序深度为每个实验约8万条序列。所获得的相关序列原始数据已存于国家基因库生命大数据平台(China National GeneBank DataBase,CNGBdb,https://db.cngb.org/)的长江中游eDNA序列文件夹中(项目编号: CNP0002410,DOI: 10.26036/CNP0002410)。
利用美吉生物云平台(www.majorbio.com)2022年更新的分析计算模块[21],进行质控、拼接(用FLASH version 1.2.11 https://ccb.jhu.edu/software/FLASH/index.shtml)、OTU聚类(用UPARSE version 7.0.1090 http://drive5.com/uparse/,线粒体COI基因序列用99%的序列相似度,16S rRNA基因序列用97%的序列相似度)、物种注释(线粒体COI基因序列比对NCBI核酸序列数据库nt_v20221012库,采用Blast算法,置信度取值0.9;16S rRNA基因序列比对silva138.1/16s_bacteria库,采用RDP classifier贝叶斯算法,置信度取值0.7)、按最小样本序列数抽平,获得每份样品所监测到的物种组成及其相对丰度[20]。统计各样品用线粒体COI基因序列所检出的真核生物物种组成和用16S rRNA基因序列所检出的细菌物种组成。
表1eDNA样品采集状况及相应水文状况*
Tab.1 Details for eDNA monitoring and corresponding hydrological conditions

*2次断面采样,8个样点(A/B/C/D/E/F/G/H)近似平均设置,H点为靠近渔政码头侧的样点,与其他逐日eDNA监测样点相近。
将样品分为时间序列组(WHW01、WHW02H、WHW03、WHW04、WHW05、WHW06、WHW07、WHW08、WHW09、WHW10、WHW11、WHW12、WHW13、WHW14H、WHW15、WHW16)以及空间序列组(WHW02A、WHW02B、WHW02C、WHW02D、WHW02E、WHW02F、WHW02G、WHW02H、WHW14A、WHW14B、WHW14C、WHW14D、WHW14E、WHW14F、WHW14G、WHW14H)。基于各样品所检出的物种组成,分析时间序列组内各样品间的Bray-Curtis距离,空间序列组内各样品间的Bray-Curtis距离,两组样品间的Bray-Curtis距离。基于各样品所检出的物种数统计,回归分析水温、水位、流量和各样品(包括两次断面汇总)所检出物种数之间的相关性;分别分析时间序列组样品监测到的累计物种数,空间序列组样品监测到的累计物种数,两组的自有物种数、检出物种数总占比,用EstimateS(Version 9.1.0,Copyright R. K. Colwell: http://purl.oclc.org/estimates)计算各组监测结果的物种积累曲线,用累计检出的物种数除以组内各样品平均检出的物种数指示样品间物种组成的异质度。其中,累计物种数,即样品组内所有样品累计检出的物种数量;自有物种数,即本样品组检出而另一个样品组未检出的物种数量;检出物种数总占比,即样品组的累计物种数除以两个样品组所有样品累计检出的物种数量;物种组成的异质度,即样品组的累计物种数除以样品组内单样品平均检出的物种数量。
2 结果
2.1 eDNA监测检出结果概况
基于线粒体COI基因的宏条形码引物(mlCOIintF/jgHCO2198R)的测序、分析、注释,30个样品共获得749265535个碱基、2335971条有效序列,共检出真核生物4界、28门、66纲、137目、208科、304属、513种,其中真菌162种、真核藻类123种、原生动物27种、后生动物201种(附表Ⅰ)。后生动物中有轮形动物48种、海绵动物4种、刺胞动物1种、扁形动物2种、线虫4种、腹毛动物2种、环节动物29种、节肢动物54种、软体动物7种、硬骨鱼37种、两栖动物1种、鸟类5种、哺乳动物6种,以及一批未获得明确注释的无脊椎动物(附表Ⅱ)。基于16S rRNA基因的宏条形码引物(338F/806R)的测序、分析、注释,30个样品共获得1004273893个碱基、2433928条序列,共检出细菌57门、174纲、399目、661科、1357属、1539种,以及1280个未培养和未分类种(附表Ⅱ)。
各样品所检出物种数对水温、水位、流量的相关性分析显示,eDNA监测检出物种数与水温有微弱的负相关(斜率小于0),与水位、流量有微弱的正相关(斜率大于0),但其相关性均不是很强也不显著(R2小于0.5,真核生物的P值大于0.05,细菌的P值小于0.05)(图2)。其中所检出真核生物物种数与水温、水位、流量之间的相关性和显著性(R2小于0.1,P值大于0.05)均比所检出细菌物种数与水温、水位、流量之间的相关性和显著性(R2介于0.2~0.5,P值小于0.05)低(图2)。即真核生物的eDNA检出物种数受水温、水位、流量的影响较小,细菌的eDNA检出物种数也受水温、水位、流量的影响较小,但比真核生物的eDNA检出物种数所受的影响要略大。其整体体现为,水温、水位、流量随采样时间呈现趋势性变化(水温趋势性上升,水位和流量趋势性下降,表1),真核生物的eDNA检出物种数随采样时间有微弱且不显著的下降(斜率为-0.0013,R2仅0.0008,P值达0.9126),细菌的eDNA检出物种数随采样时间有微弱且显著的下降(斜率为-0.0114,R2为0.2442,P值为0.0371),但均比真核生物的相关性强、显著性高(图2)。

图2eDNA检出物种数和水温、水位、流量之间相关性(检出的归一化值,指时间序列组各样品所检出的物种数除以样品WHW02H所检出的物种数所得的归一化值,或空间序列组WHW14的 8个样品合计检出的物种数除以样品WHW2的8个样品合计检出的物种数所得的归一化值)
Fig.2The relationship between the numbers of detected species by eDNA monitoring and water temperature, water level and runoff
2.2 eDNA监测检出物种组成的小尺度时空异质性
基于各样品所检出的物种组成所进行的样品间Bray-Curtis距离分析结果显示,eDNA检出的物种差异具有一定的小尺度时空异质性,其中真核生物的时间异质性比空间异质性大,细菌的空间异质性比时间异质性大,真核生物的时空异质性比细菌的时空异质性大(图3、4)。
eDNA检出的真核生物物种组成,时间序列组内各样品间的Bray-Curtis距离为0.426±0.067,空间序列组内各样品间的Bray-Curtis距离为0.384±0.060,两组间各样品间的Bray-Curtis距离为0.407±0.063(图3)。时间序列组内样品间eDNA检出的物种组成具有一定的差异;空间序列组内样品间eDNA检出的物种组成也具有一定的差异,但比时间序列组内的差异要小;时间序列组和空间序列组间样品eDNA检出的物种组成差异介于两组组内的差异之间。

图3eDNA检出真核物种组成的时空异质性(Bray-Curtis距离矩阵)
Fig.3The spatial-temporal heterogeneity of the eukaryotic species composition detected by eDNA monitoring (Bray-Curtis distance matrix)
eDNA检出的细菌物种组成,时间序列组内各样品间的Bray-Curtis距离为0.319±0.035,空间序列组内各样品间的Bray-Curtis距离为0.350±0.050,两组间各样品间的Bray-Curtis距离为0.339±0.038(图4)。时间序列组内样品间eDNA检出的物种组成具有一定的差异;空间序列组内样品间eDNA检出的物种组成也具有一定的差异,且比时间序列组内的差异要大;时间序列组和空间序列组间样品eDNA检出的物种组成差异介于两组组内的差异之间。
eDNA检出的细菌物种组成3项样品间Bray-Curtis距离指标均比真核生物物种组成3项样品间Bray-Curtis距离指标小(图3,4),即eDNA检出的细菌物种组成的时空异质性比真核生物物种组成的时空异质性小。

图4eDNA检出细菌物种组成的时空异质性(Bray-Curtis距离矩阵)
Fig.4The spatial-temporal heterogeneity of the bacteria species composition detected by eDNA monitoring (Bray-Curtis distance matrix)
2.3 eDNA监测检出物种统计的小尺度时空差异
对eDNA监测检出结果在3个层面、两个组别的分析结果显示,eDNA监测检出结果存在一定的时间异质性、空间异质性,物种数逐日逐样累计曲线和统计估算的物种积累曲线呈连续上升趋势,在样品数相同的条件下,空间重复采样(空间序列样品组)比时间重复采样(时间序列样品组)会检出更多的物种,但差距不大并且存在细分类群的差异性(图5~7,表2)。
细菌的物种检出数量在时间上有微弱的下降趋势,在空间上呈现近岸多、河中间少的趋势,物种组成的时间异质性(2.37)比空间异质性(2.61)略弱,累计物种检出数量时间重复采样(2461)比空间重复采样(2543)略少;真核生物的物种检出数量在时间上、空间上均呈随机波动、无明显变化趋势,物种组成的时间异质性(3.58)比空间异质性(3.40)略强,累计物种检出数量时间重复采样(409)比空间重复采样(415)略少(图5,表2)。
对真核生物进行大类群细分,真菌的物种检出数量在时间上、空间上均呈随机波动、无明显变化趋势且异质性明显,物种组成的时间异质性(7.06)比空间异质性(5.75)更强,累计物种检出数量时间重复采样(132)比空间重复采样(115)多;真核藻类的物种检出数量在时间上、空间上均呈随机波动、无明显变化趋势,物种组成的时间异质性(2.14)比空间异质性(2.00)略强,累计物种检出数量时间重复采样(105)与空间重复采样(107)近似;原生动物的物种检出数量在时间上、空间上均呈随机波动、无明显变化趋势且异质性明显,物种组成的时间异质性(4.42)比空间异质性(4.13)更强,累计物种检出数量时间重复采样(21)与空间重复采样(23)近似;后生动物的物种检出数量在时间上呈随机波动、无明显变化趋势,在空间上有近岸多、河中间少的微弱趋势,物种组成的时间异质性(3.67)比空间异质性(4.03)弱,累计物种检出数量时间重复采样(150)比空间重复采样(169)少(图6,表2)。

图5时间序列样品组和空间序列样品组检出的细菌和真核生物的物种数、累计物种数、物种累计曲线
Fig.5Species numbers, accumulated species numbers and rarefaction cure of the bacteria and eukaryota species that detected in the samples of temporal series group and spatial series group
对后生动物进行小类群细分,浮游动物的物种检出数量在时间上、空间上均呈随机波动、无明显变化趋势,物种组成的时间异质性(2.60)与空间异质性(2.60)相近,累计物种检出数量时间重复采样(43)比空间重复采样(44)略少;底栖动物的物种检出数量在时间上呈随机波动、无明显变化趋势,在空间上有近岸多、河中间少的微弱趋势,物种组成的时间异质性(3.91)比空间异质性(4.38)弱,累计物种检出数量时间重复采样(67)比空间重复采样(84)少;鱼类的物种检出数量在时间上呈随机波动、无明显变化趋势,在空间上有近岸多、河中间少的微弱趋势,物种组成的时间异质性(5.61)比空间异质性(6.63)弱,累计物种检出数量时间重复采样(34)比空间重复采样(29)多(图7,表2)。
对eDNA监测检出结果在细菌-真核生物层面、两个组别进行OTU的分析结果显示,两个类别、两个组别的累计OTU数和自有OTU数理所当然地远远高于相应的累计物种数和自有物种数,而检出OTU数总占比低于相应的检出物种数总占比,OTU组成的异质度高于相应的物种组成的异质度(表2、3)。在OTU水平两个组别之间的相对差异(表3)和在物种水平两个组别之间的相对差异(表2)基本趋势一致,但程度有所放大。
3 讨论
空间序列样品比时间序列样品所检出的累计物种数多(真菌和鱼类统计口径例外),所检出物种组成的空间异质性比时间异质性大(真核、真菌、真核藻类、原生动物统计口径例外)。在大型河流中,水体在较短的径流距离内难以完成水流的充分混合,受岸带土壤微生物输入的影响[20,22],近岸水体中可检出的细菌种类数会比河流中间的略多(图5)。由于细菌在流域生物信息流中生命体信息(活的或休眠的细菌个体)占比较高,且非生命体信息(死的或破碎的细菌细胞)输移半衰距离较长[20,22-23],eDNA检出的细菌物种组成的时间异质性比空间异质性略小(图4,表2)。水体中的真菌、真核藻类(浮游植物)、原生动物(浮游动物)是水体中原生且更新较快的生物类群,在水体小尺度空间中存在相对一致的物种及群落组成,尽管在流域生物信息流中生命体信息占比较高,非生命体信息输移半衰距离较长,时间序列样品中检出的累计物种数也比空间序列样品中检出的略多或近似,eDNA检出的物种组成的时间异质性也比空间异质性略大(表2)。后生动物(比如底栖动物、鱼类)虽然也是水体中原生的生物类群,但在大型河流断面上存在较为明显的分布及活动空间差异,且在流域生物信息流中生命体信息占比较低,非生命体信息输移半衰距离较短,因而时间序列样品中检出的累计物种数也比空间序列样品中检出的少,eDNA检出的物种组成的时间异质性也比空间异质性小(表2)。比如鱼类和底栖动物倾向于在近岸浅水区生活和活动,在近岸水域持续释放eDNA,因而在近岸水体中可检出的鱼类和底栖动物种类数会比河流中间的略微要多(这一点与湖泊这种具有大水面的水体类似[24-25]),eDNA检出的物种组成的空间异质性比时间异质性要大(表2)。因此,在大型河流中,用eDNA监测统计细菌和真核生物中的后生动物,样品重复的设计建议优先关注空间重复采样;监测统计真核生物中的真菌、真核藻类、原生动物,样品重复的设计建议优先关注时间重复采样。
表2时间序列样品组和空间序列样品组检出的物种数和物种组成异质度*
Tab.2 Species numbers and species composition heterogeneity of each taxonomy that detected in the samples of temporal series group and spatial series group

*累计物种数为样品组内所有样品累计检出的物种数量;自有物种数为本样品组检出而另一个样品组未检出的物种数;检出物种数总占比为样品组的累计物种数除以两个样品组所有样品累计检出的物种数量;物种组成的异质度为样品组的累计物种数除以样品组内单样品平均检出的物种数量。
表3时间序列样品组和空间序列样品组检出的OTU数和OTU组成异质度*
Tab.3 OTU numbers and OTU composition heterogeneity of each domain that detected in the samples of temporal series group and spatial series group

*累计OTU数为样品组内所有样品累计检出的OTU数量;自有OTU数为本样品组检出而另一个样品组未检出的OTU数;检出OTU数总占比为样品组的累计OTU数除以两个样品组所有样品累计检出的OTU数量;OTU组成的异质度为样品组的累计OTU数除以样品组内单样品平均检出的OTU数量。
图6时间序列样品组和空间序列样品组检出的真核生物中真菌、真核藻类、原生动物、后生动物的物种数、累计物种数、物种累计曲线
Fig.6Species numbers, accumulated species numbers and rarefaction cure of the fungi, algae, protozoa and mezozoa that detected in the samples of temporal series group and spatial series group

图7时间序列样品组和空间序列样品组检出的后生动物中浮游动物、底栖动物、鱼类的物种数、累计物种数、物种累计曲线
Fig.7Species numbers, accumulated species numbers and rarefaction cure of the zooplankton, benthos and fish (mezozoa) that detected in the samples of temporal series group and spatial series group
受目标类群自身的分布、活动、输入、降解等特征影响,小尺度上优先关注空间重复采样时需要在大尺度上考虑采样时间的选择,小尺度上优先关注时间重复采样时需要在大尺度上考虑采样空间的选择。需要优先关注空间重复采样的监测目标类群——细菌,因为存在岸带土壤微生物的输入[20,22],所以在有雨天有岸带泥沙冲入河道时与在无雨天河水清澈时,所能检出的物种数、物种组成有较大的差异,因而在监测中可根据目标需求选择监测采样时间和天气条件。需要优先关注空间重复采样的监测目标类群——鱼类,在涨水时期鱼类向近岸浅水区扩散且在水体中上层活动活跃,在落水时期向江心深水区聚集且倾向于在水体中下层活动,因而在涨水期近岸和中上层水的eDNA监测检出鱼类种类数会整体性比落水期检出的鱼类种类数要多(表1,图7),在监测中应尽可能选择涨水期开展采样工作。另外,依靠生物个体体外eDNA而非生物个体或有细胞壁包裹的胞内eDNA进行物种检出的目标类群,温度升高往往会通过加速eDNA自然降解等过程对其检出概率产生负面影响(图2,具体如鱼类,表1,图7),在监测工作和结果评估中也应予以相应考虑。需要优先关注时间重复采样的监测目标类群——真菌、真核藻类、原生动物,往往在河道弯曲、水流速度较低的河段有相对丰富的群落组成和生物量,在河道顺直、水流速度较高的河段有相对贫乏的群落组成和生物量,因而在监测中可根据目标需求选择监测采样点位。
eDNA监测的目标类群越细分,监测中偶然性误差的影响越大,目标类群物种组成的时间异质性、空间异质性越大,在监测中需要的样品重复数就越大。因为eDNA在水体中并非均匀分布,所以不同样品间捕获的eDNA信号存在一定的差异。eDNA监测目标类群越细分,这些差异信号平均落入每一个目标类群的概率越低,进而导致检出的细分类群内物种组成的时间异质性、空间异质性越大,虽然这种异质性的程度存在一定的类群特异性(表2)。本研究中,第一层级(细菌、真核生物)的时间异质性、空间异质性整体比第二层级(真核生物中的真菌、真核藻类、原生动物、后生动物)的低,更比第三层级(真核生物中的后生动物中的浮游动物、底栖动物、鱼类)的低,其中真核生物中的真核藻类是第二层级中的特殊类群,浮游动物是真核生物中后生动物第三层级中的特殊类群,因为浮游生物(真核藻类、浮游动物)在时空分布上相对于同层级其他类群有更大的相对均质性,其时间异质性、空间异质性均比上一级的要低(表2)。因而,在针对于细分类群的eDNA监测中,要保证足够的样品重复数。
eDNA监测的结果注释越精细,监测对象eDNA信息的细微时空差异越容易被捕捉到,目标类群分类单元组成的时间异质性、空间异质性越大,样品重复方式的选择对结果的影响也越大。因为同一物种不同种群之间、甚至同一种群不同个体之间所产生的eDNA可能存在一定差异,而不同种群、不同个体在时间、空间上的非均匀分布又导致其产生的eDNA在时间、空间上的分布也不均匀。越高精细度的eDNA监测测序序列结果注释(或者说序列的区分,即分类学注释时所取的置信度阈值),对不同种群、不同个体的eDNA差异有越高的检出敏感度,且不同种群、不同个体的eDNA在时间、空间上的不均匀分布,最终必然导致监测结果有更高的时间异质性、空间异质性。通常情况下,这种注释精细程度变化对监测结果时间异质性、空间异质性的影响在趋势上和程度上往往都是一致的。OTU作为物种注释精细程度的一个极端,如本研究所示,结果可以获得更多的分类单元、更多的差异分类单元、更低的各组检出分类单元占比、更高的分类单元异质性(表2、3),但OTU时间异质性、空间异质性的相对关系与物种水平的状况一致,即不改变低精细程度所展示出的相对差异态势,甚至相对差异程度变化也不大(表2、3)。
本研究中变量控制一定程度上保障了研究结论的科学性,但某些因素对结果的非线性影响可能会让结果产生不确定性的偏差,进而影响结论的适用性。本研究是在丰水期,对样品数量、采样方式、处理方式、测序方式、分析方式等进行一致性控制,以样品重复方式为单变量开展的长江中游干流武汉断面eDNA监测小尺度时空异质性分析,结论具有一定的科学性,也有一定的适用局限性。以采样方式变化为例,如用断面空间连续采样(包括跨断面连续抽滤采样和连续被动吸附)[26]和定点时间连续采样(包括定点长期连续抽滤采样和连续被动吸附)[27-28]将如何影响eDNA检出的小尺度时空格局以及是否需要调整重复采样策略,需要实验验证。另外,受当前eDNA监测技术的缺陷影响,当前结论在某些具体细节上也存在一定的不确定性。比如当前eDNA监测技术对大型底栖无脊椎动物(如节肢动物、扁形动物、刺胞动物、线形动物)检出能力偏弱[11],会导致本研究中对相关类群的检出有一定遗漏,虽然在本研究中进行了变量控制,但检出遗漏仍有可能使得所检出相关类群的小时空异质性特征产生不确定性的偏差,进而使本研究在相关类群上的结论与实际情况之间产生偏离。
各类群小尺度时空分布的总体格局是否存在随河流、江段、时间的差异,是否会对样品重复设置优先度的结论的适用性产生影响需要进一步的验证。大量研究指出,受各种自然环境因子影响和人类活动干扰,各生物类群(如鱼类[29-31]、浮游生物[32-33]、底栖动物[34]、细菌[35-36]等)结构均存在显著的河流、江段、时间异质性。可以推断,在不同的河流、江段、时间开展eDNA监测,如果方法保持一致,监测结果一定存在差异。但我们认为监测结果的小尺度时间差异和小尺度空间差异的对比格局可能会随不同的河流、江段、时间发生变化,但不是必然发生变化。随着河流、江段、时间的变化,具体监测站位具体监测时间下各生物类群的空间结构和时间结构都发生变化,而这两种变化往往是同步、同向的,因而监测结果的小尺度时间差异和小尺度空间差异的对比格局通常会保持不变;但如果出现变化不同步或变幅不同步的情况时,监测结果的小尺度时间差异和小尺度空间差异的对比格局就会发生变化。本研究是在长江中游干流武汉江段于丰水期开展的,结论(在大型河流小时空尺度的eDNA监测中,监测细菌和后生动物时,样品重复的设计优先关注空间重复采样;监测真菌、真核藻类、原生动物时,样品重复的设计优先关注时间重复采样)是否具有大型河流全时域的普遍性,或者说具有多大程度上的适用性,以及在什么条件下适用,可以开展异时异地的进一步检验。
4 附录
附表Ⅰ和Ⅱ见电子版(DOI: 10.18307/2025.0402)。