随着温室效应的加剧和日益严峻的气候条件,气候变化已对生物多样性和自然生态系统稳定性造成严重威胁。森林作为地球陆地生态系统的主体承载着如水土涵养、气候调节、生物多样性维持等诸多生态功能。习近平总书记在参加首都义务植树活动中也提出“森林和草原对国家生态安全具有基础性、战略性作用,林草兴则生态兴”。 此外,如何基于自然的解决方案助力我国实现“碳达峰”“碳中和”目标?;如何确定不同地区适应未来气候变化且适宜种植的林木树种或生态型?;又如何达到“宜林则林、适地适树、最优管理”的森林碳汇最优化目的?为了回答和解决以上关键科学问题,系统挖掘和利用适应不同气候条件的野生林木种质资源是实现从源头上保障我国林木种业发展和生态安全的根本途径。野生林木遗传和种质资源不仅是现代林业种业发展的基础,同时也是国家的基础性战略资源,对未来创制和选育适应不同气候条件的林木新种质提供重要支撑。
2022年11月1日,Nature Communications在线发表了四川老员工命科学公司王婧教授、毛康珊教授和刘建全教授课题组合作的题为"Genomic insights into local adaptation and future climate-induced vulnerability of a keystone forest tree in East Asia"的研究论文。该研究以分布在我国东北温带针阔混交林的重要林木树种-香杨(Populus koreana)为研究对象,从头组装(de novo)并注释了香杨染色体水平的参考基因组,并对野外采集的24个香杨自然群体的230个体进行全基因组重测序。进一步运用生态学、基因组学、群体遗传学等方法,并结合气候因子关联分析、分子生物学实验验证和机器学习算法等对香杨适应不同气候环境的分子遗传机制展开探究,同时评估了未来气候快速变化的背景下香杨不同种群的基因组脆弱性大小。该研究强调了运用交叉学科手段对预测物种对气候和环境变化的响应和应对策略研究的重要性。
1. 香杨染色体水平基因组的组装
研究人员首先整合Nanopore long-read sequencing (106×, 42.42 Gb),Illumina sequencing (74×, 29.82Gb)和 Hi-C paired-end reads (137×, 54.22 Gb)三种测序方式的数据组装香杨基因组。最终组装出的基因组包含19条染色体,大小为401.6 Mb,contig N50为 6.41 Mb,且BUSCO为97.4%(Fig 1)。其中,37.2%的基因组序列被鉴定为重复元件。通过结合转录组、同源性序列和从头预测的方法,作者共注释出37,072个蛋白质编码基因。
2. 香杨自然种群的群体结构、遗传多样性及群体历史动态
首先,研究人员利用采自中国东北地区的24个香杨自然种群的230个个体进行高深度全基因组重测序(Fig2),分别鉴定到16,619,620SNPs,2,663,202Indels和90,357SVs(Fig 1)。ADMIXTURE结果和NJ树显示香杨群体主要分为南(长白山地区)、北(大兴安岭地区)两个亚群。然而,2D-SFS的结果表明南北亚群共享大量遗传变异,表明相对较弱的群体遗传结构。此外,两个亚群间的遗传分化较小(Fst: 0.02125;dxy:0.01098)且核苷酸多样性、连锁衰减距离也较为接近。通过PSMC分析发现两群体历史动态相似,约在末次盛冰期(LGM)产生分化,此后北方群体的有效种群大小逐步收缩而南方群体略有扩张。
3. 香杨种群气候适应关联位点鉴定
为了探究香杨不同种群气候适应性的遗传基础,研究人员利用两种环境关联方法在全基因组水平上检测与气候因子关联的遗传变异:首先,基于19个环境变量(BIO1-19),通过LFMM(latent factor mixed model)模型在排除群体结构的条件下,检验基因组变异位点与环境变量的相关性,分别检测到3013、378和44个与环境相关联(q< 0.05)的SNPs、Indels和SVs(Fig3)。由于LFMM是一种单变量检测方法,研究人员进一步采用多变量的景观基因组方法(RDA)来进行气候因子关联。在考虑梯度森林(gradient forest; GF)的重要性排序和环境变量间的相关性后,作者保留了6个 |r| < 0.6(Spearman correlation coefficient)的环境变量(BIO1, 3, 5, 13, 15, 19)进行RDA分析。RDA分析鉴别到的环境关联位点(standard deviation > 3)中,有1,779个位点与LFMM的结果有交集,这些变异被认为是“ 核心气候适应位点”,在基因组上广泛分布(Fig1)。
与基因组中性位点相比,鉴定到的核心适应位点在群体间有着更大的Fst,环境对于适应性位点的变异解释度要更高(偏RDA分析;41.2% VS 10.4%),并且在排除地理距离因素后的IBE(isolation by environment)偏Mantel检验中仍能表现出显著的环境隔离模式(Fig 2d),说明这些适应位点在群体间的变异确实主要由环境驱动。对于LFMM和RDA检测到的核心适应性变异,只有3.2%为非同义突变,2.0%为同义突变,其余变异均为非编码变异,并且与基因组背景相比这些变异显著富集于5` UTR区和TE(p < 0.001),表明调控区序列变异对香杨气候适应性起到重要作用。结合iHS分析,作者发现适应性变异与基因组背景相比没有显著的正选择特征,表明香杨的气候适应性可能很大程度上是由大量微小效应的多基因位点共同决定。
4. 香杨气候适应关联的等位变异地理分布特征
本研究鉴定到与不同气候因子关联的多个关键基因和等位变异。例如,与BIO13(最潮湿的月份的降水)密切相关的拟南芥同源基因CRL1(Fig 3a, b)。研究人员在香杨的4号染色体上鉴定到2个CRL1的串联重复基因(Pokor12247和Pokor12248)和104个潜在的适应性变异位点(Fig 3b),并以Pokor122475’ UTR区的适应性SNP:LG04:25159299进行模式展示:T单倍型主要分布在高降水地区,而C单倍型固定在降水相对较少的区域(Fig 3c)。进一步作者通过qRT-PCR来检测Pokor12247的这两个单倍型在水淹胁迫下具有显著的表达差异(Fig 3e)。与CC基因型个体相比,TC基因型个体在水淹胁迫中基因表达增强,表明T等位基因可能与水淹的耐受性有关。此外,研究人员没有在该位点上观察到强烈的近期选择信号,且两单倍型受选择程度(extended haplotype homozygosity)在该SNP位点上没有显著差异(Fig 3d,|iHS|= 1.693),再次支持香杨的多基因适应模式。
此外,作者还鉴定多个与温度关联的基因和等位变异,如与拟南芥HMG1,PGP4,HSP60-3A等同源的基因(Fig 3a,f)。其中,与BIO5(最温暖月份的最高温度)显著关联的例子是Pokor17228,它编码一个与拟南芥HSP60-3A同源的热休克蛋白。并从该基因鉴定到62个潜在的适应性变异。研究人员选择位于内含子的一个SNP:LG07: 4796402进行展示(Fig 3f):G基因型主要分布于温度相对较高的地区,而A基因型则主要分布在温度较低的地区。同样的,在热胁迫2h后GG基因型的表达量显著高于AA基因型(Fig 3i),表明Pokor17228可能与香杨的热胁迫响应有关。作者同样没有在该位点上观察到强烈的近期选择信号(Fig 3h)。
5.香杨应对未来环境的适应性预测
基于已建立的当代基因型-气候关系和已确定的气候关联遗传位点,研究人员使用4个CMIP6气候预测模型(2061-2080和2081-2100年,两种排放情形:SSP126和SSP370)采用3种方法对香杨群体应对未来气候变化的脆弱性进行预测。
作者首先计算了不适应风险系数(risk of non-adaptedness; RONA),该方法基于等位基因频率与当代气候变量建立线性关系后,对适应未来气候条件所需的等位基因频率改变进行预测,基因组上做出的需要改变越大表明适应潜力越差。结果表明,尽管RONA的值在未来的四个气候模型中存在数值差异,但趋势高度相关。因此,作者采用不同模型的平均RONA值来比较其在种群间的差异。对于大多数环境变量,RONA随着气候变化的剧烈程度不断增加(Fig 4)。作者选择BIO5和BIO13这两个变量的预测作为代表性结果进行展示,发现位于环境变化更剧烈地区的种群有更大的RONA值(Fig 4a,c):北部和南部群体应对未来温度变化的潜力都比较差(Fig 4,b),而在面对降水时,在未来可能会经历强降雨或极端降水事件的南部群体有更高的RONA值(Fig 4c,d)。
接下来,研究人员使用梯度森林(GF)来模拟沿着当前环境梯度的等位基因频率变化,并预测未来气候条件下的遗传偏移。与在单一环境变量下的单个位点水平上估计的RONA相比,GF能根据适应性位点和多元气候变量的复合效应之间的关联进行遗传偏移预测。与RONA结果一致:南部的鸭绿江流域群体最容易受到未来气候变化的影响(Fig 5a,b)。
最后,除了classical(local)遗传偏移外,研究人员还将迁移整合到预测中,进一步评估了香杨的reverse和forward遗传偏移。首先研究人员假定香杨群体能够迁移到现有分布范围内的任何位置,将预测出的最小偏移量作为reverse offset; 然后界定香杨的最大迁移距离来估计forward offset,在不同的最大迁移距离(100、250、500、1000 km和无限)下,作者发现群体的forward offset趋势基本一致。虽然预测的local、forward和reverse遗传偏移在整个分布范围内有所不同,但南部群体有着相对较高的local、forward和reverse遗传偏移(Fig 5c,d)。
综上所述,南部的香杨群体(尤其是鸭绿江流域种群)应对未来环境的脆弱性相对要高一些,又考虑到该群体包含许多适应气候的遗传资源,并携带许多适应降水的基因,所以该地区的群体可能需要引起人们额外的重视,进行重点保护。
讨论
目前很多研究都聚焦于对短世代物种的某一层面的适应性研究,通过传统同质园实验和相互移植适应实验来探究物种的适应性往往比较困难,并且对于世代周期长、实验体系不健全的物种往往不可行。而本文通过对230份来自东亚的香杨重测序数据,结合基因组学和群体遗传学理论,创新性地利用多种方法全面阐释了香杨对当代和未来环境的适应性模式,为育种和种质保护提供了重要信息。同时,该研究强调了整合基因组和环境数据来预测物种对未来气候快速变化的适应能力的重要性,对林木树种的适应性进化机制的研究有一定的启示。
四川老员工命科学公司王婧教授、毛康珊教授和刘建全教授为通讯作者,王婧课题组在读博士生桑宇鹏和在读硕士生龙志琴为论文的共同第一作者。kaiyun开云官方网站徐晓婷副教授、刘唤唤副研究员、姜渊忠副研究员,瑞典农业科学大学Pär K. Ingvarsson教授等研究人员参与了该项工作。该研究得到了国家重点研发计划、国家自然科学基金、中央高校基本业务费等经费的支持。
此外,王婧课题组拟招聘植物分子生物学(具有林木树种研究经验者优先)、生物信息学、遗传学等专业方向的博士后,有意者请发送简历到邮箱:wangjing2019@scu.edu.cn。课题组网站:https://jingwanglab.org。