打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
科研 | Genome Biol.:全球苦荞种质的重测序揭示了多个驯化事件和与农艺性状相关的关键位点(国人佳作)

编译:微科盟大陈子,编辑:微科盟Tracy、江舜尧。

微科盟原创微文,欢迎转发转载。

导读

苦荞麦(Fagopyrumtataricum)是一种营养平衡且富含类黄酮的作物,已经种植了4000年,现在已在全球种植。尽管其具有营养保健和农业价值,然而目前关于苦荞的遗传基础和驯化过程并不清楚,严重制约着其性状改良和品质育种。本研究通过对苦荞麦510份种质进行全基因组重测序,建立了苦荞麦基因组变异数据库。我们的分析揭示了苦荞的起源和传播路径,挖掘出中国南、北两个群体间的独立驯化区间,导致现代苦荞麦品种的多样性。另外,该研究还利用GWAS定位到苦荞产量和黄酮生物合成相关的关键基因并进行了功能解析,其中FtUFGT3FtAP2YT1基因与类黄酮的积累和粒重具有显著相关性。本文介绍了苦荞的遗传基础和驯化过程,并提供了详细的基因组变异资源,为苦荞优良品种的基因组辅助育种提供了依据。


论文ID


原名:Resequencing of global Tartary buckwheat accessions reveals multiple domestication events and key loci associated with agronomic traits
译名:全球苦荞种质的重测序揭示了多个驯化事件和与农艺性状相关的关键位点
期刊:Genome Biology
IF:10.806
发表时间:2021.01
通讯作者:周美亮
通讯作者单位:中国农业科学院作物科学研究所

实验设计

1. 对不同地理区域的14个国家的510个全球苦荞种质样本进行重新测序,探究荞麦种质资源的地理分布和种群结构;

2. 采用全基因组分析研究西南地区和北方地区之间的独立驯化和分歧;

3. 采用快速LMM和EMMAx模型对的480份样本进行GWAS分析,探究全基因组与类黄酮代谢的关系;

4. 采用快速LMM和EMMAx模型对480份样本进行GWAS分析,探究全基因组与农艺性状的关系。

实验结果

1. 全基因组变异和种群结构

我们对对来自14个国家的510份苦荞核心资源进行全基因组重测序,其中包括483个地方品种和27个野生种质,以及从中国四川收集的7种其他苦荞属物种(F.esculentumF.leptopodumF.qiangcaiF.pugenseF.rubifoliumF.gracilipedoidesF.caudatam)(图1a;附加文件1:图S1;附加文件2:表S1)。总共产生了3.98 Tb的原始数据,平均测序深度为12.65,基因组覆盖率为91.72%。我们确定了最后一组1095748个单核苷酸多态性(SNP)(附加文件2:表S2)和116516个小片段插入缺失(长度为150bp)(附加文件1:图S2;附加文件2:表S3),应用包括折叠和展开的位点频谱(SFS)来确认从整个基因组调用的SNP的合理性(附加文件1:图S3)。大多数SNP位于基因间区域,2.3%存在于编码序列中,由8847个同义SNP14944个非同义SNP组成(附加文件2:表S2)。非同义SNP与同义SNP的比例为1.69,高于木豆(1.18),鹰嘴豆(1.20),蓖麻(1.39)和大豆(1.61)。苦荞的Ts/Tv(转换/颠换)比率为2.175(附加文件2:表S2)高于黑豆(1.58),番茄(1.75)和玉米(1.02)。变体表现出潜在的巨大影响,该影响由814个破坏性SNP组成,导致终止密码子的增加/减少和764个插入缺失导致移码。我们使用基于PCR的测序策略验证SNP,并且准确度估计为95.1%,表明SNP鉴定的高可靠性(附加文件2:表S4)。

系统发育分析将510个苦荞品种分为三个主要单系分支(图1b;附加文件1:图S4):HW组(喜马拉雅野生种质),包括27个野生种质和9个地方品种,SL组(西南地区),包括203个地方品种;NL组(北部地区),包括271个地方品种。主成分分析(图1c)和基于模型的聚类分析(图1d)进一步支持了这些结果,这与DAPC分析(附加文件1:图S5)一致。正如预期的那样,系统发育树表明,与其他栽培荞麦品种F.esculentum相比,苦荞麦与外群其他Fagopyrum属物种的关系更为密切(图1e),这与之前的研究一致。

这三组显示出明显不同的地理分布:HW的野生种质主要来自喜马拉雅地区;SL主要包括来自中国西南部的地方品种,包括四川,云南和贵州省;NL主要集中在中国华北和华中地区、韩国、中亚地区、俄罗斯、欧洲和北美地区(附加文件1:图S4;附加文件2:表S1)。中国和国外品种在NL中的遗传分化值(FST)0.045,远低于HW和国外种质的FST(0.16)。(附加文件2:表S5)。我们从系统发育图和FST值分析表明,苦荞可能先由喜马拉雅地区野生种驯化成为栽培种后,再由中国北方迁移到其他国家。有趣的是,在栽培组中只发现了3份来自日本的样本(NL2份,SL1份),其余的(n=7)与野生样本一起分组,Suzuki等人的研究表明,除了从俄罗斯引进外,日本还从喜马拉雅地区直接引进。

由于人工选择有利的表型性状,与野生组HW相比,栽培组SLNL在植物发育、产量和品质性状方面具有显着优势(附加文件1:图S6S7;附加文件2:表S6)。HWSL0.173)和HWNL0.193)的全基因组配对FST值表明野生群体与栽培群体之间存在显著的遗传差异(附加文件2:表S5),这是驯化形成的。

图1 荞麦种质资源的地理分布和种群结构

a 苦荞种质资源的地理分布。传播路线以蓝线显示,代表从中国北方到其他国家。HW,喜马拉雅野生登陆,SL,西南长白,NL,北长白。b 517份种质资源的邻接树,包括510份苦荞种质和7种荞麦属植物。分支的颜色表示不同的分组:HW组(红色)、SL组(绿色)、NL组(蓝色)、outgroup组(紫色),与a中的颜色一致。c 对苦荞种质资源进行主成分分析,显示出前两种成分。颜色对应于系统发育树的分组。d 不同聚类数(K=3、4和5)的种群结构分析与系统发育树相匹配。x轴列出了与进化树一致的不同种质。e 群外种的系统发育树。

2.SL和NL之间的独立驯化和分歧

为了鉴定苦荞麦驯化过程中潜在的选择信号,我们采用跨群体的复合似然比检验法(XP-CLR)对HWSLHWNL进行比较。在前5%的水平虚线阈值之上,我们在HWSL之间识别出150个扫描区,其中包含3415个推定基因(图2a;附加文件2:表S7),并且在包含3006个推定基因的HWNL之间进行了156次扫描(图2b);附加文件2:表S8),其分别覆盖组装的基因组的8.0%39Mb)和8.5%41Mb)。值得注意的是,对于SLNL之间具有选择性标记的区域,只有19次扫描(4.1 Mb)和420个基因重叠(附加文件1:图S8),表明在这两个基因和地理上不同的群体中,可能存在由人类干预驱动的独立驯化现象。除XP-CLR外,还应用了多信号去相关复合(DCM)方法来检测选择性扫描。在前10%的虚线水平阈值之上,HWSL之间扫描146次(45 Mb)(附加文件1:图S9a;附加文件2:表S9)和HWNL之间扫描112次(45 Mb)(附加文件1:图S9b;附加文件2:表S10)。我们分别确定了SLNLXP-CLR识别的扫描重叠26.6 Mb59%)和30.6 Mb68%),表明了这两种方法的可靠性。

为了阐明SLNL之间显着表型差异的基因组区域,我们计算了群体差异并发现了34次扫描(前5%FST,附加文件1:图S10a;附加文件2:表S11)。我们将FST的结果和遗传多样性(πwildlandrace)的比较结合起来寻找SLNL中独特的选择性扫描区域(附加文件2:表S12S13)。我们在SL中发现了4个独特的选择性扫描(附加文件1:图S10b;附加文件2:表S14),在NL中发现了8个(附加文件1:图S10c;附加文件2:表S14)。对苦荞SLNL遗传分化相关基因的进一步开发和功能研究将有助于解释苦荞麦的基因驯化过程。

我们利用高效混合模型关联算法EMMAx (Hybrid-modelAssociation eXpedited)10个性状样本进行GWAS分析,进一步确定与驯化过程中重要农艺性状相关的位点(附加文件1:图S9S11-S15S17)。我们发现31GWAS信号与XP-CLR识别的植物高度(PH)、千粒重(GW)、整个生长期(GP)、种子圆度(SCD)、种子翅(SWI)、粒宽(SWD)、果皮色泽(PC)和单株籽粒产量(GYPP)的选择性扫描重叠(图2ab;附加文件2:表S15)。GWAS分析产生了34个信号,与DCMS识别的GWGP、种子长度(SDL)SWDSCDSWIPCPH的选择性扫描重叠(附加文件2:表S16)。与XP-CLR相比,我们发现GWGPSWDSCDSWIPCPH22GWAS信号重叠。(SL9个,NL13个)(附加文件2:表S16)。与GWAS分析和FST比对产生了8个信号(附加文件1:图S18-S21),这些信号与GWGPSWDSWIPC相关,并与发散区域重叠(附加文件1:图S10a;附加文件2:表S17)。

通过对与千粒重相关的SLNL的两次显著选择性扫描,我们在染色体1上发现了编码13S球蛋白种子贮藏蛋白的基因FtPinG0101179200(图2c),在染色体5上发现了编码13S球蛋白种子贮藏蛋白的基因FtPinG0505344900(图2d),编码生长素诱导的蛋白质。在株高方面,SL6个显著的选择性扫描区,而NL只有1个显著选择性扫描区。通过进一步分析这些关联区域中与植物生长相关的候选基因,我们在5号染色体的SL选择性扫描中鉴定了一个蛋白激酶基因(FtPinG0505903200)(图2e),该基因在拟南芥同源物LRR激酶AtVRLK1中参与了细胞伸长和次生细胞壁增厚之间的转换。在SL的选择性扫描中,在第6染色体上也发现了一个与株高相关的翻译因子基因FtPinG0606457100(2f),该基因在拟南芥中的同源基因对植物生长起着至关重要的作用。这些基因均通过因子谱转化线性混合模型(FaST-LMM)得到确认。(附加文件1:图S22)。这些结果表明苦荞的驯化经历了两个独立的事件,这两个事件分别受到SLNL中不同遗传通路的影响。

图2 SL和NL性状独立选择的全基因组分析

a-b 8条染色体上SL(a,绿色)和NL(b,蓝色)驯化的选择性信号。红色箭头表示与GWAS信号重叠的高度选择性基因组区域。PH:株高;GW:千粒重;GP:全生育期;SCD:种子圆形度;SWI:种翅;PC:果皮颜色;GYPP:单株籽粒产量。c-d SL(c)和NL(d)群体中GWAS信号与GW选择扫描重叠的曼哈顿图。e-f GWAS信号的局部曼哈顿图与SL染色体5(e)和6(f)上PH的选择扫描重叠。

3. 全基因组与类黄酮代谢的关系

黄酮醇化合物的丰富性是苦荞麦中具有健康和药学特性之一。我们采用快速LMMEMMAx模型对用于鉴定潜在基因的480份样本进行GWAS分析,以确定与三种黄酮醇含量显着相关的潜在基因(附加文件1:图S23-S25),包括槲皮素(QC),芦丁(RC)和山奈酚-3-O-芸香糖苷(KC)。我们在1号染色体上发现了一个与山奈酚-3-O-芸香糖苷含量显著相关的基因(图3a;附加文件1:图S24;附加文件2:表S18),在该关联区发现了20个候选基因(4.52-4.72 Mb)(图3bc;附加文件2:表S19)。SNP产生了三种单倍型(Ft1:4617722A/G)(Hap.1AA)、Hap.2AG)和Hap.3GG)),它们位于FtUFGT3FtPinG0100123400)基因的启动子中(图3d),可编码UDPglucosyltransferase催化花青素转化为花青素-3-O-葡萄糖苷。FtUFGT3在种子中的表达量显著高于其他候选基因,并在种子成熟13 ~ 25DPA (后穗日)期间下降。我们进一步发现,Hap.1与较高的山奈酚-3-O-芸香糖苷含量相关,而Hap.3与较低的含量相关(图3f)。接下来,我们对FtUFGT3基因表达进行检测,发现它与山奈酚-3-O-芸香苷的含量成明显正相关(图3g)。在苦荞毛状根中过表达FtUFGT3在体内实现了山奈酚-3-O-芦丁苷含量的升高(图3h;附加文件1:图S26),并且体外酶测定显示FtUFGT3催化山奈酚转化为山奈酚-3-O-葡萄糖苷(图3h;附加文件1:图S27)。这些结果表明FtUFGT3参与了黄酮类化合物的代谢。

在槲皮素含量(QC)方面,我们发现了一个候选基因FtPinG0100487500,该基因编码谷胱甘肽转移酶,其在拟南芥(TT19)、茶叶(CsGSTa, b, c)和桃(PpGST1)中的同源性已被报道对花青素类黄酮醇和原花青素的存储必不可少。果皮色泽是由黄酮类物质积累和氧化形成的,在应用过程中具有不同的用途和偏好性质。

我们使用黑色果皮和非黑色果皮样本(附加文件1:图S28a)在2号染色体上鉴定了一个重要的GWAS信号,峰值SNPFt2:44531080 C/G)产生了三个单倍型,即Hap.1GG)、Hap.2CG)和Hap.3CC)。90%以上的Hap.1聚集在黑色种子中,99%Hap.3表现为非黑色类型(附加文件1:图S28b),这表明Hap.1与黑色果皮颜色之间存在显著相关性。在位于该关联区的9个基因(44.43 44.63Mb)中,FtPinG0202040000基因(附加文件1:图S28c;附加文件2:表S20)与拟南芥TT2同源,后者编码MYB转录因子,众所周知,MYB转录因子是发育过程中原花青素积累的关键正向调节因子。综上所述,这些位点和候选基因都有可能用于荞麦品质改良。

图3 与山奈酚-3-O-芸香糖苷含量相关的FtUFGT3基因的鉴定

a 曼哈顿地区GWAS对全人群中山奈酚-3-O-芸香苷含量(KC)的影响。虚线表示阈值logP = 5。红色箭头表示FtUFGT3的SNP。b 与KC相关基因的局部曼哈顿图(上图)和连锁不平衡热图(下图)。c 关联区基因的简图表示。I:FtPinG0100123000;II:FtPinG0100123100;III:FtUFGT3;IV:FtPinG0100123600;V:FtPinG0100123800;VI:FtPinG0100123900;VII:FtPinG0100124100。d FtUFGT3基因组序列的示意图。蓝色系代表启动子和3'UTR。致病SNP位于启动子1303 bp处,以黑线标记。Hap1,单倍型1,Hap2,单倍型2,Hap3,单倍型3。e 种子发育过程中c基因的表达。f 盒状图显示KC有三种单倍型(Hap.)。g FtUFGT3在不同荞麦品种Hap.1和Hap.3中的相对表达量。h 转基因苦荞麦毛状根过表达FtUFGT3中的KC,由5个品系混合。i FtUFGT3的体外酶学检测。上为MBP-FtUFGT3蛋白与山奈酚标准品反应产物,中为山奈酚标准品,下为山奈酚-3 - O-葡萄糖苷标准品。Kae.,山柰酚。

4. 全基因组与农艺性状的关联

在作物育种中,产量、生育期等农艺性状一直处于首位,其调控机制复杂。利用直接量化产量的千粒重GWAS(快速LMMEMMAx模型)(附加文件1:图S29),我们鉴定了位于FtPinG0404616900C/GFt4:46350596)和Ftping028000714T/GFt2:37407976)的2个非同义SNP,它们编码AP2转录因子和未知蛋白质(附加文件2:表S21S22)。因此,选择FtPinG0404616900FtAP2YT1)作为与千粒重性状相关的候选基因进行下一步的功能研究(图4a)。我们鉴定了2个单倍型,与低粒重相关的Hap.1CC)和与高千粒重相关的Hap.2CG)(图4bc)。这种非同义SNPC/G)导致第二个β-折叠位置的氨基酸从Pro变为Ala,该位置靠近其DNA结合域(图4d)。酵母单杂交试验表明,与FtAP2YT1Pro相比,FtAP2YT1AlaGCC顺式元件的结合活性显著增加(图4e;附加文件1:图S30)。我们进一步选择了7个与粒重相关的GCC顺式元件FtAP2YT1潜在靶基因进行验证(附加文件2:表S23)。在高粒重携带Hap.2的样本中,FtPinG0505979100FtPinG0707412500FtPinG0708109000三个基因的表达显著高于低粒重携带Hap.1的样本(图4f h)。这些结果表明,FtAP2YT1可能在调控千粒重相关基因的表达中起重要作用。

种子大小也是决定作物产量的重要因素。我们的GWAS分析确定了2个与种子宽度相关的候选基因,包括上述与千粒重相关的基因(FtPinG0404616900)(附加文件1:图S31;附加文件2:表S20)。FtPinG0100980400编码一种色氨酸氨基转移酶相关蛋白,据报道该蛋白通过水稻和小麦生长素生物合成对粮食产量至关重要。苦荞重要农艺性状相关区域的候选基因有望用于苦荞品种的产量改良。 

图4 千粒重相关候选基因FtAP2YT1的鉴定

a 千粒重量(GW)的曼哈顿GWAS图。虚线表示阈值logP = 5。红色箭头表示FtAP2YT1中的SNP。b FtAP2YT1基因组序列的结构,只有一个外显子,用一个方框表示。非同义SNP为226 bp,用黑线标记。Hap1:单体型1;Hap2:单体型2。c 框图显示两个单倍型的GW (Hap.)。d FtAP2YT1蛋白结构模型。与Pro76位点相比,Ala76扩大了与DNA结合的β片长度。e Y1H FtAP2YT1Pro和FtAP2YT1Ala结合GCC-box和mGCC-box活性分析。f-h FtAP2YT1的潜在靶标GCC-box基因在不同haps .1和haps .2品种中的表达。

讨论

喜玛拉雅地区荞麦资源的丰富遗传多样性和栽培荞麦祖先的特征,表明该地区是栽培荞麦的原产地。荞麦的传播是在栽培荞麦诞生后由中国和喜马拉雅南部传入世界的。本研究中,来自中国北方和来自国外的苦荞种质之间的亲缘关系较近(附录1:图S4 ),这为野生苦荞在中国改良后从中国北方传入其他国家的假说提供了证据。由于缺乏考古和孢粉学证据,且野生资源较少,这一结果具有一定的局限性。

经过几千年的栽培和人工干预,栽培苦荞品种的千粒重比野生苦荞品种显著增加,全生育期显著缩短。然而,与大多数禾本科和豆科作物不同,这种假谷类作物仍具有种子破碎、壳厚、茎高、倒伏、产量低等野生特性。除了表型之外,在通过多种方法获得的遗传选择性扫描中未发现充分表征的驯化基因(如水稻种子休眠的sh4、玉米裸粒的tga1、水稻分蘖角的PROG1、大豆、水稻和番茄种子休眠的G等),这表明驯化过程仍处于非常早期阶段。

SLNL地方品种除了在粒径、株高、全生育期和粒重等表型上存在差异外,还表现出明显的地理和遗传分化。SLNL地方品种之间的差异可以通过人工选择当地适应和偏好的性状来解释。这些独特的遗传选择图谱及其在SLNL中的基础基因(2,附录1:图S18,附录2:表S15S16 )为苦荞的分子育种提供了潜在的宝贵资源,例如,在SL的遗传选择图谱中,鉴定到一个与株高相关的蛋白激酶基因FtPinG0505903200 (2)。该基因属于富含亮氨酸的重复受体样蛋白激酶(LRR-RLK)家族,该家族是植物中最大的受体样激酶家族,在植物的发育和应激反应中发挥着重要作用。因此,我们提取了苦荞LRR-RLKs结构区域,并将其保守的激酶结构域与拟南芥LRR-RLKs结构区域进行比对。总的来说,199个荞麦LRRRLKs被分为19个不同的亚家族,FtPinG0505903200被聚在VIII-1组中(附加文件1:S32),这有助于为了解可能的基因功能和差异的机制提供思路。

结论

在本研究中,我们从包括野生样品和地方品种在内的苦荞种质资源丰富的基因组变异中,获得了与SLNL分别改良过程对应的基因组区域。遗传选择图谱和候选基因在两个地理上不同的类群可能对现代分子育种有用。此外,利用GWAS技术,我们鉴定了几个有助于苦荞重要品质和产量性状形成的基因组位点。通过分析类黄酮代谢相关的关键酶基因FtUFGT3和与粒重相关的转录因子FtAP2YT1的功能,我们揭示了关键基因在优质苦荞麦品种改良中的应用潜力。进一步,采用GWAS分析得到的这些基因座不仅为荞麦作物改良,也为其他作物改良提供了潜在基因。本研究为荞麦的起源、传播和驯化提供了广泛的基因组资源,为今后荞麦品质改良特别是产量和品质改良育种提供了重要的理论依据。

原文链接:  
https://pubmed.ncbi.nlm.nih.gov/33430931/
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
使用IMPUTE2进行基因型填充
使用Minimac进行基因型填充
问卷和量表 介绍
精神分裂症遗传学研究取得进展
短篇:call snp和GWAS的关系
对全基因组关联分析(GWAS)的一些个人理解
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服