打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
《Cell》: mRNA的3'端非编码区域(UTR)变异与人类疾病和进化的因果关系
userphoto

2022.06.11 贵州

关注
Genome-wide functional screen of 30 UTR variants uncovers causal variants for human disease and evolution
|背景介绍:
在过去二十年中,通过全基因组关联研究(GWAS)发现了数千种变异性状关联。然而,GWAS在阐明复杂疾病的机制方面受到两个限制:(1)连锁不平衡(LD),即由于强遗传连锁导致不同位点等位基因之间的关联,导致相邻中性多态性显示出与因果位点类似的强关联,大大增加了功能验证的实验负担;(2)超过90%的关联位于基因组的非编码区,其中功能解释比编码区困难得多。
3'非翻译区(3'UTR)包含一类特别重要的非编码变体,可影响转录后和翻译过程。因果性外周血顺式表达数量性状基因座(eQTL)变异体在3’UTR中富集了4倍,其水平与启动子元件的水平相匹配。在基因型组织表达项目(GTEx)的所有组织中,发现3’UTR中的EQTL富集了2倍,是所有非编码区中富集程度最大的。在除转录起始位点外的所有非编码类别中,非翻译区域具有最大的GWAS遗传力(5倍),强调了转录后活动在人类调节变异中的重要作用。
尽管3'UTR变异对于理解人类表型变异至关重要,但只有少数因果性3'UTR变异被描述。它们包括与狼疮和多发性硬化相关的TNFSF13B中的BAFF var,与高密度脂蛋白胆固醇水平相关的LPL中的rs13702,以及与冠状动脉疾病相关的TCF21中的rs12190287。在进行低通量荧光素酶确认之前,每个病例都需要跨多个特征或群体数据集进行荟萃分析,并用已知的调节因子进行注释。这些因素表明当前3'UTR因果变异的发现是多么繁重,并强调需要高通量工具来描述3'UTR变异对基因表达的功能影响。
大规模平行报告分析(MPRAs)的开发使得同时测试数千种顺式调节活动的变异,以确定非编码区域的因果变异,历史上,MPRA主要用于理解转录调控。一些研究已经采用MPRA测试3’UTR序列,但3'utr的遗传变异仍需要进一步鉴定。
在这里,我们开发了3’UTRs的大规模并行报告分析(MPRAu),以高通量、准确和可重复的方式同时量化数千个3'UTR变体的等位基因表达差异。
MPRAu检测30个UTR调控的不同方面,使我们能够通过计算模型了解控制转录本丰度的一般序列特征,精确定位变异功能背后的精确序列结构,包括RNA结构和RNA结合蛋白(RBP)占用,并指定因果变异。
我们利用MPRAu全面检测了六种人类细胞系中30个UTR遗传变异的疾病分离和进化适应性。
从我们提出的功能性因果变异中,我们也使用CRISPR诱导的等位基因替换更深入地描述了两个变异。
|核心内容:
3'非翻译编码区(3' UTR)变异与人类的进化和疾病密切相关,该区域如何调控疾病的发生并不十分清楚。
我们开发了3'UTR大规模平行报告测定系统(MPRAu),对12173个3'UTR的可变序列进行了测定。
我们将MPRAu应用于六种人类细胞系,重点关注与全基因组关联研究(GWAS)和人类进化适应有关的遗传变异。
MPRAu增强了我们对3'UTR功能的理解,表明3'UTR调节活性主要是由简单序列所决定的。
利用该方法,我们在碱基对(bp)分辨率上发现了多种不同的分子机制,例如LEPR中一个富含腺苷酸(AU)的调节元件与东亚人潜在的代谢进化适应有关。
我们提出了与遗传学上的精细测绘表型相关联的的数百个3'UTR可变序列。
利用内源性等位基因替换,我们描述了一个破坏调节病毒防御基因TRIM14的miRNA位点的变异、一个改变了PILRB丰度的变异,并提出了年龄相关性黄斑变性中导致转录变化的一个决定性3’UTR可变序列。
图1:MPRAu再现了数千个3'UTR元件的功能特征
A)MPRAu概述:(1)合成具有基因组变体的寡核苷酸3’UTR元件;(2)寡核苷酸经PCR扩增后克隆到GFP的载体3’,并将其置于随机的六聚体条码临近处;(3)将载体库转导至细胞中;(4)提取GFP mRNA并测序。将mRNA测序计数(4)与质粒计数(2)进行比较,以确定ref和alt等位基因的相对表达程度。
(B)从该散点图中可观察到大多数具有显著活性的寡核苷酸发挥了减弱效应。
(C)所有复制体中RNA计数的配对相关性热图。
(D)识别具有显著不同的alt/ref活性的tamVars(红色)变异。
(E)在所有检测的细胞类型中,对至少一种细胞类型有明显影响的变异进行的Mash调整log2FC等位基因偏移。
(F)该柱状图描述了在一个到所有六个细胞类型中共同存在的tamVar。
(G)tamVar等位基因与低通量荧光素酶检测的一致性。显示了皮尔逊R值及其统计学意义。
图2:功能3’UTR元素重叠已知的3'UTR注释
(A)比较活动效应和3’UTR结构(更多的负最小自由能,左)和百分比(右)的相关性之间的散点图。HMEClog2FC活动数据具有代表性并进行了绘制。显示了皮尔逊的r及其统计学意义。绘制点的密度用颜色尺度表示。(B)顶部:富集显著活跃的3'utr,已知的30个UTR衰减(富au、Pumillo和miRNA)和增强(富cu元素)注释。使用双侧Wilcoxon秩和检验,绘制了所有细胞类型的平均log2FC,显著性表示为***p值<0.001,**p值<0.05,使用双侧Wilcoxon秩和检验。底部:获得上述列出的30个UTR注释的变体的等位基因倾斜的条形图。误差条:95%CI。(C)具有高等位基因偏斜的变异(|log2FC偏斜|R1)比具有较低等位基因偏斜的变异具有更大的体内eCLIPRBP结合得分(*p值<0.05,使用单侧Wilcoxon秩和检验)。
图3:3’UTR活动的计算模型揭示了对准确预测的重要特征
(A)精度召回率和(B)最佳模型(xgboost)的接收者工作特征曲线(显示的数据用于HMEC)。来自控制模型(使用百分比U的单变量决策树模型)的结果也被绘制出来进行比较。(C)模型性能的前10个最重要的预测变量的图,按平均值排序(|Shap值|)。(D)最小自由能(mfe,左)和百分比U(pU,右)与该变量的大小进行比较。Shap值越大,对模型衰减的影响越大。相关变量的大小,百分比(pGC,左)和最大U均聚物(hp)长度(右)用颜色尺度表示。mfe对衰减表现出单调效应(左),高pGC与衰减相关,低mfe(蓝色)。PU对衰减呈非线性影响(右),特别是在具有长均聚物Us(红色)的序列中观察到的衰减。
他们还量化了携带ref和alt等位基因的序列之间的差异,并将具有统计学意义的 “等位基因偏移”(allelic skew)的等位基因称为转录物丰度调节变异(tamVars)。此外,MPRAu采用了一些质量控制措施以尽量减少偏差,包括使用随机条码以确保足够的寡核苷酸库复杂性等。
图4: tamVars负责基因表达和表型变化
(A)GM12878tamVar等位基因偏斜与细胞类型匹配的Geuvadis等位基因偏斜相关。(B)GTEx中全组织中位数eQTL等位基因倾斜(后beta)之间的相关性,通过所有细胞类型的遗传敲捕(PIP>0.2)和强tamVar(BHVarp-adj<0.05)具有很高的因果关系。PIP是对一个变异偶然影响基因表达变化(从GTEx测量)或从英国生物样本库收集的表型性状的概率的估计。(C)来自英国生物样本库的GWAS变体随着PIP截止的增加显示,在至少一种测试细胞类型中通过MPRAu显著变异的富集(*p值<0.05,Fisher的精确检验)。(D)tamVar等位基因倾斜与河流评分相关,这是一种罕见变异的功能估计(HMEC的数据具有代表性并显示)。显示了皮尔逊的r及其统计学意义。
图5:MPRAu通过SNV和缺失碱基片段(A-C)揭示了功能序列结构。
顶部:使用跨越100bp的参考文献(红色)或alt(蓝色)序列上下文对目标变体进行5bp的缺失贴片。误差条:ref/alt活动的标准差。底部:SNV贴±在每个变体周围10bp,显示两种变体上下文下的log2倍变化和基序富集得分。绘制了所有面板的HEK293 30 UTR活动数据。(A)rs16975420(CIBAR2)上的贴图,包括U1snRNP的序列基序(灰色阴影)。(B)rs3751756(KIAA0513)的贴图覆盖了RNA元件的预测结构(中间底部)。在SNV贴片中观察到的巨大变化预计会破坏茎结构中的碱基。(C)在rs34448361(LEPR)上标记有富铝元素的地块。
图6: rs705866和rs1059273是内源性验证的tamVars,影响人类疾病和适应表型
(A)黄斑变性标签SNPrs7803454与rs705866(mprau检测SNP)周围的年龄相关性黄斑变性GWAS关联图以粗体表示。(B)rs705866的MPRAu等位基因结果。误差条:ref/alt活动的标准差。(C)HDR实验管道示意图(左)。从HDR估计的rs705866(中心)和rs1059273(右)的等位基因偏倚表现出与MPRAu结果相同的方向性。误差条:95%CI。(D)rs1059273周围的EHH评分提示汉族(CHN)的进化选择。为了进行比较,我们对尼日利亚Esan(ESN)的EHH分数也显示出来。(E)MPRAu在等位基因背景中显示出显著的衰减活性,rs1059273的结合位点。
原文摘要:
3’ untranslated region (3' UTR) variants are strongly associated with human traits and diseases, yet few have been causally identified.
We developed the massively parallel reporter assay for 3' UTRs (MPRAu) to sensitively assay 12,173 3’UTR variants.
We applied MPRAu to six human cell lines, focusing on genetic variants associated with genome-wide association studies (GWAS) and human evolutionary adaptation.
MPRAu expands our understanding of 3’UTR function, suggesting that simple sequences predominately explain 3'UTR regulatory activity.
We adapt MPRAu to uncover diverse molecular mechanisms at base pair resolution, including an adenylate-uridylate (AU)-rich element of LEPR linked to potential metabolic evolutionary adaptations in East Asians.
We nominate hundreds of 3’UTR causal variants with genetically fine-mapped phenotype associations.
Using endogenous allelic replacements, we characterize one variant that disrupts a miRNA site regulating the viral defense gene TRIM14 and one that alters PILRB abundance, nominating a causal variant underlying transcriptional changes in age-related macular degeneration.
评估了6个细胞系中数千个GWAS和适应相关的3'UTR变异
提出了数百个具有活性功能证据的具有因果关系的GWAS变异
在碱基对分辨率下描绘机制调控基序
对黄斑变性因病变异的等位基因替代和病毒防御
简版:
对3'UTR进行大规模平行报告分析,测量了与人类疾病和许多细胞类型的进化选择相关的12,000个3'UTR变异的个体调控效应,并提出了功能遗传变异。
Massively parallel reporter assay for 3' UTRs measures individual regulatory effects of over 12,000 3' UTR variants associated with human disease and evolutionary selection in many cell types, nominating functional genetic variation.
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
ANNOVAR结果说明-SNP/INDEL
HGVS基因变异命名规则
2019意犹未尽的基因组可视化IGV(一)
基因组非编码区变异的临床解读建议(中)
针对肿瘤常见突变位点设计引物
喝酒容易得肝癌,是真的吗?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服