打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
全基因组分析中明确的日本人的遗传起源和特征-尼安德特人丹尼索瓦人的基因混入和自然选择-

2024年4月18日 理化研究所 全基因组分析中明确的日本人的遗传起源和特征-尼安德特人丹尼索瓦人的基因混入和自然选择- 理化学研究所(理研)生命医科学研究中心基因组分析应用研究小组组长寺尾知可史(静冈县立综合医院临床研究部免疫研究部长、静冈县立大学药学部基因组病情分析讲座特任教授)、高级研究员刘晓溪(研究当时:基因组分析应用研究小组研究员; 静冈县立综合医院临床研究部研究员)、东京大学医科学研究所附属人类基因组分析中心测序技术开发领域的松田浩一特任教授等共同研究小组分析了大规模日本人的全部基因组测序( WGS ) [1]信息,分析了日本人集团的遗传结构,发现了来自尼安德特人[2]和丹尼索瓦人[3]的DNA和疾病的关联性,以及基因组的自然选择所影响的多个区域。本研究成果有望对日本人集团的遗传特征和起源的理解,以及对个体化医疗[4]和制药研究的贡献。 这次,共同研究小组分析了生物银行日本( BBJ ) [5]提供的3,256名日本人的全部基因组信息。 通过这个研究,明确了与日本人祖先相关的三个源流(绳文系祖先、关西系祖先、东北系祖先)的起源。 另外,确定了从被认为是现生人类(智人)最亲近的古代型人类尼安德特人和丹尼索瓦人那里继承的基因领域。 部分日本人拥有的NKX6-1基因区域与2型糖尿病风险相关,研究表明该区域来自丹尼索瓦人。 此外,还确定了日本人基因中自然选择起作用的区域。 本研究刊登在科学杂志《Science Advances》在线版( 4月17日:日本时间4月18日)上。

从大规模日本人的全部基因组序列中阐明日本人群体的遗传结构等 背景 全基因组测序( WGS )数据在遗传学和生物医学中是不可或缺的。 通过对WGS数据的分析,打开了理解人类遗传多样性和自然选择过程的新大门。 另外,进一步提高了个体化医疗和制药研究中的基因组宽相关分析( GWAS )的分析能力,与疾病相关变化的鉴定和治疗目标的确定相关联。 但是,以日本人集团为对象的WGS研究,仅限于有限的规模。 为了填补这个差距,共同研究小组分析了从全国7个地区收集到的3,256人的基因组信息,旨在明确日本人特有的遗传特征。 通过这个大规模的数据集,日本人的遗传起源、与尼安德特人和丹尼索瓦人的遗传联系,以及自然选择的过程获得了新的光芒。 研究方法和成果 由生物银行日本( BBJ )进行了全国7个地区(北海道、东北、关东、中部、关西、九州、冲绳)的医疗机构登记的共计3,256人份的全部基因组序列( WGS ),“Japanese encycloplops” 该最终数据集包括45,586,919个SNV[6]和9,113,420个indel[7],其中15,410,953个( 32.7% )为JEWEL中新观察到的变化[ 这是日本最全面的全基因组序列数据之一。 为了理解日本人的集团结构,首先基于公共变化[8]进行了以往的主成分分析( PCA ) [9]。 与以前的研究一样,这一分析再现了冲绳和本土集群的双重结构(图1B ) 假设稀有变化[8]可能在揭示人口结构方面提供更多信息,我们使用1835,116个稀有变化进行了降维( PCA-UMAP )分析[10]。 通过这一分析,明确了日本人口史无前例的遗传结构(图1C )。 该结构不仅基于公共变体再现了从PCA中得到的模式,还表现出了几个显著的特征。 具体情况如下。 1 )可以观察到本土区域之间更加明确的分离,以及从本土集群到冲绳集群之间更加明确的区分。 2 )东北人群被聚类到狭长区域。 此外,WGS数据ADMIXTURE分析[11]的分析结果表明,日本人口可以通过三个祖先(以下称为K1、K2、K3 )的混合来最好地建模。 K1、K2、K3分别在冲绳、东北、关西最高(图1D )。 K1 (冲绳)成分在除南部(与冲绳相邻的地区)以外的本土亚组中维持了比较稳定的比例约12%,在南部显示了更高的比例22%。 可见K2 (东北)和K3 (关西)成分从西到东北逐渐变化(图1D )。
图1使用全基因组序列数据的日本人群体结构结果 a )收集样品的日本七个地区。 b )进行以公共变化为基础的PCA分析,对聚集参加者的每个地区进行了颜色区分。 c )展示基于稀有变化的PCA-UMAP分析。 在b )、c )中,每个点都表示个人,点与点的距离反映了遗传学上的差异。 越近的点在遗传学上越近。 在这两幅图中,根据出生地为基础的遗传背景的不同,用颜色来区分表示。 d )进行ADMIXTURE分析,分为三个群体( K=3)。 从冲绳以外的地区随机选出100人,从冲绳分别分析了所有人( 28人)。 K1表示冲绳,K2和K3分别表示东北和关西的最高值。 以前的研究表明,日本人有绳文人和东亚( EA,主要是汉族)的祖先。 从最近的古代基因组分析中,也有人指出了东北亚( NEA )祖先的影响。 在此背景下,联合研究小组将绳文、EA、NEA的现代和古代遗传数据与此次数据一起进行了分析。 关于绳文的祖先比率,推测冲绳拥有最高的比率( 28.5% ),其次是东北( 18.9% ),另一方面关西最低( 13.4% )。 这与以前的研究表明绳文人和冲绳人民之间有很高的遗传亲和性相一致。 另外,明确了关西地区和汉族的遗传亲和性很高。 此外,联合研究小组使用中国、韩国和日本报告的古人基因组数据,评估了东北和关西之间的遗传亲和性的差异。 结果表明,关西人与黄河( YR )或其上游地区的中新石器时代及后新石器时代古代中国集团有着明显的密切关系。 相比之下,东北地区的个体与绳文人的遗传亲和性明显较高,另外显示出与冲绳宫古岛的古代日本人基因组(具有较高的绳文比率)和韩国三国时代(4~5世纪)的古代韩国人也有较高的遗传亲和性。 联合研究小组使用了最新的概率方法IBDmix[12]来检测可能从灭绝的尼安德特人和丹尼索瓦人那里继承的基因序列。 通过对JEWEL的个别数据分析,检测到了来自尼安德特人的约49Mb (兆基:以DNA长度为单位,1Mb为100万个碱基对)和来自丹尼索瓦人的约1.47Mb的基因序列。 共计,确定了很可能从尼安德特人继承的3,079个区段(基因组区域)和很可能从丹尼索瓦人继承的210个区段,分别覆盖了772Mb和31.46Mb的基因组(图2 )。
图2日本人集团中由尼安德特人或丹尼索瓦人混入的DNA序列 密度图,显示各染色体上混入的序列分布。 上面的轨道(用蓝色表示)表示被认为是直接从尼安德特人继承的排列,下面的轨道(用红色表示)表示来自丹尼索瓦人的排列。 根据BBJ到GWAS的结果,调查了被继承的序列对106个表现型的影响。 包括来自丹尼索瓦人的2个和来自尼安德特人的42个在内的44个区域和49个表现型建立了关联。 这些中有43个的关联在以前的研究中没有被报告。 特别是POLR3E来自丹尼索瓦人的区段与身高相关,NKX6-1的区段与2型糖尿病( T2D )相关(图3 )。
图3丹尼索瓦人混入的基因 NKX6-1基因领域中被认为直接由丹尼索瓦人继承的变异与日本人群中的2型糖尿病( T2D )相关。 横轴表示人类基因组染色体上的位置,纵轴表示与各变异的T2D的关联强度。 三角形是指从丹尼索瓦人那里继承的变异,灰色的点表示其他的变异。 此外,来自尼安德特人的区段包括T2D、冠状动脉疾病( CAD )、稳定心绞痛( SAP )、特应性皮炎( AD )、格雷夫斯病( GD )、前列腺癌( PrCa )、类风湿性关节炎( RA )等七个区段 这些发现,特别是在东亚人中显示出明显的群体特异性,发现日本人的烯丙基频率[13]的中位数是欧洲人的2.5倍。 联合研究小组为了确定日本人口中可能被选择的基因组区域,用iHS[14]和FastSMC[15]两种方法进行了全基因组扫描。 通过iHS法,联合研究小组确定了在所有基因组(包括MHC、ADH集群和ALDH2 )显著性水平中处于正选择下的三个区域(图4A )。 进而,探索了横穿关西、关东、东北、九州、冲绳五个代表性地区的选择概况的潜在地域差异。 虽然在本州地区整体观察到了类似的选择概况,但是与酒精代谢相关的ADH聚类信号在冲绳比较弱,只有在本土群体中检测到了对ALDH2基因区域的自然选择。 这些差异需要进一步研究,因为冲绳样本大小有限,或者选择压力可能不同。 此外,我们使用了FastSMC方法作为验证iHS方法中观察到的信号的补充方法(图4B )。 该方法确定了过去50代中可能成为选择对象的四个候选区域。 这包括在iHS法中有意义的三个区域( ADH、ALDH2、MHC )和候选区域2p25.3。 这三个区域( ADH、ALDH2、MHC )在以前的研究中也被检测出,进一步证明了日本人口中对自身免疫系统和酒精代谢途径的强烈选择压力的存在。
图4自然选择检测结果A:在IHS法中,确定了有可能被自然选择的三个基因组区域。 B:B:FastSMC法确定了有可能自然选择的四个基因组区域。 图表的横轴表示染色体上的位置,纵轴表示自然选择痕迹的强度。 曲线表示各区域的分析结果,纵轴的值越大,意味着受到了自然选择的强烈影响。补充说明 1 .全基因组测序( WGS ) 与微阵列不同,是在整个基因组区域进行DNA测序并决定基因序列的技术。 对于检测用微阵列难以捕捉的频率较低的SNP等很有用。 通过新一代测序仪的问世和改良,提高了测序精度和降低了成本,我们期待今后的需求会进一步提高。 WGS是Whole Genome Sequence的缩写。 2 .尼安德特人 被认为是从与智人的共同祖先中分离出来的其他系统的人类。 3 .丹尼索瓦人 虽然很可能是尼安德特人的兄弟种类,但也有争论说是由现代人类和尼安德特人的混血产生的。 4 .个体化医疗 根据每个人的体质、疾病类型进行治疗。 例如,在详细调查体质疾病相关基因的基础上进行治疗。 5 .生物银行日本( BBJ ) 是以日本人集团27万人为对象的生物试样的生物银行,设置在东京大学医科学研究所内。 拥有理化学研究所等取得的约27万人的基因组数据。 通过定制医疗的实现程序、基因组研究生物银行事业等实施事业,收集基因组DNA和血清样本以及临床信息,向研究者提供数据和分售。 6.SNV 单核苷酸变体。 是指在基因组序列中,某个区域的DNA碱基序列在个人之间只有一个碱基不同的多样性。 SNV是single nucleotide variant的缩写。 7.indel 基因组序列中碱基序列的插入( insertion )和/或缺失( deletion )。 8 .变体、公共变体、稀有变体 变异是指基因个体碱基序列的差异,拥有等位基因(过敏频率)的比例高的(1%以上)为共有变异,低的(不到1% )为稀有变异。 9 .主成分分析( PCA ) 是在群体遗传学上使用的分析方法之一。 使用PCA分析整个基因组的大量SNP (单核苷酸多态性)信息时,由于每个人被标绘在与遗传背景相应的位置,所以可以可视化个人之间的遗传距离。 SNP是人类基因组上的个人差异之一,是人类基因组中约存在1,000万处的单核苷酸的不同。 PCA是打印组件分析的缩写。 10 .降维( PCA-UMAP )分析 数据分析方法之一。 通过与PCA组合,可以可视化仅靠PCA无法区别的详细的个人间遗传背景的差异。 UPAM是统一制造应用程序和项目的缩写。 11.ADMIXTURE分析 调查人们的遗传背景是如何来自不同群体的方法。 使用它,可以推测个人的DNA从不同地理或民族群体中混合的程度。 12.IBDmix 用于确定现代人基因组内古人基因混入的方法。 该方法基于找出遗传相关个体之间共享的DNA片段。 具体来说,就是确定现代人和尼安德特人、丹尼索瓦人等古人之间共有的DNA部分,分析现代人的基因中含有多少从古代人直接继承的基因。 IBDmix是identity by descent mixing的缩写。 13 .烯丙基频率 是指某个群体中特定SNP出现的频率。 烯丙基频率因人种而异。 14.iHS 通过自然选择选择有利的遗传区域后,该区域的群体频率将迅速增加。 检测这种基因组区域的方法。 iHS是集成haplotype score的缩写。 15.FastSMC 这是将基因组全部区域中自然选择痕迹量化的分析方法之一。 通过高速探索各基因组区域内包含的多个变异体的共同祖先的系谱,可以对数十万人规模的基因组信息进行自然选择的分析。 16 .“双重结构”模式 埴原和郎先生的假说。 他说,日本人的祖先群体来自绳文人和从东北亚来的弥生人,这两个群体在日本列岛内逐渐混血,但来自东北亚的渡来人对阿伊努人和西南诸岛的人的影响很小。 17 .“三重结构”模式 日本人的祖先集团来自绳文祖先、东北亚祖先、东亚祖先,这三个集团在日本列岛内逐渐混血的说法。 联合研究组 理化研究所生命医生科学研究中心 基因组分析应用研究小组 队长寺尾知可史 (静冈县立综合医院临床研究部免疫研究部长、静冈县立大学药学部基因组病态分析讲座特任教授) 高级研究员(研究当时研究员; 静冈县立综合医院临床研究部研究员)刘晓溪 研究员石川优树 研究员(研究当时)小杉俊一 (现客座研究员) 客座研究员小池良直 高级技师富冢耕平 客座研究员伊藤修司 农业基因组学研究小组 特别研究员曳野圭子 基础技术发展研究小组 队长桃泽幸秀 技术人员(研究当时)髙田定晓 人才派遣铃木邦彦 骨关节疾病研究小组(研究当时) 团队领导(研究当时)池川志郎 (现基因组分析应用研究小组客座主管研究员) 心血管基因组信息学研究小组 队长伊藤熏 特别研究员(研究当时)小山智史 (现broad institute of MIT and Harvard research fellow (美国) ) 糖尿病代谢基因组疾病研究小组(研究当时) 团队领导(研究当时)堀越桃子 (现基因组分析应用研究小组客座主管研究员) 东京大学研究生院新领域创建科学研究科医学信息生命专业 复杂性状基因组分析领域 教授镰谷洋一郎 助教小井土大 临床测序领域 教授松田浩一 (东京大学医科学研究所附属人类基因组分析中心测序技术开发领域特任教授、生物银行日本( BBJ )代表) 金泽大学人类社会研究领域附属国际文化资源学研究中心 助教觉张隆史 研究支援 本研究基于日本医疗研究开发机构( AMED )基因组医疗实现生物银行利用计划(基因组医疗实现推进平台尖端基因组研究开发)、“着眼于先天性/后天结构多态性的免疫/精神疾病病情阐明相关研究开发”、“炎症性关节炎的综合基因组学分析”、 该难治性疾病实用化研究事业“单细胞综合基因组学解析阐明的硬皮病病情基础的开发”,该创新的癌症医疗实用化研究事业“体细胞马赛克的作为癌症发病及预后因子的意义阐明的开发”, 在该免疫·过敏疾病实用化研究事业“利用先天性和后天的基因组信息和临床信息构筑类风湿性关节炎的分层基础”、实现该基因组医疗的生物库利用计划(基因组研究生物库)“以利用为目的的日本疾病生物库的运营管理”的资助下进行 原论文信息 Xiaoxi Liu、Satoshi Koyama、Kohei Tomizuka、Sadaaki Takata、Yuki Ishikawa、Shuji Ito、Shunichi Kosugi、Kunihiko Suzuki、Keiko hi Yoshinao Koike、Momoko Horikoshi、Takashi Gakuhari、Shiro Ikegawa、Kochi Matsuda、Yukihide Momozawa、Kaoru Ito、yo Ichiro kam atatatatata " Decoding tri-ancestral origins,archaic introgression,and natural selection in the Japanese population by whole-genome sequencing 主讲人 理化研究所 生命医学科研中心基因组分析应用研究小组 高级研究员刘晓溪 (研究当时研究员; 静冈县立综合医院临床研究部研究员) 队长寺尾知可史 (静冈县立综合医院临床研究部免疫研究部长、静冈县立大学药学部基因组病态分析讲座特任教授) 寺尾知可史队长的照片 寺尾知可史 刘晓溪高级研究员合影 刘晓溪 东京大学医科学研究所附属人类基因组分析中心测序技术开发领域 特任教授松田浩一 新闻发言人 理化研究所宣传室新闻发言人 静冈县立综合医院总务科 tel:054-247-6111 /传真: 054-247-6140 email:Sogou-soumu [ at ] Shizuoka-pho.jp 静冈县立大学宣传企划室 Tel: 054-264-5130 email:koho [ at ] u-Shizuoka-ken.AC.jp 东京大学医科学研究所项目协调员室(宣传) Tel: 090-9832-9760 email:koho [ at ] IMS.u-Tokyo.AC.jp ※请将上述[at]替换为@。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
基因组学研究追溯人类迁移历史(上)
新研究表明该阿尔泰尼安德特人含有现代人类基因
天!我们可能还有一个我们甚至都不知道的第三祖先
考古DNA检测技术引发质疑 历史命题需重究溯源
AI发现人类DNA中未知“祖先”的踪迹
21世纪分子人类学研究最新成果
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服