打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
2022年七大科学技术展望

从基因编辑到蛋白质结构测定,再到量子计算,以下七项技术可能会在未来一年对科学产生影响。




01

完整版基因组

当加利福尼亚大学的基因组学研究者Karen Miga和美国国家人类基因组研究所的Adam Phillippy在2019成立端粒到端粒(Telomere-to-Telomere, T2T)联盟时,大约1/10的人类基因组仍然未知。现在,这个数字降到了零。在2021年5月出版的一份预印本中,该联盟报告了人类基因组的第一个端粒到端粒序列,为广泛使用的人类参考基因组序列GRCh38增加了近2亿个碱基对,并撰写了人类基因组计划(Human Genome Project)的最后一章。

GRCh38于2013年首次发布,是一个很有价值的工具,也是绘制测序序列的支架。但它充满了漏洞。这在很大程度上是因为Illumina开发的广泛使用的测序技术可以产生准确但短的读数。它们的长度不足以清晰地绘制高度重复的基因组序列,包括染色体末端的端粒和在细胞分裂期间协调新复制DNA分配的着丝粒。

事实证明,长读测序技术是游戏规则的改变者。这些技术由太平洋生物科学公司和牛津纳米孔公司(Oxford Nanopore Technologies, ONT)开发,可以在一次读取中对数十个甚至数十万个碱基进行测序。然而,到2020年T2T团队首次重组单独的染色体——X染色体和8号染色体时,太平洋生物科学公司的测序已经发展到了这样的程度,T2T科学家可以在长重复序列中检测到微小的变异。这些细微的“指纹”使得长重复的染色体片段易于处理,基因组的其余部分很快就排列成一条直线。ONT平台还捕获了许多调节基因表达的DNA修饰,T2T也能够在全基因组范围内绘制这些“表观遗传标签”。

T2T基因组来自一个细胞系,该细胞系包含两组完全相同的染色体。正常的二倍体人类基因组包含每个染色体的两个版本,研究人员正在研究“阶段化”策略,可以将每个序列分配给适当的染色体拷贝。

这项二倍体组装工作正在与T2T的合作伙伴——人类泛基因组参考联盟(Human Pangenome Reference Consortium)合作进行,该组织希望根据来自世界各地的数百名捐赠者绘制出更具代表性的基因组图谱。“我们的目标是平均捕获97%的人类等位基因多样性。”该联盟的首席研究员之一、洛克菲勒大学的遗传学家Erich Jarvis说。作为脊椎动物基因组项目(Vertebrate Genomes Project)的主席,Jarvis还希望利用这些完整的基因组组装能力,为地球上的每一个脊椎动物物种生成完整的序列。


02

蛋白质结构解析

结构决定功能。但这可能很难衡量。在过去两年里,重大的实验和计算进展为研究人员提供了补充工具,以前所未有的速度和分辨率确定蛋白质结构。

Alphabet子公司DeepMind开发了AlphaFold2结构预测算法,该算法依靠“深度学习”策略从氨基酸序列推断折叠蛋白质的形状。在2020年蛋白质结构预测关键评估(Critical Assessment of protein Structure Prediction)竞赛中取得决定性胜利后,AlphaFold2的声誉和采用率飙升。在这场竞赛中,计算生物学家对其结构预测算法进行了正面(head-to-head)测试。资深科学家、欧洲生物信息学研究所前所长Janet Thornton说:“对于其中一些结构,预测几乎出奇地好。”自2021年7月公开发布以来,AlphaFold2已应用于蛋白质组,以确定人类和20种模式生物中表达的所有蛋白质的结构,以及Swiss-Prot数据库中近44万种蛋白质的结构。AlphaFold算法也证明了其处理多链蛋白质复合物的能力。

与此同时,冷冻电镜(cryogenic-electron microscopy, cryo-EM)的改进使研究人员能够用实验方法处理最具挑战性的蛋白质和复合物。2020年,cryo-EM硬件和软件的改进使两个团队能够生成分辨率小于1.5 埃的结构,从而捕获单个原子的位置。纽约结构生物学中心西蒙斯电子显微镜中心的联合主任Bridget Carragher说:“在此之前,我们肆无忌惮地谈论'原子分辨率’这个词,但它只是接近原子。”“这确实是原子级的。”Carragher说,尽管两个研究团队都使用了一种被称为脱铁铁蛋白的模型蛋白质,但这些研究表明,对于其他更困难的目标,近原子分辨率也是可行的。

还有一种相关的方法,即冷冻电子断层摄影术(cryo-electron tomography, cryo-ET),它可以捕捉冷冻细胞薄片中的自然发生的蛋白质行为,这也让人相当兴奋。但是,对这些拥挤、复杂的图像进行解读是一项挑战,Carragher认为机器学习领域的计算技术进步将是至关重要的。


03

量子模拟

原子在适当的条件下可以被诱导进入一个高度激发、超大尺寸的状态,直径在一微米(μm)或更大的数量级。通过以受控的方式对数百个原子仔细定位的阵列进行激发,物理学家已经证明他们可以解决将传统计算机推向极限的具有挑战性的物理问题。

量子计算机以量子比特的形式处理数据。通过量子物理中的纠缠现象,量子比特可以在一定距离内相互影响。这些量子比特可以极大地提高计算能力,而在经典计算机中,通过给定的量子比特分配(相对于等效的比特数)可以实现这一点。

有几个小组已经成功地将单个离子用作量子比特,但它们的电荷使它们难以在高密度下组装。包括法国国家研究中心的Antoine Browaeys和美国哈佛大学的Mikhail Lukin在内的物理学家正在探索另一种方法。研究小组使用光镊在紧密排列的2D和3D阵列中精确定位不带电的原子,然后应用激光将这些粒子激发成大直径的“里德堡原子”,并与它们的邻居纠缠在一起。“里德堡原子系统是单独可控的,它们的相互作用可以打开和关闭。”韩国高级科学技术研究所的物理学家Jaewook Ahn解释道。这反过来又赋予了可编程性。

这种方法在短短几年的时间里获得了相当大的发展势头,技术进步提高了里德堡原子阵列的稳定性和性能,并从几十个量子比特快速扩展到几百个量子比特。Browaeys估计,这种量子模拟器在一两年内就可能商用。这项工作可能为量子计算机的更广泛应用铺平道路,包括在经济、物流和加密领域。


04

精准基因组操作

尽管CRISPR-Cas9技术拥有强大的基因组编辑能力,但它更适合于基因失活而非修复。这是因为,尽管将Cas9酶靶向于基因组序列相对精确,但细胞修复由此产生的双链切割并不精确。通过一种称为非同源末端连接的过程介导,CRISPR-Cas9修复常常因小的插入或删除而变得混乱。

哈佛大学化学生物学家David Liu指出,大多数基因疾病都需要基因修复而不是破坏。Liu与他的团队已经开发了两种很有希望的方法来实现这一点。两者都利用了CRISPR的精准定位,同时也限制了Cas9在该位点切割DNA的能力。第一种被称为碱基编辑,它将一种催化受损的Cas9与一种酶结合,这种酶有助于一种核苷酸转化为另一种核苷酸,例如胞嘧啶转化为胸腺嘧啶或腺嘌呤转化为鸟嘌呤。但目前这种方法只能实现特定的碱基转化。另一种称为引导编辑,将Cas9与逆转录酶联系起来,并使用一种经过修改的向导RNA,将所需要的编辑整合到基因组序列中。通过多阶段的生化过程,这些成分将向导RNA复制到DNA中,最终取代目标基因组序列。重要的是,两种方法都只切割一条DNA链,这对细胞来说是一个更安全、破坏性更小的过程。


05

靶向基因疗法

基于核酸的药物可能会在临床上产生影响,但它们在组织中的应用仍然受到很大限制。大多数治疗需要局部给药,或从患者体内获取细胞进行体外操作,然后再将其移植回患者体内。肝脏是例外,它能够过滤血液,被证明是选择性药物输送的一个强有力的靶点。在这种情况下,静脉注射甚至皮下注射都可以完成这项工作。

腺相关病毒是许多基因疗法的首选载体,动物研究表明,仔细选择合适的病毒并结合组织特异性基因启动子,可以实现局限于特定器官的高效药物递送。然而,病毒有时难以大规模生产,并可能引发免疫反应,从而破坏疗效或产生不良事件。

脂质纳米粒提供了一种非病毒替代品,过去几年发表的几项研究强调了调节其特异性的潜力。例如,由生物化学家Daniel Siegwart与他的同事在德克萨斯大学西南医学中心开发的选择性器官靶向(selective organ targeting, SORT)方法,能够快速生成和筛选脂质纳米粒,找出能有效靶向组织(如肺和脾脏)细胞的纳米粒。


06

空间多组学

单细胞组学发展的激增意味着研究人员现在可以常规地从单个细胞中获得遗传学、转录组学、表观遗传学和蛋白质组学方面的见解。但单细胞技术将这些细胞从其原生环境中剥离出来会丢失关键信息。

2016年,瑞典皇家理工学院的Joakim Lundeberg团队提出了解决这一问题的策略。该团队用条形码寡核苷酸(RNA或DNA短链)制备了载玻片,这些寡核苷酸可以从完整的组织切片中捕获信使RNA,这样每个转录本都可以根据其条形码分配到样本中的特定位置。

此后,空间转录组学领域出现了爆炸性的发展。现在有多种商业系统可用,包括10x Genomics的Visium空间基因表达平台。研究团队也在继续研发新方法,以更好的深度和空间分辨率绘制基因表达图谱。例如,耶鲁大学的生物医学工程师Rong Fan开发了一个名为DBiT-seq的平台,该平台使用了一个微流控系统,可以同时为数千个mRNA转录本和数百个用寡核苷酸标记抗体标记的蛋白质生成条形码。与仅从转录组数据获得的结果相比,它可以更准确地评估细胞基因表达如何影响蛋白质的产生和活性。


07

基于CRISPR的诊断

CRISPR-Cas系统精确切割特定核酸序列的能力,源于其作为细菌“免疫系统”抵御病毒感染的作用。这一联系启发了该技术的早期使用者考虑该系统对病毒诊断的适用性。

Cas9是基于CRISPR的基因组操作的首选酶,但基于CRISPR的诊断中的许多工作都使用了被称为Cas13的靶向RNA分子家族,该家族于2016年由分子生物学家张锋及其团队首次发现。“Cas13使用其RNA向导通过碱基配对来识别RNA靶点,并激活核糖核酸酶活性,核糖核酸酶可以通过利用报告RNA作为诊断工具。”2020年诺贝尔化学奖获得者、加利福尼亚大学的Jennifer Doudna解释说。这是因为Cas13不仅能切割向导RNA所靶向的RNA,还能对附近的其他RNA分子进行“旁系切割”。许多基于Cas13的诊断都使用报告RNA,将荧光标记与抑制荧光的猝灭分子相连。当Cas13在识别病毒RNA后被激活时,它会切断报告基因并从猝灭剂中释放荧光标记,产生可检测的信号。有些病毒会释放很强的信号,可以在不扩增的情况下检测到,从而大大简化了即时诊断流程。

参考文献:Michael Eisenstein. Seven technologies to watch in 2022[J]. Nature,2022,601:658-661.

推荐 · 阅读


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
Nature:2022年7大“颠覆性”技术
2022的七大热点技术: 靶向基因治疗、空间多组学……
可能改变2022年科学发展的七项技术
《自然》榜单:有望改变2022年科学进程的7大前沿技术
《自然》杂志发布2022年七大前沿科技
CRISPR/Cas9技术详解,简单易懂
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服