Nature Medicine｜健康和医学领域的人工智能

编译｜俞正秋

本次报道的论文来自于Pranav Rajpurkar，Eric J. Topol等人发表在nature medicine在上的AI in health and medicine。

这篇综述提供了关于医学人工智能发展的简明概述，阐述了一项为期两年的工作（该工作跟踪和分享医学人工智能的关键发展事件，https://doctorpenguin.com），分析了AI用于医学图像的前瞻性研究和进展，提出了几个医学与人工智能研究途径的新观点，包括非图像数据源、非常规问题公式和人工智能协作，最后讲到了AI的技术问题以及伦理学挑战（fig1）。

人工智能算法在医学中应用的最新进展

如今，AI转化为可实践的工具用于临床相对较少，并且有不少批评者提出AI用于实际临床的质疑。但目前已有相关RCT研究证明了AI在实际医疗环境中可产生可量化的积极影响。此外，相关临床指南的制定也为AI用于临床提供了理论支持，如SPIRIT和CONSORT 关于AI-specific部分和即将推出的 STARD-AI指南，这些均有助于医疗人工智能应用的标准化，涵盖了规范化临床试验协议和疗效判定等内容。

此外近年来，部分人工智能工具赢得了政策支持。一项2020年的研究提示，美国食品药品监督管理局(FDA)正在批准人工智能尤其是机器学习等产品的加速研发。根据FDA规定，该类这产品将获得更低要求的审批监管标准。值得注意的是，这些获得监管许可的数据集通常是由追溯性的单一机构的数据组成，这些数据大多未公开，被认为是专有的。为了建立对医学人工智能系统的信任，需要更强的报告透明度和验证标准，包括对临床结果影响的演示。

医学影像

近年来，由于神经网络在图像分类中取得的显著成功，在较严重依赖图像解释的临床专业如放射学、病理学、消化病学和眼科等，医疗相关AI技术也得到了蓬勃发展。

病理学领域，AI模型能够有效地识别病理玻片中的感兴趣区域，帮助加快诊断工作流程；辨别原发性肿瘤的起源，检测病理结构变异或驱动突变；基于AI对不同肿瘤类型做出更准确的生存预测。消化病学方面，AI用于协助结肠镜检查，帮助判断病变良恶性，帮助诊断息肉和其他容易遗漏的病变，提高诊断准确性。眼科领域，通过半自动或全自动人工智能筛查帮助节省眼科普查成本，例如用于糖尿病视网膜病变的筛查。

人工智能算法发展的机遇

医学人工智能研究通常遵循一个熟悉的范式，即使用有标签数据的监督学习来解决图像分类问题。但本文提出了打破这种常规方法的三种其他有希望的研究途径(图2)。

首先，我们处理非图像数据源，如文本、化学和基因组序列，这可以提供丰富的医学见解。其次，我们讨论了超越有监督学习的问题表达，通过诸如无监督或半监督学习的范例从未标记或不完美的数据中获得见解。最后，我们来看看与人类合作而不是竞争的人工智能系统，这是一条比人工智能或人类单独获得更好性能的道路。

a.不局限于医学影像数据

深度学习模型可以从多种输入数据中学习，包括数字、文本甚至输入类型的不同组合。近期工作涵盖了采用分子信息、自然语言、医学信号如脑电图数据和多模态数据的数据类型。A I极大促进了生物化学领域的发展，提高了对于生物分子结构和行为的理解。例如由DeepMind团队开发的具有突破性意义的AlphaFold，一种基于深度学习的蛋白结构预测方法，它略过了蛋白质的折叠过程，直接从序列预测出最终的蛋白质三位结构。这大大降低了获取蛋白结构的时间和成本，加速了基于蛋白质结构的药物研发，并且为一部分现象提供了理论上的解释，如预测药物-蛋白质相互作用和预测突变的效果。（小编按：AlphaFold蛋白质数据库在其网站的FAQ中明确指出AlphaFold没有在预测点突变方面被验证过。特别地，对于能显著破坏蛋白质稳定性的点突变AlphaFold很可能不会预测出一个与天然序列不同的结构。此外，Nature Structural & Molecular Biology 2022.1.19发表短幅通讯”Can AlphaFlod2 predict the impact of missense mutations on structure?”以3个明确反例说明AlphaFold无法应对错义点突变（missense mutation）。即目前AlphaFold还没有经过训练或验证来预测突变的效果，特别是破坏蛋白质稳定性的点突变的影响。）例如哈佛大学George M. Church团队利用基于序列的深度表现学习，对合理的蛋白质工程化设计进行了统一化建模，基于这个统一表现（UniRep）构建的最简单模型可以广泛应用于蛋白质工程信息学。团队通过捕捉蛋白质关键特性使用UniRep，以并帮助神经网络用更少的数据进行学习，使得用于下游任务(如预测分子功能)的模型可以用更少的标记数据并获得高性能。

AI同样被广泛用于基因组学领域。AI用于外周血循环的细胞游离DNA(Cell free DNA, cfDNA)的数据中，使得通过无创的手段完成肿瘤筛查、预后评估、识别组织来源等成为可能（即液体活检的一种）。AI用于基于CRISPR的基因编辑技术，如帮助挖掘anti-CRISPR蛋白家族，以及构建更精确的gRNA（guide RNA）效率预测模型CRISPRon。

AI帮助加速新药研发，预测药物分子相关物理特性，如潜在生物活性毒副性等，帮助设计针对耐药菌感染的有效分子等等。

自然语言处理任务用于大型医学文本数据集，如transformers和word embeddings技术。例如BioBERT，一个基于大型医学文本语料库上训练的模型，其表现已经超过了以往回答生物医学问题等自然语言任务上的最先进表现。此外，相关应用还有如从生物医学文献中学习药物间相互作用，自动出具影像报告，大规模追踪的群体心理健康趋势等等。

通过机器学习预测医疗信号数据的结果，如脑电图、心电图等数据。有研究将ML应用于临床反应迟钝的脑损伤患者的脑电图信号，帮助可以检测大脑活动，以预测康复结果。有研究通过AI技术将脑电波直接转换为语音或文本信息以帮助对于患有中风的失语症患者。

使用多种医学数据源的多模态模型，如电子健康记录，它包含了各种各样的数据，如医疗诊断、生命体征、处方和实验室结果。这种模型可以基于不同类型的数据进行预测，就像人类临床医生在实践中做出决策时依赖多种类型的信息一样。

b.不局限于有监督学习

使用无监督学习，例如聚类算法。该方法已经被应用于诸如败血症、乳腺癌和子宫内膜异位症之类的情况，从而识别临床上有意义的患者亚组，帮助揭示疾病表现的新模式，最终有助于确定诊断、预后和治疗。该方法从有噪声或不完美的数据中提取信息，可大大降低数据收集的成本。

c.不局限于比较AI和人类的优劣性

人类可以积极地与AI合作提供监督。最近的研究已经开始探索AI和人类之间的这种协作机制。例如，Sim等人发现，有人工智能辅助的临床专家在判断肺部结节上超过了人类和人工智能。但是，关于人工智能辅助究竟如何影响人类的表现，仍然有一些悬而未决的问题。例如，人工智能辅助有时被证明可以提高临床专家的敏感性，但同时会降低他们的特异性，而一些研究发现，人工智能和人类的综合表现无法超越人工智能的单独表现。

未来的挑战

尽管取得了惊人的进步，医学人工智能领域仍然面临着重大的技术挑战(fig3)。

实施挑战

a.数据集限制

由于神经网络所需的内存量会随着模型的复杂性和输入中的像素数量而增加，因此大图像尺寸会带来额外的问题。许多医学图像很容易包含数十亿个像素，太大而无法适合平均神经网络。有许多方法可以解决这个问题。图片可能会以牺牲细节为代价来调整大小，或者它们可能会被分割成多个小块，人类可以识别较小的感兴趣区域。

另一个问题是缺乏监督学习所需的标签。标签通常由医学专家手工指定，但由于数据集大小、时间限制或缺乏专业知识，这种方法可能很困难。在其他情况下，标签可以由非专业人员提供，例如，通过众包。然而，这样的标签可能不太准确，且面临与隐私相关的复杂问题。还有因为数据不同来源而造成的偏倚。

b.模型信任

人工智能系统需要可靠、使用方便、易于集成到临床工作流程和具备可解释性，需要进一步的研究来解释人工智能决策过程，量化其可靠性，并将这些解释清楚地传达给受众。此外，值得信赖的人工智能研究应该是可复制的，即使在用不同的数据样本进行训练时，模型也能保持一致。

问责制——监管挑战

监管机构需要各种标准评估模型，注重保护患者隐私，对用户进行人为因素测试和质量培训，根据情况及时更新模型，开发新的认证流程等等。随着人工智能系统在医疗保健环境中承担更多责任，将面临的一个问题是，临床医生可能会过度依赖人工智能。反过来，医疗人工智能的发展也会对患者个公众产生的影响。随着医疗决策越来越依赖于潜在的无法解释的人工智能判断，个别患者可能会对自己的治疗失去一些理解或控制。例如，如果智能设备为患者提供持续的建议，那么这些患者可能会被期望遵循这些建议，或者对负面的健康结果负责。此外目前尚无相关法律法规界定，如果一个模型在经过彻底的临床验证后出现错误，开发人员、监管人员、销售人员或医疗保健提供者是否应该承担责任。

公平——数据道德

参与身份盗窃和其他不当行为的不良行为者可能会利用医疗数据集，这些数据集通常包含大量关于真实患者的敏感信息。除了这种恶意攻击，还有其他关于如何尊重患者隐私的问题。敏感数据通常应在征得患者同意的情况下收集并用于研究，并且在可行的情况下，应使用匿名化和聚合策略来掩盖个人详细信息。

公平和偏见

人工智能可以让服务不足的群体更容易获得医疗保健，但它也有加剧现有不平等的风险，因为人工智能模型可能会延续隐藏在数据中的偏见。医学人工智能系统可能无法归纳出他们没有接受过训练的新数据；因此，众所周知，在边缘化群体代表性不足的数据集上进行训练，会导致对这些群体形成偏见的系统。未来，人工智能工具可能会在部署前系统地接受特殊测试，以验证神经网络能公平地为边缘化人群提供服务。

结论

尽管人工智能在医学领域取得了长足的进步，但其验证和实施仍处于早期阶段，需要更多的实际解决方案和大胆的尝试。未来，越来越多涉及非图像数据类型和非常规研究范式的新型人工智能研究将会出现。人工智能与人类协作的方式值得进一步探索。目前医学人工智能仍然存在重大的技术和伦理问题，但当这些关键问题得到系统性解决后，有理由相信AI将会彻底改变医学发展的未来。

参考资料

Rajpurkar, P., Chen, E., Banerjee, O. et al. AI in health and medicine. Nat Med (2022).

https://doi.org/10.1038/s41591-021-01614-0

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。