京东用自己多年积累的零售、健康、物流数据,喂出了一个专门解决行业问题的大模型。 作者 | 郑玄 又一个重要玩家入局大模型赛道。7 月 13 日,京东云峰会在北京开幕。会上,京东正式推出了千亿规模的言犀大模型,以及言犀 AI 开发计算平台,并展示了京东基于大模型,开发的一系列服务京东原有业务的产品和解决方案。与华为、火山、阿里等国内云厂商相似,京东同样是从行业应用而非 ChatGPT 这样的 C 端产品切入大模型赛道。京东云表示,言犀大模型的训练数据来源于 70% 的通用大数据和 30% 的京东数智供应链原生数据,这使得言犀大模型从诞生之初,就有更强的产业属性,从而更好的解决产业问题。要让大模型真正服务千行百业,除了老生常谈的在技术和基础设施层面解决训练成本、部署成本和推理成本等问题,还要让开发、部署大模型这件事本身变得更加简单。使得原来需要数个 AI 科学家才能完成的工作,让几个普通程序员也能「手到擒来」。京东云基于大模型开发了一系列平台工具和应用产品。会上,各个工具和产品的负责人一一登台,现场演示了生成、训练、部署自己的行业 AI 大模型,以及利用 AI 大模型开发的工具来寻医问诊、生成 AI 商图的实践操作。每一项工具和应用的使用,可以说都是「傻瓜式」操作,比如只需要五步勾选几个选项就能生成各种各样的大模型,其难度不会超过填写一个网上的调查问卷。在云巨头们纷纷 All in 的大模型赛道,京东云并不是「种子选手」。看起来没有太多 AI 大牛和噱头的京东云,选择了最接地气的方式,召开了自己的第一场大模型发布会。但就像极客公园此前多次说过的那样,今天大模型领域比拼的不是谁的技术背景、算力更强,谁的参数更大,而是谁能真正解决行业使用大模型的难题,让技术真正服务于产业,服务于消费者。而务实的京东云,完全有可能会是这个大目标下的一匹黑马。
01
言犀大模型
和 AI 开发计算平台
会上,京东详细介绍了言犀大模型的技术底座,以及基于京东云过去积累的 AI 技术能力和计算资源,开发的面向行业客户的言犀 AI 开发计算平台。京东从 2017 年就开始布局人机交互,并在之后涉足大语言模型。2021 年,京东推出了十亿级模型 K-PLUG,2022 年推出了百亿级规模的 Vega,而本次大会上,展示的则是千亿级规模的言犀大模型。京东探索研究院院长何晓冬介绍,言犀大模型有三大特征:产业原生,价值驱动,开放协同。产业原生,指的是训练大模型的数据,除了 70% 来自通用数据,还有一部分来自京东原有的零售、物流、金融、健康等业务场景,使得言犀具备产业认知能力,同时京东每年产生的数百亿交互数据会作为大模型的「燃料」,帮助言犀持续强化迭代。价值驱动,指的是利用前沿的算法能力,提升模型的推理速度、降低部署成本、提高迭代效率,从而让模型有更高的应用价值。开放协同,是指基于京东云的计算集群(天琴α)和自研向量数据库,用更强的算力来加快模型迭代和部署速度。值得一提的是,让大模型持续升级迭代是今天行业需要解决的关键问题之一,而这个问题的钥匙之一就是向量数据库。京东自研了向量数据库 Vearch,可以支持百亿级向量搜索,目前该数据库已经开放给国内首个开源软件基金会——原子基金会。与大模型基座一同发布的「言犀 AI 开发计算平台」,则是基于言犀大模型解耦出的基础能力,集成了超过 100 种场景的 AI 算法和工具,打造的一个低代码 MaaS 平台。京东云介绍,行业用户可以在这个平台上完成从训练模型到应用服务部署的全周期管理。之前需要 10 余人的科学家团队工作,现在只需要 1-2 个算法人员,通过平台即可完成从数据准备、模型训练到模型部署的全流程,训练效率提升 2 倍,推理提效 6.2 倍,成本节约近 90%。如下图所示,发布会现场,京东云演示了言犀 AI 计算平台构建的工作流程。在言犀上构建行业大模型,基础底座可以选择言犀或其他开源大模型。基于选择的参数训练大模型,并在原有模型的基础上,加入新的数据持续迭代。何晓东介绍,未来,言犀大模型将实施三步走战略。第一步,2023 年 7 月推出言犀大模型;第二步,2023 年下半年,在京东内部应用到核心业务,打造标杆实践;第三步,2024 年上半年,全面开放,服务产业。
京东健康多年来累积了大量的行业数据和资源,包括累计超 3000 万高质量临患对话,百万级规模医学知识图谱,医疗专家团队,覆盖线上 140 余科室的医生、药师、营养师、心理医生。基于这些数据和能力,京东训练了健康大模型和行业应用。大模型的多轮交互、工具调用、总结摘要、图文多模态等能力,帮助京东健康在多场景升级应用:有服务用户的个人健康助手、随访管理;还有服务医生、药师的诊疗助手、医疗文案书写、科研助理、诊疗服务调度等。会上,京东云展示了一个医疗问诊案例。传统的 AI 医疗问诊,往往是一次提问而 AI 直接回答一大串内容,从结果来看这样的做法和搜索引擎相似。而真正的医师(包括互联网医师)往往是通过多轮提问,为缺少医疗知识的患者答疑解惑,从而更准确地判断病情。而引入大模型的多轮交互和学习能力以后,如上图所示,AI 可以像医生一样通过一轮轮提问,更准确地判断患者病情,并给出相应的医疗判断和建议。