发布千亿大模型，京东自己先用了个遍

京东用自己多年积累的零售、健康、物流数据，喂出了一个专门解决行业问题的大模型。

作者 | 郑玄

又一个重要玩家入局大模型赛道。

7 月 13 日，京东云峰会在北京开幕。会上，京东正式推出了千亿规模的言犀大模型，以及言犀 AI 开发计算平台，并展示了京东基于大模型，开发的一系列服务京东原有业务的产品和解决方案。

与华为、火山、阿里等国内云厂商相似，京东同样是从行业应用而非 ChatGPT 这样的 C 端产品切入大模型赛道。京东云表示，言犀大模型的训练数据来源于 70% 的通用大数据和 30% 的京东数智供应链原生数据，这使得言犀大模型从诞生之初，就有更强的产业属性，从而更好的解决产业问题。

要让大模型真正服务千行百业，除了老生常谈的在技术和基础设施层面解决训练成本、部署成本和推理成本等问题，还要让开发、部署大模型这件事本身变得更加简单。使得原来需要数个 AI 科学家才能完成的工作，让几个普通程序员也能「手到擒来」。

京东云基于大模型开发了一系列平台工具和应用产品。会上，各个工具和产品的负责人一一登台，现场演示了生成、训练、部署自己的行业 AI 大模型，以及利用 AI 大模型开发的工具来寻医问诊、生成 AI 商图的实践操作。每一项工具和应用的使用，可以说都是「傻瓜式」操作，比如只需要五步勾选几个选项就能生成各种各样的大模型，其难度不会超过填写一个网上的调查问卷。

在云巨头们纷纷 All in 的大模型赛道，京东云并不是「种子选手」。看起来没有太多 AI 大牛和噱头的京东云，选择了最接地气的方式，召开了自己的第一场大模型发布会。

但就像极客公园此前多次说过的那样，今天大模型领域比拼的不是谁的技术背景、算力更强，谁的参数更大，而是谁能真正解决行业使用大模型的难题，让技术真正服务于产业，服务于消费者。而务实的京东云，完全有可能会是这个大目标下的一匹黑马。

言犀大模型

和 AI 开发计算平台

会上，京东详细介绍了言犀大模型的技术底座，以及基于京东云过去积累的 AI 技术能力和计算资源，开发的面向行业客户的言犀 AI 开发计算平台。

京东从 2017 年就开始布局人机交互，并在之后涉足大语言模型。2021 年，京东推出了十亿级模型 K-PLUG，2022 年推出了百亿级规模的 Vega，而本次大会上，展示的则是千亿级规模的言犀大模型。

京东探索研究院院长何晓冬介绍，言犀大模型有三大特征：产业原生，价值驱动，开放协同。

产业原生，指的是训练大模型的数据，除了 70% 来自通用数据，还有一部分来自京东原有的零售、物流、金融、健康等业务场景，使得言犀具备产业认知能力，同时京东每年产生的数百亿交互数据会作为大模型的「燃料」，帮助言犀持续强化迭代。

价值驱动，指的是利用前沿的算法能力，提升模型的推理速度、降低部署成本、提高迭代效率，从而让模型有更高的应用价值。

开放协同，是指基于京东云的计算集群（天琴α）和自研向量数据库，用更强的算力来加快模型迭代和部署速度。

值得一提的是，让大模型持续升级迭代是今天行业需要解决的关键问题之一，而这个问题的钥匙之一就是向量数据库。京东自研了向量数据库 Vearch，可以支持百亿级向量搜索，目前该数据库已经开放给国内首个开源软件基金会——原子基金会。

与大模型基座一同发布的「言犀 AI 开发计算平台」，则是基于言犀大模型解耦出的基础能力，集成了超过 100 种场景的 AI 算法和工具，打造的一个低代码 MaaS 平台。

京东云介绍，行业用户可以在这个平台上完成从训练模型到应用服务部署的全周期管理。之前需要 10 余人的科学家团队工作，现在只需要 1-2 个算法人员，通过平台即可完成从数据准备、模型训练到模型部署的全流程，训练效率提升 2 倍，推理提效 6.2 倍，成本节约近 90%。

如下图所示，发布会现场，京东云演示了言犀 AI 计算平台构建的工作流程。

在言犀上构建行业大模型，基础底座可以选择言犀或其他开源大模型。

基于选择的参数训练大模型，并在原有模型的基础上，加入新的数据持续迭代。

何晓东介绍，未来，言犀大模型将实施三步走战略。第一步，2023 年 7 月推出言犀大模型；第二步，2023 年下半年，在京东内部应用到核心业务，打造标杆实践；第三步，2024 年上半年，全面开放，服务产业。

京东的大模型应用实践

会上，京东云还介绍了一系列京东内部基于言犀大模型打造的应用和实践，具体可以分成两类：一类是基于京东原有的电商、物流、健康、金融等业务场景，开发的行业应用；另一类则是基于大模型的技术能力开发的原生应用，比如在数字人、具身智能等领域的实践。

具体如下：

大模型+京东健康：

健康助手及辅助诊疗

京东健康多年来累积了大量的行业数据和资源，包括累计超 3000 万高质量临患对话，百万级规模医学知识图谱，医疗专家团队，覆盖线上 140 余科室的医生、药师、营养师、心理医生。

基于这些数据和能力，京东训练了健康大模型和行业应用。大模型的多轮交互、工具调用、总结摘要、图文多模态等能力，帮助京东健康在多场景升级应用：有服务用户的个人健康助手、随访管理；还有服务医生、药师的诊疗助手、医疗文案书写、科研助理、诊疗服务调度等。

会上，京东云展示了一个医疗问诊案例。

传统的 AI 医疗问诊，往往是一次提问而 AI 直接回答一大串内容，从结果来看这样的做法和搜索引擎相似。而真正的医师（包括互联网医师）往往是通过多轮提问，为缺少医疗知识的患者答疑解惑，从而更准确地判断病情。

而引入大模型的多轮交互和学习能力以后，如上图所示，AI 可以像医生一样通过一轮轮提问，更准确地判断患者病情，并给出相应的医疗判断和建议。

大模型+京东物流：京东物流超脑

以前的物流网络建设，更多是基于物理世界的运营自动化。随着产业智能化推进，利用仿真技术建立物理世界的数字孪生体，实现智能预测，成为物流科技的升级方向。

京东物流超脑基于多模态大模型实现实时交互、根因分析和智能决策，并将随着技术的不断更新迭代，逐步具备实时自动生成全局最优的供应链解决方案的能力。针对供应链全链路，提供辅助决策、运营优化，以及一线作业智能助手等能力，实现降本增效，推动供应链物流进入大模型时代。

在仓内智能交互建模方面，实现对仓库布局问题的智能化原因分析。例如输入，请分析在今年双 11 大促的布局堵点。系统经过分析，会回答，效率堵点为地狼货架数目不够，建议增加一排货架。这极大的减少了传统方法花在调研、分析上的成本。

大模型+数字营销：京东科技 AI 增长营销平台

在金融营销场景的应用探索中，京东金融数十年在行业理解、营销流程、运营策略等知识的积累，解决了诸如关键性任务，动态适应性、用户体验等问题，大幅优化了营销运营流程，降低运营人员的学习成本与操作成本。

最终实现了方案生产效率上百倍提高。将过去涉及产品/研发/算法/设计/分析师等 5 类以上职能才能完成的流程，压缩至 1 人；同时，一个入口的全新交互模式，让人机交互次数从 2000 次降低至少于 50 次，将操作效率提升了超过 40 倍。

大模型+内容生成：京东云 AIGC 内容营销平台

在电商领域，基于京东积累的商品数据和大模型，可以更好地理解商品特征，从而帮助商家自动化生成商品图片、卖点等营销素材，提升商家运营工作效率和营销内容质量。

如上图所示，通过一张商品图片，可以快速生成电商运营需要的商品主图，营销海报图和商详图等，满足快速开店、上品、营销的需求，每套图成本降低 90%，周期从 7 天缩短到半天。

值得一提的是，在产品层面，京东云并不在追求单纯的技术能力，而是以实践需求优先。比如在生成商图上，除了提供文生图这样的多模态能力，京东云还提供了图生图，比如在多个生成图片均不满意的情况下，商户可以提供其满意的营销素材作为参照，让 AI 更快生成用户需要的宣传图片。

大模型+数字人：京东多模态数字人

在当下大火的数字人领域，京东也推出了相应的产品和工具。甚至在活动开始时，京东云还让京东数字人与歌手一起同台献唱。

京东云多模态数字人集合了最前沿的、综合性的、多模态的人机交互技术，言犀数字人大模型将单人数据进行参数差异化迁移，可通过提供极少量样本素材，以对话交互模式实现从形象、音色、背景视觉、知识库到短视频等全链路内容自动生成，支持 5 分钟简易拍摄，支持生成大姿态（如侧脸/走动/手势），支持动态局部高清与语义驱动的肢体动作编排。

基于京东云自研电商领域知识增强模型 K-PLUG，仅需在直播后台上传商品链接，便能够智能「阅读」商品详情，找到关键的规格、卖点等信息，自动生成更真实、生动、可阅读性强的直播文案。据统计，商家原先写出 50 个 SKU 的直播脚本需要至少五小时，使用 K-PLUG 模型只需要一键生成，极大提升了直播间运营效率。目前，京东云多模态数字人已经入驻 4000+品牌直播间，带动超 8 亿元 GMV。

大模型+机器人：具身智能

最后还有一个彩蛋，是当下最火的大模型行业应用之一，具身智能。也就是大模型与机器人技术的结合。

在这一块各家企业都还处于早期探索阶段，与前几天的华为一样，京东云也没有阐释太多，而是播放了一段实拍的概念 Demo。视频中，何晓东坐在办公桌前，桌子上有一个白色的机械臂，他用自然语言命令言犀为他拿一样东西，机械臂就按照他的命令完成了所有的动作。

*头图来源：京东云

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。