有道类ChatGPT模型“子曰”即将开放内测，垂类模型有机会吗?

在教育领域，很多企业此前都已经构建了AI能力，垂类大模型暗流涌动。

来源|多知网

作者|王上

图片来源|多知网

多知网今日获悉，有道专为教育场景自研的类ChatGPT模型将推出，模型名字确定为“子曰”。目前，基于“子曰”研发的AI口语老师和中文作文批改demo已完成，并将于近期开放内测。

此前在2月初，媒体报道称有道AI技术团队已投入到ChatGPT同源技术（AIGC）在教育场景的落地研发中。

不少观点认为，ChatGPT有望带来教育内容和教学方式的革命性变革。目前，国内包括网易有道、科大讯飞和好未来等多家教育公司均透露了类ChatGPT的产品和技术信息。

ChatGPT让全球看到了AGI（通用人工智能）的强大，其是大模型（Large Language Model）是指在大规模语料库上训练的语言模型，通常采用深度学习算法，能够处理自然语言中的语法、语义和上下文等多种信息，并能处理各种自然语言，进行多轮对话。此外，ChatGPT还是一个通用的、可扩展的、跨多个应用场景的语言模型架构。这3个多月以来，ChatGPT在不断演化，从GPT-4来看，它是多模态的，即支持文本、图像、视频、音频等。

在国内，目前已经形成了三个不同的发展派别，包括以百度、华为、360等为代表的通用大模型派，以有道、京东云、同花顺等为代表的垂类模型派，以及以王慧文、李开复、王小川等为代表的ChatGPT创业派，三方都希望实现GPT从技术到产品、场景的商业化落地。

有道的“子曰”是“大模型+小样板”在教育领域的一次尝试，相比通用模型，“子曰”在教育领域内的数据是否更全面，交互会更精准？具体效果尚待验证。

‍有道自研垂类模型，或将率先用于口语练习环节

教育是ChatGPT的最佳应用场景之一，GPT-4的发布会上，有6个落地应用案例，其中两个是关于教育的，一个是多邻国，一个是可汗学院。这也是有道自研教育类大模型的价值。

根据多邻国的披露，在嵌入GPT-4后，多邻国加入了两大功能：解释我的回答(Explain My Answer)和角色扮演(Roleplay)。

(图片来源：多邻国官网)

多知网了解到，有道基于“子曰”模型研发的AI口语老师和中文作文批改相关demo已完成。

多知网从接近有道的消息人士获悉，“子曰”将首先用于英语口语陪练环节。比如在练习口语当中，用户可以与“子曰”进行多轮对话，跟真实场景的对话类似。并且，“子曰”还能引导用户“开口说话”。

这或许跟多邻国的角色扮演类似，可以在相应的语言环境中扮演不同的角色进行口语练习。

在教育领域，很早就有AI形式的口语练习，但是预设好的场景，基本是剧本式的对话，比较一板一眼，不太符合真实的口语环境，不能很好地解决用户练口语的需求，而大语言模型或许可以带来开放式的对话，帮用户练习实际的场景口语。

此外，以往的对话练习是单一形态，而基于“子曰”模型打造的AI口语练习产品，用户可以直接输入语音或者文字，进行多轮对话。某种程度上看，这是更具个性化的一对一陪练，具有一定的非标性。

值得注意的是，“子曰”作为陪练老师的角色，回复是否准确，是否真正理解“人”的特征最为关键，这背后对于“子曰”的要求是非常严苛的。

有道在语言学习方面涉足较早，2007年有道推出了互联网词典，这让有道积累了较多的语言学习语料，这些语料包括了搜索信息、文本信息等。这也提供了“子曰”在口语场景最先应用的土壤。

创新工场董事长兼首席执行官、创新工场人工智能工程院院长李开复在 “AI 1.0到AI 2.0的新机遇”的媒体分享会上提到：“AI进入2.0时代，所有应用都会被重写一遍。”

未来，如果“子曰”足够强大，那么，它可以重构教育的每一个环节。

垂类模型能跑出来吗？

今年以来，ChatGPT在全球持续高热，国内外科技企业纷纷入局竞速。不过，是直接对标ChatGPT还是做垂类模型？不同基因的公司选择了不同的道路。有道选择了做垂类大模型。

很多人的疑问是垂类大模型真的能跑出来吗？

上海证券3月20日刊文称，ChatGPT基于“大模型+小样本”结合下游具体应用场景（基于通用大模型“深度学习”行业小样本）有望形成差异化的垂类大模型。

从ChatGPT的开发机构OpenAI来看，其通过投资布局了一系列落地场景。其中，OpenAI投资了一个教育项目Speak，这是一个人工智能口语训练平台，帮助更多人流利地掌握包括英语在内的新语言。从这个路径可以看出，ChatGPT同样缺乏垂类的数据，否则不会投资垂类公司来获取语料了。

可以说，如果有教育垂类大模型跑出，或许应用成本会更低，也更便捷。

值得注意的是，大模型的跑出，需要数据、算力、算法，教育垂类也不例外。有道推出“子曰”，背后是其在教育内容、硬件和技术方向上长期坚持。

在数据层面，针对教育领域，有道覆盖从少儿到成人全年龄段的数据。不过，对教育领域来说，容错率很低，准确至关重要，这就需要在数据训练中需要数据足够多，参数越多，就越精细。

算力方面，一个很大的问题是成本。根据测算，训练一次ChatGPT要450万美元，需要10000张A100训练一个月。GPT-3有1750亿参数，GPT-4的参数据说有100万亿，而ChatGPT的推理更贵。谷歌预测，如果其所有的搜索都用ChatGPT完成，需要购买1000亿美元的GPU芯片，ChatGPT每搜索一次的成本都超过了1美分。

只针对教育垂类，可能成本会有所下降。在成本中，芯片是重要的因素之一。在此前的瑞芯微开发者大会上，瑞芯微曾透露，有道与其合作已有五年之久。其中的代表项目有：围绕着Rockchip NPU来深度优化有道AI模型的效率和效果。据了解，有道词典笔P5产品已升级至NPU方案，相对CPU版本的模型推理速度提高了4-10倍，实现了实时的一目十行识别；在模型大小增大15倍的基础上，AI引擎精确度大幅提升。

算法方面，国内企业的算法已经比较成熟，不过，有道“子曰”能达到什么程度尚不得知。

在技术层面，从GPT-4可以看到多模态成为趋势。公开资料显示，有道自2016年开始协同构建AI基础能力，同步组建语言、视觉、声音团队，为多模态打下基础。

（图片来源：有道智云官网）

以翻译为例，有道词典笔通过OCR、智能组段、机器翻译、图片渲染多个技术的应用，实现了用户拍照整页文字即可即时实现文档翻译。

除了自研模型和落地应用以外，有道旗下的网易云课堂最近上架了两门AI自研课程：《人工智能绘画与设计》及《ChatGPT从入门到熟练（办公自动化）》。

可以看到，在新技术来临时，有道是有准备的。

有道的“子曰”可以说是在搜索技术的老家底上，叠加了AI能力，并连接了整个有道生态，即通过建立“AI+硬件+内容”闭环，打通了产业链条，便于“子曰”较快实现商业化落地。

这一次，有道希冀有一个较高的占位。

值得一提的是，在教育领域，不少企业此前都已经构建了AI能力，垂类模型暗流涌动。

END

本文作者：王上

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。