北师大卢宇：生成式人工智能及其教育应用

本文大概

4000

字

读完共需

分钟

导语：8月6日，由北京师范大学未来教育高精尖创新中心主办，北京师范大学现代教育技术研究所、“移动学习”教育部-中国移动联合实验室承办，智慧教育国家新一代开放创新平台协办的“数智赋能教育·课堂融合创新·教师专业发展”数智化转型推动教育的高质量发展研讨会暨全国“基础教育跨越式发展创新试验研究”2023年会在北京宽沟会议中心举行。
会上，北京师范大学副教授、未来教育高精尖创新中心人工智能实验室主任卢宇作“生成式人工智能及其教育应用”报告，分享了生成式人工智能的定义、技术能力、应用演示、应用展望、局限与潜在风险。

观点 | 卢宇

整理 | 教育信息化100人

来源 | 数智化转型推动教育的高质量发展研讨会

以下内容据

卢宇主任的视频分享整理

近年来，人工智能技术在包括教育在内的多个垂直领域有非常广泛的应用，但同时，它也有很多局限，比如在智能性和通用性上都存在很大问题，无论是现在的智能评价、自动批改作文，还是个性化学习软件平台，其实都有这些问题。

而之所以大家今天都在谈论生成式人工智能，其实就是因为它有可能可以解决当前的这些瓶颈。举个最简单的例子，在生成式人工智能的加持下，可能苹果的 Siri 或者小米的小爱同学就不再像以前那么“愚蠢”，只能做一些最简单的问题回答。

什么是生成式人工智能？

简单来说，生成式人工智能指的是利用一些预训练的大模型，来生成文本、图像、视频、音频等多模态内容的一种技术，它又可以称为人工智能生成内容，简称AIGC。

它所生成的模态很多，而且也不只是这一两年才开始被使用。

在文本生成方面，很早就有人开始做诗歌的人工智能生成创作，现在商业领域也在做一些营销文案类的文本生成，当然，最引人注目的还是一些交互式聊天对话文本的生成，比如ChatGPT。

在图像生成方面，中央美术学院其实几年前就在毕业画展中和微软合作，做了印象派、抽象派等各种各样风格画作的生成，当时的质量已经很好了。现在很多电商的banner和宣传海报，也都在做图像的生成。

在音频生成方面，最早的时候可能做一些基本的不同风格音乐的生成，现在可以把作词、作曲、编曲、演唱、混音等综合起来做音频内容的生成。

最后，在视频生成方面，三四年前就有学生利用一些相关技术替换头像，做一些电影桥段的内容改编。现在大家在今日头条的推送里可能会看到很多清朝、民国时期的原始画面被修复成了彩色的，非常逼真。这些都是生成式人工智能在视频生成上的具体成果。

生成式人工智能很早就已经出现。在上世纪50年代，就有了第一支由计算机创作的弦乐四重奏《依利亚克组曲》；在本世纪10年代之前，就已经有了人工智能创作的第一部小说，注意是小说，并不是简单的一篇短文或者作文；到了2022年年底，大家最关注的是ChatGPT。

所以生成式人工智能本身是有非常好的历史沿革，在技术上也有很多相关储备。

我们团队从大概2019年、 2020年就开始关注 GPT-2 和GPT-3，我们先暂时不看它里边复杂的技术，只讲它的基本的外显的参数量。

GPT-1是2018年开始有的，在二零零几年的时候，几百个参数就是一个很大的一个模型了。但是到了2018 年， GPT- 1的参数达到了1. 17 亿。GPT-2跟GPT-3的参数量分别是150亿和1750亿。

ChatGPT实际上是GPT3.5的加强版或者改进版，它其实也不是 OpenAI 的一个里程碑式的软件系统版本，但是它确实展现出了非常强的能力。

看参数量也可以看出来，从1亿到 1750亿，大概只用了两到三年的时间就展现出来了。

大家知道人脑是多大的参数量吗？人脑是由生物神经元组成的，假如我们把生物神经元里边的每一个突触认为是一个参数的话，人脑的参数量大概是 100 万亿个。ChatGPT的参数量大概是人脑的1/ 1000，但仅仅是1/ 1000 的量级，就已经能让它做非常多事情了，至少没有一个人敢说自己比 ChatGPT 更博学，对吧？

那么，ChatGPT有什么样的能力呢？简单来说，可能有以下四项基本能力：

第一，启发性内容生成能力。也就是说它能根据一些特定的主题或者给定的指引，在多轮对话的过程中生成启发性和创造性的文本，包括诗词、故事、评论等等，这是之前的自然语言处理系统很难达到的。

第二，对话情境理解能力。这也是一个自然语言处理系统一直在试图攻克的问题，也就是上下文理解能力或者多轮对话的理解能力。如果去问苹果的Siri或小米的小爱同学，你会发现只能跟它说一两轮的话，对话长了之后，它基本上就已经忘掉了之前整个对话中的情境。但是ChatGPT和你对话十几轮之后，它还是能继续把之前对话中的一些具体意义和情境联系起来。这是有很大突破性进展的一方面。

第三，在具备启发性内容生成能力和对话情境理解能力的基础上，它有很好的序列任务执行能力。在多轮对话的过程中，可以把一些复杂的任务交给它去一步一步完成。

第四，程序语言解析能力。ChatGPT能够根据多种编程语言的语法规则、数据结构、算法构建与编程规范，对代码程序进行结构与算法分析，并根据用户任务需求自动生成符合任务要求的代码程序或错因解析。

生成式人工智能教育应用

那么，现在的生成式人工智能能帮助老师做哪些事情？

前几天我录了一个小视频，我想知道，如果我是一个语文老师，GPT-4能帮助我做什么？

我先输入了朱自清的《荷塘月色》这篇课文，想看它能不能帮我做一些备课相关的事情，比如能不能找到这篇课文里的比喻句和拟人句，并且分别输出。

GPT-4分别给出了三个比喻句和三个拟人句，还标注了页数。

接着，我让他找出朱自清引用的诗词歌赋，输出引用段落的完整内容，给出出处，并对主要内容进行总结。

它给出了两篇引用的诗词歌赋，一篇是《采莲赋》，一篇是《西洲曲》。这两篇分别讲了什么内容、出处是哪里，GPT-4都给出了具体的信息和来源链接，它总结得还是很好的。

然后我想，能不能根据这三篇文章中的关键词，由GPT-4生成相应的图片，我放到备课的PPT里？

《荷塘月色》的图，确实有荷塘也有月色；《采莲赋》的图，也确实和莲相关；《西洲曲》这幅图，好像和文章的直接联系没有那么大。但是，至少我们看到，GPT-4可以很轻松地生成多副对应不同古文或者现代文的图片。

假如我是一名新老师，完全没上过《荷塘月色》这节课，我还想知道，学生会在课堂上提什么问题？我应该怎么回答？所以我尝试让GPT-4做一些角色扮演的工作，这也是现在生成式人工智能很擅长的一点。

GPT-4分别扮演了有教学经验的语文老师、语文基础薄弱的学生和语文基础教好的学生。我和认识的语文老师讨论之后认为，GPT-4的回答还是符合教学基本要求的。

接着，我让GPT-4分别生成一道选择题和一道作文题，它都生成得非常迅速。

可见，对于老师尤其是新手老师来说，备课的时候问GPT-4几个问题，还是有帮助的。

除了备课，老师还需要做什么？比如上完三个班的《荷塘月色》这节课，拿到所有学生的作文成绩之后，传统的情况下是需要老师把分数一个个输入Excel，做分析。但现在我们就可以交给GPT-4来做。

下面这个视频展示了GPT-4的回答情况：

我们简单地输入一段话，GPT-4就可以自动生成非常多的分析数据，包括学生的分数段、不同分数段的学生分别占多大比例、所有学生的平均分是多少等等。

它还会自动选择合适的图，比如用圆环图或者扇形图来做基本的展示。在这个过程中，它可能会出错，但它现在已经具备了基本的代码自我修复能力，经过修复之后，它又可以继续进行任务。

视频中可以看到，它完整列出了班级1、班级2、班级3相应分数段的百分比。在可视化展示的时候，它可能觉得在这个情境下调用柱状图比较合适，所以就自动生成了柱状图来展示这三个班级各自的信息。同时分析了主要存在的问题，并且做了班级间的对比性总结。

在生成雷达图时，GPT-4又出现了错误，但它花了大概5秒钟就自动修复了这个错误，然后生成了一个叠加三个班级数据的雷达图。

这次考试的区分度好不好？正态分布合不合适？然后，GPT-4又做了展示正态分布的图，到这里，其实已经上升到了偏教研视角的对作文题目进行评价的地步。

最后，它还分析了三个班级的基本情况和存在的问题。当然，它分析得不一定对，但是在我只输入了非常简短的一段话，且没有做任何新的提示的情况下，GPT-4就自动完成了这些非常丰富的内容。

这是我想给大家展示的一个简单的例子。

生成式人工智能的教育应用展望

既然GPT-4有这些能力，那么我们对于生成式人工智能有哪些教育应用，可以有怎样的展望？

对于生成式人工智能，我们一般都在讲它是基于预训练大模型。预训练大模型本身是一个超大规模的神经网络，现在国内最好的高校都不一定能做得了，但是在大模型的基础上，我们可以继续做它的迁移学习。

也就是说对于一些具体的下游任务，可以通过一些少量的数据做微调，把大模型基本的通用能力聚焦到一些特定任务上，比如教育教学中教学材料、教学资源、教学评价等等这些任务的生成。

经过微调的模型，就能解决人工智能以前根本不能解决的教育教学问题。总体来讲，除去人工智能本来已经解决掉的一些教育应用问题之外，目前生成式人工智能可以着重解决以下几个问题：

首先，基于多模态的数据与知识（无论是互联网数据还是学科领域知识），结合教学场景，完成对于教学对象以及教育资源的一些理解。实际上，在高维空间上，大模型现在已经可以对这些教学对象和教学资源做更深维度的理解。在这个基础上，它就可以更好地理解教学目标和教学过程，最终可以做一系列的适配的教育任务的模型，包括教师的智能辅助、教学资源的自动生成等，最终达成人机协同的过程支持。

刚才那个例子里，作文题目、选择题这些教学资源的自主生成就很简单，老师也可以调整这些题目的难易程度和所考核的知识点。

还有教学智能辅助，生成式人工智能可以辅助老师去模拟课堂中不同角色间的提问和回答。上个月，我们在东京的全球顶级人工智能教育大会上和卡内基梅隆大学做了一个workshop。我们模拟5个不同角色的学生，完整模拟了一堂课的基本演进过程。除了帮助老师准备课程，很多时候对于学生而言，通过第三者视角去观察整个对话的过程，其实也可以促进他们的自学。

教学资源生成和教学智能辅助这两者结合在一起，就可以完成人机协同的过程支持。

比如前面的例子中，老师以后要写教学总结报告，不需要再手动生成图表、填充文字。老师可以首先对机器给出一个基本的任务目标，接着不断让它调整你具体想做的一些小的任务，最终它可以自动调取相关的代码。老师们就不用再跟代码或者office里的一些编程功能打交道，机器可以自动生成相关图片和文本。

对生成式人工智能的应用，可以让我们在教学资源的自动生成、教师教学的智能辅助以及人机协同过程的支持这三个维度上，做得比之前更好。

生成式人工智能有很多好处，但确实也有很多局限。

首先，所有人都在讲，它可能会导致学术诚信问题。另外，生成式人工智能本身是大规模的神经网络，一般规模的神经网络的可解释性本身就很差，这种超大规模的神经网络的可解释性更差，所以它生成的内容的依据就可能有很多问题。

它的中文表达能力也比较弱，因为不管是GPT-4 还是其他版本，基本都是在拉丁语系的语料库上进行训练，中文只占很小的语料比例，但是通过我们举的例子，大家可以看到，它对于中文的理解和语言表达，至少在中小学教学这个层面问题不大，总体上能满足基本教学要求。

另外还有知识产权问题、高成本问题等，都是它存在的一些局限和潜在的风险。

最后，我想用这幅图来结束今天这个简短的讲话。

最开始看这幅图，我看到的是生成式人工智能的有形之手把智能机器放到了社会各种协同工作的场景中去，教育也是这些场景之一。但另一方面，这只无形之手可能会把那些不太愿意或者不擅长用人工智能的教师逐步取代掉，把他们剥离出现代社会发展的队伍，所以也希望各位老师多关注这个领域的一些应用成果，多尝试，跟上人工智能时代发展的脚步。

注：卢宇，系北京师范大学副教授、博士生导师、未来教育高精尖创新中心人工智能实验室主任。本文整理自“数智赋能教育·课堂融合创新·教师专业发展”数智化转型推动教育的高质量发展研讨会暨全国“基础教育跨越式发展创新试验研究”2023年会。

《教育信息化100人》是由产学研媒联合发起的智库型媒体，关注教育信息化、教育数字化、智慧教育、互联网教育、人工智能教育、教育技术等领域，我们要“让优质的信息和知识更快被看见”！

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。