让大模型 Agent 走进您的办公室

背景

不管你愿不愿意、在不在意，大模型的时代的确来了。之前大模型出现之后，热衷深度学习的我反而似乎远离了这个领域。可能 chatGPT 这样大模型出现之后，让我们的路越来越窄。可能是我个人对大模型的一个偏见吧。

chatGPT 的出现，可以划分为 2 类，一类从事大模型的人，一类是大模型服务的人。很少有像 chatGPT 这样快速渗透到各个领域。

基于大模型，主要提供以下几种途径

提示词工程

提示工程，我们如何通过提示词准确控制大模型来完成我们预期的任务。现在也在学习如何写出可以准确控制 LLM 的提示词，看了一篇文章发现有关于提示词的 paper，的确我小看了提示词工程，这是最直接决定是否你可以更好利用大模型的关键。

提示词背后让 LLM 坍缩到某一个特定领域，也就是给模型一些额外信息或者说是额外约束。

在公司内部我们更需要专业，专职而不是泛化，我们更需要的精准而不是看上去没错，但是答案并不是我们要想要。

知识库

现在知识库提供向量方案，不过知识库准确性并不高，在向量知识库对答案检索能力通常是在 70% 左右，还是需要通过一些技术，额外工作可以将在知识库检索能力提升到 90% 左右。

搭建本地知识库 langChain 加载文本，将文档生成向量,也就是 embedding vector，根据向量去找到相似的结果，以达到对答案召回的效果。

Agent

那么什么是 Agent 呢? 谈到 Agent 我们自然想到房产中介或者金融产品推销人员，Agent 并不是在大模型时代产生新的词汇，而是在大模型时代赋予 Agent 新的含义。Agent 理解就是将大模型通过企业的现有应用，例如信息化系统接入到企业最好方式，这就是 Agent。

微调

微调是又贵又难，微调是有门槛的，做个基于现有模型做过微调人可能更有体会，微调是需要一定经验和并且对深度学习有深刻理解的技术人员。而且想要训练一下，怎么也要有个 500w 预算，这个对一般中小型公司是难以承担的。

适合 Agent 的应用场景

在教育领域、医疗领域、还有金融法律领域，这些强调个性化服务还是需要 Agent 的。这里以教育领域为例，传统方式是一种教学方式、一套解决方案来帮助班级每一个学生进行提升。其实虽然目标一致的，每个学生是有差异化的，传统方式是无法估计到每一个学生，而基于大模型的 agent 却可以考虑每一个学生，为每一个学生提供专属其的服务。

Agent 的未来

随着大模型不断进化，虽然可能做的事越来越多，不过还是有一些专业领域和特定工作还是大模型无法触及的，还是需要 Agent 方式来解决的。所以暂时还不用过于担心的 Agent 未来。

多 Agent 协作

多 Agent 协作不仅限于 Agent 之间，还包括 Agent 和人之间协作。协作这里准备引入博弈论和强化学习来达到多 Agent 合作效果，这里关系一定仅限于合作，也可能是竞争的关系。

Agent 进化

我们是工作中不断进步，积累经验，提升自己。那么 agent 应该如何提升自己呢? 首先对于我们来说 fine-tuning 大模型的遥不可以及，想要提升 Agent 可以通过 2 种方式，第一种就是提升 prompt ，prompt 也是在搜索空间找到一个合适 prompt 让LLM 输出效果最好，那么需要一个根据任务生成 prompt 的模型，可以用强化学习模型来实现，然后就是对输出的评估模型。

还有就是 prompt 搜索空间优化，可以考虑 NAS 这样搜索网络，或者渐进式的 LSTM 来找到一个合适的 prompt。

也可以通过遗传算法，遗传算法可以提升。通过遗传算法来提升 prompt ，因为遗传算法适合场景就是对于这个问题无从下手。

启发式算法—遗传算法(GA)，从一个小案例来解释如何使用遗传算法来解决实际问题

入职面试(requirement)

对于一名要入职的新员工，如果他是刚刚从校门走出，还没有任何关于入职岗位的工作经验，我们应该如何培养他呢? 带着这个想法我们来看一看 agent 相对于入职的新员工有什么不同，需要如何设计一个 agent 来帮助他快速成长为一名合格员工。

计算能力，基础数学计算、具有逻辑处理能力
具有一定语言表达能力，接收信息和输出信息
对语言理解能力
具有一定经验，需要他有记忆能力，经验传承
沟通能力和协作能力

Agent 框架

我们先从实际出发来设计框架，开始先不去接近任何现在市面上流行的 agent 框架。这个框架名字就是就叫 zi-office 或者叫 zi-factory，还是叫 zi-office吧，先让 agent 从事文本处理相关的工作。

通讯模块、记忆模块、逻辑运算、调度模块、语义分析模块，环境...

Agent 之间通讯方式，整个任务是动态的，Agent 之间通讯、Agent 与环境的通讯以及 Agent

这张图只是前期的草图，经过对 Agent 了解，感觉还是远远不够。不过不难看出 Agent 背后是 LLM 不过 Agent 不仅仅是一个 LLM 我们可以需要一些可以训练的大模型。

Agent 记忆

关于 Agent 的记忆，这里是也是 Agent 的设计一个重要环境，可以采用外部存储，也可以采用内部存储。可以通过设计 LSTM 来通过参数来记忆一些新的，当下的发生的事情或者更新的知识，也可以通过外部在磁盘上存储一些内容。

Agent 和人不同，一个 agent 背后可能是几十个 agent 在支撑，甚至是成千上万 agent 作为计算单元组成网络。

最后在这里也欢迎大家指正批评，积极参与讨论来一起共同构建一个 Agent 框架，欢迎留言。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。