随着AI的发展越来越成熟,如何让AI帮我们干活就成了一个非常热的话题,其中就产生了AI智能体(AI Agent)的概念。AI智能体就是具备自主决策和执行能力的AI系统,而不再是最早期的只能聊天的机器人。不过想详细了解智能体,还是需要分成两个层面,一个是纯用户层面的AI智能体,一个是开发层面的AI智能体。
首先说纯用户层面的AI智能体
现在很多AI应用都有智能体的功能,比如常见的像豆包,来看下它的智能体都有啥,如下所示:
这里的智能体可以包括编程、APP开发、PPT生成等在工作中比较有用的东西,也包括一些文生图、文生视频等内容。这里来看app制作这个智能体,可以看到它真的可以像我的员工一样,在给我确定技术选型、分析需求等,看起来好像很专业的样子。
当然在手机上使用智能体可能还是不如在电脑上方便一些,因为这样操作空间要大的多,比如我们可以在coze上使用别人的智能体,比如uniapp开发专家来做app开发相关的事情。
当然我们也可以创建自己的AI智能体,这其中可定制的内容就非常多了,比如我们还是以coze为例,可以定制的主要内容包括的有:
(1).技能,简单理解就是要执行的各种功能,比如提取抖音视频的文案。
(2).知识,简单理解就是各种固定的内容,这种可以是一些企业或个人内部的私有数据。
(3).记忆,简单理解就是上下文的历史交互,可以根据需要进行调整。
(4).对话体验,简单理解就是一些无关紧要的体验上的配置。
下面两张图可以分别说明:
这里我定制了一个知识,只有一句话,就是“张三的爸爸叫张小三”,是通过一个txt文件上传的,如下所示:
那么当我继续在问这个AI智能体的时候,就可以看到我在问他张三的爸爸叫什么的时候,他通过检索了我的知识库,给出了我想要的回答:
然后是开发层面的智能体
鉴于开发层面的智能体涉及的知识面太广泛了,因此这里简单做一个概述:
(1).大语言模型的增强与微调,主要是基于特定领域和特定知识库对大语言模型的结果进行调整,让它的输出更加准确。
(2).任务拆解和执行,主要是基于思维链技术和强化学习等相关技术,让AI把我们要做的内容逐步拆分,然后分步骤去执行。
(3).记忆管理,主要是可以让智能体记住交互的历史,避免后面步骤执行的时候忘记了前面做的内容。
(4).工具调用,主要是可以让智能体去调用外部工具,比如我们想要一个3D模型,就可以让blender通过MCP协议配合大模型完成建模。
(5).评估优化,主要是有基准测试和对抗训练等内容,可以让AI做出来的工作准确率更高,更加符合我们的诉求。
由于AI智能体范围还是太大了,包括的内容太多了,因此本文相对概要的介绍这么多。 |
|