研一刚入学导师让我搭各种LLM的Ai Agent框架，应该往什么方向努力才能出成果呢？

现在研一刚入学导师一直让我们复现各种各样的aiagent框架，想在之后开发自己的agent的框架，我有点没有方向感，复现了一个又一个框架但是不知道有什么意义也不知道怎么做才能出成果，请问我现阶段在看那些最新的aiagent框架的时候应该将重心放在什么地方，往什么方向发展比较好能够出成果呢，是否需要学习底层机器学习的课程或者其他基础课程，感谢指点~

发表于 5 天前

“System_prompt.txt” is all you need，至于代码嘛，狗头护体；
人们从写代码，魔改模块，变成了改prompt，逗“傻子”GPT取乐！

发表于 5 天前

同为受害者，深表遗憾，这方向就是个纯纯工程方向，硕士真造个啥框架也不太可能，如果没有项目能做垂直领域应用只能自求多福了（我现在就这样），要毕业还是结合别的方向发吧

发表于 5 天前

目前我理解的ai agent。如果有错误，大家当个玩笑就算了。
首先第一点，目前所有训练出来的模型有一个问题，就是幻觉问题，这点没办法解决，你无法做到一个模型干一百种不同的事，哪怕是GPT100也不行。
第二点，你导师的让你搭建的是各种llm的ai agent，不是搭建一个新的llm，你可以参考langchain，这个是开源项目，可以看做一个方向。
第三点就是agent了，你不应该想agent，而是agents，区别在于agent就一个代理人，agents是代理群，比如你让想训练一个agent写代码，这时你需要好几个agent了，第一个agent规化这个项目的是什么类型的，第二个agent就是规划项目是什么样子的，有那些模块，干什么的，第三个agent才是写代码，前两个agent是为了加强第三个agent。
更新一下吧
第四点就是agent需要的资料，还是那句，你不可能训练出能干一百种不同活的模型，只能让模型用工具干活，例如，还是拿上面那个agent写代码为例子，假设写个小程序，你是不是应该要写工具，告诉agent小程序的api都有那些东西。agent的未来是蓝海，核心还是公司想定制一个ai agent，但怕信息泄露，或者说他内部的资料不足训练出满意的。这时候才是ai agent的出场机会。要让ai agent知道那些资料在哪里，对于超过范围的事可以回答或者交给人工服务。
其实第四点就是说工具，给ai使用的工具，来达到目的。
第五点就是工作流，或者说是任务，让agent完成的任务，让ai自主决策任务什么时候结束，跳转条件，需要多次和ai进行交互，如果是现在的ai就几岁小孩的智商，我们需要的就是多来个几岁小孩分工合作，类似于，给你四十个小孩，打扫布置教室，你需要的是分组，一组搞卫生，一组布置。而不是让他们自由发挥。
第五点就是rag，把句子低纬化，方便检索，举个例子:小明天天喜欢溜那条叫小白的狗。如果ai需要在整个文档中找出小明的狗叫什么。能全文搜索狗叫做或者狗的名字，还是一个一个找狗在的句子？因为小明加够，变成的向量就是[1.6.9.4]，那么问题变成的向量可能就是[1.6.8.4]，相似度达到0.5以上，OK，把这段话给ai，ai就知道小明的狗叫什么了，而不是阅读整本书。

发表于 5 天前

agent的狂欢基本已经结束了，不建议继续纯做这个，起码得加点多模态和ml,dl了。
具体可以看看各家公司的agent都到什么水平了，比如网易逆水寒这种，别人已经纯商业赚钱了，你如果不如人家的，大概率还是很难。

今天刚中了nips，也是llm agent的工作。
有需要的话，我可以写一下自己对这方面的经验。

现在llm agent的工作好几类，而我主要是关注游戏方面的，所以有些地方肯定是没写清楚或者有错误，还希望多多包涵。

第一种可以称之为博弈类，或者mallm类。
这类一般是以前做过marl的人转战llm agent，把之前的marl里面的方法拿过来各种套。大部分工作都会在矩阵博弈，overcook这种环境做，主要目标还是涨点啥的。个人不是很喜欢，不过做的人不少，毕竟科研也是工作的一种，能发文章的方向肯定是好方向，只不过找工作这个就不太实际了。

第二种可以称之为游戏类，虽然博弈也叫game，但这里指的还是真正有人玩的游戏，起码得有受众。

这类又可以细分，一类是构建文本化的环境，比如civrealm，llm play sc2(我做的，自卖自夸一下)，还有各种兵棋。这类主要考验你对这些游戏的掌握程度，通过各种接口想办法去保证游戏的文本空间的合理映射。
最近安波老师的多模态agent cradle也很火，带领了一波多模态的浪潮，比如现在的黑神话悟空，也有人开始这么做了。
剩下的就是经典的打牌下棋了，这个也有不少，从象棋围棋到掼蛋，大家都做了一遍。
这一类的问题就是，上一波rl大火的时候，能训练的游戏基本都是超越人类的水平了，llm/mlm agent的优势和特点在哪里，这是需要解决的。

第三类可以说是各种具身智能，不过由于现在啥都叫具身智能了，我这里就只讲机器人了。这个领域我不熟悉，也没看过多少工作，但一般有真机的工作要更扎实一点，很多会议也要求有真机的。纯仿真里搞这些，就不大好了。

第四类是模拟类的，比如模拟一个人，模拟一个社会这种。
现在有的工作，比如斯坦福小镇，模拟Twitter，还有模拟选举什么的。其实和游戏类差不多，有的甚至就在游戏里面搞的。我们需要设计合理的机制，做好前后端接口，把一个真实的社会给仿真出来，尽可能让大模型像每一个性格迥异的人。
这里有几个问题很难解决，第一是仿真器怎么做，斯坦福小镇的爆火就是他们可视化做的好，后续大家都在unity里开发了。第二是怎么保证个性化和智力，大模型经过rlhf之后，很难让它细粒度的扮演一个人进行决策，主流的商业模型都会给出一个很中庸的回答，根本没法用。第三是怎么支撑起几百，甚至几百万的agent交互，这个很复杂，方法很多，但花的钱肯定不少。
当然有些人是没有前端渲染的工作，多快好省，这其实不太好，因为这个领域Demo胜过一切，你连一个好看的Demo都没有，别人肯定是不会浪费时间看你的工作。

第五个才是现在最有用的agent，比如客服问答，rag这种，做的人很多，很卷，但是真的能落地赚钱。这方面我完全不熟，希望有人补充。
第六个可以说是tool use之类的工作，比如hugginggpt什么的，现在也很火，该赚钱的已经都在赚钱了，公司也非常看中这个，毕竟这些是真的能提升生产力。
第七个是自动化流水线，比如metagpt写代码，各种生物化学的agent用来合成东西，发现和分析数据啥的。代码类现在吹得很凶，但效果还是很难做好，毕竟严重依赖基础模型。而ai for science这类的，主要靠py和science端的知识，cs的学生肯定是没这品味，也没这兴趣去搞这种(毕竟我就是生物本科，我感觉大部分做ai for science的同学，根本不了解真正的基础研究)。
发现忘记写minecraft了，由于23年做他们的人太多了，特此把他从游戏类提出来单独写一下。
有三类，第一类纯rl，大家以前做的比较多，比如Minecraft有openai做的那个，从视频里学习的。

第二类是纯llm，这个就满天飞了，什么Voyager，ghost in Minecraft，非常多，一般都是技能库，调用代码什么的，相信大家看过很多Demo了。当然最近也有1000个agents的这种，这种其实主要是因为minecraft本身游戏比较好，能支持这么agent进去，有钱加上合理的设计，肯定能做出来。

第三种是llm+rl，有设计reward的，有存储技能书的，也是一大堆，不少都中了顶会。
minecraft竞争过于激烈，不建议大家再搞了，除非你有信心战胜10个清华博士全力开卷的能力。
所以总结一下，大部分的agent领域低垂得果实，都已经被摘完了，22年底到23年的那种随便调调api，编点故事就乱发的美好时代已经过去了。当然对于老师来说，他们往往才开始了解，所以不懂这个竞争多惨烈，只能看到别人xxx都能发，我们为什么不能。
如果大家想继续做这个方向，那就得想清楚自己擅长什么。大模型的商业化实际上是依赖agent的，没有公司支持的大模型研究，基本都是搞笑的，公司不但会提供商业场景，也会提供资源支持，而高校这种小打小闹，在如今是完全行不通的。
毕竟大模型就是个工程活，不要老觉着自己是在做科研，你和纯数，生化环材的比一下，就知道自己在做啥了。

怎么收藏比点赞还多。

最近准备申博，想去卡多钱多事少能摆能实习的地方(可能在梦里)。
最终毕业后，目标还是工业界，因为能赚钱，不想再体验生物那种牛马学术了。如果有合作或者发我实习啥的，可以联系我。
目前是中科院自动化所群体决策智能实验室研三在读，马纬彧。
邮箱：740988193@qq.com
sc2meisah@gmail.com

发表于 5 天前

针对某一个具体领域，比如数学或者代码，用小模型搭建agent，尝试超越大模型的效果。如果做出来了，就可以宣称吊打GPT4o，国产o1。

发表于 5 天前

你好，针对你的情况，作为一名内容编辑的建议如下：<br><br>目前刚入学研究生阶段，导师让你们搭建AI Agent框架是非常常见的任务。建议首先熟练掌握各种框架的核心原理和构建方式，在此基础上进行实际项目经验的积累和实践能力的锻炼。复现框架时不仅要知其然还要知其所以然，每个框架的背后都对应一定的实际应用场景或技术问题。只有将框架与实际应用相结合，才能真正理解其价值所在。同时，建议注重机器学习基础知识的积累，如深度学习、自然语言处理等。在此基础上，关注最新的AI技术趋势和前沿研究，如强化学习、迁移学习等。此外，参加相关学术研讨会和项目实践，与同行交流学习，不断提升自己。希望这些建议对你有所帮助。加油！

研一刚入学导师让我搭各种LLM的Ai Agent框架，应该往什么方向努力才能出成果呢？

本周热门