现在AI和AI Agent 发展很快却没有实质性的提升效率？_发现AI问答

baiyuting 发表于 4 天前

现在AI和AI Agent 发展很快却没有实质性的提升效率？

现在各种开源的、闭源的项目，类似Coze、Manus等工具使用起来的确方便了一些简单、重复事务的处理，但是复杂一点的任务、需要多次思考的任务执行起来却并不尽人意，为什么当前AI的发展并没有实质性的提升效率呢？

dyanother 发表于 4 天前

第一：对AI的理解和使用，还非常浅，或者对AI的理解，仍然停留在互联网的工具思维里。

我前两天给一群企业老板讲deepseek的使用，很多老板对此不屑一顾，他们说，不就是比搜索更厉害了吗。
这是很多人选择对AI的态度，他们认为，无论是deepseek，还是豆包等工具，其实就是一个取代了搜索的工具而已。
这种认识，根本没有入AI的门！
首先，无论是deepseek,还是豆包，他其实只是一个大语言模型，是Ai时代里一个一个驱动器，AI的应用，基于这些大模型，但是不只是这些大模型。
其次：AI不是万能的，现在很多人使用AI，就觉得AI可以帮我解决任何问题，我一句话就能让他把活儿干完了。这种思想也普遍存在，比如Manus的出现，就让很多人惊呼，我一句话告诉给AI，剩下的事儿，AI去帮我干就完了。但其实这是非常错误的。甚至我判断，这类特长工作流的智能体，其实根本没有实践价值，为什么？
AI智能体的使用，有一个重要的逻辑：就是区分清楚人类决策点和AI执行层之间的关系问题。就是AI可以帮你干活，但是在干活的过程中，哪些需要人类接入干预？需要人类判断取舍？这个东西要分清楚。比如：假如你是老板，你让员工帮你写一份策划案，你首先交代了一些这个策划案的方向，要点等信息，员工根据这些信息，开始去筹备，撰写。这个过程如何进行拆解呢？老板需要做哪些决策？员工该如何干活？
这里边有几个思路：
思路一：员工根据老板第一次给的信息，完成了一个完整的方案出来，并且给出了PPT图纸等所有交付资料。但是这时候老板突然发现，这个员工理解的偏差了，或者老板有些地方好像没交代清楚，该怎么办？只能打回去，然后员工又回去写，就这样反复轮回，最终老板满意了。但是你会发现，这样很浪费时间，为什么？因为每次他是给出了交付成果后，老板才发现问题，耗费了太多的时间和精力。纯属浪费
思路二：员工根据老板给的信息，先回去思考和梳理，结合自己的经验和各方面信息，作出了一个方案的大致思路，然后去找老板商量，看看是否是老板想要的，如果不是，老板提出意见，员工修改，修完完成后，员工对老板的意图完全理解并接确定能给出想要的东西后，回去把这些方案细化、生成PPT，图纸等信息。最终交付。这个思路有什么特点？就是员工做的这件事，每到需要老板决策的时候，都会去跟老板确认，确认后再进行下一步，这样就极大的提升了效率。
其实这两种思路，就是选择很多AI使用者面临的困境，很多人对Agent的期望，就是思路一的模式。希望一句话，Ai就帮我完成了所有的工作。manus也好，coze也好，很多人在搭建自己的智能体时，都面临了这样的问题。企图让AI一个只能干完所有活儿，那么AI只能给你一坨屎！
所以，要想真正的用好AI，就要明白这个道理，让A I不断的理解我们的意图，他才能更好的干活，AI干活也是需要不断的修正和指导的。这跟人类没有区别。你不可能一次就把方案做到最完美！AI也是如此。
第二：让AI听话的基础能力不具备

Agent干活，需要三个基本能力：提示词、AI工具、数据库。我们以coze为例：

[*]提示词部分就是人设与回复逻辑部门的编写，清楚的告诉AI该怎么干活，该如何干，给出什么样的结果。把这些定义清楚是基础。
[*]AI工具，就是工作流和各种插件的使用，某些工作需要工具才能解决，那么需要找到合适的AI工具才行。
[*]数据库，就是知识库、历史记忆、数据库等方面的集合。可以让AI学习这些数据，或者在这些数据范围内帮你干活、思考、分析。
但是，这里边三个环节，其实都未必能完全掌握和使用充分，尤其是数据库，很多人是无从下手的。
数据库其实是AI听话的基础，你想让AI想你所想，干你所干，前提是你要让AI知道你是怎么想的，这个从何而来？就是数据库。
数据库分为三个层次：

[*]第一个层次，是公开性的数据库，解决普遍性信息和时效性信息问题，不让AI落后。
[*]第二个层次是行业数据库，AI是否了解你的行业特性？是否动你的行业？这个就是由行业数据库决定。
[*]第三个是个人数据库或者企业数据库，你想要什么？你的经验、阅历这些构成了第三个数据库，将这些东西数字化，AI才可以真正理解你的意图。
所以，为什么很多人发现配置的Agent无法使用，或者比较麻烦？原因往往出现在第三个层面上，即缺乏有效的数据，AI听不懂你想要什么。
第三：不懂业务，AI再牛也白搭

工具再牛，不懂业务也是白搭。AI是工具，而工具的价值，永远取决于使用者的认知深度。若缺乏对业务场景的深刻理解，也不过是空中楼阁。在AI的浪潮中，真正能够驾驭这股力量，让它发挥最大价值的，是那些既掌握先进技术，又深谙业务之道的人。
AI 只是超级工具，而非万能钥匙。
在专业领域，常常依赖 DeepSeek 和 Kimi 等工具快速生成看似完美的 PPT，华丽的图表和行业术语堆砌其中，却往往忽略了最核心的要素：
业务洞察与行业 Know-How。
AI 的确能高效生成内容，但它无法替代我们对业务本质的理解。如果没有扎实的业务知识，即便借助 AI 生成的内容再“完美”，也无法确保其有效性和实际价值。
制作一份高质量的 PPT，远不止于掌握软件操作技巧。
去年，我认识一个某直播公司老板炫耀：“AI一天生成500条短视频，流量暴涨300%！”三个月后再见面，他瘫在沙发上苦笑：“粉丝跑得比涨得还快。”
这像极了互联网史上的轮回——从门户时代的关键词堆砌，到社交媒体的标题党，再到今天的AI洗稿，流量猎手们总在追逐“技术捷径”，却忽略了一个事实：算法可以计算点击率，但算不出人心的共鸣。2023年抖音TOP500账号中，仅17%存活超过两年。那些常青树，比如“无穷小亮”或“手工耿”，从不依赖算法校准，而是深耕内容厚度。
快时尚品牌SHEIN表面是AI选款算法的胜利，实则是扎根广州番禺20年积累的“小单快反”供应链Know-How。东方甄选能穿越直播泡沫，核心壁垒不在虚拟人技术，而在于董宇辉们对农产品糖酸比数据的掌握，以及对陕西果农故事的共情能力。
这些故事印证了任正非的铁律：“不在非战略机会点消耗战略资源。”当技术跃进缺乏业务根基，就像在流沙上建城堡——外观越华丽，崩塌越惨烈。

晓晓的波浪 发表于 4 天前

感觉还是底层模型能力的问题吧？
我感觉内行人扯那些技术名词，什么这个榜单跑分，那个什么MoE，这又什么幻觉的。
对于用户来说，讲了等于白讲。
而且那些营销号，就喜欢扯名词，喜欢营造一种自己是内行人的假象。
或者打个比方。
你输出一个指令。
大模型从语料库里，摇色子似的，摇出跟你指令匹配的字，返回给你。
那么。
它摇出的内容100%跟你的指令匹配吗？
不见得。
问题就在这里。
他或许能保证95%匹配、99%匹配
但是，剩下的5%，1%，分布在哪里，完全不可控。
就是你的指令列举了5条要求

[*]你要xxx
[*]你要yyy
[*]…………

那么问题来了，他有可能漏掉1、有可能漏掉4、有可能漏掉23……他漏掉哪里，搞错哪里，完全不可控。
薛定谔的状态。你摇出来才知道哪里没做到位。
如果这个缺陷率，缺在哪里，是可控的话，那问题里的“实质性的提升效率”，马上就会出现。
但问题就是不可控。
这样的底层能力，是设计不出能大规模应用的产品的
或许reason的思路——也就是ds那个思考中的框框，能在将来解决这个问题。
但至少，现在，此刻，还解决不了。

页: [1]

发现AI问答's Archiver

现在AI和AI Agent 发展很快却没有实质性的提升效率？