baiyuting 发表于 4 天前

现在AI和AI Agent 发展很快却没有实质性的提升效率?

现在各种开源的、闭源的项目,类似Coze、Manus等工具使用起来的确方便了一些简单、重复事务的处理,但是复杂一点的任务、需要多次思考的任务执行起来却并不尽人意,为什么当前AI的发展并没有实质性的提升效率呢?

dyanother 发表于 4 天前

第一:对AI的理解和使用,还非常浅,或者对AI的理解,仍然停留在互联网的工具思维里。

我前两天给一群企业老板讲deepseek的使用,很多老板对此不屑一顾,他们说,不就是比搜索更厉害了吗。
这是很多人选择对AI的态度,他们认为,无论是deepseek,还是豆包等工具,其实就是一个取代了搜索的工具而已。
这种认识,根本没有入AI的门!
首先,无论是deepseek,还是豆包,他其实只是一个大语言模型,是Ai时代里一个一个驱动器,AI的应用,基于这些大模型,但是不只是这些大模型。
其次:AI不是万能的,现在很多人使用AI,就觉得AI可以帮我解决任何问题,我一句话就能让他把活儿干完了。这种思想也普遍存在,比如Manus的出现,就让很多人惊呼,我一句话告诉给AI,剩下的事儿,AI去帮我干就完了。但其实这是非常错误的。甚至我判断,这类特长工作流的智能体,其实根本没有实践价值,为什么?
AI智能体的使用,有一个重要的逻辑:就是区分清楚人类决策点和AI执行层之间的关系问题。就是AI可以帮你干活,但是在干活的过程中,哪些需要人类接入干预?需要人类判断取舍?这个东西要分清楚。比如:假如你是老板,你让员工帮你写一份策划案,你首先交代了一些这个策划案的方向,要点等信息,员工根据这些信息,开始去筹备,撰写。这个过程如何进行拆解呢?老板需要做哪些决策?员工该如何干活?
这里边有几个思路:
思路一:员工根据老板第一次给的信息,完成了一个完整的方案出来,并且给出了PPT图纸等所有交付资料。但是这时候老板突然发现,这个员工理解的偏差了,或者老板有些地方好像没交代清楚,该怎么办?只能打回去,然后员工又回去写,就这样反复轮回,最终老板满意了。但是你会发现,这样很浪费时间,为什么?因为每次他是给出了交付成果后,老板才发现问题,耗费了太多的时间和精力。纯属浪费
思路二:员工根据老板给的信息,先回去思考和梳理,结合自己的经验和各方面信息,作出了一个方案的大致思路,然后去找老板商量,看看是否是老板想要的,如果不是,老板提出意见,员工修改,修完完成后,员工对老板的意图完全理解并接确定能给出想要的东西后,回去把这些方案细化、生成PPT,图纸等信息。最终交付。这个思路有什么特点?就是员工做的这件事,每到需要老板决策的时候,都会去跟老板确认,确认后再进行下一步,这样就极大的提升了效率。
其实这两种思路,就是选择很多AI使用者面临的困境,很多人对Agent的期望,就是思路一的模式。希望一句话,Ai就帮我完成了所有的工作。manus也好,coze也好,很多人在搭建自己的智能体时,都面临了这样的问题。企图让AI一个只能干完所有活儿,那么AI只能给你一坨屎!
所以,要想真正的用好AI,就要明白这个道理,让A I不断的理解我们的意图,他才能更好的干活,AI干活也是需要不断的修正和指导的。这跟人类没有区别。你不可能一次就把方案做到最完美!AI也是如此。
第二:让AI听话的基础能力不具备

Agent干活,需要三个基本能力:提示词、AI工具、数据库。我们以coze为例:

[*]提示词部分就是人设与回复逻辑部门的编写,清楚的告诉AI该怎么干活,该如何干,给出什么样的结果。把这些定义清楚是基础。
[*]AI工具,就是工作流和各种插件的使用,某些工作需要工具才能解决,那么需要找到合适的AI工具才行。
[*]数据库,就是知识库、历史记忆、数据库等方面的集合。可以让AI学习这些数据,或者在这些数据范围内帮你干活、思考、分析。
但是,这里边三个环节,其实都未必能完全掌握和使用充分,尤其是数据库,很多人是无从下手的。
数据库其实是AI听话的基础,你想让AI想你所想,干你所干,前提是你要让AI知道你是怎么想的,这个从何而来?就是数据库。
数据库分为三个层次:

[*]第一个层次,是公开性的数据库,解决普遍性信息和时效性信息问题,不让AI落后。
[*]第二个层次是行业数据库,AI是否了解你的行业特性?是否动你的行业?这个就是由行业数据库决定。
[*]第三个是个人数据库或者企业数据库,你想要什么?你的经验、阅历这些构成了第三个数据库,将这些东西数字化,AI才可以真正理解你的意图。
所以,为什么很多人发现配置的Agent无法使用,或者比较麻烦?原因往往出现在第三个层面上,即缺乏有效的数据,AI听不懂你想要什么。
第三:不懂业务,AI再牛也白搭

工具再牛,不懂业务也是白搭。AI是工具,而工具的价值,永远取决于使用者的认知深度。若缺乏对业务场景的深刻理解,也不过是空中楼阁。在AI的浪潮中,真正能够驾驭这股力量,让它发挥最大价值的,是那些既掌握先进技术,又深谙业务之道的人。
AI 只是超级工具,而非万能钥匙。
在专业领域,常常依赖 DeepSeek 和 Kimi 等工具快速生成看似完美的 PPT,华丽的图表和行业术语堆砌其中,却往往忽略了最核心的要素:
业务洞察与行业 Know-How。
AI 的确能高效生成内容,但它无法替代我们对业务本质的理解。如果没有扎实的业务知识,即便借助 AI 生成的内容再“完美”,也无法确保其有效性和实际价值。
制作一份高质量的 PPT,远不止于掌握软件操作技巧。
去年,我认识一个某直播公司老板炫耀:“AI一天生成500条短视频,流量暴涨300%!”三个月后再见面,他瘫在沙发上苦笑:“粉丝跑得比涨得还快。”
这像极了互联网史上的轮回——从门户时代的关键词堆砌,到社交媒体的标题党,再到今天的AI洗稿,流量猎手们总在追逐“技术捷径”,却忽略了一个事实:算法可以计算点击率,但算不出人心的共鸣。2023年抖音TOP500账号中,仅17%存活超过两年。那些常青树,比如“无穷小亮”或“手工耿”,从不依赖算法校准,而是深耕内容厚度。
快时尚品牌SHEIN表面是AI选款算法的胜利,实则是扎根广州番禺20年积累的“小单快反”供应链Know-How。东方甄选能穿越直播泡沫,核心壁垒不在虚拟人技术,而在于董宇辉们对农产品糖酸比数据的掌握,以及对陕西果农故事的共情能力。
这些故事印证了任正非的铁律:“不在非战略机会点消耗战略资源。”当技术跃进缺乏业务根基,就像在流沙上建城堡——外观越华丽,崩塌越惨烈。

晓晓的波浪 发表于 4 天前

感觉还是底层模型能力的问题吧?
我感觉内行人扯那些技术名词,什么这个榜单跑分,那个什么MoE,这又什么幻觉的。
对于用户来说,讲了等于白讲。
而且那些营销号,就喜欢扯名词,喜欢营造一种自己是内行人的假象。
或者打个比方。
你输出一个指令。
大模型从语料库里,摇色子似的,摇出跟你指令匹配的字,返回给你。
那么。
它摇出的内容100%跟你的指令匹配吗?
不见得。
问题就在这里。
他或许能保证95%匹配、99%匹配
但是,剩下的5%,1%,分布在哪里,完全不可控。
就是你的指令列举了5条要求

[*]你要xxx
[*]你要yyy
[*]…………

那么问题来了,他有可能漏掉1、有可能漏掉4、有可能漏掉23……他漏掉哪里,搞错哪里,完全不可控。
薛定谔的状态。你摇出来才知道哪里没做到位。
如果这个缺陷率,缺在哪里,是可控的话,那问题里的“实质性的提升效率”,马上就会出现。
但问题就是不可控。
这样的底层能力,是设计不出能大规模应用的产品的
或许reason的思路——也就是ds那个思考中的框框,能在将来解决这个问题。
但至少,现在,此刻,还解决不了。
页: [1]
查看完整版本: 现在AI和AI Agent 发展很快却没有实质性的提升效率?