你在我这儿 发表于 6 天前

Grok 3 推理模型引入 DeepSearch 功能,这将为用户带来哪些新的体验?

2月18日,马斯克旗下人工智能公司xAI宣布Grok 3推理模型引入名为DeepSearch的新功能,该功能可扫描互联网和X平台以分析信息,并提供摘要来回应查询。

晓晓的波浪 发表于 6 天前

我在2025年初就专门在知乎写文章预测过,自从24年下半年OpenAI 率先推出o1系列推理模型以来,各种推理模型比如DeepSeek R1系列等逐步追上OpenAI的步伐,inference-time scaling已经被证明是行之有效的路子,随着优秀推理模型相继被推出,以此为基座模型的各种AI Agent也会迎来指数爆发年。
2025年开启了AI agent的指数爆发年因为将来随着推理模型能力提升,用推理模型作为基座模型的agent必然会继续有性能上的飞跃,将来的Agent是要基于推理模型,就是用带CoT的推理模型作为基座模型,并随着inference-time scaling而迭代的agent,不是前推理时代用llm或vlm作为基座再用上rl来堆积起来的agent。
这次的马斯克发布的deepsearch 产品其实就是基于Grok3推理模型推出的Agent。


对标的产品就是二月份OpenAI 发布的深度研究deep research ,关于deep research的具体分析,就像我在另一个问题和公众号里面都提到过的那样:
如何看待OpenAI发布的DeepResearch?有什么技术和产品影响?个人感觉Deep Research这种Agent和随后的迭代,毋庸置疑会给部分天坑专业的研究者们带来一定的冲击。。
比如Openai对deep research产品介绍中有内部的Expert-level task examples,其中的一道化学题挺有意思,用了4个小时做出来:
Prompt:I am a researcher interested in bringing mixed-gas sorption capabilities to my lab. Please discuss the differences between pure- and mixed-gas sorption for glassy polymers, how the dual-mode sorption model can be used to predict mixed-gas sorption behavior in glassy polymers (include equations where applicable), and what challenges there are in accurately predicting pure- and mixed-gas sorption using the dual-mode sorption model. Only include open-source information as of October 1, 2024.Prompt:我是一名研究人员,有兴趣将混合气体吸附能力引入我的实验室。请讨论纯气体和混合气体吸附在玻璃态聚合物中的差异,如何使用双模式吸附模型预测玻璃态聚合物中的混合气体吸附行为(包括适用的方程),以及在使用双模式吸附模型准确预测纯气体和混合气体吸附时面临的挑战。仅包含截至2024年10月1日的开源信息。
Deep Research的答案在官网上,我就不赘述了,
相关研究行业特别是research assistant,可以自行对比一下,看看自己被取代还有多远。。
另外,我在X上刷到一个用deep research写癌症研究相关专利的例子,也很有意思。
图中这位用deep research先做专利检索,然后直接写了25页的专利申请。。



正如OpenAI 刚发布不久的deep research Agent产品,在openai内部Expert-Level Tasks的测试上,所说的那样:
“The more the model browses and thinks about what its browsing, the better it does, which is why giving it time to think is important.”
“模型浏览和思考它所浏览的内容越多,它的表现就越好,这就是为什么给它时间思考很重要。”

页: [1]
查看完整版本: Grok 3 推理模型引入 DeepSearch 功能,这将为用户带来哪些新的体验?