遭遇DeepSeek冲击后,OpenAI新产品功能的发布频率显著加快。继3天前发布正式版o3-mini模型并在ChatGPT中免费增加“推理”按键后,北京时间2月3日上午,OpenAI发布了ChatGPT新功能“深度研究”(Deep Research),该功能旨在通过5到30分钟的联网和深度思考后,生成可以达到分析师级别的报告。目前Pro用户已经可以使用该功能。
OpenAI首席执行官山姆·奥特曼表示,这是如同“按需提供专家”一样的服务,可以完成之前需要花费数小时或数天完成的任务。不过,OpenAI方面表示,该功能有时也会在回答中产生幻觉或做出错误的推断,但错误出现的概率明显低于现有ChatGPT旗下其他模型。
值得注意的是,在Humanity’s Last Exam(简称HLE)测试中,深度研究所使用的模型在专家级问题上达到了26.6%的准确率,创下新高。相比之下,DeepSeek的R1模型的准确率是9.4%。这一测试由全球众多领域专家共同开发,目的是评估人工智能在广泛学科领域的表现,被视为衡量人工智能学术能力的前沿基准。该测试包含超过3000道多项选择题和简答题,涵盖从语言学到火箭科学、从古典学到生态学等100多个学科领域。
资料来源 |
|