OpenAI 将在几周内发布 o3、o4-MINI,未来几个月发布 GPT-5,会带来哪些新功能?

4月5日讯 当地时间周五,OpenAI首席执行官奥尔特曼表示,将在未来几周内发布o3和o4-mini,未来几个月将发布GPT-5。
奥尔特曼当天在社交媒体上发文称,GPT-5的发布比预期要晚,但这是有原因的,最令人兴奋的是,现在有能力把GPT-5做得比最初预期的要好不少。

OpenAI 将在几周内发布 o3、o4-MINI,未来几个月发布 GPT-5,会带来哪些新功能?-1.jpg


“我们还发现,顺利整合所有内容比我们预想的要困难得多。而且我们希望确保有足够的能力来支持我们预期的前所未有的需求。”这说明OpenAI预计GPT-5发布后会非常受欢迎,可能会有大量的用户使用,所以他们需要提前做好准备。
近期以来,随着ChatGPT的全新图片生成功能引发互联网狂欢,OpenAI的活跃用户数、应用内订阅收入,以及下载量均创下历史新高。据悉,ChatGPT的付费用户数量已经突破2000万人,去年底时这个数字为1550万人。
o3和o4-mini的技术规格尚未公开,但预计它们将填补GPT-4与即将到来的GPT-5之间的能力差距。行业观察人士认为,GPT-5将在推理、规划和记忆功能方面有显著改进。
OpenAI此前在公布有关GPT-5的细节时提到,公司打算以“标准智能设置”为用户提供对GPT-5的无限聊天访问权限,但会受到“滥用阈值”的限制。ChatGPT Plus用户将能够以“更高智能水平”运行GPT-5,而ChatGPT Pro用户将能够以“更高一级的智能水平”运行GPT-5。
奥尔特曼在今年早些时候透露:“GPT-5将整合语音交互、画布(Canvas)、深度搜索、深度研究等功能。”他提到的是OpenAI在过去几个月中在ChatGPT中推出的一系列功能。他还表示:“我们的一个重要目标是通过创建能够使用我们所有工具的系统,能够判断何时需要深入思考、何时不需要,并且能够广泛应用于各种任务,来统一我们的大模型。”
与此同时,OpenAI正面临来自竞争对手日益增长的压力,这些竞争对手采用了“开放”的方式来推出模型,例如中国的AI实验室DeepSeek。与OpenAI的策略不同,这些“开放”的竞争对手将他们的模型提供给人工智能社区用于实验,在某些情况下还用于商业化。
不过就在近日,奥尔特曼也宣布OpenAI将在未来几个月内发布一个“强大的带有推理能力的全新开放权重(open-weight)模型”。该模型将具有推理能力,并将接受额外的安全评估。
收藏者
0
被浏览
62

5 个回答

mssafia LV

发表于 2025-4-8 10:49:37

O3估计也就是O1+++,不会有太多新功能,看奥特曼的说法,Gpt5也只是O家之前各种功能的集大成之作。而且我很怀疑O3能不能比Gemini2.5Pro好用,毕竟Gemini的上下文和多模态实在是太强了。
O家要危啊,这个上半年算是被围剿了——X家的Grok3,A家的Claude3.7sonnet合力逼出一个Gpt4.5,这次Google的Gemini2.5Pro又逼出来原计划不单独发布的O3。不过Claude4出来O家怎么办呢?Gpt5还是O4?啊对,还有D家的V4和R2,这两个不一定能做到SOTA,但绝对能狠狠给O家这个吃相上一课。
下半年估计更有乐子,看Grok3的情况,X家的20W卡搞出来的Grok4性能不会太差,至少是T1梯队,Google的Gemini3也是很值得期待的。
今年绝对是非常有活的一年,很有可能下半年就会有能独立完成(无需人类干涉)大型项目的模型出来了,很期待那一天。当然,我更期待国产模型能达到T1甚至T0梯队,现在Deepseek V3/R1的可用性还是不高,期待V4/R2(不考虑本地部署的情况下,Qwen还是算了吧,榜单战神)

雪落 LV

发表于 2025-4-8 11:01:37

是这样的:
1)原本OAI说的是GPT-4.5以后就不区分GPT-4/5和GPT-o系列了,统称为GPT-5,这样:
a)原本1月份发布的GPT-3期货,不会单独拿出来发了,只是内部使用和用在DR里;
b)不会有新的o系列了,GPT-4.5之后就是GPT-5;
c)1个多月前说GPT-5是a few month,原本大家是抓5月底发的。
2)现在按照他新的说法:
a)GPT-5还是a few month,跟5月底发的预期不太匹配;
b)GPT-o3和GPT-o4 mini说明他短时间内拿不出新货,只能用这种本来不准备发的东西应付,这个跟发掉GPT-4.5的逻辑一样;
c)过往GPT-o3 mini跟GPT-o1性能是一致的,类比GPT-o4 mini跟GPT-o3性能应该是一致的,也就意味着未来几周的发布不会推进智能的边界。
3)说明了什么:
a)GPT-5训练可能不顺利,mark chen有可能融合推理和预训练模型的时候失败了;
b)未来几周有可能会有新的模型,OAI在恶心人,大概率狙击的是LLAMA 4,Grok跟deepseek大概率也会狙击LLAMA。

bingfeng009 LV

发表于 2025-4-8 11:11:28

这里OpenAI提到的o3以及GPT-5之前已经是发了预告,唯一的新品是o4-mini。

OpenAI 将在几周内发布 o3、o4-MINI,未来几个月发布 GPT-5,会带来哪些新功能?-1.jpg

o3其实在去年“OpenAI 12天活动”的第12天已经发布了。o1是第一个基于强化学习训练的大型推理模型,而o3进一步扩展了(scaling)强化学习来提升模型效果。

OpenAI 将在几周内发布 o3、o4-MINI,未来几个月发布 GPT-5,会带来哪些新功能?-2.jpg


OpenAI 将在几周内发布 o3、o4-MINI,未来几个月发布 GPT-5,会带来哪些新功能?-3.jpg

o3在编程以及数学方面,相比o1均有明显提升。比如,o3在真实世界编程基准SWE-bench Verified上实现了71.7%的准确率,比o1高出20%;o3在Codeforces上的得分已经达到了2727 ELO,在全球排名中名列第175位,这已经超过了网站中的99.9%的人类选手。

OpenAI 将在几周内发布 o3、o4-MINI,未来几个月发布 GPT-5,会带来哪些新功能?-4.jpg


OpenAI 将在几周内发布 o3、o4-MINI,未来几个月发布 GPT-5,会带来哪些新功能?-5.jpg


OpenAI 将在几周内发布 o3、o4-MINI,未来几个月发布 GPT-5,会带来哪些新功能?-6.jpg

而且o3还在一个ARC-AGI测试上取得了突破。在 10,000 美元计算限制下的半私有测试集上取得了突破性的75.7% 的成绩,取得了公共排行榜第一而在高计算配置下,o3 得分为87.5%。

OpenAI 将在几周内发布 o3、o4-MINI,未来几个月发布 GPT-5,会带来哪些新功能?-7.jpg

OpenAI 最强推理模型 o3 发布,AGI 测试能力暴涨,会对哪些领域带来影响?不过o3一直是没有对外正式发布,但在今年1月底上线了o3-mini[1]。
OpenAI 上线推理模型 o3-mini,首向免费用户开放推理,体验如何?有何技术亮点和新应用场景?o3-mini按照推理强度(推理思维链长短)分为low、medium和high三档,其中o3-mini low效果超过o1-mini,o3-mini medium性能和o1相当,而o3-mini high超过o1。

OpenAI 将在几周内发布 o3、o4-MINI,未来几个月发布 GPT-5,会带来哪些新功能?-8.jpg


OpenAI 将在几周内发布 o3、o4-MINI,未来几个月发布 GPT-5,会带来哪些新功能?-9.jpg


OpenAI 将在几周内发布 o3、o4-MINI,未来几个月发布 GPT-5,会带来哪些新功能?-10.jpg


OpenAI 将在几周内发布 o3、o4-MINI,未来几个月发布 GPT-5,会带来哪些新功能?-11.jpg

所以o3-mini应该是OpenAI线上最强的推理模型,大号版本o3应该能超过它。而我比较期待的是o系列的下一个版本o4,看来OpenAI还是先推出mimi版本o4-mini,o4如果能继续提升明显,那么说明推理模型的test-time inference scaling还是有搞头的。
而对于GPT-5,今年2月份的时候奥特曼也已经透露过了。OpenAI在发布GPT-4.5之后会发布GPT-5:
In both ChatGPT and our API, we will release GPT-5 as a system that integrates a lot of our technology, including o3. We will no longer ship o3 as a standalone model
OpenAI 放王炸,将发布整合多项技术的 GPT-5,并免费无限使用,该模型有哪些技术亮点?当时的说法,GPT-5会集成OpenAI很多技术,包括o3,而且说o3不会作为一个单独的模型发布。
但是现在看来,o3应该是提前于GPT-5单独发布。而且GPT-5可能比预期更好,但基本确定是延迟发布了。

OpenAI 将在几周内发布 o3、o4-MINI,未来几个月发布 GPT-5,会带来哪些新功能?-12.jpg


不过之前奥特曼说GPT-5会直接集成到ChatGPT了,没有订阅ChatGPT会员的用户也可以免费使用。如果真正推出的时候会是免费的,效果强于现在免费的GPT-4o的话,那么就很有用了。
OpenAI 将在几周内发布 o3、o4-MINI,未来几个月发布 GPT-5,会带来哪些新功能?-13.jpeg


https://www.zhihu.com/video/1891866596919715006

jshrjx LV

发表于 2025-4-8 11:22:06

某种程度上,反应了当今大模型领域日新月异的竞争压力。而这种竞争压力的直接来源我认为很可能是谷歌前几天发布的gemini2.5pro
按照奥特曼在2月的设想,o3将和gpt4.5一起,被整合到gpt5中,那时候估计gpt5会在5月份发布,可以参考gpt3.5到gpt4的发布时间,gpt4.5显然只是一个过渡时期的模型,并没有打算做多模态,上个月还在更新gpt4o,更新后的性能直超gpt4.5,再加上昂贵的价格,可见gpt4.5只是临时被推出来,做一个过渡时期的模型,真正的主菜应该是不久后推出的gpt5
但最近几个月大模型领域竞争过于激烈,先是deepseek r1在国内外爆火,open ai同期发布了o3 mini模型,grok3和claude3.7的推出open ai又匆忙发布了gpt4.5,谷歌发布gemini2.5pro又使得open ai推出了gpt4o的更新。接下来各家还会有新模型,而且,都在卷推理模型,包括即将发布的r2和qwen3,如果奥特曼只是用去年12月研发的o3,配上那个所谓情感深度的gpt4.5,昂贵的api价格我发誓会被其他家的纯推理模型锤的很惨,尤其是deepseek和gemini,在这种情况下,虽然之前计划要简化命名,但还是得硬着头皮单独发布o系列的模型。而且我觉得,o4系列应该早就已经研发了,只是之前可能想着是gpt5.5或者gpt6用的,现在单独推出来,用升级版的o3暂时和对手竞争,gpt5也会迎来相关的升级,推理部分应该是用o4了,当然,时间也会推迟几个月,估计至少要等到7月之后才能和大家见面了
今年下半年可以期待一波GPT5,Claude4,Grok4以及已经追赶上来的谷歌的Gemini3四家产品同台亮相。国内的话,看deepseek是否也会尝试整合v4和r3模型推出新的产品,总之,下半年基本聊天、推理领域就卷到人类目前水平的尽头了,今年开始逐渐卷新的赛道是agent,接下来几年还会卷创新,组织,这些都完成了的时候,agi就真的来临了

siyue110 LV

发表于 2025-4-8 11:31:59

我看有人在吹 GPT-5,我咋觉得恰恰相反。我看完之后的感觉是,这一切都在为 GPT-5 的训练遇阻和发布延后做找补。简单来说,推理模型和非推理模型的融合遇到了困难,但推理模型本身还没有遇到瓶颈
我们首先要理解 OpenAI 的「计划有变」是怎么个变法,比较重要的信息就在 Sam Altman 前后发的两条推特里。
之前的计划(2月13日)是[1]:

OpenAI 将在几周内发布 o3、o4-MINI,未来几个月发布 GPT-5,会带来哪些新功能?-1.jpg

简单来说就是

  • 发布 GPT-4.5 作为最后一个非思维链模型(现在已经发布)
  • 将整合所有工具、思考、功能,统一 o 系列和 GPT 系列,数月内推出 GPT-5
  • 不再单独发布 o3
  • 免费用户将可以无限制使用 GPT-5
  • 付费用户可以以「更高智力水平」运行 GPT-5,并使用各种高级工具
看上去似乎比较混乱。实际上 OpenAI 的模型现在就是两条路线:

  • 推理模型(去年 9 月之后):o1/o1-mini → o3/o3-mini(o3 之前已经发布了,但 OpenAI 并没有实际上面向用户推出,据说是消耗算力的成本过高)
  • 非推理模型:GPT-3.5 → GPT-4 → GPT-4o(多模态) → GPT-4.5(传闻中的 Orion,也是最后一代非推理模型)→ GPT-5(融合所有能力)

OpenAI 将在几周内发布 o3、o4-MINI,未来几个月发布 GPT-5,会带来哪些新功能?-2.jpg

而现在 OpenAI 的计划是[2]:

OpenAI 将在几周内发布 o3、o4-MINI,未来几个月发布 GPT-5,会带来哪些新功能?-3.jpg


  • 依然会发布 o3 和 o4-mini(也许在几周内)
  • 几月之后发布 GPT-5,能够将 GPT-5 训练得比最初预想的效果更好
  • 整合所有能力比预计的更难
  • 希望得到更多容量(算力)来支持
首先是大家最关心的 GPT-5,出现了自相矛盾的描述。一方面说 GPT-5 会效果更好,另一方面又说整合所有事情比预想的更难。
因为最初 GPT-5 的主要目的是整合推理和非推理两条路线的模型,以及各种模态和工具能力。现在说「整合遇到困难」,实际上就是承认 GPT-5 的训练不及预期。
考虑到大模型行业现在你追我赶的迭代速度,如果真的延期三个月,别家就会迭代出小版本,所以才会补偿性地承诺出「GPT-5 会效果更好」。
同样,由于 GPT-5 短期内拿不出来,或者说 GPT 系列已经遇到了显著的瓶颈(否则去年也不会去折腾推理模型),所以 OpenAI 发现自己模型发布之间的空档期过久(GPT-4.5 已经推出了,虽然成本很高),所以他们需要别的东西来填补中间的空挡,给用户一种他们依然技术领先的感觉。
于是之前不打算发布的 o3 被迫拿了出来,又画了一个 o4-mini 的饼。
o3 的成本目测会持平/高于 o1 pro。换句话说,o3 也许会像 GPT-4.5 一样,成本高到失去实际上的可用性,因为大家都用不起。
一个例证在于,ARC-AGI 去除了 o3-high 的分数,他们将最初 o3-low 的估算从每任务 20 美元提高到每任务 200 美元。推测 o3-high 从每任务 3,000 美元提高到每任务 30,000 美元,由于成本突破了每任务 10,000 美元的限制,o3-high 不再被包括在内[3]。

OpenAI 将在几周内发布 o3、o4-MINI,未来几个月发布 GPT-5,会带来哪些新功能?-4.jpg

至于 o4-mini,往好处想,这说明推理模型暂时还没有到上限,依然能有能力突破(至少是测评分数的提升)。
现在 OpenRouter 上出现了一个神秘的匿名模型 Quasar Alpha[4](目前免费可用),OpenRouter 官方称:这是一个提供给社区以收集反馈的“披露受限”模型。它是一个功能强大、用途广泛的模型,支持包括代码生成在内的长上下文任务。该模型的所有提示词和生成内容都会被提供方以及OpenRouter记录。

OpenAI 将在几周内发布 o3、o4-MINI,未来几个月发布 GPT-5,会带来哪些新功能?-5.jpg

实际测试的话,Quasar Alpha 会承认自己来自 OpenAI:

OpenAI 将在几周内发布 o3、o4-MINI,未来几个月发布 GPT-5,会带来哪些新功能?-6.jpg

而且 Quasar Alpha 有另外几个印象非常深刻的优点,第一是快,第二是上下文长,第三是性能似乎还不错。
实际测试中,Quasar Alpha 往往能提供超过 100 tokens/s 的速度,数倍高于其他模型(考虑到速度往往和模型尺寸、价格强相关,可以推断 Quasar Alpha 也许模型不大,且未来定价不高);按照 OpenRouter 的标注,Quasar Alpha 支持 1M tokens 上下文;一些网友给出的测评分数中,Quasar Alpha 超过了 o3-mini 和 Claude 3.5.

OpenAI 将在几周内发布 o3、o4-MINI,未来几个月发布 GPT-5,会带来哪些新功能?-7.jpg

综合以上信息,很多人都在猜 Quasar Alpha 会不会就是 o4-mini,毕竟 OpenAI 目前已经预告的短期之内可能会发布的新模型就剩下 o4-mini 了。
但我个人倒是感觉不太可能,因为 Quasar Alpha 显然不是一个推理模型,更有可能是 GPT 系列。而且不论怎么说,这些和 GPT-5 都没关系,都是在为 GPT-5 的延期找补。
以上。

您需要登录后才可以回帖 登录 | 立即注册