OpenAI 的 ChatGPT-4.5 是不是一个被 DeepSeek-R1 逼出来的半成品?

ChatGPT-4.5 是 OpenAI 为了应对 DeepSeek-R1,而匆忙推出的半成品吗?
收藏者
0
被浏览
94

5 个回答

艾娃AI绘画 LV

发表于 4 天前

其实并不是,GPT4.5的代号为猎户座,和之前爆料出的消息完全一样,根据《华尔街日报》在2024年12月份的爆料,GPT4.5是原本是OpenAI内部寄予厚望的GPT5,在GPT4训练完成后就开始,但是目前经历过最少两次训练,每次训练成本高达5亿美元,最终结果虽然比目前市场上所有非推理模型效果都要好,但是相比于天价的成本来说提升并不明显。奥特曼本人在2024年12月就曾经对这个信息在推特上吐槽过。

OpenAI 的 ChatGPT-4.5 是不是一个被 DeepSeek-R1 逼出来的半成品?-1.jpg

所以看回答就可以明显知道,答“是”的绝对是deepseek火之后来跟风的,还有OpenAI真被逼的话会自己放出o3的,OpenAI扔出这么个赔钱玩意是说明下后面要用4.5做基模加回本罢了。

先头部队 LV

发表于 4 天前

不是
GPT-4.5在openAI内部的代号是Orion,有心关注大模型进展的人应该在去年很早之前就看到网上关于Orion的传闻了。
另一个例证是,GPT-4.5的知识截止日期是2023年10月和GPT4o,4o-mini,o1,o3-mini一样。
openAI对Orion是寄予厚望的,回想一下去年上半年到三季度Altman扮演他最喜欢的谜语人时发表的种种狂言就可见一斑。我想openAI最开始对Orion的期待应该是GPT-5。
所以,没错,我们去年,乃至前年被Altman画的各种关于GPT-5的饼,都是指的现在这个发布的4.5。
综上所述,根据时间线和披露的信息,最合理的推测是,GPT-4.5是很早之前openAI就开始训练的巨无霸级模型,openAI想在其身上复制初代GPT-4.0的成功,可惜结果没有达到预期,4.5参数规模和语料规模上去了,但是智能水平没有质的提升。这也解释了为什么去年他们迟迟不发货GPT-4.5,因为发不出来。
当然,openAI双向押注,重心已经转向了o系列长思考模型。

zzzss654321 LV

发表于 4 天前

很明显,deepseek-r1是缺乏了完整有效的人类对齐的。这也是为什么它表现出很多不同于以往语言模型的神奇性质。
但gpt-4.5是做了完整的rlhf的。
所以下面有答主说的对,你这个问题应该反过来问。
deepseek-r1更像是一个半成品,但半成品不一定就不好,我们可能也没必要期待一个人类定义的“成品”语言模型。

niming LV

发表于 4 天前

我觉得是的!但不是DeepSeek-R1一个模型,而是Grok3、Claude 3.7 Sonnet等等多个模型的陆续发布刺激到了Sam。

OpenAI最新发布的GPT-4.5,尽管被官方称为迄今为止最大的语言模型,但从发布时间、未达预期的性能表现,以及与竞争对手Anthropic、XAI、DeepSeek的强烈对比来看,更像是一场防御性反击的产物,甚至可能是一个未完全成熟的半成品。


OpenAI 的 ChatGPT-4.5 是不是一个被 DeepSeek-R1 逼出来的半成品?-1.jpg


(开心的AI频道整理2025年2月国内外公司发布的部分模型)


在AI史上,2025年2月绝对是浓墨重彩的一个月,头部公司纷纷发布自家的新产品:X AI发布使用约20万个GPU的大型数据中心训练,计算能力是 Grok 2的10倍;人工智能初创公司Anthropic推出Claude 3.7 Sonnet,称它是迄今为止最智能的模型,也是市场上首款混合推理模型.....

但是我觉得最大黑马是DeepSeek,发布之后的趋势很像2022年底OpenAI发布GPT 3.5的势头。在刚刚过去的2月,我看到最多的新闻就是XXX接入DeepSeek,而我本人也是DeepSeek的用户,使用了一个多月再来回望一下。

DeepSeek并非依赖算力堆砌,而是通过多头潜在注意力(MLA)技术专家混合(MoE)模型架构实现突破。MLA技术优化了信息处理效率,MoE架构则通过动态分配计算资源降低训练成本。这种算法创新使其在性能接近GPT-4的情况下,训练成本仅为600万美元,不到MetaLlama3-405B的1/10

上线18天下载量突破1600万次,25天逼近4000万次,日活用户20天突破2000万,远超字节跳动豆包的1695万。DeepSeek 的市场扩张堪称现象级。短短一个月内,应用横扫全球157个国家和地区的苹果商店免费榜榜首,单日访问量从百万级飙升至 4900万次,涨幅超过600%。恰逢春节期间,DeepSeek 日活用户火速突破1500万,几乎复刻了2022年底ChatGPT一夜爆红的轨迹。

DeepSeek的开源策略不仅降低使用门槛,更吸引了全球开发者基于它的架构二次开发,形成类似安卓的生态网络。相比之下,OpenAI的闭源模式在灵活性和社区粘性上明显落后。这种压力直接传导到 OpenAI 的战略调整。据硅谷业内人士透露,原本计划3月发布的 O3推理模型被紧急叫停,GPT-4.5的发布时间足足提前一个月。这种仓促决策,像极了手机厂商为应对竞品突然降价而临时修改产品线。

GPT-4.5的仓促登场

面对DeepSeek的压力,OpenAI选择以更大规模、更高成本的路径应战,但GPT-4.5的表现却暴露了多重矛盾。

尽管OpenAI宣称GPT-4.5拥有更广泛的知识和更少幻觉(幻觉率37.1%,显著低于GPT-4o的61.8%),但其短板同样明显:数学能力:落后于自家的O3-mini模型;科学推理:略逊于O3-mini;编码表现:在真实世界编码基准测试中改进微乎其微,被开发者批评为“缺乏实质性突破”

OpenAI 的 ChatGPT-4.5 是不是一个被 DeepSeek-R1 逼出来的半成品?-2.jpg

研究机构NousResearch创始人直言,自GPT-4发布两年多来,OpenAI投入数千倍资本却未实现颠覆性进步,GPT-4.5更像是技术停滞期的过渡品。

GPT-4.5被定义为最后一个非推理模型,试图通过扩大预训练数据提升通用性,但这一策略与行业趋势背道而驰:
混合推理是行业趋势:Anthropic在2025年2 月 25 日发布了Claude 3.7 Sonnet已实现混合推理,既能提供即时响应,又能分步骤展示思考过程,更贴近实际应用需求;

用户需求分化:开发者更青睐DeepSeek的性价比(API成本仅为OpenAI的1/30),企业用户则期待推理模型解决复杂问题,而GPT-4.5未能满足任一群体的核心诉求。

尽管GPT-4.5在情感交互上有所提升(例如更自然的共情回应),但它的计算密集型”架构导致成本飙升。在发布模型之初仅ChatGPT Pro用户可以使用,Pro用户月费高达200美元,到了3月5日才宣布普通会员用户可以使用,普通会员的月费也是20美元。

GPT-4.5发布之初,Sam Altman 坦承GPU严重短缺,需紧急部署数万块芯片,并计划投入数十亿美元建设基础设施。但是开发者普遍认为,GPT-4.5的改进仅停留在交互流畅度层面,未触及技术本质,更像是对旧模型的优化包装。

OpenAI 的 ChatGPT-4.5 是不是一个被 DeepSeek-R1 逼出来的半成品?-3.jpg

面对OpenAI、Anthropic、DeepSeek等模型厂商的激烈竞争,理解大模型的核心技术逻辑与行业趋势已成为从业者的必备技能。无论是开源生态的协作潜力,还是闭源模型的商业化路径,都需要系统性知识支撑。你是否希望系统掌握大模型背后的技术奥秘,真正驾驭前沿工具,在AI时代快人一步?

知乎知学堂推出大模型应用开发公开课,为你深度解析核心技术,包括Transformer架构、混合推理技术、低成本训练优化;实战案例,包括DeepSeek的开源策略解析、GPT-4.5的预训练瓶颈;未来趋势,包括算法创新与算力博弈的平衡点、AI商业化落地路径。



现在关注,即可快速掌握大模型核心技能,弯道超车,抢占AI时代先机,成为炙手可热的AI人才!

OpenAI的困境
GPT-4.5的发布,暴露了OpenAI对规模至上路线的路径依赖。

但是对于烧钱的AI行业来说,资本投入是不可持续性。OpenAI需投资数十亿美元建设AI基础设施,而DeepSeek仅用200人团队、过时芯片和1000万美元成本便实现相近效果。微软虽为OpenAI输血超130亿美元,但高成本模式难以长期支撑,尤其面对DeepSeek的“性价比革命”。


当前AI竞赛的核心已从“堆算力”转向“算法创新”时,Open AI的发展路径好像与整体行业趋势背离。DeepSeek通过MLA与MoE架构的技术优化突破算力限制,推出更符合实际场景的交互需求的混合推理模型,再通过低成本开源生态,吸引开发者共建技术生态。但是OpenAI整体路线是闭源的,正如分析师所言,未来属于能平衡技术、成本与开放性的玩家,而非单纯依赖资本扩张的巨头。

未来展望
GPT-4.5或许只是OpenAI应对竞争压力的权宜之计。它的真正价值可能在于为GPT-5铺路。据报道,GPT-5被Sam Altman称为“集成多项技术的系统”。然而,若OpenAI继续忽视效率与开源生态,行业地位恐将被DeepSeek等挑战者进一步蚕食。


GPT-4.5的发布,表面上是一场技术升级,实则是OpenAI在资本、战略与创新能力上的焦虑映射。当规模竞赛触达天花板,行业需要的是更务实的创新——DeepSeek的案例表明,在资源有限的情况下,算法优化能够以更低成本实现效率突破,为算力主导的竞争格局提供了另一种可能。

奕夫 LV

发表于 4 天前

GPT-4.5 估计是为了拉一把Pro订阅,API价格应该是虚标的。
o3-mini-high已经把R1热度压下去了。而且高价裸模4.5,打低价推模R1,就是变形金刚大战小马宝莉,这都是哪跟哪啊,画风都不一样啊。
GPT-4.5肯定不是半成品,它经过了high-taste RLHF调教。只是大部分人不买账,Karpathy已经盲测了,4.5高品位版被4o低品味版挑落马下,当时场面有点尴尬。GPT-4.5不仅不是半成品,甚至有点抛光过度了。
R1更像是一个半成品。它很有趣,但安全性,对齐性都做得,呃,不是……很正统。

您需要登录后才可以回帖 登录 | 立即注册