OpenAI 的 ChatGPT-4.5 是不是一个被 DeepSeek-R1 逼出来的半成品？

ChatGPT-4.5 是 OpenAI 为了应对 DeepSeek-R1，而匆忙推出的半成品吗？

发表于 2025-4-1 09:43:31

其实并不是，GPT4.5的代号为猎户座，和之前爆料出的消息完全一样，根据《华尔街日报》在2024年12月份的爆料，GPT4.5是原本是OpenAI内部寄予厚望的GPT5，在GPT4训练完成后就开始，但是目前经历过最少两次训练，每次训练成本高达5亿美元，最终结果虽然比目前市场上所有非推理模型效果都要好，但是相比于天价的成本来说提升并不明显。奥特曼本人在2024年12月就曾经对这个信息在推特上吐槽过。

OpenAI 的 ChatGPT-4.5 是不是一个被 DeepSeek-R1 逼出来的半成品？-1.jpg

所以看回答就可以明显知道，答“是”的绝对是deepseek火之后来跟风的，还有OpenAI真被逼的话会自己放出o3的，OpenAI扔出这么个赔钱玩意是说明下后面要用4.5做基模加回本罢了。

发表于 2025-4-1 09:52:54

不是
GPT-4.5在openAI内部的代号是Orion，有心关注大模型进展的人应该在去年很早之前就看到网上关于Orion的传闻了。
另一个例证是，GPT-4.5的知识截止日期是2023年10月和GPT4o，4o-mini，o1，o3-mini一样。
openAI对Orion是寄予厚望的，回想一下去年上半年到三季度Altman扮演他最喜欢的谜语人时发表的种种狂言就可见一斑。我想openAI最开始对Orion的期待应该是GPT-5。
所以，没错，我们去年，乃至前年被Altman画的各种关于GPT-5的饼，都是指的现在这个发布的4.5。
综上所述，根据时间线和披露的信息，最合理的推测是，GPT-4.5是很早之前openAI就开始训练的巨无霸级模型，openAI想在其身上复制初代GPT-4.0的成功，可惜结果没有达到预期，4.5参数规模和语料规模上去了，但是智能水平没有质的提升。这也解释了为什么去年他们迟迟不发货GPT-4.5，因为发不出来。
当然，openAI双向押注，重心已经转向了o系列长思考模型。

发表于 2025-4-1 10:04:46

很明显，deepseek-r1是缺乏了完整有效的人类对齐的。这也是为什么它表现出很多不同于以往语言模型的神奇性质。
但gpt-4.5是做了完整的rlhf的。
所以下面有答主说的对，你这个问题应该反过来问。
deepseek-r1更像是一个半成品，但半成品不一定就不好，我们可能也没必要期待一个人类定义的“成品”语言模型。

发表于 2025-4-1 10:15:46

我觉得是的！但不是DeepSeek-R1一个模型，而是Grok3、Claude 3.7 Sonnet等等多个模型的陆续发布刺激到了Sam。

OpenAI最新发布的GPT-4.5，尽管被官方称为迄今为止最大的语言模型，但从发布时间、未达预期的性能表现，以及与竞争对手Anthropic、XAI、DeepSeek的强烈对比来看，更像是一场防御性反击的产物，甚至可能是一个未完全成熟的半成品。

（开心的AI频道整理2025年2月国内外公司发布的部分模型）

在AI史上，2025年2月绝对是浓墨重彩的一个月，头部公司纷纷发布自家的新产品：X AI发布使用约20万个GPU的大型数据中心训练，计算能力是 Grok 2的10倍；人工智能初创公司Anthropic推出Claude 3.7 Sonnet，称它是迄今为止最智能的模型，也是市场上首款混合推理模型.....

但是我觉得最大黑马是DeepSeek，发布之后的趋势很像2022年底OpenAI发布GPT 3.5的势头。在刚刚过去的2月，我看到最多的新闻就是XXX接入DeepSeek，而我本人也是DeepSeek的用户，使用了一个多月再来回望一下。

DeepSeek并非依赖算力堆砌，而是通过多头潜在注意力（MLA）技术和专家混合（MoE）模型架构实现突破。MLA技术优化了信息处理效率，MoE架构则通过动态分配计算资源降低训练成本。这种算法创新使其在性能接近GPT-4的情况下，训练成本仅为600万美元，不到MetaLlama3-405B的1/10。

上线18天下载量突破1600万次，25天逼近4000万次，日活用户20天突破2000万，远超字节跳动豆包的1695万。DeepSeek 的市场扩张堪称现象级。短短一个月内，应用横扫全球157个国家和地区的苹果商店免费榜榜首，单日访问量从百万级飙升至 4900万次，涨幅超过600%。恰逢春节期间，DeepSeek 日活用户火速突破1500万，几乎复刻了2022年底ChatGPT一夜爆红的轨迹。

DeepSeek的开源策略不仅降低使用门槛，更吸引了全球开发者基于它的架构二次开发，形成类似安卓的生态网络。相比之下，OpenAI的闭源模式在灵活性和社区粘性上明显落后。这种压力直接传导到 OpenAI 的战略调整。据硅谷业内人士透露，原本计划3月发布的 O3推理模型被紧急叫停，GPT-4.5的发布时间足足提前一个月。这种仓促决策，像极了手机厂商为应对竞品突然降价而临时修改产品线。

GPT-4.5的仓促登场

面对DeepSeek的压力，OpenAI选择以更大规模、更高成本的路径应战，但GPT-4.5的表现却暴露了多重矛盾。

尽管OpenAI宣称GPT-4.5拥有更广泛的知识和更少幻觉（幻觉率37.1%，显著低于GPT-4o的61.8%），但其短板同样明显：数学能力：落后于自家的O3-mini模型；科学推理：略逊于O3-mini；编码表现：在真实世界编码基准测试中改进微乎其微，被开发者批评为“缺乏实质性突破”

OpenAI 的 ChatGPT-4.5 是不是一个被 DeepSeek-R1 逼出来的半成品？-2.jpg

研究机构NousResearch创始人直言，自GPT-4发布两年多来，OpenAI投入数千倍资本却未实现颠覆性进步，GPT-4.5更像是技术停滞期的过渡品。

GPT-4.5被定义为最后一个非推理模型，试图通过扩大预训练数据提升通用性，但这一策略与行业趋势背道而驰：
● 混合推理是行业趋势：Anthropic在2025年2 月 25 日发布了Claude 3.7 Sonnet已实现混合推理，既能提供即时响应，又能分步骤展示思考过程，更贴近实际应用需求；

● 用户需求分化：开发者更青睐DeepSeek的性价比（API成本仅为OpenAI的1/30），企业用户则期待推理模型解决复杂问题，而GPT-4.5未能满足任一群体的核心诉求。

尽管GPT-4.5在情感交互上有所提升（例如更自然的共情回应），但它的计算密集型”架构导致成本飙升。在发布模型之初仅ChatGPT Pro用户可以使用，Pro用户月费高达200美元，到了3月5日才宣布普通会员用户可以使用，普通会员的月费也是20美元。

GPT-4.5发布之初，Sam Altman 坦承GPU严重短缺，需紧急部署数万块芯片，并计划投入数十亿美元建设基础设施。但是开发者普遍认为，GPT-4.5的改进仅停留在交互流畅度层面，未触及技术本质，更像是对旧模型的优化包装。

OpenAI 的 ChatGPT-4.5 是不是一个被 DeepSeek-R1 逼出来的半成品？-3.jpg

面对OpenAI、Anthropic、DeepSeek等模型厂商的激烈竞争，理解大模型的核心技术逻辑与行业趋势已成为从业者的必备技能。无论是开源生态的协作潜力，还是闭源模型的商业化路径，都需要系统性知识支撑。你是否希望系统掌握大模型背后的技术奥秘，真正驾驭前沿工具，在AI时代快人一步？

知乎知学堂推出大模型应用开发公开课，为你深度解析核心技术，包括Transformer架构、混合推理技术、低成本训练优化；实战案例，包括DeepSeek的开源策略解析、GPT-4.5的预训练瓶颈；未来趋势，包括算法创新与算力博弈的平衡点、AI商业化落地路径。

现在关注，即可快速掌握大模型核心技能，弯道超车，抢占AI时代先机，成为炙手可热的AI人才！

OpenAI的困境
GPT-4.5的发布，暴露了OpenAI对规模至上路线的路径依赖。

但是对于烧钱的AI行业来说，资本投入是不可持续性。OpenAI需投资数十亿美元建设AI基础设施，而DeepSeek仅用200人团队、过时芯片和1000万美元成本便实现相近效果。微软虽为OpenAI输血超130亿美元，但高成本模式难以长期支撑，尤其面对DeepSeek的“性价比革命”。

当前AI竞赛的核心已从“堆算力”转向“算法创新”时，Open AI的发展路径好像与整体行业趋势背离。DeepSeek通过MLA与MoE架构的技术优化突破算力限制，推出更符合实际场景的交互需求的混合推理模型，再通过低成本开源生态，吸引开发者共建技术生态。但是OpenAI整体路线是闭源的，正如分析师所言，未来属于能平衡技术、成本与开放性的玩家，而非单纯依赖资本扩张的巨头。

未来展望
GPT-4.5或许只是OpenAI应对竞争压力的权宜之计。它的真正价值可能在于为GPT-5铺路。据报道，GPT-5被Sam Altman称为“集成多项技术的系统”。然而，若OpenAI继续忽视效率与开源生态，行业地位恐将被DeepSeek等挑战者进一步蚕食。

GPT-4.5的发布，表面上是一场技术升级，实则是OpenAI在资本、战略与创新能力上的焦虑映射。当规模竞赛触达天花板，行业需要的是更务实的创新——DeepSeek的案例表明，在资源有限的情况下，算法优化能够以更低成本实现效率突破，为算力主导的竞争格局提供了另一种可能。

发表于 2025-4-1 10:27:00

GPT-4.5 估计是为了拉一把Pro订阅，API价格应该是虚标的。
o3-mini-high已经把R1热度压下去了。而且高价裸模4.5，打低价推模R1，就是变形金刚大战小马宝莉，这都是哪跟哪啊，画风都不一样啊。
GPT-4.5肯定不是半成品，它经过了high-taste RLHF调教。只是大部分人不买账，Karpathy已经盲测了，4.5高品位版被4o低品味版挑落马下，当时场面有点尴尬。GPT-4.5不仅不是半成品，甚至有点抛光过度了。
R1更像是一个半成品。它很有趣，但安全性，对齐性都做得，呃，不是……很正统。

OpenAI 的 ChatGPT-4.5 是不是一个被 DeepSeek-R1 逼出来的半成品？

本周热门