OpenAI 即将发布开源推理模型，对行业会带来怎样的影响？

2025 年 3 月 31 晚，奥特曼宣布: 几个月后将发布自 GPT-2 以来的第一个开源 openai 模型，这对大模型领域有何影响。

发表于 2025-4-8 12:24:08

先说结论：没有很期待。OpenAI开源，并不是奥特曼突然开窍了，而可能是这几个月的压力测试下，它终于意识到，再封闭下去，它就不是游戏的主导者了。
当然了CloseAI肯开源变成真的OpenAI，那也当然是好事。OpenAI 毕竟还是那个 OpenAI，手里握着的技术和数据，影响力摆在那里。他们愿意开源，哪怕只是一个推理模型，也意味着：

门槛进一步降低： 至少现在可以确认，开源的模型可以本地部署和运行。这对于我们这些开发者、中小企业、研究机构来说，要是能直接用上（可能）是顶尖水平或者接近顶尖水平的推理能力，成本大大降低，创新的速度无疑会加快。很多以前因为调用 API 成本高、受限制而不敢想、不敢做的应用，或许就能跑起来了。当然，如果给的是全量大模型，那种没有96G显存就玩不起的，你当我没说。
生态可能更卷，也更繁荣： 开源社区会得到巨大的“燃料”。围绕这个模型的优化、微调、应用开发会像雨后春笋一样冒出来。大家有了新的、强大的基石模型可选，可以更快地验证想法，做出产品。这会倒逼其他所有玩家，无论是开源的还是闭源的，都得拿出真本事。就跟这段时间，4o的生图能力把Midjourney的v7都吓出来了一样。

只是……OpenAI好歹先列出一下到底会开源哪些大小的权重啊？所谓的几个月后开源，谁知道你后面到底开的是什么，会不会看别的几家厂商什么反应，再慢悠悠选一个你觉得可以的去开？

现在是 2025 年了，同学们。万家服务商抢着部署DeepSeek，以能够提供DS接入为荣。

这消息要是放在一两年前，能把行业弄得晕头转向。自媒体纷纷又要“王炸”来“王炸”去了。但是要是现在这个时间点，其实大家都不太有感觉。
DeepSeek开源的那一周，朋友圈和群都被刷屏了。那一刻，我意识到：我们好像真的进入了一个开源先行的新时代。甚至可以说，以DeepSeek为代表的开源+强大的大模型，像GPT-3.5刚问世时一样，再次让整个行业跟着走。
2023开年AI热潮，是ChatGPT、Midjourney这些最为人熟知的闭源模型系列。
2024年，是Sora这种可看不可拿的视频闭源模型，继续刷了一波热潮。
而2025年，DeepSeek 开源那一下，带来的冲击波有多强，大家还记忆犹新吧？直接把模型性能的“底裤”都快掀了，用实打实的 Code 和 MoE 效果，告诉全世界：开源，不仅能打，还能打得非常漂亮，还能又快又便宜。它打破的不仅仅是性能壁垒，更是那种“最好的技术一定牢牢攥在少数巨头手里”的迷思。
那一刻，感觉整个 AI 社区的空气都清新了不少，可能性的大门又被踹开了一条缝。
但是大家光关注DeepSeek热度爆表，可能忽略了一个更值得回顾的事实：中国模型的“开源转向”，不是这几个月才开始的。阿里早在通义千问系列中，就已经稳定地开放了模型权重，甚至在7B~70B区间给出了多种配置。智谱AI则在GLM系的多代演进中，一直坚持中英文双优、持续开源，尤其是GLM-4系列，更是在结构和效果上接近闭源模型的同时，依旧开放参数。

然后才是DeepSeek，一锤定音，成为国产开源大模型集体努力后的高光一击。
OpenAI 现在宣布要开源，更像是一种顺应时势，甚至可以说是被“卷”到不得不做出的姿态。毕竟，Llama 系列、Mistral/Mixtral、以及国内的这些优秀开源模型，已经把开源的“水位”抬得相当高了。
如果几个月后，OpenAI 上货的时候再不拿出点东西，它在开发者社区心中的“开放”光环（虽然自 GPT-2 后就没怎么亮过）可能就真要熄灭了。

发表于 2025-4-8 12:36:01

应该是一个小但是还可以的模型，对标qwen 32b，然后许可证里面整点儿恶心你的骚操作
主要还是看一下openai内部的技术栈长啥样，用处肯定不大

发表于 2025-4-8 12:49:57

与其说期待openai的开源，我其实更期待google的开源。包括他们旗下的gemini 2.0 flash、gemini 2.0 flash thinking、2.0 flash lite以及gemini 1.5 flash。google究竟给了2.0 flash多大的参数，竟然让这个小模型在各项基准测试中全面超越了gemini 1.5 pro和旧版本的gpt4o? 这里面的技术力真的值的好好借鉴。

发表于 2025-4-8 13:03:10

怕不是自己优化不动了, 准备找英伟达当冤大头.
模型想要盈利, 无非就是降本增效

增效, 靠的是 AI 架构设计, 数据集构造, 人肉微调
降本, 靠的就是 AI Infra 了

至于 OpenAI 的 infra 水平么, 看看他们的最新定价就能略知一二.
我只能在 OpenAI 太坏, 所有人都在摸鱼贪污和 OpenAI 太蠢, 优化技术真的不行里二选一.
<hr/>好的 infra 和差的 infra 成本能差几个数量级
同一个模型, 可能有的人运营亏本, 有的人运营不亏, 有的人则可以大赚特赚.
之前不是有老人家质疑 DeepSeek 成本造假, 结果 DeepSeek 丝毫不讲武德, 直接一个闪电五连鞭, 直接把老人家的脸都打肿了.
基本上测算下来 Hopper 架构下可以降低两个数量级的成本.
最后英伟达亲自下场, 在 Blackwell 架构上成本再降二十倍.
这样利润空间就大很多了.
<hr/>这下就看 OpenAI 会不会和模型一起同步开源 infra 了
能一起开源的话就是秀肌肉, 伊利亚那波人走就走吧, 你 OpenAI 还是你大爷.
只有模型的话那就是求救了, 那么英伟达不得不搞个大新闻拉一手, 随手提升个一百倍效率什么的.
而且 OpenAI 可得赶快开源, 再拖一段时间 DeepSeek R2 都要出来了, 那就更加骑虎难下了.

发表于 2025-4-8 13:12:14

OpenAI 是真没劲，开源就开源，磨磨唧唧的，得预告几次啊，就不能向 DeepSeek、Qwen、Mistral 学习一下，直接放模型权重，行与不行大家自有评判。
先汇总一下现有信息：
第一，Sam Altman 宣布「计划 | 在未来几个月后 | 以开源权重的方式开源 | 一个有推理功能的模型」[1]。

熟悉的味道，熟悉的期货。未来几个月？我只能说毒打还没挨够，现在的消息是，Qwen3 会在这个月底前发布，DeepSeek R2 大概率会在 5 月发布，到时候如果 OpenAI 闭源模型都比不过这俩，开源一个更旧、更小的模型就是笑话了。
开放权重模型（open weights model）倒是无所谓，大家都这么开，已经差不多成行业通用做法了，没什么好指摘的。
with reasoning 这个描述有点暧昧。如果是 o 系列模型，大可以直接说 reasoning model 推理模型，这个 with reasoning 搞的好像是 GPT 模型附带推理能力一样？
第二，来自 OpenAI 员工 Steven Heidel[2]：「我们今年会发布一个你可以在自己硬件上运行的模型」。

这句话说了跟没说一样。
有两种解读，第一种解读是，这里的 your own hardware 指的是大多数人所拥有的消费级硬件，换句话说，端侧设备（而非专门的算力服务器）。如果目标是端侧可部署，就意味着大概率会是 <32B 的模型。这样的模型部署场景更广泛，对消费者意义更大，但相应的模型能力相对受限。
第二种解读是，这里的硬件并不特指消费级硬件，仅仅是把「开源权重模型」换了种说法。换句话说，DeepSeek 671B 也可以在你自己的 8 卡 H20硬件上运行，emmmm。
第三，来自 OpenAI 员工 Johannes Heidecks[3]：安全是开放权重模型开发的核心重点，从预训练到发布都是如此。虽然开放模型带来了独特的挑战，但 OpenAI 将以准备框架为指导，不会发布他们认为会带来灾难性风险的模型。OpenAI 特别关注研究对抗性微调以及开放模型特有的其他风险。与所有模型发布一样，在公开发布之前，OpenAI 正在内部和与可信赖的第三方专家一起进行广泛的安全测试。

AI Safety，OK，fine。
<hr/>目前未知的信息：

会开 GPT 还是开 o 模型？是大模型还是 turbo 或者 mini 模型？
会以什么协议开源？能免费商用吗？

总之，从反响来看，大家似乎对 OpenAI 的开源不是特别感兴趣。如果不能直接开源，像这样提前几个月的预告毫无必要。
从 OpenAI 第一次承认打算开源，到最终实际开源，也许至少过去半年时间。半年足够 DeepSeek 训出下一代模型（并直接开源）了，而 OpenAI 选择用半年的时间选择、决定、测试究竟开源哪一个旧模型，诚意实在不足。
参考：
Altman 承认 OpenAI 的闭源策略站在了历史的错误一边，将逐步开源些旧模型，这是怎样的信号？

OpenAI 即将发布开源推理模型，对行业会带来怎样的影响？

本周热门