OpenAI 即将发布开源推理模型,对行业会带来怎样的影响?

2025 年 3 月 31 晚,奥特曼宣布: 几个月后将发布自 GPT-2 以来的第一个开源 openai 模型,这对大模型领域有何影响。

OpenAI 即将发布开源推理模型,对行业会带来怎样的影响?-1.jpg


OpenAI 即将发布开源推理模型,对行业会带来怎样的影响?-2.jpg
收藏者
0
被浏览
76

5 个回答

devil0 LV

发表于 2025-4-8 12:24:08

先说结论:没有很期待。OpenAI开源,并不是奥特曼突然开窍了,而可能是这几个月的压力测试下,它终于意识到,再封闭下去,它就不是游戏的主导者了。
当然了CloseAI肯开源变成真的OpenAI,那也当然是好事。OpenAI 毕竟还是那个 OpenAI,手里握着的技术和数据,影响力摆在那里。他们愿意开源,哪怕只是一个推理模型,也意味着:

  • 门槛进一步降低: 至少现在可以确认,开源的模型可以本地部署和运行。这对于我们这些开发者、中小企业、研究机构来说,要是能直接用上(可能)是顶尖水平或者接近顶尖水平的推理能力,成本大大降低,创新的速度无疑会加快。很多以前因为调用 API 成本高、受限制而不敢想、不敢做的应用,或许就能跑起来了。当然,如果给的是全量大模型,那种没有96G显存就玩不起的,你当我没说。
  • 生态可能更卷,也更繁荣: 开源社区会得到巨大的“燃料”。围绕这个模型的优化、微调、应用开发会像雨后春笋一样冒出来。大家有了新的、强大的基石模型可选,可以更快地验证想法,做出产品。这会倒逼其他所有玩家,无论是开源的还是闭源的,都得拿出真本事。就跟这段时间,4o的生图能力把Midjourney的v7都吓出来了一样。
只是……OpenAI好歹先列出一下到底会开源哪些大小的权重啊?所谓的几个月后开源,谁知道你后面到底开的是什么,会不会看别的几家厂商什么反应,再慢悠悠选一个你觉得可以的去开?

现在是 2025 年了,同学们。万家服务商抢着部署DeepSeek,以能够提供DS接入为荣。

这消息要是放在一两年前,能把行业弄得晕头转向。自媒体纷纷又要“王炸”来“王炸”去了。但是要是现在这个时间点,其实大家都不太有感觉。
DeepSeek开源的那一周,朋友圈和群都被刷屏了。那一刻,我意识到:我们好像真的进入了一个开源先行的新时代。甚至可以说,以DeepSeek为代表的开源+强大的大模型,像GPT-3.5刚问世时一样,再次让整个行业跟着走。
2023开年AI热潮,是ChatGPT、Midjourney这些最为人熟知的闭源模型系列。
2024年,是Sora这种可看不可拿的视频闭源模型,继续刷了一波热潮。
而2025年,DeepSeek 开源那一下,带来的冲击波有多强,大家还记忆犹新吧?直接把模型性能的“底裤”都快掀了,用实打实的 Code 和 MoE 效果,告诉全世界:开源,不仅能打,还能打得非常漂亮,还能又快又便宜。它打破的不仅仅是性能壁垒,更是那种“最好的技术一定牢牢攥在少数巨头手里”的迷思。
那一刻,感觉整个 AI 社区的空气都清新了不少,可能性的大门又被踹开了一条缝。
但是大家光关注DeepSeek热度爆表,可能忽略了一个更值得回顾的事实:中国模型的“开源转向”,不是这几个月才开始的。阿里早在通义千问系列中,就已经稳定地开放了模型权重,甚至在7B~70B区间给出了多种配置。智谱AI则在GLM系的多代演进中,一直坚持中英文双优、持续开源,尤其是GLM-4系列,更是在结构和效果上接近闭源模型的同时,依旧开放参数。

然后才是DeepSeek,一锤定音,成为国产开源大模型集体努力后的高光一击。
OpenAI 现在宣布要开源,更像是一种顺应时势,甚至可以说是被“卷”到不得不做出的姿态。毕竟,Llama 系列、Mistral/Mixtral、以及国内的这些优秀开源模型,已经把开源的“水位”抬得相当高了。
如果几个月后,OpenAI 上货的时候再不拿出点东西,它在开发者社区心中的“开放”光环(虽然自 GPT-2 后就没怎么亮过)可能就真要熄灭了。

sjorz LV

发表于 2025-4-8 12:36:01

应该是一个小但是还可以的模型,对标qwen 32b,然后许可证里面整点儿恶心你的骚操作
主要还是看一下openai内部的技术栈长啥样,用处肯定不大

晓晓的波浪 LV

发表于 2025-4-8 12:49:57

与其说期待openai的开源,我其实更期待google的开源。包括他们旗下的gemini 2.0 flash、gemini 2.0 flash thinking、2.0 flash lite以及gemini 1.5 flash。google究竟给了2.0 flash多大的参数,竟然让这个小模型在各项基准测试中全面超越了gemini 1.5 pro和旧版本的gpt4o? 这里面的技术力真的值的好好借鉴。

Zed888 LV

发表于 2025-4-8 13:03:10

怕不是自己优化不动了, 准备找英伟达当冤大头.
模型想要盈利, 无非就是降本增效

  • 增效, 靠的是 AI 架构设计, 数据集构造, 人肉微调
  • 降本, 靠的就是 AI Infra 了
至于 OpenAI 的 infra 水平么, 看看他们的最新定价就能略知一二.
我只能在 OpenAI 太坏, 所有人都在摸鱼贪污和 OpenAI 太蠢, 优化技术真的不行里二选一.
<hr/>好的 infra 和差的 infra 成本能差几个数量级
同一个模型, 可能有的人运营亏本, 有的人运营不亏, 有的人则可以大赚特赚.
之前不是有老人家质疑 DeepSeek 成本造假, 结果 DeepSeek 丝毫不讲武德, 直接一个闪电五连鞭, 直接把老人家的脸都打肿了.
基本上测算下来 Hopper 架构下可以降低两个数量级的成本.
最后英伟达亲自下场, 在 Blackwell 架构上成本再降二十倍.
这样利润空间就大很多了.
<hr/>这下就看 OpenAI 会不会和模型一起同步开源 infra 了
能一起开源的话就是秀肌肉, 伊利亚那波人走就走吧, 你 OpenAI 还是你大爷.
只有模型的话那就是求救了, 那么英伟达不得不搞个大新闻拉一手, 随手提升个一百倍效率什么的.
而且 OpenAI 可得赶快开源, 再拖一段时间 DeepSeek R2 都要出来了, 那就更加骑虎难下了.

超超 LV

发表于 2025-4-8 13:12:14

OpenAI 是真没劲,开源就开源,磨磨唧唧的,得预告几次啊,就不能向 DeepSeek、Qwen、Mistral 学习一下,直接放模型权重,行与不行大家自有评判。
先汇总一下现有信息:
第一,Sam Altman 宣布「计划 | 在未来几个月后 | 以开源权重的方式开源 | 一个有推理功能的模型」[1]

OpenAI 即将发布开源推理模型,对行业会带来怎样的影响?-1.jpg

熟悉的味道,熟悉的期货。未来几个月?我只能说毒打还没挨够,现在的消息是,Qwen3 会在这个月底前发布,DeepSeek R2 大概率会在 5 月发布,到时候如果 OpenAI 闭源模型都比不过这俩,开源一个更旧、更小的模型就是笑话了。
开放权重模型(open weights model)倒是无所谓,大家都这么开,已经差不多成行业通用做法了,没什么好指摘的。
with reasoning 这个描述有点暧昧。如果是 o 系列模型,大可以直接说 reasoning model 推理模型,这个 with reasoning 搞的好像是 GPT 模型附带推理能力一样?
第二,来自 OpenAI 员工 Steven Heidel[2]:「我们今年会发布一个你可以在自己硬件上运行的模型」。

OpenAI 即将发布开源推理模型,对行业会带来怎样的影响?-2.jpg

这句话说了跟没说一样。
有两种解读,第一种解读是,这里的 your own hardware 指的是大多数人所拥有的消费级硬件,换句话说,端侧设备(而非专门的算力服务器)。如果目标是端侧可部署,就意味着大概率会是 <32B 的模型。这样的模型部署场景更广泛,对消费者意义更大,但相应的模型能力相对受限。
第二种解读是,这里的硬件并不特指消费级硬件,仅仅是把「开源权重模型」换了种说法。换句话说,DeepSeek 671B 也可以在你自己的 8 卡 H20硬件上运行,emmmm。
第三,来自 OpenAI 员工 Johannes Heidecks[3]:安全是开放权重模型开发的核心重点,从预训练到发布都是如此。虽然开放模型带来了独特的挑战,但 OpenAI 将以准备框架为指导,不会发布他们认为会带来灾难性风险的模型。OpenAI 特别关注研究对抗性微调以及开放模型特有的其他风险。与所有模型发布一样,在公开发布之前,OpenAI 正在内部和与可信赖的第三方专家一起进行广泛的安全测试。

OpenAI 即将发布开源推理模型,对行业会带来怎样的影响?-3.jpg

AI Safety,OK,fine。
<hr/>目前未知的信息:

  • 会开 GPT 还是开 o 模型?是大模型还是 turbo 或者 mini 模型?
  • 会以什么协议开源?能免费商用吗?
总之,从反响来看,大家似乎对 OpenAI 的开源不是特别感兴趣。如果不能直接开源,像这样提前几个月的预告毫无必要。
从 OpenAI 第一次承认打算开源,到最终实际开源,也许至少过去半年时间。半年足够 DeepSeek 训出下一代模型(并直接开源)了,而 OpenAI 选择用半年的时间选择、决定、测试究竟开源哪一个旧模型,诚意实在不足。
参考:
Altman 承认 OpenAI 的闭源策略站在了历史的错误一边,将逐步开源些旧模型,这是怎样的信号?

您需要登录后才可以回帖 登录 | 立即注册