DeepSeek 将进一步开源其推理引擎,对行业会带来哪些影响?

https://github.com/deepseek-ai/open-infra-index/blob/main/OpenSourcing_DeepSeek_Inference_Engine/README.md
收藏者
0
被浏览
112

5 个回答

小草与叶子 LV

发表于 2025-4-22 15:06:04

各类AI巨头还在为API接口定价权争得头破血流
DeepSeek还是会抓命门,走的就是和别人不同的花路~

大厂们用triton、XLA等私有编译器构筑的技术护城河,本质上是通过信息差制造算力霸权。
大厂长期将优化后的推理引擎作为商业护城河(比如OpenAI的triton内核),DeepSeek开源相当于把行业最核心的工程机密甩到台面上。
中小厂商将能以极低成本获得接近头部企业的推理性能,直接打破「算力军备竞赛」的恶性循环倒逼所有玩家必须转向更底层的架构创新,而非依赖封闭优化的技术霸权。

DeepSeek 将进一步开源其推理引擎,对行业会带来哪些影响?-1.jpg

从修改文档的细节可窥,DeepSeek显然在下一盘生态整合的大棋——
先通过绑定vLLM、SGLang等当红项目建立技术联盟,再用「不设限合作」的话术招安整个开源社区。
这本质上是对HuggingFace生态的一次精准截胡,未来可能出现「DeepSeek系」与「Meta系」分庭抗礼的开源割据局面,中小开发者被迫站队。
当推理效率不再依赖玄学级调优,英伟达CUDA生态的统治地位将遭遇釜底抽薪。

开源引擎的透明性会让更多定制化芯片(如Groq、TPU)找到差异化突破口,甚至可能催生专为DeepSeek引擎优化的第三方硬件生态,彻底改写AI芯片市场的游戏规则。
这场开源绝非慈善,而是DeepSeek在LLM商业化困局中的一次豪赌——用核心引擎的开源换生态话语权,把技术标准攥在自己手里。

DeepSeek 将进一步开源其推理引擎,对行业会带来哪些影响?-2.jpg

如果成功,未来所有基于其引擎的优化、插件、硬件适配都将成为DeepSeek的隐形护城河,这才是比闭源更可怕的生态控制术。
当然,我们也要放开眼界,其实市面上很多AI工具也非常不错。
毕竟在这个AI时代,谁没点工具拿来用用呢?
就例如我自己在用的【迅捷AI写小说】,它堪称网文创作者的得力助手,输入诸如小说类型、核心主题、关键情节等简单指令,它便能快速生成一段段流畅且富有想象力的故事内容。
极大地启发创作者灵感,帮助创作者突破思维瓶颈,快速完成小说初稿,大幅提升创作效率。

DeepSeek 将进一步开源其推理引擎,对行业会带来哪些影响?-3.jpg

还有办公族常用的【WPS AI】,它深度融入办公场景,为文档编辑、表格制作、演示文稿设计带来革新体验。
在文档编辑时,能实时对文字内容进行语法检查、语句润色,还可根据用户需求自动生成工作总结、项目报告大纲等,极大提升文档撰写效率与质量。

DeepSeek 将进一步开源其推理引擎,对行业会带来哪些影响?-4.jpg

别被DeepSeek开源核弹炸场的烟雾带偏了节奏——AI战场从来不是单极游戏!这年头就连做PPT的都能用AI三分钟出设计稿。
这场技术冷战没有中立区,每个工具都在用代码画地为牢。当你选择开源引擎时,或许早已掉进另一张生态罗网。
OK,以上就是今天的分享啦~希望能帮到你,很高兴在这里给大家安利我的日常爱用工具,有空欢迎到@社恐打工仔主页逛逛~那就下次见啦~

xianwlg LV

发表于 2025-4-22 15:14:29

真GOAT,一开源,厂商全自研!从“烧钱游戏”到“人人可玩”。

Deespeek开源后,大部分infra公司盈利模式是算力调度优化,现在deepseek 又又又要开源啦!
4月14日下午,DeepSeek 宣布了其内部推理引擎的开源路径(internal inference engine),核心策略是通过与开源社区合作逐步推进技术共享,而非直接开源完整代码库。
开源路径的核心内容:
◪模块化贡献:将内部推理引擎中可复用的功能模块提取为独立组件,贡献给现有开源项目(如vLLM、SGLang等)。例如,原本基于vLLM早期分支的定制化优化将被模块化后融入社区项目。
◪共享技术优化:直接向开源项目提交设计改进和实现细节,例如针对模型部署效率的优化方案。
◪避免直接开源完整引擎:由于代码库与内部基础设施(如集群管理工具)深度耦合,且维护资源有限,完全开源需大量修改,因此选择更可持续的合作模式。
DeepSeek 将进一步开源其推理引擎,对行业会带来哪些影响?-1.jpg

这波优化有意义吗?答案是肯定的!因为谁不想白嫖或者低成本呢。
过去大模型研发是巨头们的“烧钱竞赛”——OpenAI训练GPT-4耗资超千亿美元,国内企业单次微调成本动辄百万起步。
而DeepSeek-R1用557万美元训练成本实现接近GPT-o1的性能,直接把行业拉进“小力出奇迹”的新赛道。
一方面,它极大地降低了开发者高效部署DeepSeek系列模型的门槛,推动了技术的普及和应用;
另一方面,它也像一面镜子,清晰地映照出当前AI基础设施(Infra)领域创业公司所面临的商业化困境——强大的开源力量,正在不断挤压纯粹技术优化型Infra产品的生存空间

DeepSeek 将进一步开源其推理引擎,对行业会带来哪些影响?-2.jpg

这场变革中,国内科技企业首次掌握规则制定权。

就像Android系统改变手机行业格局一样,DeepSeek的开源或许会催生新一代AI基础设施——这里没有“卡脖子”,只有“共建共享”。
当硅谷还在用闭源模型收“AI税”时,国内团队用开源策略实现“农村包围城市”。这不仅是技术胜利,更是商业思维的降维打击。
未来十年,AI行业的“安卓时刻”或许就要来了——而这次,主角是中国公司!
其实看这一两年国内AI发展就知道,虽然起步慢,但进展突飞猛进,差距与国外也是越来越小。
不论是文本、图像还是音视频,各种AI模型工具百花齐放,对我们日常学习/办公都起到不少辅助作用。
几个简单的实例:
文本类——迅捷AI写小说

看名字能知道这是一个专攻小说领域的AI工具,日常写网文没思路、效率不高或是质量低都可以借助它较好地解决~

DeepSeek 将进一步开源其推理引擎,对行业会带来哪些影响?-3.jpg

小说写一半卡壳,它可以按照上下文逻辑进行续写、扩写。而碰到开篇就完全没灵感的话,给个标题,它也能自动围绕其撰写万字文本。
除问答式交互外,还能再自定义生成字数、风格、语气等参数来生成,覆盖玄幻、言情、科幻等 20 多种题材,个性化强~
不用5分钟就能生成初稿,就算效果不满意,还是再进行润色等二次优化处理。

DeepSeek 将进一步开源其推理引擎,对行业会带来哪些影响?-4.jpg

图像类——WHEE

作为美图家族的核心成员之一,这款工具巧妙地将创作与修图功能划分为两大板块,既够实现一键绘图,同时又支持后续的编辑处理
此外,它还涵盖了写实、3D、美漫等多种画风,能够满足不同人的多样化需求。

DeepSeek 将进一步开源其推理引擎,对行业会带来哪些影响?-5.jpg

视频类——可灵AI

快手自主研发的视频生成大模型,它能够精准地建模复杂的时空运动,轻松搞定。
时长2分钟、帧率30fps的1080p高分辨率视频。
重点是可以模拟真实世界的物理特性,生成符合物理规律的视频,将用户丰富的想象力转化为具体且生动的画面。

DeepSeek 将进一步开源其推理引擎,对行业会带来哪些影响?-6.jpg

bye~记得要常来看吴仔仔@吴收到呀~后续我还会再更新各种热点资讯,收到请回复!

t83780734j LV

发表于 2025-4-22 15:26:45

开源的不只是代码,而是路径选择

DeepSeek 这次不是单纯地放出代码仓库,而是明确了一条“从内部工具到社区协作”的路径。在原始文档中,DeepSeek 指出其推理引擎深度依赖早期版本的 vLLM,并且与内部集群基础设施耦合严重,这意味着直接开源整套系统难度极高。换句话说,他们清醒地知道:不是所有代码都适合“裸奔”开源。
最终,DeepSeek 选择的是一个更稳妥但也更具有行业价值的策略——通过功能解耦和模块化的方式,与 vLLM、SGLang 等现有社区项目深度合作,把可复用的部分“提炼出来”,以通用库的形式贡献。这种方式的价值在于:

  • 避免重复造轮子,减少社区的碎片化。
  • 强化开源生态间的协同,而不是建立一个“我也有的闭环”。
  • 更容易形成可维护、可演化的代码体系。
这一策略不仅体现了 DeepSeek 对开源社区的尊重,也透露出他们对自身工程能力边界的清醒认知。在当前国内外AI企业普遍“急功近利”的背景下,这种选择反而更具战略意义。

DeepSeek 将进一步开源其推理引擎,对行业会带来哪些影响?-1.jpg

对行业生态的直接冲击:重构推理栈的“信任基线”

vLLM 本身已经在社区中成为推理引擎的事实标准之一,支持高吞吐、长上下文和分布式部署。而 SGLang 正在探索 prompt-routing 和 serving 的上层逻辑控制。DeepSeek 此番与这两者“深度联动”,可能的中期结果是:

  • vLLM + DeepSeek 优化路径形成半官方的高性能版本,更契合 DeepSeek-V3 等大模型。
  • SGLang 作为任务调度层,将可能内置 DeepSeek 风格的推理执行逻辑,为大模型服务平台提供“开箱即用”的能力。
  • 模型服务部署从“调通一个demo”走向“生产可用栈”,社区门槛被极大拉低。
换句话说,DeepSeek 的加入不只是提供“另一个选择”,而是可能和 vLLM/SGLang 一起构建一条更标准化、更开源友好的推理路径。它让原本需要大量定制、踩坑、调参的部署过程,变成了更易迁移、更好演进的工程链条。
如果未来这些能力被整合进如 FastChat、LMDeploy、SkyPilot 等更上层的 AI infra 项目,那么对初创团队、学术组织甚至中小企业来说,部署高性能大模型将不再是工程灾难。

DeepSeek 将进一步开源其推理引擎,对行业会带来哪些影响?-2.jpg

另一个隐藏价值:强化开源社区对国产模型的支持度

DeepSeek 此举还有一层战略含义不容忽视——它在主动构建“国产模型友好型”开源基础设施。我们长期以来的开源环境,很大程度上是围绕 OpenAI 和 Meta 等国外模型做优化的。即便社区项目号称“支持任何模型”,但实际的优化路径、兼容测试和 bug 修复,大多还是围绕 GPT-3、LLaMA 系列展开。
DeepSeek 将自身推理引擎的一部分“嫁接”到 vLLM/SGLang 意味着:

  • 下游开源工具链将更容易适配 DeepSeek-V3/R1 等国产模型;
  • 有更多的 pull request 和 issue 是围绕中文语料、国产 tokenization 特性展开;
  • 甚至社区评测平台(如 Arena、OpenRouter)也会更多地收录并优化这些模型。
这种潜移默化的迁移,将推动国产模型从“兼容国外生态”向“主导国产生态”演进。这不仅是一种技术输出,更是语义层面的控制权重构。
个人判断:真正的挑战,是如何保持“持续协作”而非“短期秀肌肉”

我个人对 DeepSeek 这次开源路径的判断是积极的,但也保持警惕。目前最值得观察的变量不是它会不会做,而是能不能持续做下去
开源不是一锤子买卖。模块解耦容易,持续维护难。特别是 DeepSeek 自己也承认团队规模有限、工程精力紧张,这意味着如果后续社区响应不积极,或者贡献被边缘化,那么这次开源路径可能就会变成“昙花一现”。
但换个角度,如果 DeepSeek 能在这轮开源尝试中,建立起与核心社区(如 vLLM)的话语互信和代码共建机制,那么未来哪怕不再直接开源整套系统,其影响力也将深刻嵌入整个开源推理栈的骨干中。
写在最后

DeepSeek 的动作,看似只是“又一家模型厂商开源了推理引擎”,但背后其实代表着技术路线选择、社区合作策略、行业生态协调方式的深层变化。
在国产大模型话语权竞争越发激烈的今天,这种不以单点突破为目标,而是选择“深耕共建式开源”的方式,更值得同行们关注和借鉴。
开源真正的意义,从来不是“我能做给你看”,而是“我和你一起把这事做好”。
这一次,DeepSeek 的开源路径,值得我们继续追踪。

DeepSeek 将进一步开源其推理引擎,对行业会带来哪些影响?-3.jpg

csyxd LV

发表于 2025-4-22 15:40:06

Deepseek用的推理引擎是vLLM,自己做了魔改
现在就是改为直接向vLLM贡献代码,这样自己就不用维护一个相对很旧的分支
对开源社区以及自己都是好事

一发最何 LV

发表于 2025-4-22 15:53:58

超大参数的moe肯定是未来很长一段时间sota模型的主要实现结构。

ds开源的推理引擎必然成为范本。
之前开源的flashmla、deepep库对开源推理框架moe推理这块有正向作用,但是还是比较有限。
主要原因还是缺少一个好的pd分离实现方案,尤其是能处理几百卡大batch的。导致deepep库很难发挥出作用,deepep要发挥显著作用decode至少都得几百卡。很期待ds的pd分离实现。当然愿意花几百张卡部署一个模型,怎么保证高利用率也是一个问题。

推理和硬件平台是绑定的。
ds都是用h800部署,不怎么考虑2c产品的成本和收益。
国内做2c这块的公司都要考虑硬件成本,比较少用h800部署,多的还是用h20, 或者h800做prefill,h20做decode这种方案。可能大部分团队都要进行二次开发,当然站在ds肩膀上肯定容易不少。
用华为卡,amd卡,或者其他卡的可以从中受益。

等发布了好好学习一波。moe推理这块,大家又被拉到同一水平线了。

您需要登录后才可以回帖 登录 | 立即注册