DeepSeek 将进一步开源其推理引擎，对行业会带来哪些影响？

https://github.com/deepseek-ai/open-infra-index/blob/main/OpenSourcing_DeepSeek_Inference_Engine/README.md

发表于 2025-4-22 15:06:04

各类AI巨头还在为API接口定价权争得头破血流
DeepSeek还是会抓命门，走的就是和别人不同的花路~

大厂们用triton、XLA等私有编译器构筑的技术护城河，本质上是通过信息差制造算力霸权。

大厂长期将优化后的推理引擎作为商业护城河（比如OpenAI的triton内核），DeepSeek开源相当于把行业最核心的工程机密甩到台面上。

中小厂商将能以极低成本获得接近头部企业的推理性能，直接打破「算力军备竞赛」的恶性循环，倒逼所有玩家必须转向更底层的架构创新，而非依赖封闭优化的技术霸权。

从修改文档的细节可窥，DeepSeek显然在下一盘生态整合的大棋——

先通过绑定vLLM、SGLang等当红项目建立技术联盟，再用「不设限合作」的话术招安整个开源社区。

这本质上是对HuggingFace生态的一次精准截胡，未来可能出现「DeepSeek系」与「Meta系」分庭抗礼的开源割据局面，中小开发者被迫站队。
当推理效率不再依赖玄学级调优，英伟达CUDA生态的统治地位将遭遇釜底抽薪。

开源引擎的透明性会让更多定制化芯片（如Groq、TPU）找到差异化突破口，甚至可能催生专为DeepSeek引擎优化的第三方硬件生态，彻底改写AI芯片市场的游戏规则。
这场开源绝非慈善，而是DeepSeek在LLM商业化困局中的一次豪赌——用核心引擎的开源换生态话语权，把技术标准攥在自己手里。

如果成功，未来所有基于其引擎的优化、插件、硬件适配都将成为DeepSeek的隐形护城河，这才是比闭源更可怕的生态控制术。
当然，我们也要放开眼界，其实市面上很多AI工具也非常不错。
毕竟在这个AI时代，谁没点工具拿来用用呢？
就例如我自己在用的【迅捷AI写小说】，它堪称网文创作者的得力助手，输入诸如小说类型、核心主题、关键情节等简单指令，它便能快速生成一段段流畅且富有想象力的故事内容。
极大地启发创作者灵感，帮助创作者突破思维瓶颈，快速完成小说初稿，大幅提升创作效率。

还有办公族常用的【WPS AI】，它深度融入办公场景，为文档编辑、表格制作、演示文稿设计带来革新体验。
在文档编辑时，能实时对文字内容进行语法检查、语句润色，还可根据用户需求自动生成工作总结、项目报告大纲等，极大提升文档撰写效率与质量。

别被DeepSeek开源核弹炸场的烟雾带偏了节奏——AI战场从来不是单极游戏！这年头就连做PPT的都能用AI三分钟出设计稿。
这场技术冷战没有中立区，每个工具都在用代码画地为牢。当你选择开源引擎时，或许早已掉进另一张生态罗网。
OK，以上就是今天的分享啦~希望能帮到你，很高兴在这里给大家安利我的日常爱用工具，有空欢迎到@社恐打工仔主页逛逛~那就下次见啦~

发表于 2025-4-22 15:14:29

真GOAT，一开源，厂商全自研！从“烧钱游戏”到“人人可玩”。

Deespeek开源后，大部分infra公司盈利模式是算力调度优化，现在deepseek 又又又要开源啦！
4月14日下午，DeepSeek 宣布了其内部推理引擎的开源路径（internal inference engine），核心策略是通过与开源社区合作逐步推进技术共享，而非直接开源完整代码库。
开源路径的核心内容：

◪模块化贡献：将内部推理引擎中可复用的功能模块提取为独立组件，贡献给现有开源项目（如vLLM、SGLang等）。例如，原本基于vLLM早期分支的定制化优化将被模块化后融入社区项目。
◪共享技术优化：直接向开源项目提交设计改进和实现细节，例如针对模型部署效率的优化方案。
◪避免直接开源完整引擎：由于代码库与内部基础设施（如集群管理工具）深度耦合，且维护资源有限，完全开源需大量修改，因此选择更可持续的合作模式。

这波优化有意义吗？答案是肯定的！因为谁不想白嫖或者低成本呢。
过去大模型研发是巨头们的“烧钱竞赛”——OpenAI训练GPT-4耗资超千亿美元，国内企业单次微调成本动辄百万起步。
而DeepSeek-R1用557万美元训练成本实现接近GPT-o1的性能，直接把行业拉进“小力出奇迹”的新赛道。
一方面，它极大地降低了开发者高效部署DeepSeek系列模型的门槛，推动了技术的普及和应用；
另一方面，它也像一面镜子，清晰地映照出当前AI基础设施（Infra）领域创业公司所面临的商业化困境——强大的开源力量，正在不断挤压纯粹技术优化型Infra产品的生存空间。

这场变革中，国内科技企业首次掌握规则制定权。

就像Android系统改变手机行业格局一样，DeepSeek的开源或许会催生新一代AI基础设施——这里没有“卡脖子”，只有“共建共享”。
当硅谷还在用闭源模型收“AI税”时，国内团队用开源策略实现“农村包围城市”。这不仅是技术胜利，更是商业思维的降维打击。
未来十年，AI行业的“安卓时刻”或许就要来了——而这次，主角是中国公司！
其实看这一两年国内AI发展就知道，虽然起步慢，但进展突飞猛进，差距与国外也是越来越小。
不论是文本、图像还是音视频，各种AI模型工具百花齐放，对我们日常学习/办公都起到不少辅助作用。

几个简单的实例：

文本类——迅捷AI写小说

看名字能知道这是一个专攻小说领域的AI工具，日常写网文没思路、效率不高或是质量低都可以借助它较好地解决~

小说写一半卡壳，它可以按照上下文逻辑进行续写、扩写。而碰到开篇就完全没灵感的话，给个标题，它也能自动围绕其撰写万字文本。
除问答式交互外，还能再自定义生成字数、风格、语气等参数来生成，覆盖玄幻、言情、科幻等 20 多种题材，个性化强~
不用5分钟就能生成初稿，就算效果不满意，还是再进行润色等二次优化处理。

图像类——WHEE

作为美图家族的核心成员之一，这款工具巧妙地将创作与修图功能划分为两大板块，既够实现一键绘图，同时又支持后续的编辑处理。
此外，它还涵盖了写实、3D、美漫等多种画风，能够满足不同人的多样化需求。

视频类——可灵AI

快手自主研发的视频生成大模型，它能够精准地建模复杂的时空运动，轻松搞定。
时长2分钟、帧率30fps的1080p高分辨率视频。
重点是可以模拟真实世界的物理特性，生成符合物理规律的视频，将用户丰富的想象力转化为具体且生动的画面。

bye~记得要常来看吴仔仔@吴收到呀~后续我还会再更新各种热点资讯，收到请回复！

发表于 2025-4-22 15:26:45

开源的不只是代码，而是路径选择

DeepSeek 这次不是单纯地放出代码仓库，而是明确了一条“从内部工具到社区协作”的路径。在原始文档中，DeepSeek 指出其推理引擎深度依赖早期版本的 vLLM，并且与内部集群基础设施耦合严重，这意味着直接开源整套系统难度极高。换句话说，他们清醒地知道：不是所有代码都适合“裸奔”开源。
最终，DeepSeek 选择的是一个更稳妥但也更具有行业价值的策略——通过功能解耦和模块化的方式，与 vLLM、SGLang 等现有社区项目深度合作，把可复用的部分“提炼出来”，以通用库的形式贡献。这种方式的价值在于：

避免重复造轮子，减少社区的碎片化。
强化开源生态间的协同，而不是建立一个“我也有的闭环”。
更容易形成可维护、可演化的代码体系。

这一策略不仅体现了 DeepSeek 对开源社区的尊重，也透露出他们对自身工程能力边界的清醒认知。在当前国内外AI企业普遍“急功近利”的背景下，这种选择反而更具战略意义。

对行业生态的直接冲击：重构推理栈的“信任基线”

vLLM 本身已经在社区中成为推理引擎的事实标准之一，支持高吞吐、长上下文和分布式部署。而 SGLang 正在探索 prompt-routing 和 serving 的上层逻辑控制。DeepSeek 此番与这两者“深度联动”，可能的中期结果是：

vLLM + DeepSeek 优化路径形成半官方的高性能版本，更契合 DeepSeek-V3 等大模型。
SGLang 作为任务调度层，将可能内置 DeepSeek 风格的推理执行逻辑，为大模型服务平台提供“开箱即用”的能力。
模型服务部署从“调通一个demo”走向“生产可用栈”，社区门槛被极大拉低。

换句话说，DeepSeek 的加入不只是提供“另一个选择”，而是可能和 vLLM/SGLang 一起构建一条更标准化、更开源友好的推理路径。它让原本需要大量定制、踩坑、调参的部署过程，变成了更易迁移、更好演进的工程链条。
如果未来这些能力被整合进如 FastChat、LMDeploy、SkyPilot 等更上层的 AI infra 项目，那么对初创团队、学术组织甚至中小企业来说，部署高性能大模型将不再是工程灾难。

另一个隐藏价值：强化开源社区对国产模型的支持度

DeepSeek 此举还有一层战略含义不容忽视——它在主动构建“国产模型友好型”开源基础设施。我们长期以来的开源环境，很大程度上是围绕 OpenAI 和 Meta 等国外模型做优化的。即便社区项目号称“支持任何模型”，但实际的优化路径、兼容测试和 bug 修复，大多还是围绕 GPT-3、LLaMA 系列展开。
DeepSeek 将自身推理引擎的一部分“嫁接”到 vLLM/SGLang 意味着：

下游开源工具链将更容易适配 DeepSeek-V3/R1 等国产模型；
有更多的 pull request 和 issue 是围绕中文语料、国产 tokenization 特性展开；
甚至社区评测平台（如 Arena、OpenRouter）也会更多地收录并优化这些模型。

这种潜移默化的迁移，将推动国产模型从“兼容国外生态”向“主导国产生态”演进。这不仅是一种技术输出，更是语义层面的控制权重构。
个人判断：真正的挑战，是如何保持“持续协作”而非“短期秀肌肉”

我个人对 DeepSeek 这次开源路径的判断是积极的，但也保持警惕。目前最值得观察的变量不是它会不会做，而是能不能持续做下去。
开源不是一锤子买卖。模块解耦容易，持续维护难。特别是 DeepSeek 自己也承认团队规模有限、工程精力紧张，这意味着如果后续社区响应不积极，或者贡献被边缘化，那么这次开源路径可能就会变成“昙花一现”。
但换个角度，如果 DeepSeek 能在这轮开源尝试中，建立起与核心社区（如 vLLM）的话语互信和代码共建机制，那么未来哪怕不再直接开源整套系统，其影响力也将深刻嵌入整个开源推理栈的骨干中。
写在最后

DeepSeek 的动作，看似只是“又一家模型厂商开源了推理引擎”，但背后其实代表着技术路线选择、社区合作策略、行业生态协调方式的深层变化。
在国产大模型话语权竞争越发激烈的今天，这种不以单点突破为目标，而是选择“深耕共建式开源”的方式，更值得同行们关注和借鉴。
开源真正的意义，从来不是“我能做给你看”，而是“我和你一起把这事做好”。
这一次，DeepSeek 的开源路径，值得我们继续追踪。

发表于 2025-4-22 15:40:06

Deepseek用的推理引擎是vLLM，自己做了魔改
现在就是改为直接向vLLM贡献代码，这样自己就不用维护一个相对很旧的分支
对开源社区以及自己都是好事

发表于 2025-4-22 15:53:58

超大参数的moe肯定是未来很长一段时间sota模型的主要实现结构。

ds开源的推理引擎必然成为范本。
之前开源的flashmla、deepep库对开源推理框架moe推理这块有正向作用，但是还是比较有限。
主要原因还是缺少一个好的pd分离实现方案，尤其是能处理几百卡大batch的。导致deepep库很难发挥出作用，deepep要发挥显著作用decode至少都得几百卡。很期待ds的pd分离实现。当然愿意花几百张卡部署一个模型，怎么保证高利用率也是一个问题。

推理和硬件平台是绑定的。
ds都是用h800部署，不怎么考虑2c产品的成本和收益。
国内做2c这块的公司都要考虑硬件成本，比较少用h800部署，多的还是用h20，或者h800做prefill，h20做decode这种方案。可能大部分团队都要进行二次开发，当然站在ds肩膀上肯定容易不少。
用华为卡，amd卡，或者其他卡的可以从中受益。

等发布了好好学习一波。moe推理这块，大家又被拉到同一水平线了。

DeepSeek 将进一步开源其推理引擎，对行业会带来哪些影响？

本周热门