为什么DeepSeek出来可以轰动全世界，而差不多功能其他国产大模型却没什么人关注？

发表于 2025-4-22 13:17:34

这几款我都用过，GPT，豆包，文心一言，kimi，DS，这么说吧，之前没用DS时候，我感觉都比我脑子好使，用了DS，感觉我是废物

发表于 2025-4-22 13:31:28

我下载了三个ai软件来对比，分别是豆包，kim，deepseek，同时问三个软件相同的问题，得出的结论如下：
①豆包，简单问题回答的最快，信息来源大部分来自抖音或者公开的网络信息，基本可以理解为一个精炼的搜索引擎，所以豆包能做到的仅仅是简单的网络公开信息的整合，回答的复杂问题不具备参考性。
②Kim，回答速度比豆包慢，信息来源为全网信息搜索，所以信息比豆包的信息量更大一些，回答问题也更有深度一点，但也一样是既有信息的整合精炼，不具备逻辑思考能力，可以理解为更精确一点的搜索引擎。
对了，还有kim推荐的那个图画生成功能，说是能取代专业美院毕业生，这就有点搞笑了，说实话就它生成的图片画风和画面的艺术性，别说专业美院了，就是去参加美术联考估计都不会及格，所以那些说ai会取代美术生的是小学生审美吧？反正未来会提升到多高的水平不知道，但以kim的绘画水平还差的很远。
③deepseek，问简单问题比如如何做白切鸡，如何清洁地砖上的锈迹。。问这类的问题绝对没有豆包好用，但如果是问复杂的有深度点的问题，它可以甩豆包几条街，完全不在一个水平线，因为它有类似人脑的逻辑思维，可以从不同角度不同层次来分析解答问题。
不过近期deepseek不太好用，基本每天只等回答1-2个问题，应该是要么是现在太热门，全球应用量太大，导致计算能力跟不上，要么就是目前依然被美国的黑客持续攻击着，所以经常宕机，但无论如何只是问了几个问题，就已经能看出来它确实能做到深度求索了。
④对了，后来又下载了阿里旗下的通义，对比下来的感觉是比kim智能一些，但比deepseek还是要差一点。这几天用通义比较多，因为deepseek大部分时间用不了，只能用通义，至少比kim和豆包强一些。
最后再举例说明一下，我问了以上4个软件同样的问题：感染了病毒以后，为什么洗澡会加重症状？
我问这个问题是因为之前感染新冠的时候，网上都在说不要洗澡，但我不信邪啊，我家中央空调室温26度，不存在洗个澡就会受凉的说法，然而我洗一次重一次，洗了两次澡，把本来一点都不严重的新冠感染硬生生的洗的非常严重，以至于用了整整两个月才勉强完全恢复。
这件事一直令我很困惑，查了无数资料看了很多医生专家的说法，没有一个能说清楚原因的，就是没人能说清楚洗澡为什么会加重病情，说的最多的是有可能受凉，但内在逻辑没人知道，且我本人不存在受凉的情况。
这个问题豆包，kim，通义给的答案差不多，通义的内容更多一些，但答案都是网上公开的那几种，没什么新意也不具备科学根据，只有deepseek给出的答案中有一条与众不同，且我认为是唯一正确的答案，大概意思是说洗热水澡时由于温度差，血液和体液会快速流向体表，导致免疫系统建立的免疫屏障被破坏，从而病毒暂时取胜病情加重。
单单只这一条，就让我对deeoseek佩服的五体投地了，因为这条答案之前我查遍全网都没有查到，那么问题来了，这个信息它是从哪里得来的？如果不是既有信息的提炼，那么就只有一种可能了，它已经有了超出人脑的思维能力了。

发表于 2025-4-22 13:40:42

举个例子：如果说豆包是位德智体美劳全面发展的三好学生，DeepSeek则是那个虽然有点偏科，但是那个所偏的科目直接干到了全球大赛冠军的惊人程度。

为什么DeepSeek出来可以轰动全世界，而差不多功能其他国产大模型却没什么人关注？-1.jpg

《黑神话·悟空》的冯骥说：DeepSeek是个国运级别的科技成果。
我觉得，他说得并不为过。
随着三大运营商全面接入DeepSeek这款AI平台正在快速渗透到数字基建的毛细血管，并成功打入全球市场。坦白讲，我去年还对DeepSeek、以及深度求索这家公司关注得并不多。而像之前字节跳动推出的豆包，长年占据国内AI软件下载量头把交椅，而DeepSeek那个时候知名度还没有智谱、海螺、KimiChat等AI六小虎的知名度高。
就拿豆包来说，非常努力，啥能力都具备，对话、语音聊天、图片生成、音乐生成、AI搜索、智能体……无所不能，简直就是一个六边形战士，但是DeepSeek-R1一出，却在短时间内一骑绝尘，超过了豆包8倍的下载量。

为什么DeepSeek出来可以轰动全世界，而差不多功能其他国产大模型却没什么人关注？-2.jpg

曾经的网红豆包就这样黯淡了下来，不是豆包不被人关注，而是所有的聚光灯都给到了DeepSeek。
DeepSeek能够成功，说明目前美国的科技封锁，对中国是没有用的，反而会激发出更大的创新。
这种创新，同样体现在美国封锁华为5G芯片，最终Mate60 Pro问世，搭载上自研的7nm 5G芯片。
更具象征意义的是，当DeepSeek冲击全球算力格局时，美国商务部正对其开展国家安全调查，试图遏制这个来自东方的AI新贵。
有些美国的AI科学家讽刺DeepSeek并没有创新，用的都是现成的AI技术，我只想说一句，你行你上啊！
当然，DeepSeek的效果在很多方面确实是赶上了GPT-o1的。DeepSeek目前虽然还只专注于文字对话，但是其推理能力已经达到了全球级别的顶尖水平。
“DeepSeek时刻”能够出现的最大意义，我想主要有两点：
一、开源

DeepSeek原本可以选择学习其他公司，把自己最好的模型先闭源，然后开始要人们充值，交会员费。但是他们没有这么做。
OpenAI的傲慢，连曾经的金主爸爸马斯克都看着不爽，OpenAI不Open，高昂的会员费，自以为掌握了最先进的AI大模型，就可以大肆收割。

为什么DeepSeek出来可以轰动全世界，而差不多功能其他国产大模型却没什么人关注？-3.jpg

我在设想，DeepSeek的工程师们，在发现他们训练出来的R1版本在各项评分中都赶上了GPT-o1时的那种激动心情。
我在设想，DeepSeek的创始人梁文锋面对自己心爱的作品，到底要不要开源时，有没有犹豫，可能也有片刻犹豫吧，不过马上就做了一个惊天地泣鬼神的决定——“开源”，普惠AI行业。
在分析DeepSeek与豆包的&#34;六边形战士&#34;之争时，我们不难发现技术普惠性和应用落地能力才是决胜关键。
自DeepSeek开源以来，越来越多的企业和开发者开始深入研究其原理并积极学习。许多企业也已经开始部署和应用这一技术。到了3月份，一场激烈的AI人才争夺战已经打响！
看看最近的大厂动态就能明白，Google、百度、阿里、微软等都在致力于打造最接近AIGC的AI应用。例如，字节的扣子智能体已经有千万用户在使用，这些公司在人才招聘方面也是求贤若渴。从2025年的招聘数据来看，AI大模型人才的薪资待遇已经达到50K。
当下，进入AI领域的最佳途径莫过于知乎知学堂的AI大模型免费公开课。课程由专业老师带领，让你从0到1了解AI的底层原理和实际应用。课程内容以DeepSeek的核心算法为切入点，深入解析其底层原理，同时还会教授LLM大模型的训练方法、Prompt Engineering（交互工程），以及如何利用LangChain和Fine-tuning技术为工作和生活赋能。强烈推荐大家体验：
值得一提的是，许多学员在完成课程后，成功训练了自己的AI大模型，这一经验在求职时成为了核心竞争力，助力他们在职场上脱颖而出，特别是在薪资和职业Offer的选择上，可以说是步步高升。
梁文锋在接受采访时表示：

“面对颠覆性技术，封闭只是暂时的。即便是OpenAI的封闭策略，也无法阻止他人赶上。因此，我们的核心价值在于团队——同事们在这一过程中成长，积累技术知识，形成一个有创新能力的组织和文化，这才是我们的护城河。开源、发表论文，对我们而言实际上没有成本。对于技术人才来说，看到他人跟随自己的创新，会有极大的成就感。事实上，开源更多是一种文化行为，而非商业行为，参与其中能赢得尊重。对于一家公司而言，这种文化也具有吸引力。”

在问及深度求索这家公司是否会像OpenAI早期开源，后期闭源一样时，梁文峰继续回答：

“我们不会转向封闭。我们认为，首先建立一个强大的技术生态系统比什么都重要。这不仅仅是理想主义，而是符合商业逻辑的。如果模型是商品化的——目前看来确实如此——那么长期的竞争优势来自于更优的成本结构，而DeepSeek正是实现了这一点。这也呼应了中国如何在其他行业取得主导地位的方式。这种思维方式与大多数美国公司的差异很大，美国公司通常依赖差异化产品来维持更高的利润率。”

这让我想起一句话，你给予得越多，回报也越多。
是的，用开源构建生态，这事美国也不是没成功过，比如Android系统的成功，咋现在就忘了呢？当然也还有记得的，比如Meta开源的Llama也大力促进了AI行业的发展。只是这次，好运站在了DeepSeek这边，站在了中国这边。连顶级域名<a href="http://link.zhihu.com/?target=http%3A//ai.com" class=" external" target="_blank" rel="nofollow noreferrer">http://ai.com都默认转向了DeepSeek，以前，这个殊荣是给ChatGPT的。
你的目标越无私，越具有大爱，越符合道，这个世界会馈赠你更多，因为老天爷认为，把这么多钱财交管给这种人，他放心！
我想，化名为“一只平凡的小猪”捐款1.38亿给慈善机构的梁文锋，也是这种人。
二、大幅降低训练成本

DeepSeek公布的最后训练成本是557.6万美元，这个成本不到GPT-o1的1/10。当然，他们也说了这不是所有的成本，但这并不重要，确实是便宜了很多。

这种成本优势直接动摇了全球算力市场的定价权，DeepSeek冲击全球算力格局的态势已然成型。所以美国各大高科技公司股价会在DeepSeek-R1开源后大跌。

所以特朗普、马斯克、山姆奥特曼、孙正义们都紧张了，因为他们刚刚号称要花5000亿美元建立一个“星际之门”计划，大幅提高AI基础设施投入，让自己的算力优势遥遥领先。

可讽刺的是，这个计划刚公布没几天，DeepSeek就啪啪打脸了，全世界才知道，原来算力也没有想象中那么重要，这么一来，连印度也宣布要大搞AI了，当然，基于咱们的DeepSeek。

因为美国芯片封锁，深度求索买不到最强劲的英伟达H100芯片，退而求其次买了带宽有限的H800，利用有限的算力，极致创新，做出了很多突破式优化。

英伟达的CUDA架构限制了算力的发挥，咱们这些聪明的小伙们就想办法绕开CUDA，用上底层的像汇编语言一样的PTX语言，愣是突破了限制，大幅降低成本。

当然，DeepSeek的创新还有很多，篇幅有限，咱们明天接着详细聊聊DeeepSeek的创新点。

春节档里，电影《哪吒2》也火了，和DeepSeek感觉也是惺惺相惜的。

DeepSeek就像哪吒一样，不畏强权，并对着全世界喊出了：

&#34;若天下无路，我就开出一条路。若天地不容，我便扭转这乾坤”。

三、当豆包还在做&#34;表面美容&#34;，DeepSeek已在进行&#34;脑科手术&#34;

如果说豆包的优化是给文章涂脂抹粉，DeepSeek的深度思考则像拿着手术刀做神经接驳——它不仅重构表达，更重塑思维骨架。这种差距在实测对比中如同降维打击：
比如一位用户想做一个“AI视频生成”的视频号，于是问豆包，“做好一个“AI视频生成”视频号的技巧”，得到下面的答案：

为什么DeepSeek出来可以轰动全世界，而差不多功能其他国产大模型却没什么人关注？-4.jpg

可以看到，内容比较空泛，也比较模板化，感觉放之四海而皆准，说了很多但是实操性不强。
而同样的问题，问DeepSeek-R1，它上来首先是搜了40篇资料，然后引用9篇，深度思考了38秒，得到如下答案：

为什么DeepSeek出来可以轰动全世界，而差不多功能其他国产大模型却没什么人关注？-5.jpg

内容实操性巨强，往哪个垂直领域挖掘、用什么工具、做什么案例以及风险分析，都帮你分析得明明白白，可以直接落地行动了。
你会发现，DeepSeek的深度思考能力真是一流，输出内容的质量高上了很多，再呼应开头，如果说豆包是位德智体全面发展的应届毕业生，DeepSeek就是那位历经风雨，吃过的盐比毕业生的饭还多的老中医，药到病除，专家号一号难求的那种。
当然了，豆包最近还是迎头直上的了，终于也在页面上加入了“深度思考”功能，终于会思考了，内容质量也开始追赶DeepSeek，如下效果。我喜欢这样的良性竞争，不过刚推出的DeepSeek-V3-0324，已经把编程能力强化到了仅次于全球最牛AI编程大模型Claude-3.7，关键还开源，再次轰动。DeepSeek-R2据说也快要推出来了，到时候，还不知道会不会再次惊艳世界呢？我们拭目以待吧~~
相关文章：
吴言不语零一二三：DeepSeek是怎样炼成的？用武侠故事讲透文科生也能看懂的“AI武林秘籍”吴言不语零一二三：DeepSeek开源的DeepEP通信库原来借鉴了诸葛亮的八百里加急驿站系统，神操作让我看跪了

为什么DeepSeek出来可以轰动全世界，而差不多功能其他国产大模型却没什么人关注？-6.jpg

发表于 2025-4-22 13:50:52

以下是deepseek和豆包分别以“沁园春”为词牌，写的金庸小说主题的诗。大家可以分别打个分。文末有deepseek和豆包子对两首诗的评分。
deepseek：《沁园春·金庸江湖》
剑气冲霄，侠影横空，谁铸奇峰？看华山论剑，狂歌裂帛；襄阳鏖血，铁马嘶风。塞北乔峰，江南七怪，一掌降龙万壑松。光明顶，有乾坤挪转，烈焰焚穹。
人间尽是豪雄，偏写尽痴嗔爱恨浓。叹白猿腹裂，九阳融雪；绝情谷冷，断臂雕龙。鹿鼎藏奸，连城埋玉，笑傲江湖曲未终。浮槎去，剩碧涛深处，侠骨留踪。
豆包：《沁园春·金庸江湖》
侠影江湖，笔绘乾坤，墨染情仇。看华山论剑，群雄逐鹿；神雕侠侣，侠侣情柔。大漠孤烟，襄阳烽火，侠义昭昭护九州。刀光闪，听金戈铁马，岁月长流。
江湖故事悠悠。多少梦、书中一并收。叹萧峰豪迈，义薄云天；郭靖守土，热血盈眸。芷若情深，无忌义重，恩怨情仇意难休。抬望眼，品金庸笔下，千古风流。

豆包给两首诗的评分分别是：86和82
deepseek给两首诗的评分：92和85

再来两首deepseek的写的三体的：
《沁园春·黑暗森林》
星海沉渊，万籁噤声，光锥锁疆。  看田园倾覆，霓虹碎烬；歌者抛箔，寰宇平章。  猜链横空，熵钟倒卷，蝼蚁仓皇叩大荒。  抬望眼，问藏弓谁执？弓挽天狼。
曾痴善恶虚妄，笑稚子燃灯照虎狼。  叹面壁焚计，孤舟破雾；执剑凝眸，只手悬霜。  人性燎原，兽锋裂帛，血色星尘溅八荒。碑文锈，纵星焚万界，炬照苍茫！
《水调歌头·黑暗森林》
蝼蚁窥天幕，振翅即招弓。  藏形匿迹如芥，犹恐露鳞鸿。  一念星河裂变，刹那千帆蔽日，火雨噬苍穹。  猜链锁重劫，沉默是兵戎。
面壁计，持剑令，判枯荣。  沙中鱼跃，幽瞳深处启迷蒙。  曲迹流亡星野，残舰独航熵海，归路已冰封。  碑上文明字，半是烬尘红。  莫问谁开刃，宇宙本盲聋。

发表于 2025-4-22 14:02:39

二者不一样哈，差远了，不是同一类大模型
字节的豆包是普通大模型
deepseek R1 是推理大模型
这意味着
核心目标不一样

豆包:文本生成、基础问答、信息检索
DS:多步骤逻辑推理、复杂问题解决、因果分析
训练数据不一样

豆包:通用语料（网页、书籍、对话等）
DS:增加逻辑题、数学题、科学推理等结构化数据
训练方法不一样

豆包:自回归语言建模
DS:结合思维链（CoT）、程序辅助、符号逻辑增强
输出特点不一样

豆包:流畅但可能缺乏深度逻辑
DS:结构化、分步骤、注重因果链推导
所以，豆包和deepseekR1压根儿没有可比性
举个例子你可能就明白了

鸡兔同笼问题

从鸡兔同笼问题的回答我们可以看出，虽然结果一样，但，deepseek的思维链展示更加清晰完整。
如果你还不能理解deepseek的伟大，那我再给你举一个语料库被污染的典型例子

看，你们吹嘘好用的豆包，成傻子了吧！

看，这就是deepseek的牛逼之处，就算语料库被污染了，她也能通过自己的思考得出正确的答案。
来和高手学习一下

感谢 @野火吃腰果提供的调试思路
再看一个比大小的问题R1表现如下

关于字母统计的问题，我们看看豆包怎么说
第一步，让豆包承认传统生成式大模型存在缺陷

为什么DeepSeek出来可以轰动全世界，而差不多功能其他国产大模型却没什么人关注？-7.jpg

好，豆包投降了，我们趁热打铁，问问豆包，传统生成式大模型还有哪些缺陷，应如何克服

为什么DeepSeek出来可以轰动全世界，而差不多功能其他国产大模型却没什么人关注？-8.jpg

好，这是豆包告诉我们的真相，我们不能只相信一面之词，还要问问deepseek，看看这个火出圈的家伙怎么说
关于英文字母统计的问题

为什么DeepSeek出来可以轰动全世界，而差不多功能其他国产大模型却没什么人关注？-9.jpg

ds很开明，不仅把原因公布了出来，还把如何解决公布了出来，就这一点ds就可以吊打世上大多数生成式ai了！
作为普通人，我们只能通过提高自己的提示词编写技术，来让ai输出更加精准的答案，比如ds给出的改进建议:清逐个字母统计分析
关于生成式大模型的缺陷问题

为什么DeepSeek出来可以轰动全世界，而差不多功能其他国产大模型却没什么人关注？-10.jpg

以豆包为首的普通生成式大模型，你们好好学学吧，自己有问题不敢直接面对，怎么进步，还得让竞争对手拿鞭子抽？AI工程师们，加油努力吧，方法都有了，就看你们怎么改进了
别光说别人不好，我们看看DS在这些缺陷上的进展现状

为什么DeepSeek出来可以轰动全世界，而差不多功能其他国产大模型却没什么人关注？-11.jpg

这还不够，你敢承认自己不行吗？

厉害了，不仅承认了自己的不足，还给出了，例子，原因，和用户应对建议！我就喜欢这样的AI，开诚布公的让我知道AI得不足，我就可以有的放矢的提升自己的专项技能，让AI变得更好，但，豆包这类传统生成式大模型总是藏着，掖着，生怕用户知道它的不足，你连自己的弱点都不敢面对，你咋进步呀！
通过这一系列得沟通，我学到了很多新知识，有一些还没有完全学通透，还需要与ds进行更加深入的沟通，探讨，验证…
加油，deepseek，相信你会变得更好，在你的加持下，我会变得更优秀

deepseek+豆包使用实例

讲道理我为什么觉得豆包比deepseek还好用？关于深度思考与联网搜索的使用

@不宅不舒服斯基问联网搜索和深度思考两个按钮什么时候开，什么时候关，如何配合使用，嗯，这应该是第一次使用AI时，最重要的问题，因为你只有了解了AI的特性，才能更好的发挥AI的作用，看看DS怎么回答

为什么DeepSeek出来可以轰动全世界，而差不多功能其他国产大模型却没什么人关注？-13.jpg

更多深入探讨与应用技巧清移步
DeepSeek深度思考与联网搜索使用指南

发表于 2025-4-22 16:13:40

DeepSeek之所以能引起全球关注，是因为其在某些关键技术上取得了显著突破和创新。可能的原因包括其在模型算法的优化、大规模数据处理能力、高精准度的预测等方面的出色表现。此外，DeepSeek团队可能进行了有效的市场推广和宣传，使其获得了较高的知名度。至于其他类似功能的国产大模型未获得广泛关注，可能与市场推广、技术实力、用户认知度等多方面因素有关。每个模型都有其独特之处和擅长的领域，也存在其局限性。建议通过深入研究和技术对比，理性看待每一个大模型的发展潜力和价值。

为什么DeepSeek出来可以轰动全世界，而差不多功能其他国产大模型却没什么人关注？

本周热门