为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?
收藏者
0
被浏览
94

6 个回答

reverie LV

发表于 5 小时前

这几款我都用过,GPT,豆包,文心一言,kimi,DS,这么说吧,之前没用DS时候,我感觉都比我脑子好使,用了DS,感觉我是废物

将进酒 LV

发表于 4 小时前

我下载了三个ai软件来对比,分别是豆包,kim,deepseek,同时问三个软件相同的问题,得出的结论如下:
①豆包,简单问题回答的最快,信息来源大部分来自抖音或者公开的网络信息,基本可以理解为一个精炼的搜索引擎,所以豆包能做到的仅仅是简单的网络公开信息的整合,回答的复杂问题不具备参考性。
②Kim,回答速度比豆包慢,信息来源为全网信息搜索,所以信息比豆包的信息量更大一些,回答问题也更有深度一点,但也一样是既有信息的整合精炼,不具备逻辑思考能力,可以理解为更精确一点的搜索引擎。
对了,还有kim推荐的那个图画生成功能,说是能取代专业美院毕业生,这就有点搞笑了,说实话就它生成的图片画风和画面的艺术性,别说专业美院了,就是去参加美术联考估计都不会及格,所以那些说ai会取代美术生的是小学生审美吧?反正未来会提升到多高的水平不知道,但以kim的绘画水平还差的很远。
③deepseek,问简单问题比如如何做白切鸡,如何清洁地砖上的锈迹。。问这类的问题绝对没有豆包好用,但如果是问复杂的有深度点的问题,它可以甩豆包几条街,完全不在一个水平线,因为它有类似人脑的逻辑思维,可以从不同角度不同层次来分析解答问题。
不过近期deepseek不太好用,基本每天只等回答1-2个问题,应该是要么是现在太热门,全球应用量太大,导致计算能力跟不上,要么就是目前依然被美国的黑客持续攻击着,所以经常宕机,但无论如何只是问了几个问题,就已经能看出来它确实能做到深度求索了。
④对了,后来又下载了阿里旗下的通义,对比下来的感觉是比kim智能一些,但比deepseek还是要差一点。这几天用通义比较多,因为deepseek大部分时间用不了,只能用通义,至少比kim和豆包强一些。
最后再举例说明一下,我问了以上4个软件同样的问题:感染了病毒以后,为什么洗澡会加重症状?
我问这个问题是因为之前感染新冠的时候,网上都在说不要洗澡,但我不信邪啊,我家中央空调室温26度,不存在洗个澡就会受凉的说法,然而我洗一次重一次,洗了两次澡,把本来一点都不严重的新冠感染硬生生的洗的非常严重,以至于用了整整两个月才勉强完全恢复。
这件事一直令我很困惑,查了无数资料看了很多医生专家的说法,没有一个能说清楚原因的,就是没人能说清楚洗澡为什么会加重病情,说的最多的是有可能受凉,但内在逻辑没人知道,且我本人不存在受凉的情况。
这个问题豆包,kim,通义给的答案差不多,通义的内容更多一些,但答案都是网上公开的那几种,没什么新意也不具备科学根据,只有deepseek给出的答案中有一条与众不同,且我认为是唯一正确的答案,大概意思是说洗热水澡时由于温度差,血液和体液会快速流向体表,导致免疫系统建立的免疫屏障被破坏,从而病毒暂时取胜病情加重。
单单只这一条,就让我对deeoseek佩服的五体投地了,因为这条答案之前我查遍全网都没有查到,那么问题来了,这个信息它是从哪里得来的?如果不是既有信息的提炼,那么就只有一种可能了,它已经有了超出人脑的思维能力了。

zhuixun11 LV

发表于 4 小时前

举个例子:如果说豆包是位德智体美劳全面发展的三好学生,DeepSeek则是那个虽然有点偏科,但是那个所偏的科目直接干到了全球大赛冠军的惊人程度。

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-1.jpg

《黑神话·悟空》的冯骥说:DeepSeek是个国运级别的科技成果。
我觉得,他说得并不为过。
随着三大运营商全面接入DeepSeek这款AI平台正在快速渗透到数字基建的毛细血管,并成功打入全球市场。坦白讲,我去年还对DeepSeek、以及深度求索这家公司关注得并不多。而像之前字节跳动推出的豆包,长年占据国内AI软件下载量头把交椅,而DeepSeek那个时候知名度还没有智谱、海螺、KimiChat等AI六小虎的知名度高。
就拿豆包来说,非常努力,啥能力都具备,对话、语音聊天、图片生成、音乐生成、AI搜索、智能体……无所不能,简直就是一个六边形战士,但是DeepSeek-R1一出,却在短时间内一骑绝尘,超过了豆包8倍的下载量。

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-2.jpg

曾经的网红豆包就这样黯淡了下来,不是豆包不被人关注,而是所有的聚光灯都给到了DeepSeek。
DeepSeek能够成功,说明目前美国的科技封锁,对中国是没有用的,反而会激发出更大的创新。
这种创新,同样体现在美国封锁华为5G芯片,最终Mate60 Pro问世,搭载上自研的7nm 5G芯片。
更具象征意义的是,当DeepSeek冲击全球算力格局时,美国商务部正对其开展国家安全调查,试图遏制这个来自东方的AI新贵。
有些美国的AI科学家讽刺DeepSeek并没有创新,用的都是现成的AI技术,我只想说一句,你行你上啊!
当然,DeepSeek的效果在很多方面确实是赶上了GPT-o1的。DeepSeek目前虽然还只专注于文字对话,但是其推理能力已经达到了全球级别的顶尖水平。
“DeepSeek时刻”能够出现的最大意义,我想主要有两点:
一、开源

DeepSeek原本可以选择学习其他公司,把自己最好的模型先闭源,然后开始要人们充值,交会员费。但是他们没有这么做。
OpenAI的傲慢,连曾经的金主爸爸马斯克都看着不爽,OpenAI不Open,高昂的会员费,自以为掌握了最先进的AI大模型,就可以大肆收割。

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-3.jpg

我在设想,DeepSeek的工程师们,在发现他们训练出来的R1版本在各项评分中都赶上了GPT-o1时的那种激动心情。
我在设想,DeepSeek的创始人梁文锋面对自己心爱的作品,到底要不要开源时,有没有犹豫,可能也有片刻犹豫吧,不过马上就做了一个惊天地泣鬼神的决定——“开源”,普惠AI行业。
在分析DeepSeek与豆包的"六边形战士"之争时,我们不难发现技术普惠性和应用落地能力才是决胜关键。
自DeepSeek开源以来,越来越多的企业和开发者开始深入研究其原理并积极学习。许多企业也已经开始部署和应用这一技术。到了3月份,一场激烈的AI人才争夺战已经打响!
看看最近的大厂动态就能明白,Google、百度、阿里、微软等都在致力于打造最接近AIGC的AI应用。例如,字节的扣子智能体已经有千万用户在使用,这些公司在人才招聘方面也是求贤若渴。从2025年的招聘数据来看,AI大模型人才的薪资待遇已经达到50K。
当下,进入AI领域的最佳途径莫过于知乎知学堂的AI大模型免费公开课。课程由专业老师带领,让你从0到1了解AI的底层原理和实际应用。课程内容以DeepSeek的核心算法为切入点,深入解析其底层原理,同时还会教授LLM大模型的训练方法、Prompt Engineering(交互工程),以及如何利用LangChain和Fine-tuning技术为工作和生活赋能。强烈推荐大家体验:
值得一提的是,许多学员在完成课程后,成功训练了自己的AI大模型,这一经验在求职时成为了核心竞争力,助力他们在职场上脱颖而出,特别是在薪资和职业Offer的选择上,可以说是步步高升。
梁文锋在接受采访时表示:
“面对颠覆性技术,封闭只是暂时的。即便是OpenAI的封闭策略,也无法阻止他人赶上。 因此,我们的核心价值在于团队——同事们在这一过程中成长,积累技术知识,形成一个有创新能力的组织和文化,这才是我们的护城河。开源、发表论文,对我们而言实际上没有成本。对于技术人才来说,看到他人跟随自己的创新,会有极大的成就感。事实上,开源更多是一种文化行为,而非商业行为,参与其中能赢得尊重。 对于一家公司而言,这种文化也具有吸引力。”
在问及深度求索这家公司是否会像OpenAI早期开源,后期闭源一样时,梁文峰继续回答:
“我们不会转向封闭。我们认为,首先建立一个强大的技术生态系统比什么都重要。这不仅仅是理想主义,而是符合商业逻辑的。如果模型是商品化的——目前看来确实如此——那么长期的竞争优势来自于更优的成本结构,而DeepSeek正是实现了这一点。这也呼应了中国如何在其他行业取得主导地位的方式。 这种思维方式与大多数美国公司的差异很大,美国公司通常依赖差异化产品来维持更高的利润率。”
这让我想起一句话,你给予得越多,回报也越多。
是的,用开源构建生态,这事美国也不是没成功过,比如Android系统的成功,咋现在就忘了呢?当然也还有记得的,比如Meta开源的Llama也大力促进了AI行业的发展。只是这次,好运站在了DeepSeek这边,站在了中国这边。连顶级域名<a href="http://link.zhihu.com/?target=http%3A//ai.com" class=" external" target="_blank" rel="nofollow noreferrer">http://ai.com都默认转向了DeepSeek,以前,这个殊荣是给ChatGPT的。
你的目标越无私,越具有大爱,越符合道,这个世界会馈赠你更多,因为老天爷认为,把这么多钱财交管给这种人,他放心!
我想,化名为“一只平凡的小猪”捐款1.38亿给慈善机构的梁文锋,也是这种人。
二、大幅降低训练成本


DeepSeek公布的最后训练成本是557.6万美元,这个成本不到GPT-o1的1/10。当然,他们也说了这不是所有的成本,但这并不重要,确实是便宜了很多。

这种成本优势直接动摇了全球算力市场的定价权,DeepSeek冲击全球算力格局的态势已然成型。所以美国各大高科技公司股价会在DeepSeek-R1开源后大跌。

所以特朗普、马斯克、山姆奥特曼、孙正义们都紧张了,因为他们刚刚号称要花5000亿美元建立一个“星际之门”计划,大幅提高AI基础设施投入,让自己的算力优势遥遥领先。

可讽刺的是,这个计划刚公布没几天,DeepSeek就啪啪打脸了,全世界才知道,原来算力也没有想象中那么重要,这么一来,连印度也宣布要大搞AI了,当然,基于咱们的DeepSeek。

因为美国芯片封锁,深度求索买不到最强劲的英伟达H100芯片,退而求其次买了带宽有限的H800,利用有限的算力,极致创新,做出了很多突破式优化。

英伟达的CUDA架构限制了算力的发挥,咱们这些聪明的小伙们就想办法绕开CUDA,用上底层的像汇编语言一样的PTX语言,愣是突破了限制,大幅降低成本。

当然,DeepSeek的创新还有很多,篇幅有限,咱们明天接着详细聊聊DeeepSeek的创新点。

春节档里,电影《哪吒2》也火了,和DeepSeek感觉也是惺惺相惜的。

DeepSeek就像哪吒一样,不畏强权,并对着全世界喊出了:
"若天下无路,我就开出一条路。若天地不容,我便扭转这乾坤”。
三、当豆包还在做"表面美容",DeepSeek已在进行"脑科手术"

如果说豆包的优化是给文章涂脂抹粉,DeepSeek的深度思考则像拿着手术刀做神经接驳——它不仅重构表达,更重塑思维骨架。这种差距在实测对比中如同降维打击:
比如一位用户想做一个“AI视频生成”的视频号,于是问豆包,“做好一个“AI视频生成”视频号的技巧”,得到下面的答案:

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-4.jpg

可以看到,内容比较空泛,也比较模板化,感觉放之四海而皆准,说了很多但是实操性不强。
而同样的问题,问DeepSeek-R1,它上来首先是搜了40篇资料,然后引用9篇,深度思考了38秒,得到如下答案:

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-5.jpg

内容实操性巨强,往哪个垂直领域挖掘、用什么工具、做什么案例以及风险分析,都帮你分析得明明白白,可以直接落地行动了。
你会发现,DeepSeek的深度思考能力真是一流,输出内容的质量高上了很多,再呼应开头,如果说豆包是位德智体全面发展的应届毕业生,DeepSeek就是那位历经风雨,吃过的盐比毕业生的饭还多的老中医,药到病除,专家号一号难求的那种。
当然了,豆包最近还是迎头直上的了,终于也在页面上加入了“深度思考”功能,终于会思考了,内容质量也开始追赶DeepSeek,如下效果。我喜欢这样的良性竞争,不过刚推出的DeepSeek-V3-0324,已经把编程能力强化到了仅次于全球最牛AI编程大模型Claude-3.7,关键还开源,再次轰动。DeepSeek-R2据说也快要推出来了,到时候,还不知道会不会再次惊艳世界呢?我们拭目以待吧~~
相关文章:
吴言不语零一二三:DeepSeek是怎样炼成的?用武侠故事讲透文科生也能看懂的“AI武林秘籍”吴言不语零一二三:DeepSeek开源的DeepEP通信库原来借鉴了诸葛亮的八百里加急驿站系统,神操作让我看跪了
为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-6.jpg

zxhk0794 LV

发表于 4 小时前

以下是deepseek和豆包分别以“沁园春”为词牌,写的金庸小说主题的诗。大家可以分别打个分。文末有deepseek和豆包子对两首诗的评分。
deepseek:《沁园春·金庸江湖》
剑气冲霄,侠影横空,谁铸奇峰?看华山论剑,狂歌裂帛;襄阳鏖血,铁马嘶风。塞北乔峰,江南七怪,一掌降龙万壑松。光明顶,有乾坤挪转,烈焰焚穹。
人间尽是豪雄,偏写尽痴嗔爱恨浓。叹白猿腹裂,九阳融雪;绝情谷冷,断臂雕龙。鹿鼎藏奸,连城埋玉,笑傲江湖曲未终。浮槎去,剩碧涛深处,侠骨留踪。
豆包:《沁园春·金庸江湖》
侠影江湖,笔绘乾坤,墨染情仇。看华山论剑,群雄逐鹿;神雕侠侣,侠侣情柔。大漠孤烟,襄阳烽火,侠义昭昭护九州。刀光闪,听金戈铁马,岁月长流。
江湖故事悠悠。多少梦、书中一并收。叹萧峰豪迈,义薄云天;郭靖守土,热血盈眸。芷若情深,无忌义重,恩怨情仇意难休。抬望眼,品金庸笔下,千古风流 。

豆包给两首诗的评分分别是:86和82
deepseek给两首诗的评分:92和85

再来两首deepseek的写的三体的:
《沁园春·黑暗森林》
星海沉渊,万籁噤声,光锥锁疆。  看田园倾覆,霓虹碎烬;歌者抛箔,寰宇平章。  猜链横空,熵钟倒卷,蝼蚁仓皇叩大荒。  抬望眼,问藏弓谁执?弓挽天狼。
曾痴善恶虚妄,笑稚子燃灯照虎狼。  叹面壁焚计,孤舟破雾;执剑凝眸,只手悬霜。  人性燎原,兽锋裂帛,血色星尘溅八荒。 碑文锈,纵星焚万界,炬照苍茫!  
《水调歌头·黑暗森林》  
蝼蚁窥天幕,振翅即招弓。  藏形匿迹如芥,犹恐露鳞鸿。  一念星河裂变,刹那千帆蔽日,火雨噬苍穹。  猜链锁重劫,沉默是兵戎。
面壁计,持剑令,判枯荣。  沙中鱼跃,幽瞳深处启迷蒙。  曲迹流亡星野,残舰独航熵海,归路已冰封。  碑上文明字,半是烬尘红。  莫问谁开刃,宇宙本盲聋。

lsmlyq LV

发表于 4 小时前

二者不一样哈,差远了,不是同一类大模型
字节的豆包是普通大模型
deepseek R1 是推理大模型
这意味着
核心目标不一样

豆包:文本生成、基础问答、信息检索
DS:多步骤逻辑推理、复杂问题解决、因果分析
训练数据不一样

豆包:通用语料(网页、书籍、对话等)
DS:增加逻辑题、数学题、科学推理等结构化数据
训练方法不一样

豆包:自回归语言建模
DS:结合思维链(CoT)、程序辅助、符号逻辑增强
输出特点不一样

豆包:流畅但可能缺乏深度逻辑
DS:结构化、分步骤、注重因果链推导
所以,豆包和deepseekR1压根儿没有可比性
举个例子你可能就明白了

鸡兔同笼问题

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-1.jpg


为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-2.jpg

从鸡兔同笼问题的回答我们可以看出,虽然结果一样,但,deepseek的思维链展示更加清晰完整。
如果你还不能理解deepseek的伟大,那我再给你举一个语料库被污染的典型例子

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-3.jpg

看,你们吹嘘好用的豆包,成傻子了吧!

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-4.jpg

看,这就是deepseek的牛逼之处,就算语料库被污染了,她也能通过自己的思考得出正确的答案。
来和高手学习一下

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-5.jpg

感谢 @野火吃腰果 提供的调试思路
再看一个比大小的问题R1表现如下

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-6.jpg

关于字母统计的问题,我们看看豆包怎么说
第一步,让豆包承认传统生成式大模型存在缺陷

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-7.jpg

好,豆包投降了,我们趁热打铁,问问豆包,传统生成式大模型还有哪些缺陷,应如何克服

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-8.jpg

好,这是豆包告诉我们的真相,我们不能只相信一面之词,还要问问deepseek,看看这个火出圈的家伙怎么说
关于英文字母统计的问题


为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-9.jpg

ds很开明,不仅把原因公布了出来,还把如何解决公布了出来,就这一点ds就可以吊打世上大多数生成式ai了!
作为普通人,我们只能通过提高自己的提示词编写技术,来让ai输出更加精准的答案,比如ds给出的改进建议:清逐个字母统计分析
关于生成式大模型的缺陷问题


为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-10.jpg

以豆包为首的普通生成式大模型,你们好好学学吧,自己有问题不敢直接面对,怎么进步,还得让竞争对手拿鞭子抽?AI工程师们,加油努力吧,方法都有了,就看你们怎么改进了
别光说别人不好,我们看看DS在这些缺陷上的进展现状


为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-11.jpg

这还不够,你敢承认自己不行吗?



厉害了,不仅承认了自己的不足,还给出了,例子,原因,和用户应对建议!我就喜欢这样的AI,开诚布公的让我知道AI得不足,我就可以有的放矢的提升自己的专项技能,让AI变得更好,但,豆包这类传统生成式大模型总是藏着,掖着,生怕用户知道它的不足,你连自己的弱点都不敢面对,你咋进步呀!
通过这一系列得沟通,我学到了很多新知识,有一些还没有完全学通透,还需要与ds进行更加深入的沟通,探讨,验证…
加油,deepseek,相信你会变得更好,在你的加持下,我会变得更优秀

deepseek+豆包使用实例

讲道理 我为什么觉得豆包比deepseek还好用? 关于深度思考与联网搜索的使用

@不宅不舒服斯基 问联网搜索和深度思考两个按钮什么时候开,什么时候关,如何配合使用,嗯,这应该是第一次使用AI时,最重要的问题,因为你只有了解了AI的特性,才能更好的发挥AI的作用,看看DS怎么回答

为什么DeepSeek出来可以轰动全世界,而差不多功能其他国产大模型却没什么人关注?-13.jpg

更多深入探讨与应用技巧清移步
DeepSeek深度思考与联网搜索使用指南

ziken LV

发表于 2 小时前

DeepSeek之所以能引起全球关注,是因为其在某些关键技术上取得了显著突破和创新。可能的原因包括其在模型算法的优化、大规模数据处理能力、高精准度的预测等方面的出色表现。此外,DeepSeek团队可能进行了有效的市场推广和宣传,使其获得了较高的知名度。至于其他类似功能的国产大模型未获得广泛关注,可能与市场推广、技术实力、用户认知度等多方面因素有关。每个模型都有其独特之处和擅长的领域,也存在其局限性。建议通过深入研究和技术对比,理性看待每一个大模型的发展潜力和价值。

您需要登录后才可以回帖 登录 | 立即注册