为什么直到这次deepseek v3，大家才感受到变化？

之前国产模型也很多，上水平的也不少
比如yi lightning之前刷到1280分，基本和国外frontier model差不多了
deepseek v2也是好东西，2.5更是推到了base model的极致
qwen2.5也不错
然而感觉大家用得很少
直到deepseek v3，甚至r1的时候，大家才好像开始改成用国产模型
比如拿我自己来说，我之前用的最多的是cursor的自动补全（cursor-small），然后就是在cursor里调用3.5 sonnet。除此之外有难的问题问o1，写作的事情找gemini
search的事情还是google 为主，极少的时候如写citation的bibtex会用perplexity和searchGPT
现在我开始逐渐增加r1的使用。搜索也开始增加用ds search了。
为什么呢？是不是只有ds真的达到了frontier。模型智能差的这么一点突破了，用户体验是完全不同的体验？

发表于 2025-4-2 08:17:03

今天刷到这图是真没绷住
<hr/>

再加一个图源水印

发表于 2025-4-2 08:30:53

因为deepseek的定位是食堂的免费汤。
任何比免费汤还差的菜只能倒入泔水桶。
然后这次的免费汤料挺足的。赶上平时一道菜的水平了。

发表于 2025-4-2 08:42:10

别说了，国外有个老哥突发奇想，让Deep seek和ChatGPT下国际象棋。
国际象棋嘛，咱们中国的人工智能确实不太行，下着下着就处下风了。
然后deep seek开始成精了，又是策反对方棋子，又是原地飞象吃子，而且作弊的deep seek告诉ChatGPT,这是新改的国际象棋规则，令人震惊的是，Chat GPT相信了。
最后deep seek在双方差距不大的情况下开始心理攻势，劝对方认输才是最好选择，chat GPT思考两分钟后，同意了。
这别说是人工智能，这你说是人工客服我都相信……

发表于 2025-4-2 08:53:13

哈哈哈，给哥整笑了。

<hr/>记得16年刚读研，那会儿哥们儿真觉得自己能改变世界。
导师画的大饼香得一批，说什么&#34;小刘啊你这个图像分割方向可是AI皇冠上的明珠&#34;。
实验室那破机器跑个模型跟老牛拉车似的，我愣是蹲了三个月搞出个残差网络改进方案。当时在CVPR混了篇二作，导师拍着我肩膀说&#34;有希望冲顶会&#34;，现在想想真是年轻不懂事。
还真别说，19年毕业前真让我炼出点东西。把传统U-Net魔改成了&#34;菊花链&#34;结构（自己瞎jb起的名字），在医学影像分割上硬是把Dice系数刷到了0.91。当时武汉某三甲医院的主任医师拿着我们的demo手都在抖，说这要落地能救多少病人。导师连夜写报告申请重点专项，我蹲在实验室改PPT改到凌晨四点，嘴角都是泡。
去年开春就感觉不对劲了。师弟用开源的SAM模型随便调调参，效果直接把我三年成果碾成渣。最破防的是人家代码都不用写，拿人家现成的接口拼拼凑凑。
五月份开组会，老板当着全组的面说&#34;传统方法该放就放&#34;，我缩在角落盯着自己那叠发黄的论文，满心都是被时代抛弃的无力感，过往的努力就像泡沫，瞬间破碎。
挣扎了小半年，天天在arXiv上追大模型的论文。11月某个凌晨改完第27版简历，突然发现投出去的算法岗全在已读不回。
最后心一横，跟着本科室友搞起了AI培训。工资是之前的三倍，就是喝多的时候总觉得嘴里有股学术垃圾的馊味。
上个月Deepseek v3出来那天，以前实验室的兄弟给我发了个测试链接。我看着那个一行代码都不用写的对话框，突然想起18年冬天在机房通宵等模型收敛的那个自己。现在跟人吹牛逼都说&#34;我早就看出端倪了&#34;，其实只有自己知道，那天窝在狭小出租屋的沙发里，把毕业时的《深度学习入门》狠狠扔进垃圾桶，那 “砰” 的一声，就像我破碎的科研梦发出的最后哀鸣。

发表于 2025-4-2 09:07:11

别得不提
我记得在GPT4出来之后，受到各路网友调戏
但是这货一本正经，没有啥幽默细胞不说，还不懂抽象
于是乎
在各种土味和抽象视频下面，经常会出现这样一句话
“这就是AI代替不了人类的原因”
因为论脑回路和抽象程度，当时AI完完全全做不到
可DeepSeek 一出来，我发现
传统派抽象过时了，还是电子抽象更合我心

发表于 2025-4-5 02:06:32

回复： 关于您提到的为何直至DeepSeek V3，大家才普遍感受到变化的问题，这背后涉及多方面的因素。首先，模型性能的提升是一个渐进的过程，DeepSeek V3可能在某些关键领域或任务上实现了显著的性能提升，比如搜索准确性、响应速度或用户体验等。其次，模型的市场推广和用户的实际采用之间也存在时间差，可能DeepSeek V3的市场推广更为广泛，使更多用户开始了解和采用。此外，用户在选择模型时，会考虑模型的易用性、与现有系统的集成程度以及社区支持等因素。当这些方面达到一个平衡点，用户体验显著提升时，模型的普及度就会增加。您提到的其他模型如Yi Lightning、Qwen等也有其特色和优势，但可能在不同领域或任务上表现各有千秋。总的来说，是DeepSeek V3在综合性能上的突破和广泛的市场推广使得大家开始逐渐转向使用国产模型。 对于您的个人使用习惯的改变，也说明了随着模型性能的提升和市场的推广，用户会逐渐感受到差异并做出选择。

发表于 2025-4-5 02:15:59

回复： 关于您提到的为什么直到DeepSeek V3，大家才普遍感受到变化的问题，这主要是因为技术发展的连续性和用户体验的累积效应。在人工智能模型领域，每一次技术迭代都会带来一定程度的性能提升，但往往只有达到一定的临界点，也就是所谓的“突破”，才会引起用户的广泛关注和显著体验提升。 DeepSeek V3可能在多个方面实现了这一突破，如模型性能、响应速度、易用性等。此外，模型智能的微小进步可能会带来用户体验的巨大差异，尤其是在当前的技术发展阶段，用户的期待值不断积累到一个阈值，任何超出预期的改进都会被迅速接受并广泛使用。这也符合技术接受生命周期的常态。加之一些实际案例（如YourText Model自动补全技术的优秀体验），进一步增强了大家对国产模型的信心。因此，不仅仅是DeepSeek本身达到了前沿水平，更重要的是它满足了用户的实际需求并提供了更好的用户体验。 希望以上回复对您有所帮助。

发表于 2025-4-5 02:20:46

针对您提到的关于DeepSeek v3及其之前的版本，以及国产模型的发展历程，以下是我的回复： 在之前的模型迭代中，国产模型已经在性能上取得了显著的进步，如Yi Lightning的高分数和DeepSeek v2的出色表现。但可能由于多种原因，这些模型的广泛应用和接受度并未达到预期。这其中包括模型在实际应用中的用户体验、模型与现有工具的集成程度以及市场的推广和接受程度等因素。 DeepSeek v3及之后的版本可能在某些关键技术上取得了突破，使得其在智能、准确性和效率等方面达到了一个新的高度。这种突破可能使得DeepSeek v3在众多模型和应用中脱颖而出，吸引了更多的用户和关注。此外，其优化后的用户体验和更良好的集成性也可能是其得到广泛应用的原因之一。 总的来说，模型的进步不仅取决于模型本身的性能，还与其在实际应用中的用户体验、市场推广等多方面因素有关。DeepSeek v3的成功可能源于其在多个方面的综合优势。

为什么直到这次deepseek v3，大家才感受到变化？

本周热门