deepseek V3开源为什么会引起这么大的动静,到底有哪些创新让大家这么兴奋?

看起来也不免费,还这么多人使劲推,有没有人从技术上说明白到底有哪些颠覆性的突破?
收藏者
0
被浏览
103

5 个回答

快活林的猪 LV

发表于 2025-4-27 17:40:40

前几天看到的段子,高度怀疑是真的。
说啊,deepseek 出来之后,meta 的 ai 部门很是恐慌。
恐慌不是因为他们产品性能低于 deepseek。
而是他们成本完全没法和 deepseek 比。
deepseek 据说成本五百万美金多一些。
meta 的一位高管年薪差不多就这个数量级。
更重要的是,他们有十几个这种高管。
当时看到这里我笑了出来。
老美千封锁万封锁,结果 ai 还是被中国追了上来。
给老美充足的资源,这帮人还是不行。
所以到底他们是啥不行呢?
欢迎评论区留言。
找到图了,更新给大家。

deepseek V3开源为什么会引起这么大的动静,到底有哪些创新让大家这么兴奋?-1.jpg

Friendcome LV

发表于 2025-4-27 17:51:07

美国冷战后成长起来的科技人、金融人普遍有一种自大、轻浮、傲慢的特点,他们和比尔盖茨、乔布斯那一代科技人有很大的不同。
在美国新一代科技人的眼中,他们才是最强的,最好的,外加上资本叙事的推波助澜,给全世界包括中国的行业内的人士PUA后,把AI神话为”第四次工业革命就是人工智能“,并强化了一种刻板的叙事公式:
先进AI=高算力+高投入+高级人才。
而在美国人,包括中国很多大厂的人看来,只有美国才具备这些条件,只有美国才能搞出来最先进的AI,在这种叙事的情景下,美国的资本、股市、科技公司不要脸的高收费等,开始了一轮疯狂的抢钱活动。
但是DeepSeek的出现,证明了这一公式并不成立,小公司,小投入也可以依靠并不那么先进芯片可以靠优秀的算法和低成本取得高投入同样的效果,这就很打脸了。这对全球的科技公司再一次的深思:AI的方向和软件的本质到底是什么?
不仅如此,DeepSeek还打破了美国一些资本和科技公司的财富梦,原来世界上还有更便宜更好的替代方案,并且模型小到可以直接装进手机,训练后还可以不依赖于云模型独立运行,这就让很多投资者的财富梦想成了泡影。
更关键的是,美国认为只要坚持不断地制裁,美国会在和中国的竞争中不断的领先并拉大差距。但这个事件证明:制裁完全取到了反效果,让美国的高投入喂了狗不说,还不断地逼出了中国的一些世界级科技成果,这让美国的政界和民众也在思考这制裁的意义。
第三世界,包括美国无法进行高投入的机构和学者简直把DeepSeek看成了救星,完全开源,意味着全世界人民都可以白嫖成果,并且还有论文和推理的过程,其它国家的科技机构说不定在此基础上,还能异军突起,做出更好的模型也不一定,这对其它国家既是一个科技福利,也是一种鼓舞,会给世界其它国家和人民一种”中国行,我也行“的感觉。
这对于想垄断AI科技和商业的美国来讲,不亚于一颗核弹扔在脑门上。现在美国的大厂就很尴尬了,花了这么多钱如何去解释?怎么解释都不好解释,最有可能的说是:方向赌错了,但这些钱是花出去了,不是你一句话就能轻飘飘地过去的,估计很多CEO\CTO少不了一顿骂,然后疯狂地拆解和抄袭代码。
DeepSeek事件,可以说是自华为MATE70全国产化以来,第二个能让中国人稳一稳情绪的一个大事件,我们最担心的事情又少了一个。客观上鼓舞了科技战绩全体人员的信心,不服就是干!
这个事件还有很多值得思考的东西,比如它是一个量化基金公司搞副业搞出来的,它以前可能根本就没有进入中国政府和科技扶持和关注的重点,也就是说那些拿了科技补贴和政策扶持的公司,那些占领传统优势的互联网公司,却干不过一个搞副业的公司,这件事也是很有意思的一个方面。
就算是股民也在想:我现在知道散户为什么干不过机构了,这是人力能对抗的吗?然后旁边很多人安慰说:这些机构干的是对手盘的主力,散户只是无意中辗过的蚂蚁,人家真心的不是想对付你,这些工具对付散户也没有太大的意义,这让散户更生气了不是?你不早说?
还有更多的人在思考,如果我们也能干出不逊色于美国的AI,那这些AI如果运用于军事的话,那我们至少和美国的水平是相当的,就算是打起仗来,我们也不会吃大亏。
所以这件事在方方面面都具有深刻的影响,动静当然就很大了。
我看过梁文峰的采访,这件事其实对于我们的启发就是:
你要自信才能创新,否则永远都只是一个追随者,或者一个商业上的偷鸡贼。

ecg2005 LV

发表于 2025-4-27 17:59:42

这一步的重要意义堪比国家计算机到个人PC的转换。
我用了一天的deepseek,我基本确定ds就算不喂训练材料,就是简单的几个问句,就可以让它快速的调整自己,形成一套你想要的输出。
这个模式适用于,会计,编程,做题,写作文,量化交易,几乎一切的人类工作。它会加大加速你在任何一个行业的学习过程,因为当你对一个领域不熟悉,有很多小白问题,或者在形成自己的学习体系时遇到的问题,它比老师和课本还有效率,还更能针对你的问题做出迅速回答。
当然以前的GPT不是不能做到这一点,各大公司新的各种ai模型工作效率也不比deepseek弱,但是以前我从来私人时间不用这个东西,因为它需要付费,并且价格昂贵。
给大公司付费又是比巨大支出,这完全不是普通人能玩的东西。
但是现在不同了,deepseek把自己开源了,你完全可以自己下载一整套deepseek,弄十台电脑运行。或者最直接的,用GPT五十分之一的价格让公司帮你训练,百万字的输入材料,也就一两块钱。
这就等于说,普通人工作/娱乐需要的任何AI辅助,在成本方面的问题解决了。
你只要花几百块钱或者自己一次性买是十个显卡,就可以有个心想事成的女仆机器人(除了她不能现实打扫家务),只要是书桌前的工作,它就都能干,你只要去最后去看她干的成果你满不满意,给她几句话的指导调整为你想要的方向就行。
而全球有70亿的人口,即使不算那些买不起电脑或者上网不了的30亿群体,剩下的40亿人每个人都可以训练自己想要的模型,各行各业将迎来内容的大爆发。
我估计医学,生物制药未来10~15年可能会取得重大突破(人类永生也不是不可能),材料学/航天紧随其后,因为这已经不再是某几个大公司训练模型这样的模式了,而是人人都有AI助手,这样会极大加速社会生产力的爆发。

zxhk0794 LV

发表于 2025-4-27 18:12:18

我感觉我要被取代了:

deepseek V3开源为什么会引起这么大的动静,到底有哪些创新让大家这么兴奋?-1.jpg

虽然这个暂时还不完全像,不过稍作优化就可以用了。
之前看到deepseek有个知乎味很浓的反击:

deepseek V3开源为什么会引起这么大的动静,到底有哪些创新让大家这么兴奋?-2.jpg

这语气跟我关注的几个知乎答主如出一辙,我还纳闷是为什么。现在明白了:



deepseek V3开源为什么会引起这么大的动静,到底有哪些创新让大家这么兴奋?-4.jpg



连我当年写的一些奇奇怪怪的东西都给汇总进来了(悲),看来deepseek应该是用了知乎的语料。
我也建议知乎是不是考虑把自己的那个AI直达直接换成deepseek的模型?那样可能效果更好一点。

a3102779 LV

发表于 2025-4-27 18:23:12

你要跟另一个新闻一起看:美国对全世界算力分三档管理,中国是第三档。
DeepSeek这个东西并不能做什么别的AI做不了的事。
他的优势是,对比GPT,做同样的事情,只需要3%的算力支撑。
这就意味着,就算没有英伟达的显卡和算卡,也不能阻止中国在AI领域的继续发展了,甚至说,美国用算力讹诈全世界的打算就此泡汤。

您需要登录后才可以回帖 登录 | 立即注册