先头部队 发表于 3 天前

三家美国巨头英伟达、微软、亚马逊同日接入 DeepSeek,这意味着什么?对行业影响有多大?

尽管春节假期已经过半,但是“来自东方的神秘力量的 DeepSeek”仍在引起全世界热议,各路业内人士也仍在从不同角度分析 DeepSeek 的模型和技术文章。
北京时间1月31日,英伟达宣布DeepSeek-R1模型登陆NVIDIANIM。同一时段内,亚马逊和微软也接入DeepSeek-R1模型。英伟达称,DeepSeek-R1是最先进的大语言模型。
韩国 Mirae Asset Securities Research 的一名分析师在 X 撰写长文分析称:“这一突破是通过实施大量细粒度优化和使用英伟达的汇编式 PTX 编程,而非通过英伟达 CUDA 中的某些功能来实现的。”
也就是说 DeepSeek 在研发大模型时绕过了 CUDA。CUDA(Compute Unified Device Architecture,统一计算架构),是由英伟达开发的一种通用编程框架,它允许开发者利用英伟达的图形处理器(GPU,Graphics Processing Unit)进行通用计算。
如果 DeepSeek 真的绕过了 CUDA,那么这能说明什么?
在 DeepSeek-V3 的技术博文中,DeepSeek 表示其使用了英伟达的 PTX(Parallel Thread Execution)语言。
假如 DeepSeek 的开发者能够很好地使用 PTX(Parallel Thread Execution)语言,那么相比使用 CUDA 提供的编程接口,肯定可以更精细地控制 GPU 之间传输数据、权重和梯度等。但是,使用 PTX 写出来的代码非常复杂,且很难维护,因此需要专业度较高的开发者。
也就是说,绕过 CUDA 的做法具有一定的技术难度,这需要开发者既要懂 AI 模型的算法,又要懂计算机系统架构来高效分配硬件资源。如果没有同时掌握这两方面技能的开发者,那就要分别招聘懂这些技能的开发者,即需要协调好不同人员。
从 DeepSeek 的技术报告来看,其主体实现还是基于 CUDA 的相关接口,其描述中也阐述绕开了 CUDA 来写通信,那就意味着它招聘了掌握不同技能的人才,并能将这些人才很好地串了起来。
这也说明 DeepSeek 拥有一些擅长写 PTX 语言的内部开发者。那么,假如它之后使用国产 GPU,其在硬件适配方面将会更得心应手,其只要了解这些硬件驱动提供的一些基本函数接口,就可以仿照英伟达 GPU 硬件的编程接口去写相关的代码,从而让自家大模型更加容易适配国产硬件。
与此同时,从 DeepSeek 的技术报告来看,其技术从学术研究角度并没有胜出一筹,但是在工程上面的确非常有技巧。考虑到 AMD 已经宣布集成DeepSeek-V3到 MI300X GPU,因此未来不排除会有更多 GPU 厂商牵手 DeepSeek。
同时,也正如上述韩国分析师在同一篇 X 文章中所说的:“这凸显了DeepSeek非凡的工程水平,并表明美国对华制裁加剧的“GPU 短缺危机“激发了他们紧迫感和创造力。“

hhhh713 发表于 3 天前

明牌局,不装了,摸兔子过河,用中国人的先贤打败中国人。
玩归玩,闹归闹,蒸馏到最后,还是要比文化内核。
读《庄子》的AI肯定要比读《97种性别》的AI聪明一些。
西方也有伟大文明,但古埃及,古巴比伦,古印度都消失了。
它们的学术成果也消失了。
当学习同样资料的时候,你抄我,我抄你,大家互相在原始数据之海蒸馏的时候,
deep seek不慌不忙,拿出了一本《庄子》。
正中眉心的那一箭,是穿越2300年的蝴蝶。
AI修仙,赛博问道,是独属于中国人的浪漫。

《庄子》:
北冥有鱼,其名为鲲。
天地与我共生,万物与我为一。
人生天地之间,若白驹过隙,忽然而已。
举世誉之而不加劝,举世非之而不加沮。
方生方死,方死方生。
人皆知有用之用,莫知无用之用。
至人无己,神人无功,圣人无名。
大知闲闲,小知閒閒。大言炎炎,小言詹詹。
大道不称,大辩不言,大仁不仁。
井蛙不可语海,夏虫不可语冰。
哀莫大于心死。
君子之交淡若水,小人之交甘若醴。
相濡以沫,不如相忘于江湖。

潜之 发表于 3 天前

本文要点:
1)DeepSeek通过低成本开源狙击美国AI的高投资叙事,长期影响美国AI在资本市场的融资,达到狙击美国AI霸权目的。
2)DeepSeek拥有先进的算法优势,并且拥有全球最大工业国的应用土壤,从而能够获得强劲的发展后劲。
3)DeepSeek应迅速与国产硬件形成合力,从而在国际市场上形成对美国AI的替代方案,打破美国AI的国际垄断。

近期随着DeepSeek R1的发布,中国AI在世界上掀起了一阵热潮。
随着国外AI行业对DeepSeek的认识愈发深入,这阵热潮在世界上有着愈演愈烈之势。
DeepSeek以极其低廉的训练成本以及开源的部署方式得到了世界AI产业界的极高评价,并被认为是AI发展道路上的“规则改编者”(Game Changer)。
截止至2月1日,国际上在AI领域领先的大厂几乎都已经部署DeepSeek R1模型,包括但不限于:
1)英伟达(NVIDIA)宣布,DeepSeek-R1正式登陆NVIDIA NIM平台。
2)微软(Microsoft)把DeepSeek R1部署到了自家的云服务Azure上以及Github中,并且宣布在Windows的Copilot中集成DeepSeek R1。
3)亚马逊(Amazon)已经在Amazon Bedrock 和 SageMaker AI 中上架 DeepSeek-R1 模型。
4)世界上最大的AI搜索引擎公司Perplexity已经把DeepSeek R1集成进自己的搜索平台。
5)AMD把DeepSeek V3集成到了Instinct MI300X GPU上。
尽管美国众多公司对DeepSeek颇有微词,但却纷纷口嫌体正直地以最快的速度把DeepSeek集成进入自家的平台。
原因很简单,免费的太香了。
不仅仅是大公司这么想,很多国外原先订阅Open AI o1模型的用户也这么想,于是这两天出现了大规模退订OpenAI的风潮。
要知道,OpenAI o1原先是200美元/月,而DeepSeek R1直接免费,效能和Open AI o1又不相上下、甚至在某些领域有所超出,直接让很多原先付费订阅Open AI o1的用户直接投入DeepSeek的怀抱。
而Open AI反应迅速,立即将最新的o3-mini版免费发布,作为对DeepSeek R1的对冲。

1.规则改变者
之所以DeepSeek能成为规则改变者原因很简单,就是因为它能以极低的训练和部署成本改变了整个AI业态的发展道路,为大家提供了摆脱臣服于美国AI霸权的路径。
这里先要提一下在DeepSeek出现之前,美国对AI霸权的预设发展路径,就是天价的硬件和人才投入。
AI大模型训练在DeepSeek出道之前,是一个需要天价投入的领域。
比如OpenAI o1,大概用了上万张英伟达H100的GPU,整体训练成本约为10亿美元。
而DeepSeek V3的训练成本,根据官方数据,使用了2048张阉割过的H800 GPU,总体成本为500万~600万美元。
二者的训练成本相差2个数量级,这就代表了DeepSeek的大模型可以在更多行业领域得到应用。而OpenAI的模型,仅仅是体量巨大的企业的玩物。
甚至现在有人开始在个人电脑上用游戏级显卡GPU,就能部署DeepSeek的大模型。
在这里我们需要明确两个概念:训练和部署。
训练就是让AI围绕自己的需求建立模型,训练出的AI能够更加符合自己需要的应用场景。训练需要强大的算力,上面说到的o1的训练成本是上万个英伟达H100的GPU、整个成本约为10亿美元,就是说的训练的成本。
大规模训练成本降低两个数量级,意味着只要是大一些的企业,都可以用DeepSeek的开源版本去训练自己的专有模型、得到更加符合自己使用需求的AI。
部署就是让训练过的AI(你可以使用别人训练的模型)能够在自己搭建的环境下运行起来。而在个人电脑上就能脱离网络部署使用自己的AI,则说明AI的普及程度可以大大提高。
为什么美国对DeepSeek这么警惕,就是因为如果大家都联网使用DeepSeek,那么用户数据就可能被服务提供方收集,造成敏感资料的外泄。
如果DeepSeek能够部署在脱离联网的个人电脑上,那么也就消除了这个问题。
这也是为什么DeepSeek能够在个人电脑上部署如此重要的原因之一,因为这样美国就无法拿DeepSeek联网使用窃取用户数据说事了。
这是一个星星之火可以燎原的过程,只有极低的训练和部署成本,才能带动AI在全社会应用普及。
DeepSeek给全球用户带来的想象力就是:
第一可以以极其低廉的成本训练和部署私有AI,这是从来没想过的;
第二这个AI可以和OpenAI投入天价巨资开发的AI相媲美,这也是从来没想过的;
第三可以有一个脱离了美国控制的AI,这还是从来没想过的。
基于这三点,全球用户发现美国对AI的天价叙事崩塌了。
原来这么低的成本就能获得和OpenAI产品媲美、甚至超越的AI产品???那还要什么自行车……

2.DeepSeek的根本冲击
DeepSeek给美国AI霸权带去的根本性冲击,并不是DeepSeek比OpenAI能赚钱,而是DeepSeek让OpenAI赚不了钱。
美国最牛逼的能力就是画饼,而AI就是给美国股市画的一个香喷喷的大饼。
AI这个香喷喷的大饼,起码可以支持起未来10年美国股市的繁荣。而美国股市的繁荣,则可以掩盖美国国内的大部分矛盾、冲突与分裂。
以上就是为什么美国要画AI这个大饼的根本逻辑,不是能促进生产力发展,也不是能够赚大钱,而是AI概念支撑起了美国股市的繁荣。
股市的繁荣又能够反哺美国企业获得天量资金从而取得全球竞争的优势。
可以说美国股市只要能够一直繁荣,美国就能够通过货币周期一直全球吸血,从而长久维系美国霸权。
美国股市就是美国的全球吸血池,金融是美国全球霸权的根本。
我们必须认识到,AI争霸并不仅仅是在AI领域竞争,而是牵扯到了美国全球霸权的维系。
简而言之,AI和算力就是新时代的石油资源。
AI和算力霸权能够让资本能够源源不断的流入美国,从而撑起了美国金融市场未来10年的繁荣。
为什么OpenAI能获得如此多的估值和投资,为什么川普要投入5000亿美元支持美国的AI发展,就是因为大家都觉得AI可能是下一次工业革命的领导者。
而谁能夺取AI到AGI(简而言之就是通用的超越人类智慧的人工智能)的桂冠,谁就能取得下一次工业革命的领导权。
而取得了工业革命的领导权,则站在了人类文明之巅,可以名正言顺的攫取巨量的财富。
这就是为什么美国需要天价投入以OpenAI为首AI产业的根本原因——夺取第四次工业革命桂冠,从而能够长久维系美国霸权。
但整个逻辑有个弱点,就是OpenAI要一直获得投资的基础就是,人们觉得OpenAI未来可以占领AI的制高点、可以赚大钱。
而目前OpenAI一直是亏本的买卖,哪怕200美元/月的高昂订阅费用,也无法让OpenAI走出亏本的泥潭。
原先OpenAI预计2029年可以盈利,但是在DeepSeek以和OpenAI相当的水平且免费开源的狙击下,这一目标成为了泡影。
并且DeepSeek给全世界带来一个全新的实现AI甚至AGI的路线,这条路线与美国进行天价投资的AI路线叙事是不同的,这不禁让全球资本开始怀疑,AI是否需要这么巨大的投资?
最直接的表现就是,高盛1月24日的报告指出,随着DeepSeek崛起、并挑战美国在AI领域的主导地位,避险基金已在观望美国国内扶植的AI热潮是否还会持续。
DeepSeek所带来的冲击,很可能是美国股市崩塌的多米诺骨牌的第一张。
如果全球资本对AI领导者美国采取观望态度,那川普所吹嘘的投资5000亿美元的AI计划“星际之门”很可能会成为一个虎头蛇尾的把戏。
如果OpenAI不能有效降低其成本、从而跟DeepSeek进行刺刀见红的竞争,那么美国很可能会丢失AI霸权的宝座。
一旦美国丢失了AI霸权宝座,那么资本市场的反应将是残酷的。
以AI概念为首的美国科技股会整体下行,从而带动整个美国资本市场下行。
美国资本市场一旦失去了AI霸权这个锚点,来自全球市场的惊涛骇浪将会掀翻美国金融的航船。
一旦美国金融航船被掀翻,那么美国将丧失通过金融从全球吸血的能力,从而造成美国全球霸权的崩塌。
所以,DeepSeek狙击OpenAI赚钱,就是蝴蝶效应的第一步。
这一步,开启了我们打击美国资本市场的先河。
我一向认为,DeepSeek选择川普发布5000亿AI投资的“星际之门”计划之时发布开源的DeepSeek R1,是对美国金融市场的一次外科手术般精准的打击。也吹响了我们掀翻美国全球霸权的号角。

3.DeepSeek的后劲
DeepSeek最大的后劲来源于两个方面,一方面是低成本和开源,另一方面是国产GPU替代。
低价意味着不用投入太多资金,就可以训练适合于自己需求的AI,这对AI的商业化普及拥有决定性的意义。
而开源则意味着人人都可以部署AI,这对DeepSeek的生态发展拥有决定性的意义。
在低价和开源的加持下,DeepSeek将以极快的速度扩张自己的生态圈,从而在短期内形成一个强大的DeepSeek生态,从而可以于OpenAI在更加广泛的领域开展竞争。
这也是为什么很多用户把OpenAI戏称为CloseAI的原因,就是因为OpenAI已经背离了开源的初衷,以成本和技术构筑高墙阻碍竞争对手的AI发展。
而DeepSeek倡导的则是开源、分享和共同推动AI进步,与OpenAI的格局高下立判。
也只有开源并且效能与OpenAI最新产品相当的DeepSeek才能够引导全球AI的发展,毕竟开源的,才是世界的。
就在今天,川普和黄仁勋会面后传出消息,将要扩大对中国高算力GPU的禁运范围。
很多朋友觉得目前DeepSeek的训练还是基于英伟达的H800 GPU,如果美国对中国扩大封锁高算力GPU,那DeepSeek是不是就发展不下去了?
经过这两天的集中研究,我觉得这是多虑的。
原因很简单,DeepSeek不仅仅是基于英伟达的平台开发,而是绕开了英伟达的通用开发平台CUDA,直接使用PTX对英伟达硬件底层进行操作。
这意味着,DeepSeek的团队没有将整个AI构建于英伟达独有的CUDA平台之上,而是拥有了直接对硬件进行编程的能力。
绝大多数的AI的开发,建立在英伟达的CUDA平台之上。这样做的好处,就是当英伟达升级GPU产品后,只要该产品支持CUDA,就不用再针对新硬件进行专门开发,这样能够提高AI的通用性、降低开发成本。
而直接针对硬件底层编程,可以绕开CUDA对程序的转译、提高AI的运行效率,缺点就是一旦使用不同平台的GPU,就要针对这个GPU再重写一遍程序,升级成本高、平台通用性差。
而DeepSeek团队选择一部分绕开CUDA、直接对硬件底层进行编程,一定考虑到了美国可能扩大封锁范围的因素。
一旦英伟达平台不能使用,那么转移到其它GPU平台上进行训练则势在必行。
拥有了对硬件底层编程的能力,可以在多平台之间进行迁移,并且针对不同的硬件平台进行专门的优化。
简单说来,就是一旦不能使用英伟达平台,那么无论是切换到AMD的GPU,还是切换到国产的GPU,DeepSeek都能游刃有余进行切换。
而且针对不同的硬件平台,也可以通过硬件底层的编程实现专门的优化,从而达到软硬件配合获得最高的效能。
我相信DeepSeek现在一定和国产GPU厂商有合作,正在稳步推进国产GPU对国外GPU产品的替代。
很多朋友又会问,英伟达现在GPU算力绝对领先,而国产GPU刚刚起步,最好的产品可能才接近英伟达上一代产品的算力,这个如何破解?
其实也不难,OpenAI可以堆算力,我们也可以堆算力。

4.综合成本的竞争
我们先看一下另外一个领域,就是中国两台扛把子的超级计算机——神威·海洋之光和天河三号。
这两台超算均属于 E级超算(Exascale,百亿亿次计算),性能均超过 1 ExaFLOP/s,与美国最新的Frontier超算(1.1 ExaFLOP/s)性能相当。
这两台超算,均通过定制化互连技术将通信延迟降至纳秒级,确保大规模芯片协同时的效率。
其中神威·海洋之光实现了千万核心级的并行计算,而天河三号则实现了十万级节点协同。
这两者的共同特点,通俗化理解,就是我们可以通过众多核心或节点协同一起堆算力。
不要小瞧了这个堆算力的能力,目前能够实现大规模堆算力的也只有中美两国。
所以,哪怕是我们的GPU产品落后一些,我们也可以通过对算力去实现与美国差不多的算力。
有人又会问了,既然中美都能堆算力,而美国的单个GPU更加先进,我们如何赢得美国?
这就要跳出单纯的硬件竞争思维。
第一,美国堆算力需要考虑资本市场的反应。
很简单,双方如果不计成本的堆算力,那么我们可能会位于劣势的地位。但美国显然不可能不计成本去堆算力。
别忘了,美国的AI霸权需要在资本市场上把故事说圆了。如果不计成本的堆算力,美国固然可能赢,但资本市场会因为高昂的成本、微薄甚至没有产出而选择不继续投资。
永远记住,美国的AI霸权是建立在资本市场买账的基础上,它的终极目的是为美国的金融霸权服务。
这也是对美国不计成本堆算力的最大的束缚——不能画赚钱大饼的,终会被资本抛弃。
第二,不是堆算力就能够获得最佳性能。
AI技术的推进并不仅仅通过堆算力实现,如果通过堆算力就能获得AI技术霸权,那么美国早通过堆算力实现了AGI。
事实上随着硬件算力的增加,AI的水平并不是相应的增加。越往后发展,AI的算法优化才是AI效率增长的大头。
在这里我们需要注意,就是AI的算力≠AI的效率。DeepSeek和OpenAI的对比就是最佳的例子。
DeepSeek通过1/20的算力成本,实现了和OpenAI相同的效率。这就是对硬件底层进行匹配优化、以及拥有更先进算法的威力。
因此我们有理由相信,DeepSeek敢于开源、让别人了解自己技术细节,就一定有更厉害的技术还没有展示出来。
如果DeepSeek拥有领先优势巨大的算法,那么美国哪怕通过极限堆硬件算力,也无法达到DeepSeek的效率水平。
第三,我们不计较一城一池的得失。
最简单的例子,就是中国的高铁。
中国的高铁网络从无到有遍布全国,虽然到目前大部分高铁线路并没有盈利,但这不代表我们要抛弃高铁。
因为我们对利益的估算一向是系统性思维。
高铁虽然不赚钱、甚至亏本,但高铁所带来的区域之间的连接、对人流、物流、资金流促进作用所带来的收益,远远要高于高铁建设和运营的成本。
我们更加看重的是AI给系统带来的整体损益,而不是在资本市场单一的收益。
这是由我们社会主义的制度所决定的,无论是AI还是高铁,一切都是为了全国统一大市场服务。
而在美国,AI仅仅是资本的敛财工具和玩物,根本没有形成全国统一大市场的可能。
在这种情况下,资本更看重的是AI画大饼的能力,而不是AI真正的对生产力的促进。
美国需要千方百计保证AI这张大饼能画得好画得圆,至于其它,都是次要的。
退一步说,在制造业空心化的美国,哪怕能够率先实现AGI,但它的应用场景是什么?
只有在拥有全球最佳生产力的中国,AI才有巨大的应用场景。AI在中国的应用可以极大推动生产力的发展。
而只有生产力在AI加持下极大发展,才是达成第四次工业革命的最基本条件。
缺少了代表全球工厂的全球最佳生产力的应用土壤,AI将成为无源之水无本之木。
这也是为什么AI在美国只能是资本市场的玩物、而无法推动生产力发展的原因。

5.DeepSeek的长期任务
最后,DeepSeek的任务非常清晰。
第一,狙击美国AI霸权发展,树立国际威望和信心。
通过低成本和开源打破美国对AI发展需要天价投入的叙事,提高美国AI在资本市场的融资成本、降低美国AI在资本市场的融资能力。
只有打破美国对AI发展画的大饼,才能有效地应对美国的科技战和金融战。
因为AI产业作为美国股市未来10年的重要锚点之一,是美国高科技产业发展和吸引产业回流的重中之重。
AI也是中美竞争的最重要指标性产业之一。
只有在AI产业能够抵挡住美国封锁、并且在美国封锁之下和美国杀得有来有回,才能够在国际社会树立起中国的威望和他国对中国的信心。
第二,在世界范围内打破美国AI霸权的垄断,为世界AI发展提供一条摆脱美国AI霸权的路径。
中国的替代路径是一条开放的、共享的、极大降低训练和部署成本的路径,而不是像OpenAI那样是一条封闭的、独有的、成本高昂的路径。
虽说AI竞争是科技竞争的最前沿,但DeepSeek用小米加步枪追赶上了飞机加大炮的美国,是教员农村包围城市路线的经典复现。
坚持教员的道路,星星之火可以燎原,DeepSeek可以击败美国的AI霸权。
第三,就是在中国范围内极大提高生产力。
中国拥有丰富的AI应用场景,这是绝大多数国家所不具备的。极大促进世界生产力的发展的基础,就是拥有着独步全球的生产力。
放眼全球,只有中国拥有联合国分类中所有门类最齐全的工业部门,因此只有中国能够把AI最有效地结合从而促进生产力的整体发展。
而中国的生产力发展的最主要目的并不是为了垄断资本服务,而是为全球国家提供物美价廉的工业产品,从而提高全球人民的生活质量,这也是中国AI促进生产力发展的伟大使命之一。

目前看来,DeepSeek已经完成了初步的任务,有效地阻击了美国AI在资本市场的吸金能力。
并且能够在敌人的包围下杀入敌人内部(英伟达、微软、亚马逊、AMD等纷纷接入DeepSeek大模型),起到了分化敌人的目的。
接下来,DeepSeek需要和国产硬件厂商一起,优化算法和国产硬件的匹配,形成对美国算力平台的替代方案。
只有形成我们完整的软硬件解决方案,才能够真正实现对美国AI平台的替代路径,才能够真正的在国际上实现对美国AI霸权的阻击。
我们的根本优势有三点:
第一,我们拥有一个开源的、成本低廉的且能够达到世界最先进水平的DeepSeek,这是AI长久发展的优势基因。
第二,我们拥有全世界最庞大的理工类毕业生,在人才方面我们拥有源源不断的供应,这是AI长久发展的必要营养。
第三,我们拥有世界上最齐全的工业生产部门,拥有世界最强的工业生产力,这是AI长久发展的必要土壤。
只要一步一个脚印稳步发展,我们必将击败美国占上世界AI之巅!

更多阅读
组合拳出击硬刚的意义质变正在发生

玛卡巴卡 发表于 3 天前

意大利第一时间宣布下架deepseek,结果美国巨头纷纷接入。意大利心里估计现在万马奔腾。希望意大利顶住,千万别上架。

你在我这儿 发表于 3 天前

DeepSeek之前的AI大模型社区氛围是这样的。
开源(黑色虚线)起步晚,不过在慢慢靠近闭源AI(紫色虚线)的性能,你可以看到24年的后半年的差距已经非常小了。


但问题是闭源社区的领头羊OpenAI,每一次都能领先整个AI社区一步,先后做出了ChatGPT,GPT4,4o,以及近期的推理模型系列o1,o3。
可以说每次感觉开源社区要追上闭源社区了,但是闭源的这几个头头总是能整出点新花样来。
转折点就在于DeepSeek,你也看到现在DeepSeek在发布V3的时候就已经超越了闭源社区的两尊大神,Claude3.5-sonnet和GPT4o。


后两者都是闭源社区的扛把子,超越了这个就象征着开源社区的尖端力量的逆袭。
随后的DeepSeek R1更是一个暴击,在OpenAI最引以为豪的推理模型上实现了追赶,性能暂且不说。
几十分之一的成本达到类似的效果,这对于OpenAI是最难受的。
因为如果DeepSeek R1消耗的资源 约等于 OpenAI的o系列,那其实还是证明了OpenAI的先进性,甚至是double认证。
再加上Nvidia,微软,AWS先后都接入了DeepSeek,更加证明了AI社区的百花争鸣,不只是所有人都仰OpenAI鼻息。
巨头们也是有脾气的好吧,用OpenAI的怎么可能比在自己服务器上运行的开源大模型让人放心?
道理很简单,开源牛逼。
DeepSeek精华库

Magic 发表于 3 天前

因为 DeepSeek 对云服务厂商和 AI 应用开发者是利好,就这么简单。
其实如果仔细去看的话,这几天上蹿下跳最厉害的当属模型厂商,特别是 OpenAI 和 Anthropic。OpenAI 指责 DeepSeek 偷 ChatGPT 数据,发布 o3-mini 还要阴阳怪气一下 DeepSeek(图中文字:假如我只有 5 岁,解释什么是 AI 蒸馏):


Anthropic 的创始人 Dario Amodei 干脆破大防,一边极力论证 DeepSeek 没那么先进,一边呼吁美国爸爸一定不能再向中国出口 AI 芯片了,要管制,要限制发展。
Dario Amodei:关于 DeepSeek 与出口管制这两家的问题就在于业务太过单一,长期被云厂商包养,OpenAI 被微软 Azure 包养,Anthropic 被亚马逊 AWS 包养,所以他们想要极力证明自己的价值。
反而 Google 自家的 Gemini,其实没那么慌,毕竟核心业务是搜索;Meta 的 Llama 本身就是开源阵营的,再说核心业务是社交,AI 对他俩都是添头。
那为什么说 DeepSeek 对云服务商和 AI 应用开发者是利好呢?
对于云服务商来说,可以通过引入多模型供应商,避免被单一厂商绑定或议价,客户可根据成本、场景等需求灵活切换模型。
而对于很多企业来说,开源模型比闭源模型更值得信任,但 671B 模型并不是谁都有自建机房的,于是就会选择云服务商的实例部署。更重要的是,DeepSeek 自己的官方服务器承载能力有限(而且一直持续被攻击),这波天大的用户流量自然有人需要接走。


所以微软、亚马逊、NVIDIA 才会不约而同地在自家云服务中上架 DeepSeek。
而在国内,硅基流动和华为云合作,在 DeepSeek 官方配合参与下,推出了基于昇腾云的DeepSeek R1&V3 推理服务:


根据硅基流动介绍:
通过双方联合创新,在自研推理加速引擎加持下,硅基流动团队基于华为云昇腾云服务部署的 DeepSeek 模型可获得持平全球高端 GPU 部署模型的效果。API 价格与 DeepSeek 官方优惠期价格保持一致。这就是 DeepSeek 开源的魅力,说白了,DeepSeek 自己接不下这么多用户,从一开始也没打算吃独食,中国的、美国的、印度的(没错,印度也干了)、欧洲的甚至非洲的,只要手里有服务器有算力,大家都可以自行部署。
这就好比一个游戏公司,愿意免费开放源码让别人去搭建私服,而且玩家排着队要玩。这会只要能把私服搭起来吸引到用户,就能有收益。
微软、亚马逊、NVIDIA 又不傻,他们可以嘴上谴责一下,但身体却诚实得很。
同时得益的还有下游的应用开发商,他们以更低的成本切换模型 API(如从GPT-4转向DeepSeek-R1),模型厂商的技术护城河被削弱,利润会进一步向应用层转移。
得道多助,当 DeepSeek 愿意将实打实的利润分给上游的云服务商和下游的应用商,夹在中间的其他模型厂商是死是活谁还关心呢,微软、AWS、NVIDIA 巴不得模型商们继续卷出性能更强、价格更低的模型。

huchuanhao 发表于 6 小时前

回复:<br><br>关于三家巨头英伟达、微软、亚马逊接入DeepSeek的这件事情,意味着AI领域正在迎来一次重大的技术革新。DeepSeek作为一个先进的大语言模型,其接入无疑将推动各行业应用AI技术的速度和范围。这也意味着在大数据和AI领域,竞争将进一步加剧,促使各大公司加快技术研发和应用创新的步伐。<br><br>从行业影响来看,这一动作可能将引发一系列的技术进步和创新应用的出现。DeepSeek的技术可能有助于解决一些目前AI应用中的难题,提高数据处理和分析的效率。此外,如果DeepSeek真的绕过了CUDA,那将是对编程框架的一次重要突破,可能引发编程框架领域的竞争和发展。<br><br>总的来说,这次接入事件将对AI行业产生深远的影响,可能会改变一些现有的技术格局和应用模式。同时,这也需要行业内的专业人士继续深入研究和分析,以更好地理解和应对这一技术变革带来的影响。

夕遥 发表于 6 小时前

针对三家美国巨头英伟达、微软、亚马逊同日接入DeepSeek这一事件,意味着人工智能领域正迎来新一轮的技术革新。DeepSeek作为先进的大语言模型,其接入将极大地推动相关产业的发展和应用场景的创新。对行业的影响表现在,DeepSeek的接入将加速人工智能技术成熟和应用落地,进一步推动行业转型升级。此外,此次三家巨头接入DeepSeek的合作彰显了其技术实力和合作深度,也预示着未来人工智能领域的竞争格局将愈发激烈。关于DeepSeek绕过了CUDA的问题,这表明其开发团队拥有更高的技术实力和人才储备,可以更好地利用英伟达的硬件资源进行模型训练和优化。总体来看,DeepSeek的发展将对人工智能行业产生深远影响,引领行业朝着更高效、更智能的方向发展。

halczy 发表于 5 小时前

针对三家美国巨头英伟达、微软、亚马逊同日接入DeepSeek,这标志着大语言模型领域的合作与竞争加剧,意味着三者都将深度参与并利用DeepSeek模型,以提升各自的技术实力和市场竞争力。对行业而言,这将促进大语言模型技术的深入研究和广泛应用,带动相关产业链的发展。<br><br>关于DeepSeek绕过了CUDA的问题,这意味着DeepSeek在研发过程中采用了不同于CUDA的编程方式,能更精细地控制GPU资源。使用PTX语言编写代码虽然复杂且维护困难,但说明DeepSeek拥有专业度较高的开发者团队,具备更强的技术实力。这也反映了DeepSeek在招聘人才方面的策略,能够吸引不同技能的开发者并有效协调他们的工作。<br><br>至于未来DeepSeek是否会使用国内的技术或资源,目前来看还不确定。但可以预见的是,随着全球技术合作的深入,DeepSeek可能会寻求更多的国际合作机会,包括与国内的合作。这将为行业带来更大的发展机遇,推动全球技术进步。
页: [1]
查看完整版本: 三家美国巨头英伟达、微软、亚马逊同日接入 DeepSeek,这意味着什么?对行业影响有多大?