寒武纪的ai芯片在国内属于什么水平?

寒武纪的ai芯片在国内属于什么水平?
收藏者
0
被浏览
95

5 个回答

吉吉 LV

发表于 2025-4-9 12:39:47

很高的水平。
卖一台信创ai服务器200万,可以拿其中50-100万做客情关系,拿其中20万买一台英伟达来解决兼容性问题,如果真的需要用,那可以拿其中1000元充值deepseek,跑到冒烟都用不完。

老羊说情感 LV

发表于 2025-4-9 12:49:45

玩过mlu 370,小模型时代还行,有完善软件/ai框架/model studio,性能也还不错,但非cuda兼容,大模型时代cnnl跨机通信都没打通, 人才都跑光了……都快成空壳了,但是股价新高。

少看知乎多读书 LV

发表于 2025-4-9 13:02:05

现阶段最强的国产AI芯片毫无疑问是升腾910C:2die的910B做出来的一个大概H800水平的单卡。这就给寒武纪的AI芯片提供了一个良好的参考,毕竟都是国产。
如果直接“虚空对虚空”可以有个数据:

寒武纪的ai芯片在国内属于什么水平?-1.jpg

思元590大概达到了升腾910B的性能,升腾910B一般认为是A100的0.8-1.1倍(取决于优化)。升腾910C则是2die 910B,传言是H800的水平。
单卡性能其实倒在其次,毕竟适当的堆料就可以提升性能。但问题是AI芯片不只是AI芯片还需要配合一堆东西,例如华为的atlas:

寒武纪的ai芯片在国内属于什么水平?-2.jpg

这是单机,如果是集群的话还要:

寒武纪的ai芯片在国内属于什么水平?-3.jpg

需要有HCCS互联,英伟达是收购了mellanox才有的,华为是自己就做交换机所以也自己弄,到集群这个级别需要的东西还是很多的。
升腾的集群,华为提供的有:

  • 8卡升腾910(自主可控工艺)
  • 2颗鲲鹏920
  • HCCS互联
  • 欧拉linux系统
  • mindspore、pytorch等框架

寒武纪的ai芯片在国内属于什么水平?-4.jpg

我们搜一下寒武纪官方文档就知道,寒武纪做的画风是:

  • 寒武纪MLU370(台积电工艺)
  • 海光/兆芯/intel/amd的x86 cpu
  • 英伟达mellanox互联
  • centos/ubuntu等linux发行版
  • pytorch、google tensorflow等框架
考虑到兆芯性能较低,海光不容易买到,实际上寒武纪应该是主要依靠intel、amd的x86体系的。

寒武纪的ai芯片在国内属于什么水平?-5.jpg

其中互联的部分看文档介绍应该是英伟达的mellanox:

寒武纪的ai芯片在国内属于什么水平?-6.jpg

我们可以得出结论:

  • 目前寒武纪主力产品使用台积电工艺,受制于管理办法性能上限被卡
  • 寒武纪配套的CPU仍然存在一部分问题,不过海光应该是能用的,兆芯的kh40000也许也可以用
  • 互联方案依赖英伟达的mellanox
  • 软件部分还有一定差距
总的来说,寒武纪目前的AI芯片和国内领先的华为差距较大,考虑到现阶段的大模型需要集群,周边配套差距更大。寒武纪缺乏英伟达的财大气粗+自由收购,也缺乏华为的历史积累+研发宽度,想要补齐这些周边配套还存在较大的困难。

你不认识我吗 LV

发表于 2025-4-9 13:15:40

陈巍谈芯:感觉这个问题的回答下面,有些不太了解芯片行业内情的人写的回答,过于误导大众。
误导1)寒武纪水平不行?作为寒武纪的潜在竞争者,我不会给寒武纪唱赞歌。寒武纪管理水平我不了解,不评论,但是寒武纪每年的专利申请量,都是实实在在的可观数字。相比之下本问题下某个高赞回答推荐的某家做稀疏化芯片的公司,烧了投资人几个亿,核心专利寥寥无几。寒武纪自己有稀疏化专利反而不用,难道是寒武纪或者他们的客户傻吗?把个别家抬到寒武纪前面难免有广告嫌疑。至少在我眼里,同为中科院出身的两位陈老师是踏踏实实做技术的,不是媒体上一言不合就PR自己干过NV或者拿个客户很少用的MLPERF给投资人看。
在指标上干过NV又怎么样呢,行业里懂行的就知道一定会被老A搞黑名单,还不如缓称王积累实力。对于“做的好又大肆宣扬自己能干过NV的",我和行业里资深的都不是太理解某些家“早死早投胎”的策略啊。

寒武纪的ai芯片在国内属于什么水平?-1.jpg


来源:陈巍

误导2)国内大模型到底怎么样?这个你们有条件的自己试一试对比下就知道了。没必要这么自信商业落地能力。那些过度自信的大概不是自己做大模型的。自信和自傲,只有一字之差,但是一个会形成努力做事,另一个大概只会导致闭门造车。如果没有国内爸爸们护着,不知道大家有没有这种自信。
误导3)中国的一流AI芯片设计水平跟NV几乎没差距?本身国内做AI芯片的有走AI专用芯片的,也有走GPGPU芯片的,不同的产品路线本来就不适合放在一起做比较。不能拿市级短跑冠军前10秒比奥运长跑运动员跑得快,就说市级一流跑步水平比奥运长跑冠军强。
要跟NV比水平的话,最好用GPGPU去做同类比较。另外也要看看NV多少GPU专利,多大资本和研发人员体量。过于乐观的话,反而容易闭门造车。

想了解行业的,可以看看以下文章
陈巍谈芯:GPT-4核心技术分析报告(2)——GPT-4的技术分析(收录于GPT-4/ChatGPT技术与产业分析)陈巍谈芯:GPT-4模型特征与训练信息最新解读(收录于GPT-4/ChatGPT技术与产业分析)陈巍谈芯:ChatGPT发展历程、原理、技术架构详解和产业未来    (收录于GPT-4/ChatGPT技术与产业分析)陈巍谈芯:3(上) GPGPU流式多处理器架构之取指译码发射——《GPGPU 芯片设计:原理与实践》节选陈巍谈芯:最新发布的壁仞GPU BR100参数深度对比和优势分析陈巍谈芯:被列入禁运的英伟达最先进H100 GPU架构深入解读

非鱼 LV

发表于 2025-4-9 13:26:23

从实际部署的情况来看,国内AI芯片里最强的是阿里平头哥,现在训练和推理都有A100的水平(实测),已经广泛应用于阿里内部的AI大模型训练和推理,替代N卡。
在OPENAI证明了聊天大模型的商业模式之后,估计阿里很快会拿出chatGPT类型的大模型出来,毕竟软硬件和模型都是现成的。
本来华为如果不受制裁的话,AI芯片算力水平应该至少不亚于阿里,可惜了,当然即便如此,华为用自己的过时工艺芯片训练的AI大模型搞得也不错,主要是企业和科研领域应用,模型规模跟chatGPT相当。
寒武纪现在投产的最高端芯片,我记得实测性能不到A100的一半,马上发布的下代产品号称达到A100的水平,但是国内跟他水平类似的AI芯片公司一大堆,技术和落地都没有优势。
百度昆仑芯不太了解,性能应该不太突出(跟国内同行比),估计也就寒武纪这水平。
另外值得一提的两家:
壁仞的BR104在MLPERF测试中,训练和推理都超过了A100的水平,BR100(BR104性能的两倍)预计应该是H100的水平,虽然壁仞上了美国制裁名单,但是现在其实还偷偷摸摸在台积电下单。
另一家是墨子芯片,这个属于技术剑走偏锋,用稀疏化计算AI大模型,以12纳米工艺就轻松在MLPERF中击败NV现在的4纳米旗舰H100,能耗比还更占优势。
这家应该是全球首家拿出落地的稀疏化计算芯片的公司,在AI大模型浪潮中,个人谨慎看好这家公司的前景。
总体来说,中国一流的AI芯片设计水平几乎跟NV没有差距,只是在台积电这块受限,和水军们意淫的啥chatGPT会让美国甩开中国相反,这类大模型国内一点都不弱,商业落地这块实际上领先美国,个人比较看好阿里和华为这种软硬兼备的巨头最终笑到最后。
chatGPT的价值其实最主要是商业模式走通了,算力对国内几家巨头根本不是问题,阿里和华为都不需要N卡去做AI大模型。
具体到寒武纪,它的AI芯片和生态在国内一众AI创业公司里并不具备特有优势,个人并不非常看好它们的前景,能分一杯羹是可以的,但是蛋糕不会分的很大。

您需要登录后才可以回帖 登录 | 立即注册