寒武纪的ai芯片在国内属于什么水平？

寒武纪的ai芯片在国内属于什么水平？

发表于 2025-4-9 12:39:47

很高的水平。
卖一台信创ai服务器200万，可以拿其中50-100万做客情关系，拿其中20万买一台英伟达来解决兼容性问题，如果真的需要用，那可以拿其中1000元充值deepseek，跑到冒烟都用不完。

发表于 2025-4-9 12:49:45

玩过mlu 370，小模型时代还行，有完善软件/ai框架/model studio，性能也还不错，但非cuda兼容，大模型时代cnnl跨机通信都没打通，人才都跑光了……都快成空壳了，但是股价新高。

发表于 2025-4-9 13:02:05

现阶段最强的国产AI芯片毫无疑问是升腾910C：2die的910B做出来的一个大概H800水平的单卡。这就给寒武纪的AI芯片提供了一个良好的参考，毕竟都是国产。
如果直接“虚空对虚空”可以有个数据：

思元590大概达到了升腾910B的性能，升腾910B一般认为是A100的0.8-1.1倍（取决于优化）。升腾910C则是2die 910B，传言是H800的水平。
单卡性能其实倒在其次，毕竟适当的堆料就可以提升性能。但问题是AI芯片不只是AI芯片还需要配合一堆东西，例如华为的atlas：

这是单机，如果是集群的话还要：

需要有HCCS互联，英伟达是收购了mellanox才有的，华为是自己就做交换机所以也自己弄，到集群这个级别需要的东西还是很多的。
升腾的集群，华为提供的有：

8卡升腾910（自主可控工艺）
2颗鲲鹏920
HCCS互联
欧拉linux系统
mindspore、pytorch等框架

我们搜一下寒武纪官方文档就知道，寒武纪做的画风是：

寒武纪MLU370（台积电工艺）
海光/兆芯/intel/amd的x86 cpu
英伟达mellanox互联
centos/ubuntu等linux发行版
pytorch、google tensorflow等框架

考虑到兆芯性能较低，海光不容易买到，实际上寒武纪应该是主要依靠intel、amd的x86体系的。

其中互联的部分看文档介绍应该是英伟达的mellanox：

我们可以得出结论：

目前寒武纪主力产品使用台积电工艺，受制于管理办法性能上限被卡
寒武纪配套的CPU仍然存在一部分问题，不过海光应该是能用的，兆芯的kh40000也许也可以用
互联方案依赖英伟达的mellanox
软件部分还有一定差距

总的来说，寒武纪目前的AI芯片和国内领先的华为差距较大，考虑到现阶段的大模型需要集群，周边配套差距更大。寒武纪缺乏英伟达的财大气粗+自由收购，也缺乏华为的历史积累+研发宽度，想要补齐这些周边配套还存在较大的困难。

发表于 2025-4-9 13:15:40

陈巍谈芯：感觉这个问题的回答下面，有些不太了解芯片行业内情的人写的回答，过于误导大众。
误导1）寒武纪水平不行？作为寒武纪的潜在竞争者，我不会给寒武纪唱赞歌。寒武纪管理水平我不了解，不评论，但是寒武纪每年的专利申请量，都是实实在在的可观数字。相比之下本问题下某个高赞回答推荐的某家做稀疏化芯片的公司，烧了投资人几个亿，核心专利寥寥无几。寒武纪自己有稀疏化专利反而不用，难道是寒武纪或者他们的客户傻吗？把个别家抬到寒武纪前面难免有广告嫌疑。至少在我眼里，同为中科院出身的两位陈老师是踏踏实实做技术的，不是媒体上一言不合就PR自己干过NV或者拿个客户很少用的MLPERF给投资人看。
在指标上干过NV又怎么样呢，行业里懂行的就知道一定会被老A搞黑名单，还不如缓称王积累实力。对于“做的好又大肆宣扬自己能干过NV的&#34;，我和行业里资深的都不是太理解某些家“早死早投胎”的策略啊。

来源：陈巍

误导2）国内大模型到底怎么样？这个你们有条件的自己试一试对比下就知道了。没必要这么自信商业落地能力。那些过度自信的大概不是自己做大模型的。自信和自傲，只有一字之差，但是一个会形成努力做事，另一个大概只会导致闭门造车。如果没有国内爸爸们护着，不知道大家有没有这种自信。
误导3）中国的一流AI芯片设计水平跟NV几乎没差距？本身国内做AI芯片的有走AI专用芯片的，也有走GPGPU芯片的，不同的产品路线本来就不适合放在一起做比较。不能拿市级短跑冠军前10秒比奥运长跑运动员跑得快，就说市级一流跑步水平比奥运长跑冠军强。
要跟NV比水平的话，最好用GPGPU去做同类比较。另外也要看看NV多少GPU专利，多大资本和研发人员体量。过于乐观的话，反而容易闭门造车。

想了解行业的，可以看看以下文章：
陈巍谈芯：GPT-4核心技术分析报告（2）——GPT-4的技术分析（收录于GPT-4/ChatGPT技术与产业分析）陈巍谈芯：GPT-4模型特征与训练信息最新解读（收录于GPT-4/ChatGPT技术与产业分析）陈巍谈芯：ChatGPT发展历程、原理、技术架构详解和产业未来（收录于GPT-4/ChatGPT技术与产业分析）陈巍谈芯：3（上） GPGPU流式多处理器架构之取指译码发射——《GPGPU 芯片设计：原理与实践》节选陈巍谈芯：最新发布的壁仞GPU BR100参数深度对比和优势分析陈巍谈芯：被列入禁运的英伟达最先进H100 GPU架构深入解读

发表于 2025-4-9 13:26:23

从实际部署的情况来看，国内AI芯片里最强的是阿里平头哥，现在训练和推理都有A100的水平（实测），已经广泛应用于阿里内部的AI大模型训练和推理，替代N卡。
在OPENAI证明了聊天大模型的商业模式之后，估计阿里很快会拿出chatGPT类型的大模型出来，毕竟软硬件和模型都是现成的。
本来华为如果不受制裁的话，AI芯片算力水平应该至少不亚于阿里，可惜了，当然即便如此，华为用自己的过时工艺芯片训练的AI大模型搞得也不错，主要是企业和科研领域应用，模型规模跟chatGPT相当。
寒武纪现在投产的最高端芯片，我记得实测性能不到A１００的一半，马上发布的下代产品号称达到A１００的水平，但是国内跟他水平类似的AI芯片公司一大堆，技术和落地都没有优势。
百度昆仑芯不太了解，性能应该不太突出（跟国内同行比），估计也就寒武纪这水平。
另外值得一提的两家：
壁仞的BR１０４在MLPERF测试中，训练和推理都超过了A１００的水平，BR１００（BR１０４性能的两倍）预计应该是H１００的水平，虽然壁仞上了美国制裁名单，但是现在其实还偷偷摸摸在台积电下单。
另一家是墨子芯片，这个属于技术剑走偏锋，用稀疏化计算AI大模型，以１２纳米工艺就轻松在MLPERF中击败NV现在的4纳米旗舰H100，能耗比还更占优势。
这家应该是全球首家拿出落地的稀疏化计算芯片的公司，在AI大模型浪潮中，个人谨慎看好这家公司的前景。
总体来说，中国一流的AI芯片设计水平几乎跟NV没有差距，只是在台积电这块受限，和水军们意淫的啥chatGPT会让美国甩开中国相反，这类大模型国内一点都不弱，商业落地这块实际上领先美国，个人比较看好阿里和华为这种软硬兼备的巨头最终笑到最后。
chatGPT的价值其实最主要是商业模式走通了，算力对国内几家巨头根本不是问题，阿里和华为都不需要N卡去做AI大模型。
具体到寒武纪，它的AI芯片和生态在国内一众AI创业公司里并不具备特有优势，个人并不非常看好它们的前景，能分一杯羹是可以的，但是蛋糕不会分的很大。

寒武纪的ai芯片在国内属于什么水平？

本周热门