少看知乎多读书 LV
发表于 2025-4-9 13:02:05
现阶段最强的国产AI芯片毫无疑问是升腾910C:2die的910B做出来的一个大概H800水平的单卡。这就给寒武纪的AI芯片提供了一个良好的参考,毕竟都是国产。
如果直接“虚空对虚空”可以有个数据:
思元590大概达到了升腾910B的性能,升腾910B一般认为是A100的0.8-1.1倍(取决于优化)。升腾910C则是2die 910B,传言是H800的水平。
单卡性能其实倒在其次,毕竟适当的堆料就可以提升性能。但问题是AI芯片不只是AI芯片还需要配合一堆东西,例如华为的atlas:
这是单机,如果是集群的话还要:
需要有HCCS互联,英伟达是收购了mellanox才有的,华为是自己就做交换机所以也自己弄,到集群这个级别需要的东西还是很多的。
升腾的集群,华为提供的有:
- 8卡升腾910(自主可控工艺)
- 2颗鲲鹏920
- HCCS互联
- 欧拉linux系统
- mindspore、pytorch等框架
我们搜一下寒武纪官方文档就知道,寒武纪做的画风是:
- 寒武纪MLU370(台积电工艺)
- 海光/兆芯/intel/amd的x86 cpu
- 英伟达mellanox互联
- centos/ubuntu等linux发行版
- pytorch、google tensorflow等框架
考虑到兆芯性能较低,海光不容易买到,实际上寒武纪应该是主要依靠intel、amd的x86体系的。
其中互联的部分看文档介绍应该是英伟达的mellanox:
我们可以得出结论:
- 目前寒武纪主力产品使用台积电工艺,受制于管理办法性能上限被卡
- 寒武纪配套的CPU仍然存在一部分问题,不过海光应该是能用的,兆芯的kh40000也许也可以用
- 互联方案依赖英伟达的mellanox
- 软件部分还有一定差距
总的来说,寒武纪目前的AI芯片和国内领先的华为差距较大,考虑到现阶段的大模型需要集群,周边配套差距更大。寒武纪缺乏英伟达的财大气粗+自由收购,也缺乏华为的历史积累+研发宽度,想要补齐这些周边配套还存在较大的困难。 |
|