三等公司卖苦力,二等公司卖软硬件,一等公司卖协议。——我刚入行的时候就听前辈这么说,事实上这么多年下来看到业界盛衰欺负都遵循这个规律。
NVIDIA通过CUDA加强了硬件的垄断地位,事实上也是在卖协议,但要说NVIDIA地位牢不可破,那也未必。
AI的技术栈生态像下面这张图一样,是分层的。
CUDA起到的就是一个承上启下的作用,对上支持PyTorch/TensorFlow这样的AI框架,对下把GPU硬件的计算能力包装成算子(operator),理论上,开发一个AI框架不用CUDA,当然不用NVIDIA的GPU也完全做得到,但是,无论CUDA还是GPU都是NVIDIA投入多年的积累,想要短时间做出超越者其中任何一个都不大可能。
更重要的是,CUDA和NVIDIA实际上互为犄角之势,你去做一个CUDA的替换品,跟不上NVIDIA自家CUDA跟得上自己GPU的节奏;你去做一个英伟达GPU的替代品,跟不上NVIDIA的CUDA对AI框架的支持。
而AI框架的生态也有很多人,这些人也不傻,他们知道成熟的技术更可靠,你的CUDA替代品没有CUDA成熟,他们就依然会优先使用英伟达的CUDA,你的CUDA替代品也就得不到发展机会,当然也没法挑战英伟达的地位。
这就是一个逃不出的死循环。
所以,如果要打破NVIDIA对生态的垄断,只有一条路,就是——降低GPU成本。
因为,虽然AI生态喜欢成熟的技术,但是他们更爱省钱。
AI圈里其他的玩家都在烧钱,钱都让英伟达赚去了,天下苦英伟达久矣!
这时候,如果有一家能够做出算力和英伟达差不太多的GPU,都不用一样强,只要差不多在一个档次,但是价格远低于英伟达,那就造成很高的性价比,这样AI生态自然会跟着来。
打破英伟达垄断的,看起来不像是AMD,苹果倒是有希望,当然,某些遥遥领先的厂商也有可能。
此外,英伟达的CUDA发展到现在有一个劣势,就是CUDA支持的是AI框架,而AI框架目前需要的算子基本上趋于收敛,没有更多算子需求了,也就是说,对于CUDA进一步功能需求不强烈了,所以焦点依然是硬件GPU上。
最终,打破英伟达垄断还是要靠降低GPU硬件成本,提高硬件性价比。 |
|