24.02.08 我心中的排行榜:
1. 智谱
2. DeepSeek
3. 华为
4. Yi
5. 面壁智能
6. 百川
7. 阿里
8. Moonshot
。。。
但是如果问今年谁会有大突破,我一定押字节跳动,第二华为
今年不会还是LLM的时代
<hr/>5.6 你们一群人不服我说DeepSeek强,现在看看呢?
64选6 MoE, long context选用的Multihead Latent Attention(我也不知道是啥,但能干到128k也挺厉害。开源里long context只有phi3-mini-128k和command-r)
DeepSeek 之前唯一的短板是数据。Math7b出了基本就补上了
<hr/>6.20 DeepSeek Coder v2怎么说?GPT4o级的数学代码模型,还有人质疑吗?现在天下比他显著强的应该只有还没发布的GPT5和谷歌内部的gemini math。
当初前八里除了不该加百川,基本都是对的。
快手和抖音里,我还是押抖音 |
|