国内做AI最好的是百度还是字节?

国内做AI最好的是百度还是字节?
收藏者
0
被浏览
61

5 个回答

ues6858 LV

发表于 4 天前

绝对是阿里的通义千问,现如今chatglm和百川最新的模型都不再同步开源版本,只有通义千问还在积极的开源,而且72b的模型效果出类拔萃,基本不落后于那些线上大模型。
所以我无条件的点赞支持阿里。另外百度的文心我付费深入研究过,效果并不突出,就算免费给我用我都不选他 。

如果 LV

发表于 4 天前

24.02.08 我心中的排行榜:

1. 智谱
2. DeepSeek
3. 华为
4. Yi
5. 面壁智能
6. 百川
7. 阿里
8. Moonshot
。。。
但是如果问今年谁会有大突破,我一定押字节跳动,第二华为
今年不会还是LLM的时代
<hr/>5.6 你们一群人不服我说DeepSeek强,现在看看呢?
64选6 MoE, long context选用的Multihead Latent Attention(我也不知道是啥,但能干到128k也挺厉害。开源里long context只有phi3-mini-128k和command-r)

国内做AI最好的是百度还是字节?-1.jpg

DeepSeek 之前唯一的短板是数据。Math7b出了基本就补上了
<hr/>6.20 DeepSeek Coder v2怎么说?GPT4o级的数学代码模型,还有人质疑吗?现在天下比他显著强的应该只有还没发布的GPT5和谷歌内部的gemini math。
当初前八里除了不该加百川,基本都是对的。
快手和抖音里,我还是押抖音

梅雨潭 LV

发表于 4 天前

我个人比较习惯用qwen,也就是阿里的通义千问,主要是查资料,写论文,报告什么的多。说下用过的几个感受:
文心:6花钱,放弃
chatgpt3.5/4:不想天天挂个VPN,不续了
glm4:长上下文的指令遵循和幻觉很成问题,多几个指令就不听话了,而且老是给插入莫名其妙的内容。放弃
海螺问问:其实效果还行,特别他的语音还蛮不错的。但是生成速度慢,界面难看,而且语音不是我的强需求。放弃
3.9补充,minimax有融资传闻,去试了下他们的abab6,效果还行,幻觉问题比较少,润色功能也行,就是数学推导能力明显比其他的差,让推导elbo生成的公式就没几个能用的。还有就是这家公司真就直接上了api调试界面,没有模型的使用网页(海螺问问那个应该不是6,输出效果差不少),用起来真难受。
kimichat:也是会出现幻觉问题,而且只有在很长文档的时候,他才能体现出特色,我单次没有上百页的文档需要处理。放弃
3.9补充下,最近kimi有大融资,我又去试了下,发现还是会出现幻觉问题,就是自己给补充文章里不存在的知识。而且还发现了个很奇怪的现象,kimi应该是针对摘要或者综述专门训练过,我给他一段文字混合公式让他更改为latex格式或者润色的时候,输出会吞掉很多的解释性句子并对其他句子进行压缩,输入越多越明显,比如3000token的句子让润色,最终输出也就不到2000。同样的prompt在qwen和glm上都没有出现过。
总体来说:
现在的版本能提高效率,但解决不了什么核心问题。
哪怕是最好的模型,写出来的摘要和翻译都是一坨,总结的时候不伦不类的,技术特点,创新点,一个写不出来。
文生图拟人语音什么的就是耍玩意,形成不了多少生产力。考数学倒是有点生产力,但高中生都没有的数学水平有啥用。
3.9补充,目前elbo唯一推导没有问题的,是用英文询问gpt4(中文也是有问题,主要体现在公式解读和log-likelihood那块)
写个测试代码和脚本还行,但凡复杂点,我改bug的时间都比我自个写的时间多。基本上就当半个百度使。
一句话:百科大全版的张雪峰。
多说些,现在大模型评测建议增加多轮次指令遵循的权重,稍微麻烦点的问题就不是一两次指令能够搞定的。国产的现在有个趋势是打榜没输过,实战没赢过,独立的问个问题还行,针对同一个问题多次细化,就忘了自个之前说的啥开始胡编了,也不知道是为啥。

伊阳进 LV

发表于 4 天前

一定是字节,百度的尿性,从来都是起一个大早,赶一个晚集,从来都是,风风火火的要搞,搞到一半就要撤了,无论是大模型,还是各种 AI,还是短视频,还是移动端布局(14-15 年)
你看,自动驾驶搞这么久,放了个响屁了吗?哪家新能源跟他合作了?
利益相关:  前百度资深工程师
<hr/>2025.1
之前极越的事情都看见了吧,合作的车就这样了…

然后是他的大模型?自认为中文第一?结果

国内做AI最好的是百度还是字节?-1.jpg

别夜郎自大了

希哦那个台 LV

发表于 4 天前

肯定是字节
传闻张一鸣已经挖到openai高级员工,在新加坡秘密入职了
这位openai的高华,也是敢裤裆里掏鸟枪群射的狠人,因为对奥特曼商业手段不服,而且openai也有意压制高华,所以在张一鸣的鼓动下,决定借助字节的财富重新成就一套新的大模型
很快,借助内部消息,字节所有内部各个研发团队的大模型都逼近gpt4,至少moe起来肯定超越gpt4了,并且海外字节的研发团队,会诞生gpt5的字节特有大模型,而且成本无限压低,人家还闷声发大财,吹都不吹。
到时候,大家就会看到,你时常生活闲聊的一句话就能刷到15秒相关的ai自动剪辑视频,并且自由融合广告的新内容形态
目前所谓ai智能搜索,故意用阉割产品和轻量化大模型缓存结果,都是根据搜索内容,强制置顶的,只是为了探索用户对AI生成内容的响应态度,一旦ab探测出市场需求发生剧烈变化,看到市场机会。
抖音会立马上线字节特有对标gpt5原型,而且是video级别的多模态超级模型,以后剪辑电影,本地生活,美女跳舞,都是你一句话而已,地理位置,生物需求,手机聊天的,语音等的记录,而且可以利用大模型消除各个输入的显著特征,让人无法追踪这是否被偷取信息。
以后做短视频的,基本只是为大模型风格化做模板而已

您需要登录后才可以回帖 登录 | 立即注册