星月喜品工坊 LV
发表于 2025-4-7 14:53:51
grok3把英伟达的股价拉上来了,只能说老马一切为了股票,只要故事讲得好,嘻嘻哈哈没烦恼。
----------
直接省流:现在Grok3每天有25次免费的提问次数,随便测试了一下,感觉Grok3不开思考模式就有点笨,肯定没ds的R1好用。
测试初等数论的基础问题经常错,但开思考模式后却做对了。
逻辑问题普通模式下做对了,开了思考模式反而错了。
翻译方面更是个神人。Grok3普通版,思考模式,深度搜索模式都一般般。基本都是音译,这个翻译水平基本和一年前的模型差不多。
AI不是算力竞赛
个人觉得算力对ai大模型的影响,以及人类科技发展到一定程度之后,科学继续发展的速度;
都会出现异常强烈的递减效应——即投入的时间越来越多,成本愈来愈多;而得到智力提升和发展速度的比例,却会越来越少。
只一味的只堆算力搞agi(通用人工智能),就像只加强大脑营养,并用头脑风暴式的思考进行不间断训练,用暴力将一个智商120的人硬拔到160,甚至是将一个160智商的人,玄学拔高到200。过程粗暴,追求的结果荒谬,必然会呈现出极大的递减效应。
<hr/>本来以为20w张卡能养出什么怪物,没想到是拉了坨大了。虽然说堆算力确实不是最佳方案,可现在看来那边也没别的方法了。
Grok3发布会上真是统计学魅力时刻,差距4%统计图做出来好像差了1/3,经典的统计图欺骗。
AI工具简单好用是最重要的
跑分测试等等终归是做给人看的,关键是这个工具实际效果怎么样。
比如说Claude,我现在就是DS的R1做plan然后Claude3.5做act写代码。结构质量很高,代码质量也很高。但是Claude3.5稍微贵一些,如果不想花钱可以用deepseek r1,一样可以做act,效果没得说。
普遍一点简单一点的,还有各种处理文档报表ppt这类的工具,实用性直接拉满,不知道怎么用AI的人也容易上手。像迅捷AiPPT,写下你的ppt主题要求,选个喜欢的模板后,它不仅大纲帮你写好,整份ppt也会给你整理排版出来。
还有最近讨论度一直很高的deepseek,虽然不知道为什么大家用来算命比较多,但不能否认确实是简单还好用。深度思考功能可以准确理解要求,不用太复杂的提示词也能上手用好。当然懂得自己弄提示词的话效果也会更好,关键还是打开网页就能直接免费用。
现在来看不管是“性能最强”还是“限时免费,”大概率就是吸引眼球的消息,Grok系列模型真那么好用大家也不会只知道GPT了。
大家想要的,是能更好帮助人进行生产、生活、劳动的AI工具;而不是单纯聪明得像人,甚至变成新人类,取代热人类的ai。ai首先应该只是工具,至少ai必须先成为工具,再成为“人”。 |
|