阿里未来三年将加大投入三大 AI 领域,对其发展有哪些影响?
2月20日,阿里巴巴集团CEO吴泳铭在2025财年第三季度财报分析师电话会上表示,面向未来,阿里巴巴将会继续专注于三大业务类型:国内外电商业务,AI+云计算的科技业务,互联网平台产品。未来三年,该集团将围绕AI这个战略核心,加大投入三大领域:AI和云计算的基础设施建设;AI基础模型平台以及AI原生应用;现有业务的AI转型升级。 AI和云计算的基础设施建设?快算了吧,阿里云裁了一大堆人,降本增效得厉害。本人老家是电力资源的富集地区,往年的双十一,几乎半个运营商的数据中心和网优部门,以及当地1/3左右的干部,都会直接驻守阿里巴巴的服务器,生怕电力通信之类的有什么闪失
结果2023年以后,阿里的人大幅减少,而且态度也大不如前
阿里云崩溃次数明显增多,这还是在软件行业快速发展,异地容灾到处都是的情况下。
在经济下行的情况下,阿里没有重点发力二手鱼,反而去重点投资未来不明朗、资源消耗巨大的项目,明显是高管捞钱的思维 阿里一直的风格,隔三差五出来通稿发满,公关做满,特别高调的做事,做后经常虎头蛇尾。
希望这次真能做成事吧 看到25年预期资本开支1500亿。和字节差不多。庞大的资本开支会推高整个产业链的景气度。但更关心的是大厂的人员扩张情况。在如此庞大的资本开支下,不搞大跃进是不可能的。
阿里股价从80已经接近翻倍。但还处于早期阶段。第一阶段,估值修复接近完成。 阿里的淘宝天猫电商零售业被拼多多围剿得太狠了,如果一直没有新的增长点,眼看就要寄了,去年甚至一度出现过市值被拼多多短暂反超。。
前段时间爆火的DeepSeek通过免费提供o1级别的推理模型,直接让全球用户体验到了推理模型的强大魅力,有了这一个突破口,随之而来的就是全世界各大厂的推理模型推出热潮,先是OpenAI免费开放了o3-mini,再是这两天马斯克发布的Grok3基座和相应的推理模型,这下是阿里来冲击刷榜推理模型了。
DeepSeek 思维链展示的是真实思考过程吗?还是为了更像人类思维而展示的呢?从国内整个互联网的市值带动方面看,自从DeepSeek 火出圈后,直到今天,恒指上多少中概股被带动大涨,中国的互联网科技公司之前被华尔街严重低估,现在逐渐价值回归,同时也让全世界认识到我们本土科技公司和人才的实力。
前几天有新闻统计,随着DeepSeek这波点燃AI热潮,过去一个月,全球对冲基金以数月来最快速度涌入中国股市,推动在岸与离岸市场总市值增长超1.3万亿美元。
恒指科技直接从4100一路涨到了今天的最高点5800,交易量也明显上来了:
至于阿里的大模型能力,我之前在答案中回答过,推理模型的效果好很大一部分要取决于训练所用的基座模型,
DeepSeek R1推理模型效果非常好的最大原因,应该是因为DeepSeek 在训练R1-zero的时候,强化学习是在v3基座上进行的。DeepSeek-v3作为强大的基座模型,语言理解和生成能力极强。
于是,用强大的模型基座能解决RL训练采样效率低的问题,(有点类似于最早alphago,有pre-training的先验知识),基座模型v3生成质量足够高的思维链,避免我们在强化训练中常见的探索维度爆炸但rewards 信号没办法稳定上升并收敛的问题。
另外就是被讨论最多的R1-zero在RL训练过程中,随着训练steps的增加,其在训练集上的平均响应长度逐渐增加,表明其自然学会在推理任务中花费更多思考时间,从而提高解决复杂任务的能力。
所以,除了思维链每一步的质量,长度问题也很关键,随着训练步数的增加,思维链长度也是稳步上升,就能生成更复杂的推理过程,而正是因为基座模型足够强,思维链的长度同时被rewards 信号鼓励增加,形成正反馈,从而获得很好的效果。
甚至,推理模型有了显著的self-evolution, 即随着test-time computation的增加,产生了反思reflection、探索解决问题的替代方法,以及经常被提到的“Aha Moment”等Agent behavior(这里可以参考我在文末放的另一个回答“智能的本质是什么”),这些行为都是模型作为RL Agent与强化学习环境相互作用的结果。
欢迎大神科普:《关于DeepSeek 的强化学习,为什么强化学习RL对LLM推理能起效? 》?董不懂在摸鱼:如何区分不同大模型、兼谈快思考和慢思考而Qwen2.5-Max与Sota基座大模型DeepSeek V3、GPT-4o 和 Claude-3.5-Sonnet等的性能对比结果如下图,可以看出来指标上都是高于DeesSeek V3(但这不一定表示推出的推理模型一定各方面都优于DeepSeek R1,还有很多其他因素)。
于是市场上的期待更高,股价便开盘就涨到了这个程度。。
就在昨晚阿里美股上直接跳空高开涨了12%,更逆天的是看看底下交易量,这才刚开盘就远超之前全天的交易量。。
当然除了前段时间座谈会信心鼓舞,主要原因一个是业绩超预期,另一个关键就是阿里的大模型和未来持续对AI的投入,给市场带来了不少期待。
为什么AI大模型容易误认为strawberry里有2个r? 说个宏观的问题。
2021~2022年我说中概股、恒生科技这些股票,触底反弹大致有几个阶段。
第一个阶段是估值见底,也就是情绪见底。
有印象的朋友还记得,那会儿三天两头来个天降铁拳,过段时间又被美国搞。外资迅速流出,估值迅速下降。
等到了2022年下半年那会儿,情绪差不多就见底了,阿里、腾讯、拼多多这些,大概都是膝盖斩的水平。
那个时间段甚至有人都在提——这几位别回头被分拆了吧。
当然,估值见底也不是立刻反弹,可以观察到对这些公司估值信心的回升,2024年初以前并不明显。
从特别有信心到没信心,又经历了1年多时间的信息低迷,然后去年初才弹起来。
中概、恒生科技这中间也是一波三折,但底部逐渐太高。
第二个阶段是基本面触底。
2021年的宏观经济背景下,确实对这些巨头的基本面有影响。当然了,对他们来说并不是业绩下滑,而是增长放缓。
大概在2023年的时候,我观察到了一些企业基本面也触底了。
那会儿知乎上很多人谈到了互联网大厂的“降本增效”,有人失业、有人收入下滑,还有的热搜是关于员工福利下降的。
财报上的数据显示,这些巨头2023年的业绩确实有起色,收入端还是艰难,但是各类利润率明显变好看了。
只不过业绩触底,和估值触底一样,也经历了1年多时间低位徘徊。
去年下半年,科技巨头们反弹比较快,今年2月份又开始加速,这里估值回升还是占了很重的比例。
阿里、B站这些企业最近的财报看,今年这些公司有挺大机会继续改善业绩。
形成估值和业绩的双击。
当然,我自己不是追高型投资者,这些持仓都是前两年买的,现在要做的就是继续拿着,把这个大周期做完再说。
有人说,我这个踏空了咋整。
如果科技巨头业绩回升,其实也反映经济基本面的逐渐回暖。
之前有些行业从去年9月以来,表现也不咋样,如果相信整体趋势,可以埋伏埋伏。
比如消费,比如我一直说的地产。
就几个月周期的投资来说,最好别扎堆。AI今天都和“娃娃”做联动了,这会儿再说我要搭车,就算了吧。
2025年还是继续做多中国的资产,只是快点慢点的问题。
有那个能力搏杀、冲浪,就搞大科技的主线;没那个能力,那就埋伏。
(当然,我还是建议避开抱团的那些板块,里面想出来的人太多了,稍微涨涨抛压就很大。)
页:
[1]