看到这个问题我不禁反思……我毕生追求的知识是啥嘞?
然后我蓦然发现,自从大模型诞生以来,我最感兴趣的知识就是大模型了。
遥想好几年前,那些研究浅层神经网络、支持向量机、随机森林的日子似乎已经很遥远;大模型出现之前的那些日子,研究兴趣已然转向了深度神经网络,探索各种DNN的结构,评估适用性,好玩又好水文章;大模型出现之后,哇塞,这东西太牛了,盘它!
所以我发现这个问题中提到的困扰,在我看来,一点都不是困扰,AI发展得越新越快,越能让我感受到多巴胺分泌的快感。
而且话说回来,目前的AI也就是一些常见架构,用海量的数据进行训练,“大力出奇迹”,得到了一个个看似神奇的大模型。
即使是让大家沸腾不已的deepseek,也只是极限挖掘了强化学习方法的有效性,证明了高效和省钱可以共存于大模型届。
我觉得deepseek研究报告中提到的“Aha Moment”(顿悟时刻),才是真正令人兴奋的事情,大模型似乎真的开始出现“自我意识”了?
之前的大模型就像是一个个擅长学习和背诵标准答案的优等生,通过学习海量的数据库知识,在面对人类的问题时,照本宣科的给出答案;deepseek让大家看到了一些新的希望,它不再背诵答案库,而是让模型完全依靠自己的探索来提升推理能力,就像一个孩子学习解决数学问题,一开始只会按部就班地套用公式。但有一天他突然顿悟了,不仅知道怎么解题,还学会了检查答案是否合理,甚至开始反思解题过程是否有更好的方法。
至于说所谓“毕生追求的知识”在AI面前是否有价值,这个担忧出现得太早了。
虽然模型的能力在不断提升,甚至开始隐隐出现真·智能,但是目前模型给出的答案仍然是不可尽信的,一本正经的胡说八道,然后正儿八经的真诚道歉,仍然是经常上演的戏码。
一个连自己名字里有几个e都会数错的大模型,我们怕它个锤子呢? |
|