自ChatGPT在2022年底登场以来,AI领域如同突破了奇点,几乎是以天为单位飞速发展。新产品不断涌现,本公众号也发表了多篇剖析文章。继年初大放异彩的Sora之后,最近AI领域再度迎来了一位耀眼的新星——Kimi。资本市场上的“Kimi概念股”因此风起云涌,股价接连涨停,Kimi的用户数量更是如火箭般飙升,如下图所示(数据来源:非凡产研)
那么,什么是Kimi,它和其他的大模型产品有什么区别,它的创始团队有何过人之处,具体它和哪些公司有关联,Kimi的崛起对于AI行业的发展意味着什么,我尝试继续用“三分钟读懂”的风格,结合最近公布出来的信息,做一些解读。
答:和ChatGPT、Claude、Gemini、文心一言、讯飞星火这样的产品类似,Kimi是一款面向普通用户(C端)的智能助手,旨在提供高效的信息查询和对话服务。它的访问网址是:https://kimi.moonshot.cn/,目前也提供了手机端,可以从各大应用商店下载“Kimi智能助手”(注意具体名称,防范各种李鬼):
答:开发Kimi的公司,叫做“月之暗面”,英文名是“Moonshot AI”。创始人杨植麟博士在访谈中提到,他认为通用人工智能(AGI)的开发,就如同当年的登月计划(Moonshot),需要全人类的共同努力。”月之暗面“一词,来自于团队很喜欢的专辑Pink Floyd的《Dark Side of the Moon》。Kimi,就是杨植麟的英文名。
答:乍看起来,Kimi和其他的C端大模型产品非常类似,用户们已经有点审美疲劳。但是实际使用起来,会有明显的感受,即它的文件理解、内容撰写、数据分析方面,有其独到之处。
虽然目前Kimi没有支持流行的多模态(生成图片、视频)、插件(plugin)和智能体(Agent)功能,但是反倒显得更加专注,因为大部分用户对这些额外功能并没有高频刚需。
目前Kimi引起广泛关注的特点,是支持”长文本“,即能够消化大量的内容,和用户进行持续的交流。这里面涉及到的概念,就是”context window“,即人机对话时,AI需要记住用户输入的文字或者文件内容,并给出相应的答复,简单来说,就是”记忆力“是不是够强。Kimi目前支持200万字,意味着它可以读完用户上传的一个几百页的报告或者书籍,并对这份报告加以总结,或者回答用户问题。
杨博士在访谈中也提到,”长文本“只是一个阶段性的功能,其实质是实现AI的记忆能力(大模型成为电脑的内存),为未来实现AGI奠定基础。
例如下面,我让Kimi总结黄仁勋最近的一个演讲,它几乎没有任何等待地输出了演讲的主要内容:
另外,在结尾处,它还提供了一些围绕演讲内容的辅助问题,让用户可以持续学习:
支持的文本越长,能够消化的报告、书籍就越长,给用户带来的冲击力无疑越明显,这是Kimi在近期引起广泛关注的重要原因。
在Kimi大火之后,阿里、百度也都纷纷推出了对于500、1000万文本的支持能力,但是我实际对比了一下,目前看来Kimi的效果还是略胜一筹。(参见我的实际对比,点击阅读原文可以访问)
根据我的体会,如果您经常需要总结文件/网页内容、阅读大量报告,或者撰写一些不是特别强调创造性的内容(例如总结、报告、计划、信件等),Kimi的使用体验非常好,而且可访问性和响应速度方面也远远由于国外同类产品。
- Kimi在技术上有什么特点?为什么可以做到比较好的”长文本“能力?
答:实现“长本文”,需要具备足够的指令检索能力和复杂的数据流处理能力。对于中文而言,还需要有大量优质的中文训练数据(语料)。
- 文本越长,对参数要求越高。Kimi与GPT一样基于Transformer架构,参数大约2000亿。Kimi会找出长上下文中有哪些关键点,分配相应的权重,再用内部算法(例如独创的文本编码方式)去优化搜索能力。简单来说,自有模型性能足够好。
- 在中文处理能力上,训练的数据量大概4-5T,全是中文。数据工程团队找了一些用户(创作、自媒体领域)进行一些训练语料的创作,这属于独有数据。这条路径和OpenAI类似,在语料方面需要投入真正的成本。在其他语言上,目前显然不如国外产品,也不是Kimi目前关注的重点。
- 交互的拟人性和逻辑推理方面,Kimi整体上落后于ChatGPT和Claude,实际使用会有感觉,但是跟国内其他产品比并不逊色。
- 我知道大模型开发、训练和推理,都需要大量的算力,Kimi是怎么解决算力问题的?
答:根据目前公开的信息,Kimi的算力平台使用的是字节的火山引擎云算力平台,硬件以英伟达GPU为主。没有自己建立数据中心。
目前的算力,足以支撑400-500万用户。事实上因为Kimi的火爆,已经进行了多次扩容。团队也计划在这个用户量级逐渐启动商业化。
Kimi最近已经启动了对C端、B端用户的API接入公测,网址是 https://platform.moonshot.cn/docs/api-reference:
可以预见,随着越来越多B端用户开始访问,Kimi的算力消耗将会指数级增长(不只是算力,也包括云服务的运维和调度资源投入)。
答:Kimi本月的日均新增用户已经达到了24万人左右,目前还是免费提供服务。也启动了API的接入公测。
另外有数据统计,目前Kimi的日活跃用户数已达100万人(60万在小程序,34万在网页端,还有5万在App端),且留存率持续上涨。其App端的下载量(效率类应用免费榜)也已经从2月的百名开外,挤进前十,仅次于豆包(抖音AI智能助手)和文心一言。
融资方面,今年2月,月之暗面逆势完成一笔大额融资。据了解,它以15亿美金投前估值完成超10亿美元B轮,8亿美元来自新股东(阿里、小红书等),2亿美元为老股东跟投(红杉中国、砺思资本等)。美团龙珠曾领投该公司上一轮融资。
该笔交易完成后,月之暗面投后估值约25亿美元——由此,它成为中国大模型赛场上现阶段估值最高的一家独角兽。
答:创始人杨植麟博士本科毕业于清华计算机系,博士就读于全美自然语言处理排名第一的卡内基梅隆大学语言技术研究所(LTI),师从苹果公司人工智能负责人Ruslan Salakhutdinov。曾在ICLR、NeurIPS、ICML、ACL、EMNLP等顶级会议发表论文二十余篇。
杨植麟与导师Ruslan Salakhutdinov(右)、William Cohen (左)合影目前团队整体100-200人,其中技术(包括算法专家、系统专家、数据工程团队等)人员加起来120人左右。其他包括产品开发团队和企业客户商业化团队。最核心技术人员为20-30人。
- 目前资本市场上很多”Kimi概念股”,到底哪些是真得跟Kimi有关的?
答:根据东方财富网的报道,主要是这么几家(仅为转述,未经核实):
- 深信服:间接参股
- 华策影视:已经接入Kimi API
- 人民网:Kimi训练数据的核心合作方和审核方
- 海天瑞声:为Kimi提供数据训练服务
- 掌阅科技:接入Kimi API
- 九安医疗:参股
答:根据团队访谈介绍,Kimi未来主要向三个方向努力:
- 继续扩大参数规模:参数量越大,文本的处理长度也会随之提升。同时,调用的神经元网络更丰富,幻觉的问题进一步减少。
- 2024年推出多模态功能:做产品化应用,推出各种插件(其实我个人希望不要做得太杂,就把对话做好就很好)。
- 文本处理能力继续增长,而且速度会很快,希望文本处理超越亿级(即1亿个中文词)。
答:我在之前的文章中,介绍了ChatGPT之后的各种事件和技术演进。在Kimi面世之前,普遍的观点是国外做创新,国内做应用(再加一句:欧洲做监管)。因为国外大模型目前对于国内用户都设置了限制,在访问上会相当困难。
如果你用过国内的一些主流的大模型产品,再比较一下国外产品,你可能都会有种“勉强可以用,但是远远达不到预期”的感觉。
Meta的LLama 2开源推出之后,大幅度降低了国内开发各种AI应用的难度。我们一度以为,国内企业只能在垂直行业应用、本土化训练语料方面做点微雕工作。但是,Kimi的出现,让我们看到了国内自创大模型方面依然可以达到一定的高度,甚至在迈向AGI方面,可以从“长文本”角度,走出独立路径的可能性,让我们对国内AI行业的发展,又燃起了希望。
请关注我,持续带来科技领域的最新见解和分析。也欢迎感兴趣的朋友,加入我的读书、创业社群“爱思会”,年费499元,添加微信frankiecui。 |
|