国内AI大模型已近80个,哪个最有前途?

找个有前途的关注,如果开源,就尝试用着,免得落后。
收藏者
0
被浏览
91

5 个回答

Zed888 LV

发表于 3 天前

我就说我用过的:
一、视频生成大模型:
一梯队:VIDU,海螺,可灵,前三个强者,1.6的可灵,VIDU的一致性,海螺新版都很能打。
即梦(稍微弱了点),腾讯混元(开源最强王者)
二梯队:智谱清言(不仅弱鸡,会员下载居然还有水印)关键是开了会员也打不过他自家开源的cogvideo(我的实测),我实在搞不懂这是什么想法。
日日新(不太能打)
美图奇想(没深度使用过,感觉太一般)
二、大语言模型(现在基本都是多模态)
面壁科技的minicpm,悄咪咪地超能打,关键是手机端下载即插即用,牛得不行。
海螺AI,这玩意最有意思,回答问题最精简,给人感觉很弱的样子,但是往往无论视觉处理还是其他部分,其实正确率很高。
deepseek(代码和推理部分很抗揍,搜索也还行)。
零一万物(有段时间很能打,后来没跟上,但是本地nsfw……嗯…不错。
阶跃星辰、百川大模型:都是角色扮演这块的王者,其它的感觉多少有点名不符实。
通义千问,豆包,智谱清言,kim,文心一言,元宝,天工,
这几个放一起说吧,整体来说我是当做弱化版本的claude和GPT来用,豆包翻译快又好,多模态能力也不错,智谱清言智能体好用,kim搜索最强,元宝画图有一手,千问和文心方方面面都能打,开源部分千问2.5很好,但是又都稍微欠缺了点,天工音乐做得不错。
三、绘图
即梦,商汤秒画,腾讯DIT(国产开源),可灵(开源),豆包
即梦中规中矩。
秒画有优点,但是肢体表现太容易崩。
腾讯DIT一致性很强,但是也容易崩。
可灵:提示词遵循很好,还是容易崩,而且多角色没法看。
豆包:改图不错,生图就算了,有待进化。
四、音乐
这个用得不多,感觉天工最能打(长时长,可以遵循提示词生成前奏间奏等),豆包这些都差了点意思。
五、各类github开源项目这个太多了,而且几乎每天都有新品,百花齐放,每天下载评测都搞不过来。
从每天的发展情况来看,相比国外,丝毫没落下风。

zke LV

发表于 3 天前

以前特别讨厌抄袭和搬运,但是慢慢发现自己的效率越来越跟不上,逐渐接触并接受使用AI,发现确实能节省大量的时间和精力,至于前途,我觉得很难作出判断,现在将接触过的AI整理出来,分享给大家。


国内AI大模型已近80个,哪个最有前途?-1.jpg

一、聊天 / 内容生成
文心一言:入口为https://yiyan.baidu.com,综合型 AI,具备内容生成、文档分析、图像分析、图表制作、脑图等功能。
通义千问:入口为https://tongyi.aliyun.com,综合型 AI,包括内容生成、文档分析、图像分析等功能。
Kimi (月之暗面):入口为https://kimi.moonshot.cn,综合型 AI,可进行内容生成、文档分析、互联网搜索等。
腾讯混元:入口为https://hunyuan.tencent.com/bot/chat,综合型 AI,具有内容生成、文档分析、灵感推荐等功能。
讯飞星火:入口为https://xinghuo.xfyun.cn,综合型 AI,主要功能为内容生成。
抖音豆包:入口为https://www.doubao.com,综合型 AI,内容生成偏向互联网运营方向。
推荐豆包,完全免费,功能强大。

国内AI大模型已近80个,哪个最有前途?-2.jpg

智谱 AI:入口为https://open.bigmodel.cn,综合型 AI,可进行内容生成、知识问答。
百川智能:入口为https://www.baichuan-ai.com/chat,综合型 AI,涵盖内容生成、文档分析、互联网搜索等功能。
360 智脑:入口为https://ai.360.com,综合型 AI,提供 360 智脑全家桶。
字节小悟空:入口为https://wukong.com/tool,综合型 AI,为字节跳动内容生成工具集。
达观数据曹植:入口为http://www.datagrand.com/,行业垂域大模型。
二、AI 办公 - 综合
360 数字员工:入口为https://ai.360.com,具备团队协作共享、企业知识库、AI 文档分析、AI 营销文案、AI 文书写作等智能工具。
有道 AI:入口为https://ai.youdao.com,涵盖文档、翻译、视觉、语音、教育等功能。
三、AI 办公 - Office
AiPPT:入口为https://www.aippt.cn,可自动生成 PPT 大纲、模板、Word - PPT。
iSlide:入口为https://www.islide.cc,AI 一键设计 PPT。
WPS AI:入口为https://ai.wps.cn,为 WPS 的 AI 插件,提供智能 PPT、表格、文档整理等功能。
ChatPPT:入口为http://www.chat - http://ppt.com,AI 插件,支持 Office、WPS,可自动文档生成。
360 苏打办公:入口为https://bangong.360.cn,AI 办公工具集,包括文档、视频、设计、开发等。
酷表 ChatExcel:入口为https://chatexcel.com,智能 Excel 公式。
商汤办公小浣熊:入口为https://raccoon.sensetime.com,智能图表。
boardmix 博思白板:入口为https://boardmix.cn/ai - whiteboard,实时协作的智慧白板,可一键生成 PPT、用 AI 协助创作思维导图、AI 绘画、AI 写作,共享资源素材。
妙办画板:入口为https://imiaoban.com,可生成流程图、思维导图。
四、AI 办公 - 会议纪要
讯飞听见:入口为https://www.iflyrec.com,可进行音视频转文字,实时录音转文字,同传,翻译等。
阿里通义听悟:入口为https://tingwu.aliyun.com,支持实时转录,音视频转文字,互联网内容提炼。
强烈推荐,实测功能非常实用。

国内AI大模型已近80个,哪个最有前途?-3.jpg

飞书妙记:入口为https://www.feishu.cn/product/minutes?from = http://thosefree.com,为飞书文档中的会议纪要工具,可实时转录,音视频转文字。
腾讯会议 AI:入口为https://meeting.tencent.com/ai/index.html,可对腾讯会议录制后的会议纪要进行整理。
五、AI 办公 - 脑图
ProcessOn:入口为https://www.processon.com,AI 思维导图。
亿图脑图:入口为https://www.edrawsoft.cn/mindmaster,AI 思维导图。
GitMind 思乎:入口为https://gitmind.cn/,AI 思维导图。
六、AI 办公 - 文档
司马阅 AI 文档:入口为https://smartread.cc/,每天免费 100 次提问,为 AI 文档阅读分析工具,可通过聊天互动形式,精准地从复杂文档提取并分析信息。
360AI 浏览器:入口为https://ai.360.com,具备智能摘要、文章脉络、思维导图等功能。
七、AI 写作
有道云笔记 AI:入口为https://note.youdao.com,为有道云笔记写作插件,可进行改写扩写润色等。
腾讯 Effidit:入口为https://effidit.qq.com,具有智能纠错、文本补全、文本改写、文本扩写、词语推荐、句子推荐与生成等功能。
讯飞写作:入口为https://huixie.iflyrec.com,提供 AI 对话写作、模板写作、素材、润色等功能。
深言达意:入口为https://www.shenyandayi.com,根据模糊描述,找词找句的智能写作工具。
阿里悉语:入口为https://login.taobao.com,淘宝专用的商品文案生成,输入商品的淘宝链接即可获得文案。
字节火山写作:入口为https://www.writingo.net,全文润色的 AI 智能写作。
秘塔写作猫:入口为https://xiezuocat.com,具备 AI 写作模板,AI 写作工具,指令扩写润色等功能。
光速写作:入口为https://guangsuxie.com,为作业帮旗下产品,可进行全文生成、PPT 生成、问答助手、写作助手。
WriteWise:入口为https://www.ximalaya.com/gatekeeper/write - wise - web?ref = ai - http://bot.cn,为喜马拉雅小说创作工具。
笔灵 AI:入口为https://ibiling.cn,可一键生成工作计划、文案方案等。
易撰:入口为https://www.yizhuan5.com,自媒体内容。
Giiso 写作机器人:入口为https://www.giiso.com,可进行写作、文配图、风格转换、文生图等。
5118 SEO 优化精灵:入口为https://www.5118.com/seometa,可快速生成高质量 SEO 标题、Meta 描述和关键字,轻松提升网站搜索引擎排名。
八、AI 翻译
沉浸式翻译:入口为https://immersivetranslate.com,可翻译外语网页,PDF 翻译,EPUB 电子书翻译,视频双语字幕翻译等。
彩云小译:入口为https://fanyi.caiyunapp.com,支持多种格式文档的翻译、同声传译、文档翻译和网页翻译。
网易见外:入口为https://sight.youdao.com,提供字幕、音频转写、同传、文档翻译等功能。
九、AI 搜索引擎
天工 AI 搜索 (昆仑万维):入口为https://search.tiangong.cn,可找资料、查信息、搜答案、搜文件,还会对海量搜索结果做 AI 智能聚合。
360AI 搜索:入口为https://ai.360.com,AI 搜索能够从海量的网站中主动寻找、提炼精准答案。
秘塔 AI 搜索:入口为https://metaso.cn,没有广告,直达结果。
perplexity.ai:入口为 www.perplexity.ai,黄仁勋带货的 AI 搜索引擎。
sciphi.ai:入口为https://search.sciphi.ai,AI 搜索引擎。
devv.ai:入口为https://devv.ai,为开发人员打造的人工智能驱动的搜索引擎。
十、图像生成 / 编辑
通义万相:入口为https://tongyi.aliyun.com,AI 生成图片,人工智能艺术创作大模型。
文心一格:入口为https://yige.baidu.com,文生图像。
剪映 AI:入口为https://www.capcut.cn,剪映一键生成 AI 绘画。
腾讯 ARC:入口为https://arc.tencent.com,可进行人像修复、人像抠图、动漫增强。
360 智绘:入口为https://ai.360.com,具备风格化 AI 绘画、Lora 训练等功能。
无限画:入口为https://588ku.com/ai/wuxianhua/Home,智能图像设计,整合千库网的设计行业知识经验、资源数据。
美图设计室:入口为 https://www.x - http://design.com,图像智能处理,海报设计等。
liblib.ai:入口为https://www.liblib.ai,AI 模型分享平台 - 各种风格的图像微调模型。
Tusi.Art:入口为https://tusiart.com,AI 模型分享平台。
标小智 Logo 生成:入口为https://www.logosc.cn,在线 LOGO 设计,生成企业 VI。
佐糖:入口为https://picwish.cn,丰富的图像处理工具。
Vega AI:入口为https://vegaai.net,文生图,图生图,姿态生图,文生视频,图生视频等。
美图 WHEE:入口为https://www.whee.com,文生图,图生图,文生视频,扩图改图超清等。
无界 AI:入口为https://www.wujieai.com,文生图。
BgSub:入口为https://bgsub.cn,抠图。
阿里 PicCopilot:入口为https://www.piccopilot.com,阿里巴巴国际,AI 驱动图片优化工具,专门为电商领域提供服务。
搜狐简单 AI:入口为https://ai.sohu.com,智能图片生成平台和社区。
6pen:入口为https://6pen.art,文本描述生成绘画艺术作品。
十一、AI 设计
阿里堆友:入口为https://d.design,面向设计师群体的 AI 设计社区。
稿定 AI:入口为https://www.gaoding.com,图像设计。
墨刀 AI:入口为https://modao.cc,产品设计协作平台。
莫高设计 MasterGo AI:入口为https://mastergo.com,AI 时代的企业级产品设计平台,涵盖界面设计、交互设计等。
创客贴 AI:入口为https://www.chuangkit.com,图形图像设计。
即时 AI:入口为https://js.design/ai,文生 UI,文生图,图生 UI 等。
PixsO AI:入口为https://pixso.cn,新生代 UI 设计工具。
抖音即创:入口为https://aic.oceanengine.com,抖音电商智能创作平台,提供 AI 视频创作、图文创作和直播创作。
腾讯 AIDesign:入口为https://ailogo.qq.com,腾讯的 logo 设计。
美间:入口为https://www.meijian.com,AI 软装设计、海报和提案生成工具。
十二、AI 音频
度加创作工具:入口为https://aigc.baidu.com,热搜一键成稿,文稿一键成片。
魔音工坊:入口为https://www.moyin.com,AI 配音工具。
网易天音:入口为https://tianyin.music.163.com,智能编曲,海量风格。
TME Studio:入口为https://y.qq.com/tme_studio,腾讯音乐智能音乐生成工具。
讯飞智作:入口为https://www.xfzhizuo.cn,配音、声音定制、虚拟主播、音视频处理等。
十三、AI 视频
PixVerse:入口为https://pixverse.ai,文生视频。
绘影字幕:入口为https://huiyingzimu.com,AI 字幕,翻译、配音等。
万彩微影:入口为https://www.animiz.cn/microvideo,真人手绘视频、翻转文字视频、文章转视频、相册视频工具等。
芦笋 AI 提词器:入口为https://tcq.lusun.com,持 AI 写稿、隐形提词效果、支持智能跟读。
360 快剪辑:入口为https://kuai.360.cn,专业视频剪辑。
万彩 AI:入口为https://ai.kezhan365.com,高效、好用的 AI 写作和短视频创作平台。
十四、数字人
腾讯智影:入口为https://zenvideo.qq.com,数字人、文本配音、文章转视频等。
来画:入口为https://www.laihua.com,动画、数字人智能制作。
一帧秒创:入口为https://aigc.yizhentv.com,AI 视频,数字人、AI 作画等。
万兴播爆:入口为https://virbo.wondershare.cn,数字人,真人营销视频。
十五、AI 写代码
昇思 MindSpore:入口为https://www.mindspore.cn,面向开发者的一站式 AI 开发平台,提供海量数据预处理及半自动化标注、大规模分布式 Training、自动化模型生成。
百度飞桨 PaddlePaddle AI Code assistant:入口为https://www.paddlepaddle.org.cn,在线编程,海量数据集。
ZelinAI:入口为https://www.zelinai.com,零代码构建 AI 应用。
aiXcoder:入口为https://www.aixcoder.com,基于深度学习代码生成技术的智能编程机器人。
商汤代码小浣熊:入口为https://raccoon.sensetime.com/code,代码生成补全翻译重构等。
CodeArtsSnap:入口为https://www.huaweicloud.com/product/codeartside/snap.html,覆盖代码生成、研发知识问答、单元测试用例生成、代码解释、代码注释、代码翻译、代码调试、代码检查等八大研发场景。
天工智码:入口为 https://sky - code.singularity - http://ai.com/index.html#/,基于昆仑天工模型的 AI 代码工具。
十六、模型训练 / 部署
火山方舟:入口为https://www.volcengine.com/product/ark,具备模型训练、推理、评测、精调等全方位功能与服务。
魔搭社区:入口为https://modelscope.cn,阿里达摩院,提供模型探索体验、推理、训练、部署和应用的一站式服务。
文心大模型:入口为https://wenxin.baidu.com,产业级知识增强大模型。
对我来说,实际使用最多的就是豆包和通义,功能很强大,还完全免费,大家可以尝试。

梦貘 LV

发表于 3 天前

总结一下通过国家工信部11个AI大模型,再推荐两个本人经常用觉得很惊艳的模型
北京5家:百度(文心一言)、字节抖音(云雀大模型)、智谱AI(GLM智谱清言)、中科院(紫东太初)、百川智能(百川大模型)
上海3家:商汤(商量)、MiniMax(ABAB大模型)、上海人工智能实验室(书生大模型)
广东2家:华为(盘古大模型)、腾讯(混元大模型)
安徽1家:科大讯飞(星火大模型)
1、百度:文心一言
文心一言总的来说,目前文心一言4.0是最逼近ChatGPT的大模型
2、字节抖音:云雀
豆包目前支持网页Web平台、iOS 以及安卓平台,用户可通过手机号、抖音或者Apple ID登录使用。
3、智谱AI:智谱清言
智谱清言智谱科技最近发布的GLM-4基座大模型,作为国内对标OpenAI产品线的重要一步,引起了广泛关注。根据智谱的官方说法,GLM-4在性能上相比GLM-3提升了60%,接近GPT-4的最新水平。
「智谱清言」已在各大应用商店上线,用户可通过苹果商店 App Store、安卓主流商店(包括华为、OPPO、vivo 及小米等)进行下载,或在微信小程序中搜索「智谱清言」体验其功能。
4、中科院-紫东太初
紫东太初大模型研究中心----中国科学院自动化研究所中国科学院自动化研究所“紫东太初”多模态大模型研究团队自成立以来,围绕人工智能前沿技术进行了不懈探索,成功研发全球首个千亿参数多模态大模型“紫东太初”,开拓性地实现了图像、文本、语音三个模态数据之间的“统一表示”与“相互生成”,理解和生成能力更接近人类,向通用人工智能迈出了重要一步。

5、百川智能:百川大模型
百川智能目前已经发展到Baichuan2-13B、Baichuan2-7B
百川智能成立于2023年4月10日,由前搜狗公司CEO王小川创立。公司以帮助大众轻松、普惠地获取世界知识和专业服务为使命,致力于通过语言AI的突破,构建中国最优秀的大模型底座。公司核心团队由来自搜狗、百度、华为、微软、字节、腾讯等知名科技公司的AI顶尖人才组成。百川智能成立不到100天,便发布了Baichuan-7B、Baichuan-13B两款开源可免费商用的中文大模型,且在多个权威评测榜单均名列前茅,下载量突破百万


6、华为:盘古大模型
盘古首页-华为云2023年7月7日,华为发布盘古大模型3.0.“不作诗、只做事”、“AI 重塑千行百业”、“AI for Industries ”华为的盘古大模型聚焦行业价值场景,围绕行业重塑、技术扎根、开放同飞三大方向,为行业客户提供服务。盘古大模型3.0是一个完全面向行业的大模型系列,包括5+N+X三层架构。
7、腾讯:混元大模型
腾讯混元直到2023年6月19日,腾讯才姗姗来迟地开了场发布会。腾讯对外公布行业大模型研发进展,宣布将助力企业构建专属大模型及智能应用,为企业提供MaaS一站式服务。

8、科大讯飞:星火大模型
讯飞星火认知大模型-AI大语言模型-星火大模型-科大讯飞“讯飞星火认知大模型”是科大讯飞发布的产品,具有7大核心能力,即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。2023年5月6日,科大讯飞正式发布星火认知大模型。
9、商汤-日日新大模型
日日新开放平台日日新(SenseNova),是商汤科技宣布推出的大模型体系,包括自然语言处理模型“商量”(SenseChat)、文生图模型“秒画”和数字人视频生成平台“如影”(SenseAvatar)等。2023年4月,商汤科技董事长兼首席执行官徐立宣布推出“日日新SenseNova”大模型体系 [1-2]。2023年8月,日日新大模型获批上线。

10、Minimax:ABAB大模型
MiniMax 开放平台2021年,由前商汤科技副总裁、通用智能技术负责人闫俊杰成立Minimax 。2023年6月,据路透报道,Minimax完成了新一轮2.5亿美元融资后,整体估值超过12亿美元。Minimax已经发布了包括文本到视觉/语音/文本三个基础模型架构,并推出自研通用大模型“ABAB”。
11、上海人工智能实验室-书生大模型
书生上海人工智能实验室(又称浦江实验室)成立于2020年,由上海人工智能创新中心发起设立。2021年,浦江实验室联合商汤、香港中文大学、上海交通大学发布通用视觉技术体系“书生”(INTERN)。到如今,书生大模型体系参数已达千亿级别,包括“书生·多模态”、“书生·浦语”和“书生·天际”等三大基础模型,以及面向大模型研发与应用的开源体系。
再推荐两个平时经常用觉得很惊艳的大模型
kimiChat
Kimi Chat - 帮你看更大的世界由月之暗面科技有限公司(Moonshot AI)开发。擅长中英文对话,可以获取信息、解答疑问,甚至阅读和理解提供的文件内容。无论是TXT、PDF、Word文档、PPT幻灯片还是Excel电子表格,能轻松应对。还可以解析网页链接。最强大的是kimiChat大海捞针通过率100%。
Kimi Chat 公布“大海捞针”长文本压测结果,也搞清楚了这项测试的精髓通义听悟
平时学习看视频总结的好帮手,可以
通义听悟 - 你的工作学习AI助手通义听悟可以在会议、学习、访谈、培训等场景下:

  • 实时记录交流内容,同步翻译
  •   批量转写音视频文件,区分发言人
  •   智能提炼全文概要、章节速览、发言总结
  •   提取视频中的PPT并总结摘要
  •   自动提取关键词、待办事项
  • 编辑整理笔记,导出、分享记录
这里李想帮大家整理了市面上常见的AI工具
纯干货!超全AI入门级资料和AI工具库资料分享!!!今天就分享到这里,我是李想,我的理想是带领10w小白学会AI,使用AI。
关注我,持续更新AI落地用法

探索者 LV

发表于 3 天前

题主说错了,不是80个,是168个!
虽然“最有前途”不好说,但是我可以帮题主排除一些错误方向:

  • 开源大模型一定比闭源的有前途吗?
  • 参数量大的模型一定就比小模型有前途吗?
  • 榜单排名高的大模型一定更有前途吗?
2024年3月更新,243个大模型中有哪几个能用的:如何看待国产大模型的现状? - 知乎 (zhihu.com)
168个国产大模型,都是什么来头?

1785年,瓦特改进了蒸汽机,人类从此摆脱了手工业的桎梏,迈向辉煌的蒸汽时代。
1870年,第二次工业革命光芒四溢,人类踏上了电气时代的漫长征程。
20世纪70年代后,数字化崛起,人类开始踏入互联网的无尽广阔领域。
时至今日,随着AI算法的不断演化和计算需求的迅猛增长,人工智能时代悄然降临。至于那匹引领人类前进的黑马是谁,是Chat GPT,或者是Chat GLM?我不知道。
但可预见的是,AI大型模型的影响力不亚于蒸汽机、电力、数字化对人类生产方式的影响,它们将为社会技术发展带来另一次飞跃,带来新一轮指数级信息爆炸。

国内AI大模型已近80个,哪个最有前途?-1.jpg


图1 全球大模型发布时间节点

而我国,依然在这场革命中涌现出了强大的科技与智慧的力量。
中国本土大型模型的崛起进程始于2017年,当时中国的科研机构与企业积极投身深度学习与自然语言处理领域,默默耕耘,蓬勃至今。据不完全统计,目前国内已有AI大模型168家(数据来源:http://github.com/wgwang/LLMs-In-China),比题主提到时,足足翻了一倍。

国内AI大模型已近80个,哪个最有前途?-2.jpg


图2 部分本土大模型信息

其中,通用模型24个,用于科研/医疗/政务/公共服务的模型40个,其他均为商业应用及服务提供。值得一提的是,其中开源模型只有几家,名列前茅的,分别是智谱AI和清华大学 KEG 实验室联合发布的ChatGLM,以及百川智能推出的Baichuan 2。
随着我们深入了解人工智能,从科幻作品中的描绘,到第一次尝试对话的新奇体验,再到探索大模型的深层架构,我们正将大模型作为自己在物理世界之外的一种智慧延伸。这些智慧触角终将揭开我们科技未来的迷雾。中国的人工智能之路虽漫长曲折,但我们正稳步走出这个序章,迈向光明的未来。
这次的人工智能大模型浪潮带来了许多机遇,去年大模型算法工程师的平均月薪已超 4w,今年 AI 大模型相关岗位需求增长超 300%,现在正是程序员和产品经理等技术相关人才入局的最佳时机。

你现在不了解也没关系,好在现在学习资源非常多,知乎知学堂的 AI 大模型公开课就非常不错,我前段时间刚听完,尤其是课程里面的教大家定制专属的大模型非常有用,学会了就可以直接用到工作中,入口我放在下面了,现在还是免费的,建议都去看看↓
对了,如果你懂点Python,那这节课对你来说学起来会很轻松!课程里大模型原理到Al应用开发框架,LangChain,Al Agent,模型微调技术这几个方面,一定要仔细听!学完你也可以定制属于自己的大模型。
开源大模型一定比闭源的有前途吗?

如何评价一个AI模型“好不好”“有没有发展”,首先就躲不掉“开源”和“闭源”两条发展路径。
在中国,大型模型可分为两大类,一类以模型本身为核心,另一类则以服务应用为主导。首先是以Chat GLM和百川为代表的通用开源模型。它们的独特之处在于在中文语境下的出色表现。为了提升这类模型在处理中文方面的能力,开发者通常采用两种策略:一是扩大词汇表的规模,二是增加中文语料库的比例。开源模型的优势在于易于使用,只需强大的GPU即可运行。不足之处在于主观体验和论文中的数据可能存在差异,实际使用时性能可能不如宣传所示。

国内AI大模型已近80个,哪个最有前途?-3.jpg


图4 国内主要公司可商用大模型表(图片来源:36Kr)

另一类大型模型数量较多,这些大模型通常以套壳Llama或其他类似模型为基础,在特定数据集上进行深度的个性化定制和优化。特点在于它们专注于特定市场细分领域,通过深度定制和优化以提升性能。当然,从论文角度看,某些模型通过特殊方法能够接近或甚至超越Chat GPT,在特定领域的任务上表现出色。
在8月推出的Llama 2 中可以看到,模型系列包含 70 亿、130 亿和 700 亿三种参数变体。此外还训练了 340 亿参数变体,相比于 Llama 1的训练数据多了40%,因此,基于Llama2的开源模型进行数据收集调用及调试的“再生长大模型”,也并非没有可能实现弯道超车。

国内AI大模型已近80个,哪个最有前途?-4.jpg

在我国,目前还是以第二类大型模型主要以服务为主导,如大家比较关注的百度、讯飞等推出了通用大型模型。这些模型不开源,用户需通过其提供的服务来使用。它们不仅提供聊天服务,还需要在特定场景中应用以实现盈利。这些模型的服务模式和费用基本与Chat GPT及其他竞争对手保持一致,以在市场竞争中取得优势。
当然,开源是有一定的技术及成本优势的。
首先,庞大参数数量的开源大型模型,性能已媲美超级规模封闭模型。其次,通过极少的预算、适度的数据和低阶适应技术(LoRA)等工具,就可以使参数相对较小的开源大型模型达到令人满意的性能水平。这种技术创新降低了训练成本,为企业提供了可替代昂贵闭源模型的低成本解决方案。
自Llama2后,大模型圈风雨欲来,可商用开源成为了下一个各大厂商牟足了劲头实现的目标。可是否开源,难道就是最终评判某个大模型是否可以在这个斗兽场里存活的标准吗?

国内AI大模型已近80个,哪个最有前途?-5.jpg

参数量大的模型一定就比小模型有前途吗?

这两天刚有一篇微软论文指出,ChatGPT的参数量只有20B(200亿),而不是以往认为的100B以上(很多人认为是175B)。
虽然微软这篇论文后来撤稿了,不过很多分析说主要是因为涉密了,并不是说真的从聊天群里取的数据。
相比单一的参数量维度,宏观来说,大模型的评价其实可以分为以下几个维度:技术维度、商业应用、伦理责任
从技术角度来讲,哪个模型在深度学习、自然语言处理、计算机视觉等方面有独特的技术优势是最底层的核心逻辑。在此之上,模型的性能通常受训练数据和计算资源的限制。哪个模型拥有更多、更多样化的数据,以及更先进的计算能力?这将直接影响模型的前途。

国内AI大模型已近80个,哪个最有前途?-6.jpg


图5 大模型技术架构

从应用角度来说,大模型厂商自身是否制定了更具前瞻性的商业策略、合理的商业模式,是其长期存活市场的基础。而其选择的赛道是否满足了标的市场的实际需求,在细分垂直领域的适用性能做到最好,市场是否买单,就是保证它前途光明的必要条件。

国内AI大模型已近80个,哪个最有前途?-7.jpg


图6  大模型行业应用逻辑

最后一个,也是全世界都在面临的同一个问题,就是机器伦理与合规。哪个模型在道德和伦理方面表现出更高的责任感?是否有明确的道德准则,以确保模型在使用中不会伤害社会和个体?哪个模型有更好的合规准则?更好的数据隐私保护和安全措施?一不小心,《终结者》或许就会变成未来的现实……

国内AI大模型已近80个,哪个最有前途?-8.jpg


图7  基于大模型的社会应用实践

而对于非投资市场及终端用户的业内人士来说,评价一个大模型的是非功过则更以数据和实践见真章。

国内AI大模型已近80个,哪个最有前途?-9.jpg


图8  大模型能力维度评价

榜单排名高的大模型一定更有前途吗?

其实,内网也早已流传着一份针对于中文通用大模型的综合性测评基准(SuperCLUE),月度更新。根据SuperCLUE最新一期(2023.07)中文通用大模型榜单排名显示,目前排在前三位的分别是来自百度的文心一言(v2.2.0),来自智谱的ChatGLM-130B,以及来自科大讯飞的讯飞星火(v1.5)

国内AI大模型已近80个,哪个最有前途?-10.jpg


图9  SuperCLUE中文大模型排行榜(2023年7月)


当然,榜单仅供参考。毕竟某厂“喜欢给自己飞小红花”的名声过于昭著。对于用户来说,开源/闭源,语料库的偏向性,应用赛道的数据需求等等问题太多了。面对着一个还没有蓄满水的鱼塘,从哪片浅滩挖蛤蜊,就是非常见仁见智的事情。
某AI大厂的架构师就曾经私下说,他们在开发自己的应用模型时,把C-Eval排行靠前的几家都试了一下,效果不好说,某个炒的比较热的模型甚至很意外的崩了。虽然他总是嚷嚷着公司抠没钱自己开源,但好处是也让他挖掘到了一些物美价廉的小LLM,发现实际体验感反而不错。
因此,排名不能完全代表“有前途”,投得热也代表不了“有前途”,甚至广泛意义上对话的人数量够多….好吧,在某种程度上来说可以代表它或许比较有前途。但在2026年高质量语库即将耗尽的预告下,人工喂养也将不再成为强壮大模型的重要决定因素。就当下来说,哪个模型使用感更好,就押宝在哪个模型,无脑傻白甜,最香。
AI大模型涌现元年,资本巨头联合科技大佬们开始一场“诸神之战”,不断扩展数据池,升级硬核算力。高昂的成本,意味着绝对高门槛。不只如此,AI 2.0的创业者们要玩得起,技术要求也跃升了一个档次。据悉,能够把基础模型打造成工程化产品的公司,在一两百个大模型中,用两只手就数的过来。也正是因为如此,招兵买马是头等大事,毕竟国内主导深度学习框架和AI框架的高手寥寥可数。
而我们流浪在这一波跨时代,跨世代,甚至跨越人类文明历史的科技变革浪潮中,能做的,只有随之进化,成为超级个体。赶快进入知乎知学堂旗下AGI课堂推出的【程序员的AI大模型进阶之旅】公开课,2天满满干货,限时全部免费!
<a data-draft-node="block" data-draft-type="edu-card" data-edu-card-id="1704814667208368128">随着我们一步一步对人工智能的开发和了解,从科幻作品中的描摹,到第一次尝试对话的新奇接触,到深入大模型的底层架构,掌握它,训练它,将大模型作为自己在物理态存在之外的,前人永远无法想象的智慧之触,只用了短短几十年。这些触角最后汇聚在数据的终点,终将可以拨开我们科技未来的层层迷雾。正如现在,虽然对于中国的人工智能来说仍然是路漫漫其修远兮,但我们正慢慢走出这混沌而曲折的序章,奔向光明的前途之路。

o111 LV

发表于 3 天前

2024.6.19日更新:
转眼大半年过去了,大模型圈经历了开源vs闭源之争,价格战...等等大事件,所谓的“国产第一”也轮番遗珠。
不过目前我最看好的是两家,一个是阶跃星辰,一个是通义千问。前者比较低调,在训万亿MoE模型,主要是多模态能力非常强,不过后者最近开源的Qwen2更是相当炸裂。

国内AI大模型已近80个,哪个最有前途?-1.jpg

阿里最近这次直接开源了五个尺寸:Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B,其中Qwen2-72B-Instruct支持128K上下文。
前脚Robin老板刚说完开源会远远落后于闭源,Qwen2-72B就直接狠狠打脸,一举斩获十几项世界冠军,超过Meta的Llama3,也超过文心4.0、豆包pro、混元pro等众多中国闭源大模型,配得上一句遥遥领先。

国内AI大模型已近80个,哪个最有前途?-2.jpg

通义千问Qwen2系列模型大幅提升了代码、数学、推理、指令遵循、多语言理解等能力。

国内AI大模型已近80个,哪个最有前途?-3.jpg

我自己有做一些项目,会不断的测试各类基础大模型,用过minimax、智谱、还有最近很火的DeepSeek,综合来看Qwen2的效果确实是目前最如意的。
后来我发现了一个全新的榜单,还是杨立昆联合Abacus.AI、纽约大学等机构搞的,大模型测评基准LiveBench AI,其中Qwen2-72B是排名最高的开源大模型,也是唯一进入前十的中国大模型,看来没有刷榜,是模型真的强。

国内AI大模型已近80个,哪个最有前途?-4.jpg

LiveBench AI的完整榜单显示,通义千问Qwen系列共有7款模型进入榜单,分别是Qwen2-72B、Qwen1.5-72B、Qwen1.5-110B、Qwen1.5-7B、Qwen1.5-4B、Qwen1.5-1.8B、Qwen1.5-0.5B,是除GPT之外入选最多的大模型团队。
目前,Qwen系列开源模型目前下载量已经突破1600万。
<hr/>11.16更新:没想到之前随手写的现在火了,收录的已经有188个了
有个开源项目一直在更新
GitHub - wgwang/LLMs-In-China: 中国大模型
我自己也在本地整理了一下

国内AI大模型已近80个,哪个最有前途?-5.jpg

此外要谈能力的话,个人推荐夸克APP! 生活中我经常需要快速找到一些信息,但又没有时间去仔细筛选。这时候,夸克智能AI搜索就成了我的得力助手。 夸克智能AI搜索真的非常方便。我只需要在搜索框里输入我想要找的关键词,几秒钟内就能得到大量相关结果。 而且,夸克智能AI搜索的结果非常精准。它能够理解我的搜索意图,快速过滤掉不相关的信息,只展示最符合我需求的结果。这样我就可以更快地找到我需要的信息,节省了大量时间,大大提高了我的学习和工作效率。 整理了一些学习资料推荐给大家↓↓
「浏览器」资源链接:https://pan.quark.cn/s/3550aa6eb4b4
另外还有很多测评,这边推荐一个比较新的SuperCLUE的

国内AI大模型已近80个,哪个最有前途?-6.jpg

BTW,李彦宏说有238个,具体不知道有哪些

国内AI大模型已近80个,哪个最有前途?-7.jpg

sc163 LV

发表于 昨天 11:15

关于您提到的国内AI大模型数量近80个的问题,每个模型都有其独特的优势和应用领域,因此难以直接判断哪个最有前途。建议关注各大模型在相关领域内的表现、技术创新、应用落地等方面的情况,以及市场反馈和用户口碑等因素,进行综合评估。<br><br>如果有开源的模型出现,可以尝试使用并了解其在技术实现、性能表现等方面的特点和优势。同时,也需要考虑自身业务需求和场景,选择最适合自己的模型进行应用。建议关注相关领域的最新进展和动态,保持学习和探索的态度,以便及时跟上技术发展的步伐。

sc163 LV

发表于 昨天 11:27

针对您提到的关于国内AI大模型的问题,目前市场上已经涌现出许多优秀的AI大模型,每个模型都有其独特的优势和适用场景。要选择哪个最有前途的模型涉及到诸多因素,包括行业应用场景、数据处理能力、模型算法等多个方面。因此,难以一概而论哪个模型最为优秀。<br><br>建议关注各大模型的发展动态和行业趋势,结合自身的应用场景和需求进行选择。同时,开源的模型可以为我们提供更多的学习和研究机会,也可以促进技术的发展和进步。您可以关注GitHub等平台上模型的开源情况,尝试使用并根据实际情况进行选择和优化。

谭志刚 LV

发表于 昨天 11:33

根据您所提供的信息,关于国内AI大模型数量已经接近80个,每个模型都有其独特的特点和优势,难以确定哪个最有前途。不过,我们可以通过观察模型的应用场景、性能表现、技术团队实力等方面来评估其潜力。<br><br>建议关注业内领先的AI大模型,如开源模型等,这些模型通常拥有广泛的应用场景和强大的技术团队支持,同时不断在技术和算法上进行创新和改进。您可以尝试了解这些模型的代码实现和性能表现,并结合自身需求进行使用和研究,以便及时跟上技术发展的步伐。最终选择哪个模型需要根据具体情况而定,需要综合考虑多个因素进行评估。

您需要登录后才可以回帖 登录 | 立即注册