目前国内的AI模型已经近100个商厂,主要以百度,阿里,腾讯,华为为主
比如,一些模型可能在自然语言处理方面表现出色,而其他模型可能在图像识别或多模态任务上表现更好。
从去年开始,就已经风起云涌了
A阿里的“通义千问”4月7日开始企业内测
华为的“盘古”大模型4月8 日亮相
商汤科技4月10日带来了“商量SenseChat”
还有科大讯飞的“1+N”和昆仑万维的“天工大模型”也紧跟其后!
这场面就像是别管行不行,反正你有我也得有!
百度文心一言
目前百度的文心一言大模型,其文心大模型我们接触的居多,其涵盖基础大模型、任务大模型、行业大模型的三级体系,打造大模型总量约40个,产业应用也较为广泛,例如电力、燃气、金融、航天等,构建了国内业界较大的产业大模型。
除了有:文心一言、AI作画应用、文心一格外,还和工业、能源、金融等多个行业领域企业,共同打造了11个行业大模型
举个例子
文心4.0的文案创作能力可谓是空前绝后,我让其这一片500字的科幻小说,结果可想而知,故事很
还可以帮助用户写周报日报,比如让其写1000字的周报
图片生成,比如我们输入提示词:未来科技的大宇宙,产生的效果还是非常可以的
虽然生成图片的能力还是有待于提高,但作为国内第一家基于中文内容开放的 AI 人工智能产品,百度至少走在前列
配置了一些强大的插件,我体验了一把感觉还比较有意思
你只需要在文心界面找到“选择插件”,而后点击、下拉,就能选择心仪的插件啦。选择插件后,在输入框内直接输入,就能得到回答,不用跳转界面。
腾讯的混元模型
其完整覆盖NLP大模型、CV大模型、多模态大模型、文生图大模型及众多行业、领域任务模型,自2022年4月,先后在MSR-VTT、MSVD等五大权威数据集榜单中登顶,实现跨模态领域的大满贯,目前,推出了HunYuan-NLP1T大模型并登顶国内权威的自然语言理解任务榜单CLUE。
借助更先进的大模型作为评委,通义千问团队在两个广泛使用的基准 MT-Bench 和 Alpaca-Eval 上对 Qwen1.5 进行了初步评估,评估结果如下:
聊天模型在人类偏好上的显著性能提升;基础模型与聊天模型均支持多语言;所有尺寸模型均稳定支持32K上下文长度
我们来考考它,v它一个2023年全国高考语文作文全国甲卷看看实力:
在腾讯文档中,新建智能文档,按下"/"键,就可以快速调出混元大模型进行文本生成:
看,是不是很有帮助?
目前越来越多的人都在生活,工作中使用这些工具了,能偶有效的减轻工作量,可谓生的上是一个完美的助手,比如当学习者在网络上很难搜索到自己想要的代码实现时,不妨可以尝试使用类gpt的工具来帮助书写代码,这可以帮助学习者在学习的时候节省时间。
此之外,由于近年来机器学习的热度不减,很多优秀的开发者、平台、学者、学校、自媒体都或多或少地发布一些公开课程。这些课程五花八门,涵盖的范围也很广,学习者们可以在互联网上寻找自己合适的课程进行学习。像答主自己也是经常在知乎上找一些课程去学习,这里给大家推荐「知乎知学堂」联合「AGI课堂」推出的【程序员的AI大模型进阶之旅】公开课
公开课的课程是免费的而且只有2天,大家不妨一试。这次特邀圈内技术大佬全面解读前沿技术,帮大家成为AI技术革新下更大的收益者,恰好可以和上面介绍的AI辅助工具相结合。
阿里:通义大模型
通义大模型基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。QWen支持1.8B、7B、14B、72B、VL等多种参数规模的模型。截止到24年2月16日;
通义千问也支持图片理解
不错不错,理解能力感觉比其他大模型要好很多,完全分析了是属于头像类型。
华为
阿里更重技术,例如M6大模型基于阿里云、达摩院打造的硬件优势,可将大模型所需算力压缩到极致
另外其底层技术优势还有利于构建AI的统一底层。
国内的这几家我都体验过,各有各的特色,都是国产先行梯队,表现最好的是百度文心一言,虽然很OpenAl有一些差距,但对中文的理解可能是更能做好本土化。
所以,面对AI的百花齐放,你看好哪一个呢? |
|