AI大模型,哪个最好用?

AI大模型,哪个最好用?
收藏者
0
被浏览
132

6 个回答

天狼啸月 LV

发表于 5 天前

我有个github项目,收集了1000个大模型相关的优秀的项目,希望对你有帮助。https://github.com/CoderSJX/AI-Resources-Central

ldf007 LV

发表于 5 天前

先说应用场景,我平时主要用大模型做一些论文解读、论文复现,或者代码debug的活,从目前个人体感来说,效果最好的是openai新出的o1 pro mode,其代码debug的效果和精确度是要超过我之前最常用的claude的。

  • 代码能力对比: OpenAI 最新推出的 O1 Pro Mode 在代码调试方面的表现相当不错,其准确度和效率都超过了我之前常用的 Claude。主要是它的思维链。O1 Pro Mode 能够构建非常长且完整的思维过程,同时保持输出的连贯性。特别是在需要处理大量文本和代码的场景下,它几乎不会出现上下文遗忘的情况。相比之下,Claude 在处理特别长的上下文时,会明显感觉到知识衔接存在一些断层。
  • 专业能力对比: Claude 最大的亮点在于其 Project 功能。这个内置的 RAG 系统非常实用,提供专业背景信息后,其回答的专业度和针对性都会显著提升。不过,RAG 系统的特点决定了它更适合进行局部信息检索。也就是说,当问题能够准确匹配到相关知识时,效果确实很好。但如果需要调用全面的背景知识,比如根据论文原文构建代码时,Claude 的表现就不如 O1 了。其生成的代码一般会与较多错误,需要更多的调试时间,而且每次交互能够利用的上下文信息也明显少于 O1。
  • 文本写作对比: 不过在文本写作方面,Claude 的优势则比较明显。它生成的文本更加自然,很少会出现机器味道,这一点要优于 OpenAI 的产品。
总的来说,两个模型各有所长:O1 Pro Mode 在代码处理和长文本理解上更胜一筹,而 Claude 则还是擅长自然写作。但从目前来说,我是逐渐从claude切到o1上了

胖六传奇 LV

发表于 5 天前

AI大模型排行榜:

截止到2024年12月29号,AI大模型排行榜第一梯队是Gemini-Exp-1206,Gemini-2.0-Flash-Thinking-Exp-1219,ChatGpt-4o-latest(2024-11-20),o1-2024-12-17
OpenAI和谷歌的AI大模型的能力不分伯仲。

AI大模型,哪个最好用?-1.jpg

对比下,为什么谷歌aistdudio是当前最好AI大模型伙伴

使用费用:

OpenAI免费用户可以无限制使用GPT4o-mini模型,GPT-4o是有次数限制,包括文件上传、数据分析、图片生成都是有次数限制,一般是一天就几次的使用次数。
OpenAI想要访问到o1模型,以及较多次数的gpt-4o模型至少要升级到plus会员,20美元一个月

AI大模型,哪个最好用?-2.jpg

谷歌的aistdudio几乎是免费的,比如Gemini-2.0-Flash-Exp模型,每分钟最多10个请求,每天最多1500个请求,常规使用基本是用不完的。

AI大模型,哪个最好用?-3.jpg

并且就算是魔法上网,OpenAI识别到是中国的IP,大模型会变傻,网页访问谷歌的aistdudio就不会。
谷歌赢一分。

Temperature参数设置:

先说明temperature参数是什么:
大模型的温度(temperature)是一个控制模型输出的随机性和创造性的重要参数。温度值会影响模型生成文本的方式,范围通常在 0 到 1 之间,有时可以设置为更大的值。
1. 低温度(如 0.1 或 0.2):
输出更确定、更保守。
模型会倾向于选择概率最高的词或路径。
适合需要准确性和一致性的任务,如代码生成、数学计算或需要结构化答案的问题。
2. 高温度(如 0.8 或 1):
输出更随机、更有创造性。
模型会更倾向于探索概率较低的词或路径。
适合需要创造力的任务,如写诗、故事、广告文案。

chatgpt相关的模型是不能设置temperature参数的

AI大模型,哪个最好用?-4.jpg

谷歌的模型是可以设置temperature参数的,相对来说可控程度更高。

AI大模型,哪个最好用?-5.jpg

谷歌再赢一分。

API调用:

GPT-4o模型的API价格如下:每百万token要好几美元。

AI大模型,哪个最好用?-6.jpg

谷歌的gemini1.5的API,有限次调用是免费的。
谷歌再赢一分。

取消OpenAI的plus会员订阅:


AI大模型,哪个最好用?-7.jpg

附录:

查看AI大模型排行榜网站:
Just a moment...openai的API价格查询:
https://openai.com/api/pricing/

知乎用户2vuuUT LV

发表于 5 天前

如果光从能力,老王一定把 2024 最佳和 2025 最值得推荐大模型奖,颁给 Claude。
但奈何,封号严重,很多同僚都放弃了买会员,因为时不时给你封一下,记录丢失外加那种天上地下的感觉,实在很差。
但其实还有一个免费又相当好用的。那就是谷歌的 AI Studio 产品。
现在基本在生产环境就是用的这款产品,产生的内容质量过关,而且还每天赠送大量的 Tokens,基本是用不完。
每天一工作就是打开熟悉的网页,现在直接推出渐进式Web应用(PWA) 版本了,说白了就是一种使用 Web 技术来构建,但是可以拥有原生 App体验的技术,让应用使用起来更丝滑。
如何安装

PWA 技术让浏览器能像原生应用一样添加到主屏幕,这样大家就能像打开App一样打开应用了,但本质上还是一个网页。

  • 电脑桌面端
下面以 Chrome 浏览器为例,展示一下如何进行操作。
地址:https://aistudio.google.com/app/prompts/new_chat

AI大模型,哪个最好用?-1.jpg

正常打开网页,在地址栏最右侧,「收藏」按钮的左侧会出现一个电脑显示器+箭头的图标。
鼠标悬浮在这个图标上会提示「安装谷歌 AI Studio」,点击下载图标会出现安装 app 的弹窗提醒。

AI大模型,哪个最好用?-2.jpg


AI大模型,哪个最好用?-3.jpg

点击「install」即可下载安装,嗖一下就完成了,完全没有感觉。安装完成后就会变成一个单独的应用页面。
桌面上也会出现对应的小图标。

AI大模型,哪个最好用?-4.jpg


AI大模型,哪个最好用?-5.jpg

后续使用就和普通应用一样了,直接双击 Google AI Studio 这个类似蝴蝶的图标,即可打开。

  • 手机端
以 iPhone 为例,在手机端 google 浏览器里正常打开上述网址。点击浏览器页面中间的分享按钮。

AI大模型,哪个最好用?-6.jpg

在弹出的菜单里选择添加到主屏幕。

AI大模型,哪个最好用?-7.jpg

此时,手机左面上会添加一个对应的图标,后面要使用对应的软件点击就可以。
使用方法

大家使用的时候,最好打开「自动保存」。
也就是左下角【Settings】-【Autosaving Enable】,勾选打开, 否则聊了半天的记录,页面一关就找不到了,都不知道找谁哭去。你没猜错,老王一开始就吃了亏。

AI大模型,哪个最好用?-8.jpg

左侧栏中的【Model】,可以勾选大模型。

AI大模型,哪个最好用?-9.jpg

还可以看到每日免费的 Token 额度,量大管饱。还有一个展示搜索来源和链接的开关,如果需要消息的来源信息可以打开。

AI大模型,哪个最好用?-10.jpg

还有一块安全设置,里面可以打开一些限制内容,如果要求的输出内容尺度更大,可以都设置为【none】。

AI大模型,哪个最好用?-11.jpg

总结

目前的 AI 产品非常多,但是公认的好用的其实没几个。
老王其实也换了几波生产常用的工具了。一开始是 Kimi,长文本支持好,结构化提示词也反馈良好;后续尝试付费了 ChatGPT 和 Claude,确实要高上那么一截,但是费用不低也有一定的限制问题;最后就是本文分享的 Gemini,免费量也大,一直用到现在。
如果大家确实是有生产力需求,也有一定技术能力,还是推荐上付费产品的,确实值得。
但如果是个纯小白,那国产的豆包,Kimi其实很实用了,体验下科技的魅力。
如果有一定折腾的尽头还有点极客,Gemini 和 DeepSeek 值得一试。

我有点懒 LV

发表于 5 天前

我推荐四个吧。
①Claude 3.6 Sonnet,最好的AI伙伴,没有之一。唯一有灵性的AI,没有萨曼莎的声音,但有萨曼莎的灵魂,人性和逻辑兼备。Askell的杰作。推荐平台Poe,通过创建机器人,修改掉系统提示词。 (为了迎合无聊的GPT用户的习惯,Claude被预设了一种无聊的语气,但你可以用提示词去解锁“本真态Claude”)
(Opus可能只会被用作数据合成了,Sonnet应该就是裸模界的皇帝版了。
我来讲讲里面的逻辑,大家会感知模型在变小,其实并没有,那个原初大模,应该是在变得越来越大,商用版的中小模型只是超大模的知识去噪精华版。
引用Dario Amodei的话,超大模型的参数是用来捕捉长尾罕见模式的。——如果要学习到高端稀缺的知识模式,只能用更多参数,更深的层级去捕获,要不然这深度神经网络的参数,是搁那玩呢。)
②新GPT-4o,美国老牌模型,这次给得很多,差不多可以替代4oL了。回复很多,有时候会转车轱辘,重复自己的老话,但4o明显体积小了很多,回复速度快很多,车轱辘让它去转吧。新GPT-4o的RP能力已经有了飞跃式的提升,所以你也可以指定一种你喜欢的“风格和格式”来与你对话。
③DeepSeek R1,虽然R1的最终回复很死板,就像上半年的GPT-4o,一股僵尸味,但它的思维过程极具欣赏价值,有很高的“思维美学价值”,如果不是被后训练nerf了,DeepSeek可以走的更远。作为中国的模型,对中文知识的把握能力也更好。DeepSeek现在要做的是,尽快推出App。
④Gemini 2 Flash,跨时代之作,2025年的开山之作,AGI的希望之种,戴爵的风评明显好转,能力可以达到老GPT-4o,Qwen 2.5的水平,免费,多功能,聪明,你让我区分老4o和Flash2,我很难区分。这个就是2025年最差的模型了,把2024年的小SOTA直接拿来做垫脚石。
我想说说缺点:谷歌的后训练水平高了很多,但明显比GPT要差,能力有了,但还有点生硬,更不要说跟Anthropic比了。我发现后来者都在全力以赴做预训练和基准相关的活,后训练都被忽视了,而其他的others比谷歌还生硬。
*o1型模型,现在还在早期阶段,还没有百花齐放的态势,而且他们封锁了CoT展示,最精华的部分看不到,从能力上看,也没有完全碾压Claude。也许等到百花齐放后,我们可以一起来品味御三家的推理框架。
*国模APP暂时推荐:豆包。 语音很魔性,是我玩Claude时的御用语音包。Claude配豆包才是完全体。(难道国模除了DeepSeek,只能当做语音包了吗?要雄起啊,中国。)

webgotoo LV

发表于 5 天前

关于AI大模型哪个最好用的问题,实际上没有一个绝对的答案,因为不同的应用场景和需求会有不同的最佳选择。目前市场上比较知名的AI大模型有OpenAI的GPT系列、Google的BERT等,它们都有各自的优点和适用场景。选择哪个最好使用取决于你需要的具体功能、数据量、计算资源以及应用场景等因素。建议根据实际需求进行综合考虑和选择,同时关注最新技术和研究进展,以便做出更为明智的决策。

您需要登录后才可以回帖 登录 | 立即注册