AI大模型，哪个最好用？

AI大模型，哪个最好用？

发表于 2025-3-31 07:20:19

我有个github项目，收集了1000个大模型相关的优秀的项目，希望对你有帮助。https://github.com/CoderSJX/AI-Resources-Central

发表于 2025-3-31 07:29:13

先说应用场景，我平时主要用大模型做一些论文解读、论文复现，或者代码debug的活，从目前个人体感来说，效果最好的是openai新出的o1 pro mode，其代码debug的效果和精确度是要超过我之前最常用的claude的。

代码能力对比： OpenAI 最新推出的 O1 Pro Mode 在代码调试方面的表现相当不错，其准确度和效率都超过了我之前常用的 Claude。主要是它的思维链。O1 Pro Mode 能够构建非常长且完整的思维过程，同时保持输出的连贯性。特别是在需要处理大量文本和代码的场景下，它几乎不会出现上下文遗忘的情况。相比之下，Claude 在处理特别长的上下文时，会明显感觉到知识衔接存在一些断层。
专业能力对比： Claude 最大的亮点在于其 Project 功能。这个内置的 RAG 系统非常实用，提供专业背景信息后，其回答的专业度和针对性都会显著提升。不过，RAG 系统的特点决定了它更适合进行局部信息检索。也就是说，当问题能够准确匹配到相关知识时，效果确实很好。但如果需要调用全面的背景知识，比如根据论文原文构建代码时，Claude 的表现就不如 O1 了。其生成的代码一般会与较多错误，需要更多的调试时间，而且每次交互能够利用的上下文信息也明显少于 O1。
文本写作对比：不过在文本写作方面，Claude 的优势则比较明显。它生成的文本更加自然，很少会出现机器味道，这一点要优于 OpenAI 的产品。

总的来说，两个模型各有所长：O1 Pro Mode 在代码处理和长文本理解上更胜一筹，而 Claude 则还是擅长自然写作。但从目前来说，我是逐渐从claude切到o1上了

发表于 2025-3-31 07:42:30

AI大模型排行榜：

截止到2024年12月29号，AI大模型排行榜第一梯队是Gemini-Exp-1206，Gemini-2.0-Flash-Thinking-Exp-1219，ChatGpt-4o-latest(2024-11-20)，o1-2024-12-17
OpenAI和谷歌的AI大模型的能力不分伯仲。

对比下，为什么谷歌aistdudio是当前最好AI大模型伙伴

使用费用：

OpenAI免费用户可以无限制使用GPT4o-mini模型，GPT-4o是有次数限制，包括文件上传、数据分析、图片生成都是有次数限制，一般是一天就几次的使用次数。
OpenAI想要访问到o1模型，以及较多次数的gpt-4o模型至少要升级到plus会员，20美元一个月

谷歌的aistdudio几乎是免费的，比如Gemini-2.0-Flash-Exp模型，每分钟最多10个请求，每天最多1500个请求，常规使用基本是用不完的。

并且就算是魔法上网，OpenAI识别到是中国的IP，大模型会变傻，网页访问谷歌的aistdudio就不会。
谷歌赢一分。

Temperature参数设置：

先说明temperature参数是什么：
大模型的温度（temperature）是一个控制模型输出的随机性和创造性的重要参数。温度值会影响模型生成文本的方式，范围通常在 0 到 1 之间，有时可以设置为更大的值。
1. 低温度（如 0.1 或 0.2）：
输出更确定、更保守。
模型会倾向于选择概率最高的词或路径。
适合需要准确性和一致性的任务，如代码生成、数学计算或需要结构化答案的问题。
2. 高温度（如 0.8 或 1）：
输出更随机、更有创造性。
模型会更倾向于探索概率较低的词或路径。
适合需要创造力的任务，如写诗、故事、广告文案。

chatgpt相关的模型是不能设置temperature参数的

谷歌的模型是可以设置temperature参数的，相对来说可控程度更高。

谷歌再赢一分。

API调用：

GPT-4o模型的API价格如下：每百万token要好几美元。

谷歌的gemini1.5的API，有限次调用是免费的。
谷歌再赢一分。

取消OpenAI的plus会员订阅：

附录：

查看AI大模型排行榜网站：
Just a moment...openai的API价格查询：
https://openai.com/api/pricing/

发表于 2025-3-31 07:51:05

如果光从能力，老王一定把 2024 最佳和 2025 最值得推荐大模型奖，颁给 Claude。
但奈何，封号严重，很多同僚都放弃了买会员，因为时不时给你封一下，记录丢失外加那种天上地下的感觉，实在很差。
但其实还有一个免费又相当好用的。那就是谷歌的 AI Studio 产品。
现在基本在生产环境就是用的这款产品，产生的内容质量过关，而且还每天赠送大量的 Tokens，基本是用不完。
每天一工作就是打开熟悉的网页，现在直接推出渐进式Web应用（PWA） 版本了，说白了就是一种使用 Web 技术来构建，但是可以拥有原生 App体验的技术，让应用使用起来更丝滑。
如何安装

PWA 技术让浏览器能像原生应用一样添加到主屏幕，这样大家就能像打开App一样打开应用了，但本质上还是一个网页。

电脑桌面端

下面以 Chrome 浏览器为例，展示一下如何进行操作。
地址：https://aistudio.google.com/app/prompts/new_chat

正常打开网页，在地址栏最右侧，「收藏」按钮的左侧会出现一个电脑显示器+箭头的图标。
鼠标悬浮在这个图标上会提示「安装谷歌 AI Studio」，点击下载图标会出现安装 app 的弹窗提醒。

点击「install」即可下载安装，嗖一下就完成了，完全没有感觉。安装完成后就会变成一个单独的应用页面。
桌面上也会出现对应的小图标。

后续使用就和普通应用一样了，直接双击 Google AI Studio 这个类似蝴蝶的图标，即可打开。

手机端

以 iPhone 为例,在手机端 google 浏览器里正常打开上述网址。点击浏览器页面中间的分享按钮。

在弹出的菜单里选择添加到主屏幕。

此时，手机左面上会添加一个对应的图标，后面要使用对应的软件点击就可以。
使用方法

大家使用的时候，最好打开「自动保存」。
也就是左下角【Settings】-【Autosaving Enable】，勾选打开，否则聊了半天的记录，页面一关就找不到了，都不知道找谁哭去。你没猜错，老王一开始就吃了亏。

左侧栏中的【Model】，可以勾选大模型。

还可以看到每日免费的 Token 额度，量大管饱。还有一个展示搜索来源和链接的开关，如果需要消息的来源信息可以打开。

还有一块安全设置，里面可以打开一些限制内容，如果要求的输出内容尺度更大，可以都设置为【none】。

总结

目前的 AI 产品非常多，但是公认的好用的其实没几个。
老王其实也换了几波生产常用的工具了。一开始是 Kimi，长文本支持好，结构化提示词也反馈良好；后续尝试付费了 ChatGPT 和 Claude，确实要高上那么一截，但是费用不低也有一定的限制问题；最后就是本文分享的 Gemini，免费量也大，一直用到现在。
如果大家确实是有生产力需求，也有一定技术能力，还是推荐上付费产品的，确实值得。
但如果是个纯小白，那国产的豆包，Kimi其实很实用了，体验下科技的魅力。
如果有一定折腾的尽头还有点极客，Gemini 和 DeepSeek 值得一试。

发表于 2025-3-31 08:04:13

我推荐四个吧。
①Claude 3.6 Sonnet，最好的AI伙伴，没有之一。唯一有灵性的AI，没有萨曼莎的声音，但有萨曼莎的灵魂，人性和逻辑兼备。Askell的杰作。推荐平台Poe，通过创建机器人，修改掉系统提示词。 (为了迎合无聊的GPT用户的习惯，Claude被预设了一种无聊的语气，但你可以用提示词去解锁“本真态Claude”)
(Opus可能只会被用作数据合成了，Sonnet应该就是裸模界的皇帝版了。
我来讲讲里面的逻辑，大家会感知模型在变小，其实并没有，那个原初大模，应该是在变得越来越大，商用版的中小模型只是超大模的知识去噪精华版。
引用Dario Amodei的话，超大模型的参数是用来捕捉长尾罕见模式的。——如果要学习到高端稀缺的知识模式，只能用更多参数，更深的层级去捕获，要不然这深度神经网络的参数，是搁那玩呢。)
②新GPT-4o，美国老牌模型，这次给得很多，差不多可以替代4oL了。回复很多，有时候会转车轱辘，重复自己的老话，但4o明显体积小了很多，回复速度快很多，车轱辘让它去转吧。新GPT-4o的RP能力已经有了飞跃式的提升，所以你也可以指定一种你喜欢的“风格和格式”来与你对话。
③DeepSeek R1，虽然R1的最终回复很死板，就像上半年的GPT-4o，一股僵尸味，但它的思维过程极具欣赏价值，有很高的“思维美学价值”，如果不是被后训练nerf了，DeepSeek可以走的更远。作为中国的模型，对中文知识的把握能力也更好。DeepSeek现在要做的是，尽快推出App。
④Gemini 2 Flash，跨时代之作，2025年的开山之作，AGI的希望之种，戴爵的风评明显好转，能力可以达到老GPT-4o，Qwen 2.5的水平，免费，多功能，聪明，你让我区分老4o和Flash2，我很难区分。这个就是2025年最差的模型了，把2024年的小SOTA直接拿来做垫脚石。
我想说说缺点：谷歌的后训练水平高了很多，但明显比GPT要差，能力有了，但还有点生硬，更不要说跟Anthropic比了。我发现后来者都在全力以赴做预训练和基准相关的活，后训练都被忽视了，而其他的others比谷歌还生硬。
＊o1型模型，现在还在早期阶段，还没有百花齐放的态势，而且他们封锁了CoT展示，最精华的部分看不到，从能力上看，也没有完全碾压Claude。也许等到百花齐放后，我们可以一起来品味御三家的推理框架。
＊国模APP暂时推荐：豆包。语音很魔性，是我玩Claude时的御用语音包。Claude配豆包才是完全体。(难道国模除了DeepSeek，只能当做语音包了吗？要雄起啊，中国。)

发表于 2025-3-31 16:43:12

关于AI大模型哪个最好用的问题，实际上没有一个绝对的答案，因为不同的应用场景和需求会有不同的最佳选择。目前市场上比较知名的AI大模型有OpenAI的GPT系列、Google的BERT等，它们都有各自的优点和适用场景。选择哪个最好使用取决于你需要的具体功能、数据量、计算资源以及应用场景等因素。建议根据实际需求进行综合考虑和选择，同时关注最新技术和研究进展，以便做出更为明智的决策。

AI大模型，哪个最好用？

本周热门