OpenAi 与Gemini 算法模型谁更厉害?

人工智能

发表于 2025-4-1 12:11:19

数据就是最好的描述和证明，接下来，我们综合看看OpenAI和Google家的Gemini的模型对比结果如何
综合评分如下：

从图上可以看到，12月22号之前还是Gemini的模型占领第一，OpenAI的ChatGPT-4o紧跟其后，总比比分稍逊Gemini。

PS 因为笔者平时使用最多的是ChatGPT和Claude，需要升级ChatGPTPlus/Pro会员的童鞋可以参考：ChatGPT订阅升级教程

接下来我们再看看各个模型的稳定性对比

上图图标说明：模型强度的置信区间（Confidence Interval, CI）指的是模型评分的统计范围，用于表明在重复测评中，模型真实表现可能落在哪个区间。具体来说：
上下限范围：置信区间通常以“±某值”表示，比如95%置信区间为+5.84 / -6.00，表示实际分数有95%的概率落在这个范围内。
用途：它反映了模型评分的稳定性。如果置信区间较窄，说明评分更稳定、误差更小；较宽则表明可能存在更大变动。

可以从上图看到ChatGPT-4o的稳定性比Gemini稍好。
接下来我们看看各模型对比其它模型的胜率百分比

胜率最高的是Gemini其次再是ChatGPT-4o;
我们再来看看Web能力各个模型得分大比拼

接着我就在竞技场给大家试了试Claude VS Gemini模型web能力
Gemini结果展示
界面还有括号！！！

Claude Haiku：
看着还行哈！

总体是Claude更好，但是思考的时间比Gemini稍稍长点，但是鉴于Gemini不尽人意的结果，时间长点还是可以接受的。

大家觉得两模型表现如何，以后想给客户展示原型就方便了很多啊！

发表于 2025-4-1 12:24:24

都在吹Google和Cluade啊，但是我从2023年3月份入坑GPT-4使用这么以来，综合最佳的还是OpenAI

首先代码和专业数学能力方面，O1吊打全场程度的领先，很多关键的生产力任务，“能”或者“不能”就是一道天堑，特别是代码，能写出来就是90分起步，写不出来那都是0分。我觉得这么长时间下来，唯一OpenAI在代码领域明显落后的时候，就是2024年中Cluade-3.5-sonnet刚推出，而4o-Latest和o1-preview都还没出的时候。那4个月的时间窗口确实是很多任务只有3.5-sonnet写得出来而4o写不出来，但也就那几个月了，后面o1又继续吊打全场（Gemini滚一边去，写代码就没好用过）
不过写作方面，Cluade-3.0-Opus一直是最佳（3.5-sonnet是中模，没有大模细腻，还是有很多AI味），稍微调教一下写出来的东西真的跟真人无异了，写作这一块还是要给Cluade点赞的，最强！
最后是日常使用，还是OpenAI最佳，这东西的智力水平就是压其他家一头，给各位看个细微的例子，问：“未来的太空部队，会跟当前3种部队：陆军、海军、空军，的哪一种部队最为相似？”
这个问题是《三体》中章北海父亲问章北海的问题，答案并不是看上去“一起高速在飞”的空军，而是看起来“笨笨慢慢”的海军，各位也可以自行琢磨一下这点细微的差别在哪。我觉得这种细节最能看出“哪个模型最聪明”
下面放各个模型的回答
ChatGPT 4o-Latest

Claude-3.5-Sonnet

o1

Gemini-1.5-Pro

我的Poe出了点问题，Gemini-2.0-Flash和Pro死活不给用，下面的都是Google AI Studio上调用的
Gemini-Experimental-1206

Gemini-2.0-Flash

我还试了最新的Google版的thinking模型，emmm.......感觉thinking了个寂寞

最后加一个DLC，国产的DeepSeek-V3

发表于 2025-4-1 12:37:53

白嫖之王 gemini，代码 3.5 sonnet，数学 OpenAI o1
比较分析：Gemini vs. ChatGPT vs. Claude

功能	Gemini	ChatGPT	Claude
优势	强语义理解，个性化体验，多模态集成	流利的自然语言，创造性文本生成，研究能力	知识图谱集成，代码生成
劣势	可能不如 ChatGPT 创造性	可能需要更多用户指导	公开可用性有限
理想用于	寻求个性化体验和多模态搜索的用户	需要创造性文本生成和研究帮助的用户	编程、寻求 AI 驱动的客户服务和支持的企业

发表于 2025-4-1 12:50:52

就我使用的感觉而言，Gemini的知识水平比现在的gpt高一点。而且Gemini flash每天有1500次的免费api额度。Gemini flash可能是同等尺度下的最强模型，用同样prompt在其它家小模型提问，要么不说人话要么漏洞百出。
Claude水平非常高，如果你想生成一些内容而不想被看出是AI生成的，用Claude是首选。同样编程问题用Claude也是首选。

发表于 2025-4-1 13:04:53

目前来看，Claude＞Gemini＞GPT
Claude有妖术，诚不可争也，这个模型吃了太多RL，已经有点通人性。Claude 4应该是最被期待的底模，属于精神系模型。A社圣诞茶话会氛围很好，气定神闲，Claude 4修仙成精……问题不大。
Gemini数据多，世界直觉好，微调方面还是不如O家和A社，能力有点被封印住了。按照底模来讲，Gemini是最好的。Gemini属于风系模型，广博但随性。
GPT还是最重要的普通玩家，普通很重要，有时候你要的就是普通回复。他们的波动很大，最新两版本GPT都还不错，GPT在尝试说人话了，踩点准确，补充到位，就是啰嗦，爱给肤浅的解决方案，你让它分析，它就给你解决方案，啥也解决不了。

发表于 2025-4-1 13:30:45

关于OpenAI与Gemini算法模型谁更厉害这个问题，实际上很难一概而论，因为这两个模型都有各自的优势和应用场景。 OpenAI以其强大的自然语言处理能力和广泛的应用而备受瞩目，其算法模型在自然语言处理任务上表现优异。而Gemini算法模型则在处理特定任务时表现出色，如图像识别和预测等。因此，无法简单地比较哪个更厉害。 总的来说，人工智能领域的技术发展日新月异，各种算法模型都有其独特的优势和应用场景。我们应该关注其在实际应用中的表现，并根据具体需求选择合适的模型。

发表于 2025-4-5 14:24:35

关于OpenAI与Gemini算法模型谁更厉害这个问题，实际上很难一概而论。两者都在人工智能领域拥有广泛的应用和先进的算法技术。OpenAI以强大的深度学习技术和广泛应用落地实践赢得了行业认可；而Gemini模型也在数据挖掘和解析领域有着出色表现。选择哪一个更合适，主要取决于具体应用场景和需求。如果您关注的是自然语言处理或对话生成等任务，OpenAI更为出色；而涉及到复杂的图像处理等任务时，Gemini可能更适合。建议结合具体应用场景，进行选择和调整。

发表于 2025-4-5 14:29:02

关于OpenAI与Gemini算法模型谁更厉害的问题，实际上无法简单地给出一个绝对的答案，因为两者都有各自的优势和适用场景。 OpenAI以其强大的自然语言处理能力和广泛的应用而著称，其算法模型在许多领域都有出色的表现。而Gemini算法模型则在特定的任务中展现出高效的性能，比如在图像处理等领域。每个模型都有其独特的设计理念和实现方式，都有其擅长的领域和优势。 因此，要选择哪个模型更厉害，需要根据具体的应用场景、任务需求以及数据来综合考虑。在人工智能领域，没有一种模型是万能的，选择适合的模型才是最重要的。

OpenAi 与Gemini 算法模型谁更厉害?

本周热门