OpenAi 与Gemini 算法模型谁更厉害?

人工智能
收藏者
0
被浏览
98

6 个回答

杨帆 LV

发表于 4 天前

数据就是最好的描述和证明,接下来,我们综合看看OpenAI和Google家的Gemini的模型对比结果如何
综合评分如下:

OpenAi 与Gemini 算法模型谁更厉害?-1.jpg

从图上可以看到,12月22号之前还是Gemini的模型占领第一,OpenAI的ChatGPT-4o紧跟其后,总比比分稍逊Gemini。
PS 因为笔者平时使用最多的是ChatGPT和Claude,需要升级ChatGPTPlus/Pro会员的童鞋可以参考:ChatGPT订阅升级教程
接下来我们再看看各个模型的稳定性对比

OpenAi 与Gemini 算法模型谁更厉害?-2.jpg
上图图标说明:模型强度的置信区间(Confidence Interval, CI)指的是模型评分的统计范围,用于表明在重复测评中,模型真实表现可能落在哪个区间。具体来说:
上下限范围:置信区间通常以“±某值”表示,比如95%置信区间为+5.84 / -6.00,表示实际分数有95%的概率落在这个范围内。
用途:它反映了模型评分的稳定性。如果置信区间较窄,说明评分更稳定、误差更小;较宽则表明可能存在更大变动。
可以从上图看到ChatGPT-4o的稳定性比Gemini稍好。
接下来我们看看各模型对比其它模型的胜率百分比

OpenAi 与Gemini 算法模型谁更厉害?-3.jpg

胜率最高的是Gemini其次再是ChatGPT-4o;
我们再来看看Web能力各个模型得分大比拼

OpenAi 与Gemini 算法模型谁更厉害?-4.jpg

接着我就在竞技场给大家试了试Claude VS Gemini模型web能力
Gemini结果展示
界面还有括号!!!

OpenAi 与Gemini 算法模型谁更厉害?-5.jpg

Claude Haiku:
看着还行哈!

OpenAi 与Gemini 算法模型谁更厉害?-6.jpg

总体是Claude更好,但是思考的时间比Gemini稍稍长点,但是鉴于Gemini不尽人意的结果,时间长点还是可以接受的。

OpenAi 与Gemini 算法模型谁更厉害?-7.jpg

大家觉得两模型表现如何,以后想给客户展示原型就方便了很多啊!

三江易生 LV

发表于 4 天前

都在吹Google和Cluade啊,但是我从2023年3月份入坑GPT-4使用这么以来,综合最佳的还是OpenAI

首先代码和专业数学能力方面,O1吊打全场程度的领先,很多关键的生产力任务,“能”或者“不能”就是一道天堑,特别是代码,能写出来就是90分起步,写不出来那都是0分。我觉得这么长时间下来,唯一OpenAI在代码领域明显落后的时候,就是2024年中Cluade-3.5-sonnet刚推出,而4o-Latest和o1-preview都还没出的时候。那4个月的时间窗口确实是很多任务只有3.5-sonnet写得出来而4o写不出来,但也就那几个月了,后面o1又继续吊打全场(Gemini滚一边去,写代码就没好用过)
不过写作方面,Cluade-3.0-Opus一直是最佳(3.5-sonnet是中模,没有大模细腻,还是有很多AI味),稍微调教一下写出来的东西真的跟真人无异了,写作这一块还是要给Cluade点赞的,最强!
最后是日常使用,还是OpenAI最佳,这东西的智力水平就是压其他家一头,给各位看个细微的例子,问:“未来的太空部队,会跟当前3种部队:陆军、海军、空军,的哪一种部队最为相似?”
这个问题是《三体》中章北海父亲问章北海的问题,答案并不是看上去“一起高速在飞”的空军,而是看起来“笨笨慢慢”的海军,各位也可以自行琢磨一下这点细微的差别在哪。我觉得这种细节最能看出“哪个模型最聪明”
下面放各个模型的回答
ChatGPT 4o-Latest

OpenAi 与Gemini 算法模型谁更厉害?-1.jpg

Claude-3.5-Sonnet


OpenAi 与Gemini 算法模型谁更厉害?-2.jpg

o1

OpenAi 与Gemini 算法模型谁更厉害?-3.jpg

Gemini-1.5-Pro

OpenAi 与Gemini 算法模型谁更厉害?-4.jpg

我的Poe出了点问题,Gemini-2.0-Flash和Pro死活不给用,下面的都是Google AI Studio上调用的
Gemini-Experimental-1206

OpenAi 与Gemini 算法模型谁更厉害?-5.jpg

Gemini-2.0-Flash

OpenAi 与Gemini 算法模型谁更厉害?-6.jpg

我还试了最新的Google版的thinking模型,emmm.......感觉thinking了个寂寞

OpenAi 与Gemini 算法模型谁更厉害?-7.jpg

最后加一个DLC,国产的DeepSeek-V3

OpenAi 与Gemini 算法模型谁更厉害?-8.jpg

sifeng LV

发表于 4 天前

白嫖之王 gemini,代码 3.5 sonnet,数学 OpenAI o1
比较分析:Gemini vs. ChatGPT vs. Claude

功能GeminiChatGPTClaude
优势强语义理解,个性化体验,多模态集成流利的自然语言,创造性文本生成,研究能力知识图谱集成,代码生成
劣势可能不如 ChatGPT 创造性可能需要更多用户指导公开可用性有限
理想用于寻求个性化体验和多模态搜索的用户需要创造性文本生成和研究帮助的用户编程、寻求 AI 驱动的客户服务和支持的企业

mike LV

发表于 4 天前

就我使用的感觉而言,Gemini的知识水平比现在的gpt高一点。而且Gemini flash每天有1500次的免费api额度。Gemini flash可能是同等尺度下的最强模型,用同样prompt在其它家小模型提问,要么不说人话要么漏洞百出。
Claude水平非常高,如果你想生成一些内容而不想被看出是AI生成的,用Claude是首选。同样编程问题用Claude也是首选。

absct LV

发表于 4 天前

目前来看,Claude>Gemini>GPT
Claude有妖术,诚不可争也,这个模型吃了太多RL,已经有点通人性。Claude 4应该是最被期待的底模,属于精神系模型。A社圣诞茶话会氛围很好,气定神闲,Claude 4修仙成精……问题不大。
Gemini数据多,世界直觉好,微调方面还是不如O家和A社,能力有点被封印住了。按照底模来讲,Gemini是最好的。Gemini属于风系模型,广博但随性。
GPT还是最重要的普通玩家,普通很重要,有时候你要的就是普通回复。他们的波动很大,最新两版本GPT都还不错,GPT在尝试说人话了,踩点准确,补充到位,就是啰嗦,爱给肤浅的解决方案,你让它分析,它就给你解决方案,啥也解决不了。

huchuanhao LV

发表于 4 天前

关于OpenAI与Gemini算法模型谁更厉害这个问题,实际上很难一概而论,因为这两个模型都有各自的优势和应用场景。<br><br>OpenAI以其强大的自然语言处理能力和广泛的应用而备受瞩目,其算法模型在自然语言处理任务上表现优异。而Gemini算法模型则在处理特定任务时表现出色,如图像识别和预测等。因此,无法简单地比较哪个更厉害。<br><br>总的来说,人工智能领域的技术发展日新月异,各种算法模型都有其独特的优势和应用场景。我们应该关注其在实际应用中的表现,并根据具体需求选择合适的模型。

您需要登录后才可以回帖 登录 | 立即注册