deepseek和chatgpt谁性能更强?

最近很火的deepseek和ChatGPT究竟谁更厉害
收藏者
0
被浏览
92

5 个回答

eyou121 LV

发表于 4 天前

目前来看,还是chatgpt能更强一下,当然这是那chatgpt o3 和 deepseek R1做比较,不过如果论性价比,那么deepseek优势就很大了。

deepseek和chatgpt谁性能更强?-1.jpg

下面是chatgpt o3 和 deepseek R1的一些比较。
1. 数学与科学推理

AIME 2024数学竞赛:o3-mini高推理强度下准确率87.3% vs R1的79.8%;但低强度模式下R1(71.5%)反超o3(60%)。
博士级科学问题(GPQA):o3最高准确率79.7%,略优于R1的71.5%;但R1在非结构化数据处理中误差率更低。
跨学科综合能力:o3在ARC-AGI测试中达87.5%准确率(人类水平门槛85%),DeepSeek未披露同类数据。
2. 编程与工程能力

代码生成(SWE-bench):o3得分71.7 vs R1的71.6,但R1生成的代码执行完整性和稳定性更优(如无"穿模"问题)。
竞争性编程(Codeforces):o3 Elo评分2727,显著高于R1(未公开具体数值)。
3. 抗幻觉与推理稳定性

贝叶斯推理实验:o3-mini在提示条件下正确率最高(88%),推理过程简洁且逻辑清晰;R1结论正确但过程冗长且混乱,用词量是o3的3-10倍。
安全审核:o3通过深度对齐技术过滤有害内容,而R1存在越狱攻击漏洞。
中国如何使用chatgpt?国内怎么使用chatgpt?chatgpt网站怎么使用?

植树种草 LV

发表于 4 天前

chatgpt比较保守,deepseek比较激进。但是deepseek目前没有突破性的进站。充其量只是用了一些取巧的办法降低通用性,提高专业性的性能。
但是用的多了,就发展大模型幻觉非常多,很容易混乱。根源是机器学习这套办法本来就是错的。人不能自己把自己提起来。同样的机器学习不可能通过机器学习就提升自己的能力。
机器学习这套办法,只能让大模型本身增强推理能力。但是大模型的智力水平比较有限。类似于一个100智商的人,通过教育能够理解120分的题目。但是基础智商决定了,再学习也无法理解130分智商需要的难题。
两个大模型本身,其实都没有跳出语言模型的范畴。只是调教的水平不同。

likey LV

发表于 4 天前

你说的是deepseek v3还是R1?
ChatGPT的4o?还是o1、o1mini?o3、o3mini?
假设你说的是deepseek R1,那么你能免费接触到的所有市面上大语言模型都不如它。
在性能上,也只有GPT付费用户可以用的o1模型以及o3mini和deepseekR1性能差不多,不是哪个更强而是差不多,GPT系列在数学以及复杂的编程上会更好一些,但是对于普通人实际感受上两者并无明显差距,但是因为deepseek是国内的模型,中文理解能力更好,虽然性能相似,但是我更倾向于用deepseek而不是用昂贵的ChatGPT

ICOM LV

发表于 4 天前

很简单,一样的问题同时丢给Deepseek满血版和GPT o1,
会发现Deepseek的回答,特别是对中文语境的理解更深一筹,
与此同时,
你通过各类新闻,可以清楚地观察到,大洋彼岸的大漂亮,气的吹胡子瞪眼,
不惜喊出口号,漂亮人用Deepseek将面临最高20年监禁的处罚,
完全把向来用以标榜的自由民主抛之脑后,
便知道Deepseek的厉害,
该事件中,NVDA应该是被误杀的,
但GPT是妥妥的被命中靶心。

tccrock LV

发表于 4 天前

当然是gpt.
ds就像360浏览器套壳chrome一样,ds是通过蒸馏gpt出来的,训练方法是通过不断地向chatgpt提问,然后用这些问题和答案来进行训练。ds刚开始的版本竟然自我介绍说自己是 GPT-4,当被问到 API 介面时,甚至直接抛出 OpenAI 的技术说明,和 GPT-4 的回答几乎一模一样......
换句话说,他是以gpt的数据为基础的,可以做到差不多好,但永远不可能超越大树。由于很多敏感字的存在,他也无法蒸馏所有的数据,所以完整度上也是差gpt一截的。
评论里的狡辩大可不必,你以为别人乱指控是吧,现在有RSE(相似度评估)和ICE(身份一致性评估)等检测技术,可以直接测出来DS的蒸馏母体,DSV3发布的时候就有人测过了,蒸馏的是GPT
ds也是通过这个办法节省了芯片数目,因为他不用自己大规模计算,只需要借用gpt数据蒸馏即可。中国通过第三国采购美国的高性能芯片来蒸馏,美国其实是知道的,但他以前觉得问题不大。所以这不是一个管不管得住问题,而是一个愿意出多少精力和财力的控制成本问题

您需要登录后才可以回帖 登录 | 立即注册