deepseek究竟处于一个什么水平?

真的如同新闻报道的那样处于国际领先地位了吗?
收藏者
0
被浏览
71

8 个回答

ldf007 LV

发表于 3 天前

什么水平我不知道。但是它的回答让我哭了。

deepseek究竟处于一个什么水平?-1.jpg


deepseek究竟处于一个什么水平?-2.jpg

半个多小时才慢慢恢复平静缓过来。谢谢研发人员,我感受到被尊重,被理解。很神奇,时代变了,真的变了。

pxwwwd LV

发表于 3 天前

大哥大嫂求你了能不能别攻击了,api服务一天24小时有20个小时不可用,做个人吧

yyctt LV

发表于 3 天前

战↓,,,反正是挺通人性的,,

deepseek究竟处于一个什么水平?-1.jpg

奔跑的蜗牛 LV

发表于 3 天前

这几天我在Berkeley参加一个LLM的研讨会,就谈谈我的见闻吧
一、Deepseek引起的轰动是现象级的。
第一天到场的人并不多,但这个讲Deepseek的会场人满为患。

deepseek究竟处于一个什么水平?-1.jpg

这个talk是一周前Deepseek发布r1版本之后才临时加进来的,主讲人甚至在开讲前俩小时还在做PPT,足以见得主办方对此很重视,人满为患也说明听众对此很感兴趣。
主讲人说他和他爸平时从来不会聊大模型相关的东西,即便他自己就是做大模型的。他也不觉得他爸平时会关注这方面的科研进展。一个七十岁的退休老头平时也就看看球钓钓鱼,但前几天突然发消息问他Deepseek到底怎么样,而且对此非常感兴趣。这足以证明Deepseek这次有多么火出圈了。

deepseek究竟处于一个什么水平?-2.jpg


二、当我们谈论Deepseek时,我们在谈论什么
Deepseek火出圈的主要原因是便宜,六百万刀干了别人几亿投资的事,而且没有用最新的GPU,属于是手搓澡盆横渡英吉利海峡了。

deepseek究竟处于一个什么水平?-3.jpg

注意这个六百万其实是来自于Deepseek-V3的技术报告,其早在去年十二月就发布了,但并没有掀起多大的波澜。很多人总是把V3和R1混为一谈,V3是很厉害,用了很少的成本训练出了相当不错的模型,但其性能还远远达不到OpenAI系大模型的水平。但R1通过新的reward机制GRPO (group relative policy optimization),并使用规则类验证机制自动对输出进行打分,以V3为基础模型,一个多月时间里调教出了性能堪比4o, o1的模型,成果是非常亮眼的。
很多人没有看技术报告就张口蒸馏,闭口用了gpt的输出训练,让人蛮无语的。Deepseek在理论,网络架构和实现工程上均有不小的创新。就比如说V3叠了61个MoE (mix of expert 混合专家) block,虽然总参数量很大,但每次训练或推理时只激活了极小一部分链路,使得训练成本大大降低,推理速度也显著提高。

deepseek究竟处于一个什么水平?-4.jpg

此外,Deepseek最大的技术亮点是采用了混合精度框架,即在不同的区块里使用不同的精度来存储数据。众所周知精度越高内存占用越大,运算起来复杂度也越大。Deepseek在一些不需要很高精度的模块,使用很低的精度FP8储存数据,极大的降低了训练计算量。

deepseek究竟处于一个什么水平?-5.jpg

当然即便如此,训练Deepseek的成本还是巨大的,虽然没有最先进的显卡,但保守估计还是用了大概50000张显卡。
三、未来?
最后,主讲人提到Deepseek还是有一些没公布的技术细节,比如没有开源整个训练过程,包括数据集和训练权重。
但这并不妨碍其他人复现Deepseek,据我所知,已经有几个组靠着公开的技术文档复现了mini版的Deepseek-r1,效果相当不错,正准备往智能医疗智能教育方向应用。
Deepseek的技术开源将对整个大模型领域影响深远。

deepseek究竟处于一个什么水平?-6.jpg


最后,不得不说国外对Deepseek关注度还是很高的,当然Deepseek也配得上这样的关注。
回到问题本身,Deepseek究竟处于什么水平?
就目前各方反响来看,稳稳处于第一梯队,与最先进的大模型不相上下,但要说远远超过遥遥领先倒也不至于。
不过目前Deepseek处于GPU劣势,同样的技术,别人用更多的显卡一定能堆出比它更好的模型,尤其是在公布技术路线后,短时间出现比Deepseek更强的模型是必然的。这时我们只能期待下一次的技术工程革新了。
不论如何,Deepseek最近的动作都称得上是大模型领域的revolution,未来大模型的进化只会越来越快,竞争越来越激烈,AI取代人类将不再是镜花水月。

无论最终结果将人类历史导向何处,我们决定,选择希望!

冰湖小生 LV

发表于 3 天前

现在的互联网已经完全烂了,你想搜点东西搜到的全都是广告。
现在的AI就像是以前的互联网,可以搜到想要的东西。

halczy LV

发表于 3 天前

DeepSeek作为专业的AI深度学习平台,在机器学习领域有着非常高的水平。它集成了先进的人工智能技术,具有强大的数据处理和分析能力,可实现高效率的搜索和智能推荐等功能。至于是否处于国际领先地位,需要从不同的角度和标准来评估。<br><br>可以说,DeepSeek在技术实力、应用前景等方面都具备了很强的竞争力。但是,人工智能领域的技术发展日新月异,各家企业都在持续不断地投入研发力量进行创新。因此,我们不能简单地下定论说DeepSeek一定处于绝对的领先地位。需要持续关注该领域的发展,以及DeepSeek的最新进展和成果,才能做出更为准确的判断。

谭志刚 LV

发表于 3 天前

关于DeepSeek的技术水平,它作为人工智能领域的先进工具之一,在多个方面都表现出了出色的性能。具体来说,它在目标识别、语音识别、自然语言处理等方面具有广泛的应用。至于是否处于国际领先地位,需要具体分析其应用领域和技术特点,并结合行业内其他竞品的表现来综合评估。不过,可以说DeepSeek的技术实力确实不容小觑。它基于深度学习和大数据分析等技术,在保证数据安全性的同时提高了算法的精度和可靠性。当然,未来的发展仍然充满变数,具体还需观察其在实际应用中的表现和技术的持续进化情况。

danssion LV

发表于 3 天前

关于DeepSeek的技术水平,它确实是一个在人工智能领域具有领先技术的工具。其强大的深度学习能力和高效的数据处理能力使其在多个领域中取得了显著成果。<br><br>至于是否处于国际领先地位,这需要根据具体的评价标准和应用场景来判断。在特定的任务和应用上,DeepSeek已经展现出其卓越的性能和精准度。然而,技术的发展是不断进步的,各个国家和地区都在投入大量资源进行研究和开发,因此,DeepSeek可能需要不断地更新和改进以保持其竞争优势。<br><br>总的来说,DeepSeek在人工智能领域具有重要地位,并且已经取得了令人瞩目的成果。

您需要登录后才可以回帖 登录 | 立即注册