都说接入的DeepSeek是满血版,为什么感觉还是官方的好用?

接入DeepSeek的腾讯元宝,纳米,秘塔都说是满血版,但是同一个问题,我感觉解答总是不如官网细致合理,上下文联系也差点意思,就像少了点灵动,请问这是什么原因?还是我的错觉?
收藏者
0
被浏览
280

5 个回答

lusys LV

发表于 2025-4-27 17:15:51

严格的说,大家deepseek都不是满血版,包括官方API。ds-r1官方开源的版本上下文支持是128k上下文+32k思维链长度+8k输出,而官方API只支持64k上下文+32k最长思维链+8k输出。

至于蒸馏版,我都觉得不能称之为r1,当成一个带思维链强化版Qwen/Llama用就行了,性能差正版太远。说白了,只是吃了一点r1的蒸馏数据,连训练方法都和正版r1不同,正版r1的写作能力,共情能力都是蒸馏版不具备的,几乎只能用在做做数学题这种比较无聊的地方。

紫依女孩 LV

发表于 2025-4-27 17:26:43

你说的对,满血是个广告词,都是话术,都是话术,都是话术!
跟你说是671B参数量,ok,那推理精度是FP16还是INT8,亦或是INT4呢?token吞吐量如何,输入输出序列长度是不是做了阉割,4096Bits还是1024Bits,这些都不说,就是耍流氓。

justcool LV

发表于 2025-4-27 17:36:15

嗨,自称671b卖钱,实际人家就是部署的7b 32b的多了去了
买到个70b的都算良心商家了。
资本主义他就是这样的

baicai LV

发表于 2025-4-27 17:48:54

国内广告学的魅力时刻。
简单来说,就是 DeepSeek-R1 正确的版本应该是: DeepSeek-R1 - 671b F32版本(无量化、无压缩或精度损失处理)(补,经评论区提醒修正为DeepSeek-R1 - 671b FP8版本),这才是真正所谓的“满血版”。
而题主列举的这些APP,要不然部署的是 671b 量化版本,要么可能部署的是 671b 较低精度版本,要么甚至部署的有可能只是 70b 的压缩版本,这样运行成本更低,而且你就说是不是 DeepSeek 吧。
至于敢于称自己是“满血版”,嗯....

乐趣无穷 LV

发表于 2025-4-27 17:59:15

看到一个很好用的测试案例,可以用来简单测试是不是DeepSeek满血版。
请用我给你的四个数字,通过加、减、乘、除、括号,组成一个运算,使得结果为24。注意:数字需要全部我提供的数字:4 4 6 8。
这是DeepSeek官方提供的回答,简洁明了,一次就答对了。

都说接入的DeepSeek是满血版,为什么感觉还是官方的好用?-1.jpg

知乎直答也可以,也可以证明是满血版。

都说接入的DeepSeek是满血版,为什么感觉还是官方的好用?-2.jpg

而那些几次都答不对的,可以一律标记「蒸馏版」。
DeepSeek只有R1有蒸馏版,官方一共提供了7个,从1.5B到70B都有。

都说接入的DeepSeek是满血版,为什么感觉还是官方的好用?-3.jpg

具体的模型版本和基础模型数据如下:
模型版本基础模型
DeepSeek-R1-Distill-Qwen-1.5BQwen2.5-Math-1.5B
DeepSeek-R1-Distill-Qwen-7BQwen2.5-Math-7B
DeepSeek-R1-Distill-Llama-8BLlama-3.1-8B
DeepSeek-R1-Distill-Qwen-14BQwen2.5-14B
DeepSeek-R1-Distill-Qwen-32BQwen2.5-32B
DeepSeek-R1-Distill-Llama-70BLlama-3.3-70B-Instruct
我们拿最小的模型举例:DeepSeek-R1-Distill-Qwen-1.5B。
它的特性全在三个参数里面,其中:

  • Distill表示它是蒸馏模型
  • Qwen代表了被传输知识的模型,也就是具体某个学生
  • 1.5B说明了模型的大小,这个数字越小,意味着学生的年级也越小

都说接入的DeepSeek是满血版,为什么感觉还是官方的好用?-4.jpg

上表的第二列详细的列出了基础模型,也就是绿色框中的模型名字,主要有两个类别:Qwen和Llama。
其中Qwen是国内公司阿里云做的,Llama是美国公司Meta(前身Facebook)做的,因为他们开源了各种型号的大模型,所以很适合用来搭载蒸馏模型。
但是要记住,对于大模型来说,满血版性能大于非满血版。如果是非满血版,那么参数量越大,通常模型性能越好。
在使用DeepSeek的时候,尽量选官网,这可以保证是满血版;如果官方卡顿,那就选知乎直答这类型大平台的DeepSeek他们为了口碑也都是正儿八经的满血版。
当然除了这几种方式,你可以可以通过第三方API+第三方软件使用自己专用的满血版DeepSeek,具体的部署方法可以参考专栏文章的「API+客户端」部分。
平凡:【2/15 文字】从注册到落地:DeepSeek保姆级全链路操作手册

您需要登录后才可以回帖 登录 | 立即注册