官网显示模型名为deepseek-V3-600B Deepseek V3的Aider代码能力排行榜正确率为48.4%,仅次于OpenAI o1,超过Claude 3.5 Sonnet。 全文
是利用了其他"教师模型"(openai, gemini等)的数据进行了数据蒸馏,还是调整了训练及推理的算法精度等,影响成本最大的因素是哪个 全文
今日英伟达在北京举办迎新年会,英伟达创始人 CEO 黄仁勋出席。 据第一财经报道,黄仁勋在致辞中表示,很多人不了解英伟达在中国已经 25 年了,北京、上海、深圳拥有近 4000 名员工,中国员工流失率是全 ... 全文
之前国产模型也很多,上水平的也不少 比如yi lightning之前刷到1280分,基本和国外frontier model差不多了 deepseek v2也是好东西,2.5更是推到了base model的极致 qwen2.5也不错 然而感觉大家用得很少 直 ... 全文
本人18年开始自学板绘,到现在也第五个年头了,平时利用空闲时间画画二次元美少女,不图钱只图一乐,时常也会为自己画艺不精而焦虑。 但自从22年ai绘画进入大众视野后我就无时无刻地不在被ai图轰炸,绘画 ... 全文
一个问ai好图的帖子下 看到好多人夸ai画的好看 图类似于二次元和水墨画结合 有人回复说ai画的不生动答主讽刺说人高雅 我真的不懂 答主还说自己就是个俗人 贬低自己的话就没必要说了好吗 好多人评论说ai画 ... 全文
Deepseek是否越发华而不实? 全文
我和身边的朋友交流之后,发现大家往往都有这样的感受:仅仅依靠一个人的外貌和举止,就能看出他是一个ABC(其实加拿大出生的也大概能感觉出来,但是别的国家的就未必了。)。但是我们都说不清到底是什么 ... 全文
1DeepSeek-V3新版本悄然上线,参数量达685B,代码数学推理能力显著提升。 2与上一个版本相比,V3在代码领域表现出色,甚至能与Claude 3.7正面较量。 3除此之外,DeepSeek-V3采用MIT开源协议,支持模型蒸馏 ... 全文
个人认为,黄仁勋现在全球影响力,不亚于乔布斯 马斯克 比尔盖茨了 公司市值已经超越特斯拉了,而且有超越苹果的趋势,成为全球最值钱的公司 全球大佬们跪舔的对象,除了乔布斯,马斯克和比尔盖茨都得看他 ... 全文
现在都21世纪了,每个人都有追求自己喜好的权利,我觉得不应该戴有色眼镜。 全文
我使用了一下DeepSeek.主要是验证一下是不是像网上说的那样神奇。我提了两个问题,两个问题全部回答错误。我把正确的答案告诉他以后他再次进行了修正,回答的问题还是错误的。我真不知道他们的数据是从哪 ... 全文
英伟达现在为什么甩AMD几条街了? 全文
https://huggingface.co/deepseek-ai/DeepSeek-V3-0324 据说在前端开发能力达到了Sonnet 3.5/3.6的水平 和上周不少朋友期待的一样,新一周第一天的北京时间 3 月 24 日晚,DeepSeek 果然「突然」发布了模 ... 全文
英伟达的首席执行官黄仁勋称,他认为电信巨头华为是中国“最强大的”科技公司。 华为“在人工智能领域的实力逐年增强,”黄仁勋在周三接受《金融时报》采访时说道。“我们不能假设他们不会成为一股重要力 ... 全文
使用时如何选择二者? 全文
第一财经消息,4月19日,记者获悉,英伟达CEO黄仁勋已结束中国之行。针对外界高度关注的黄仁勋是否与DeepSeek创始人梁文锋会面,第一财经记者从了解黄仁勋中国之行细节的人士方面证实,黄仁勋全程未与Deep ... 全文
deepseek V3 的代码能力是行业 top1 吗? 全文
亚裔在美国地位这么低,为什么警察致死的案件比黑裔少得多? 全文
英伟达近日发布 Mistral-NeMo-Minitron 8B 小语言 AI 模型,具备精度高、计算效率高等优点,可在 GPU 加速的数据中心、云和工作站上运行模型。 全文