文章来源:08ai导航网发布时间:2025-08-07 09:38:28
今天,我们正式发布 DeepSeek-R1,并同步开源模型权重。
DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借助 R1 训练其他模型。
DeepSeek-R1 上线API,对用户开放思维链输出,通过设置 `model="deepseek-reasoner"` 即可调用。DeepSeek 官网与 App 即日起同步更新上线。我们在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时,通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。
HuggingFace链接:
https://huggingface.co/deepseek-ai
为了推动和鼓励开源社区以及行业生态的发展,在发布并开源 R1 的同时,我们同步在协议授权层面也进行了如下调整:
模型开源 License 统一使用 MIT。我们曾针对大模型开源的特点,参考当前行业的通行实践,特别引入 DeepSeek License 为开源社区提供授权,但实践表明非标准的开源 License 可能反而增加了开发者的理解成本。为此,此次我们的开源仓库(包括模型权重)统一采用标准化、宽松的 MIT License,完全开源,不限制商用,无需申请。
产品协议明确可“模型蒸馏”。为了进一步促进技术的开源和共享,我们决定支持用户进行“模型蒸馏”。我们已更新线上产品的用户协议,明确允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。
登录DeepSeek官网或官方App,打开“深度思考”模式,即可调用最新版 DeepSeek-R1 完成各类推理任务。
DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元。
详细的 API 调用指南请参考官方文档:
https://api-docs.deepseek.com/zh-cn/guides/reasoning_model
APPSO 在第一时间进行了实测,我们用之前体验 Claude3.7 的一个 prompt 来测试:
「做一个带有动画效果的天气卡片,要求是使用 HTML、CSS 和基础 JavaScript,实现时间和天气信息的动态更新。」
大概十几秒就跑出来了,发现效果比之前好了不少,设计细节和交互动画都很在线。
因此可以推断这次更新后 R1 编程能力有了明显增强,甚至可能可以跟刚发布的编程新王 Claude 4 一较高下。
这次更新很有可能已经用上了 3 月发布的 DeepSeek-V3-0324 模型,这个新模型参数达 685B,编程能力大大提升。
相关攻略 更多
最新资讯 更多
DeepSeek-R1发布,性能对标OpenAIo1正式版,实测编程性能直逼claude4
更新时间:2025-08-07
小红书成立「hilab」,提出要对AI做人文训练
更新时间:2025-08-07
谷歌推出开源框架,要给AI大模型的跑分“立规矩”
更新时间:2025-08-07
对话赫拉利王小川:当历史学家试图按下AI暂停键
更新时间:2025-08-07
GoogleCEO:AI比互联网还大,未来将是多终端并行
更新时间:2025-08-07
扣子空间上线极致拟人的AI播客,这次真是降维打击了。
更新时间:2025-08-07
AI生成像素风如何保持一致?做对这几点很重要!
更新时间:2025-08-07
大风起兮云飞扬:Agent,o3幻觉,刷榜,大厂布局深意…|南乔的月度观察
更新时间:2025-08-07
第一批追赶AI的人,正在被AI甩开
更新时间:2025-08-07
AI产品千篇一律?去GoogleLabs,淘下一个AI爆款
更新时间:2025-08-07