微立顶科技

新闻资讯

创新 服务 价值

  DeepSeek论文和模型资源

发布日期:2025/1/30 10:03:57      浏览量:

DeepSeek论文和模型资源


DeepSeek将 DeepSeek-R1 训练技术全部公开,以期促进技术社区的充分交流与创新协作。
论文链接:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

模型链接:https://modelscope.cn/collections/DeepSeek-R1-c8e86ac66ed943

DeepSeek在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时,通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 7B 和 14B 模型在多项能力上实现了对标 OpenAI o1-mini 效果、展现了较高的生产环境部署性价比。


DeepSeek-R1-Distill-Qwen 的不同参数模型模型链接

1.5B:https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

7B:https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B

14B:https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-14B

32B:https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-32B



 点击在线阅读



  业务实施流程

需求调研 →

团队组建和动员 →

数据初始化 →

调试完善 →

解决方案和选型 →

硬件网络部署 →

系统部署试运行 →

系统正式上线 →

合作协议

系统开发/整合

制作文档和员工培训

售后服务

马上咨询: 如果您有业务方面的问题或者需求,欢迎您咨询!我们带来的不仅仅是技术,还有行业经验积累。
QQ: 39764417/308460098     Phone: 13 9800 1 9844 / 135 6887 9550     联系人:石先生/雷先生