DeepSeek论文和模型资源
发布日期:2025/1/30 10:03:57 浏览量:
DeepSeek论文和模型资源
DeepSeek将 DeepSeek-R1 训练技术全部公开,以期促进技术社区的充分交流与创新协作。
论文链接:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
模型链接:https://modelscope.cn/collections/DeepSeek-R1-c8e86ac66ed943
DeepSeek在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时,通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 7B 和 14B 模型在多项能力上实现了对标 OpenAI o1-mini 效果、展现了较高的生产环境部署性价比。
DeepSeek-R1-Distill-Qwen 的不同参数模型模型链接
1.5B:https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B
7B:https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B
14B:https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-14B
32B:https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-32B

马上咨询: 如果您有业务方面的问题或者需求,欢迎您咨询!我们带来的不仅仅是技术,还有行业经验积累。
QQ: 39764417/308460098 Phone: 13 9800 1 9844 / 135 6887 9550 联系人:石先生/雷先生