ChatGLM3-6B正式发布,10B以下最好开源模型
发布日期:2023/10/30 23:04:33 浏览量:
评测显示,在44个中英文公开数据集测试中,ChatGLM3在国内同尺寸模型中排名首位,甚至超过众多13B的模型等。同时开源的ChatGLM3-6B、ChatGLM3-6B-Base、ChatGLM3-6B-32K三个模型已经发布在wisemodel.cn社区,欢迎大家前往wisemodel.cn社区注册使用。
ChatGLM3-6B模型地址:
https://wisemodel.cn/models/%E6%99%BA%E8%B0%B1AI/chatglm3-6b
ChatGLM3-6B-Base模型地址:
https://wisemodel.cn/models/%E6%99%BA%E8%B0%B1AI/chatglm3-6b-base
ChatGLM3-6B-32K模型地址:
https://wisemodel.cn/models/%E6%99%BA%E8%B0%B1AI/chatglm3-6b-32k
ChatGLM3全新技术升级 更高性能更低成本
1. 更强大的性能:今年以来,这是我们第三次对ChatGLM基座模型进行了深度优化。我们采用了独创的多阶段增强预训练方法,更丰富的训练数据和更优的训练方案,使训练更为充分。评测显示,与 ChatGLM 二代模型相比,在44个中英文公开数据集测试中,ChatGLM3在国内同尺寸模型中排名首位。其中,MMLU提升36%、CEval提升33%、GSM8K提升179% 、BBH提升126%。
2. 瞄向GPT-4V的技术升级:瞄向GPT-4V,ChatGLM3 本次实现了若干全新功能的迭代升级,包括:多模态理解能力的CogVLM,看图识语义,在10余个国际标准图文评测数据集上取得SOTA;代码增强模块 Code Interpreter 根据用户需求生成代码并执行,自动完成数据分析、文件处理等复杂任务;网络搜索增强WebGLM,接入搜索增强,能自动根据问题在互联网上查找相关资料并在回答时提供参考相关文献或文章链接。ChatGLM3的语义能力与逻辑能力大大增强。
3. 全新的 Agent 智能体能力:ChatGLM3 本次集成了自研的 AgentTuning 技术,激活了模型智能体能力,尤其在智能规划和执行方面,相比于ChatGLM二代提升 1000% ;开启国产大模型原生支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。
4. Edge端侧模型:ChatGLM3 本次推出可手机部署的端测模型 ChatGLM3-1.5B 和 ChatGLM3-3B,支持包括Vivo、小米、三星在内的多种手机以及车载平台,甚至支持移动平台上 CPU 芯片的推理,速度可达20 tokens/s。精度方面 ChatGLM3-1.5B 和 ChatGLM3-3B 在公开 Benchmark 上与 ChatGLM2-6B 模型性能接近。
5. 更高效推理/降本增效:基于最新的高效动态推理和显存优化技术,我们当前的推理框架在相同硬件、模型条件下,相较于目前最佳的开源实现,包括伯克利大学推出的 vLLM 以及 Hugging Face TGI 的最新版本,推理速度提升了2-3倍,推理成本降低一倍,每千 tokens 仅0.5分,成本最低。
马上咨询: 如果您有业务方面的问题或者需求,欢迎您咨询!我们带来的不仅仅是技术,还有行业经验积累。
QQ: 39764417/308460098 Phone: 13 9800 1 9844 / 135 6887 9550 联系人:石先生/雷先生