OpenAI发布GPT-4o mini，比GPT-3.5价格下降60%，更快更强

发布日期：2024/7/19 7:10:23 浏览量：

OpenAI发布GPT-4o mini，比GPT-3.5价格下降60%，更快更强

刚才，OpenAI官方宣布即将推出GPT-4o mini模型，这是一个成本很低的AI大模型，是GPT-3.5的替代版本。OpenAI官方说，该模型最大的特点是很便宜，但是能力更强，因此可以极大提高AI在不同领域的应用。

GPT-4o mini模型简介
GPT-4o mini是一个多模态的大模型，支持文本、图片、视频和音频的输入和输出，最高支持128K超长上下文。训练的知识截止到2023年10月份。由于和GPT-4o一样的tokenizer，它在非英文文本上的表现也非常好。

GPT-4o mini模型的评测结果
尽管GPT-4o mini是一个规模较小的模型，它时延很小，但是能力却很强。根据官方的信息，GPT-4o mini模型的各方面评测都超过了GPT-3.5-Turbo，同时支持多模态。在函数调用等方面表现也很好。

根据评测结果，GPT-4o mini模型在MMLU评分是82分，超过了Gemini Flash的77.9和Claude Haiku的73.8%。在代码编程和数学方面也比对手好很多。下图是GPT-4o mini在所有模型的对比结果，按照MMLU排序。

推理任务：GPT-4o mini 在涉及文本和视觉的推理任务中优于其他小型模型，在 MMLU 上得分为 82.0%，而 Gemini Flash 为 77.9%，Claude Haiku 为 73.8%。

数学和编码能力：GPT-4o mini 在数学推理和编码任务方面表现出色，超过了市场上先前的小型模型。在衡量数学推理的 MGSM 上，GPT-4o mini 得分为 87.0%，而 Gemini Flash 为 75.5%，Claude Haiku 为 71.7%。在衡量编码性能的 HumanEval 上，GPT-4o mini 得分为 87.2%，而 Gemini Flash 为 71.5%，Claude Haiku 为 75.9%。

多模态推理：GPT-4o mini 在多模态推理评估 MMMU 上也表现出色，得分为 59.4%，而 Gemini Flash 得分为 56.1%，Claude Haiku 得分为 50.2%。

GPT-4o mini的输出速度大幅提升
GPT-4o mini一个显著的能力提示是它的推理速度。每秒可以达到200个tokens左右，超过了所有OpenAI此前的模型，是GPT-3.5-Turbo的速度的2倍！但是首字符时延表现似乎一般。GPT-4o mini的首字符延高于GPT-3.5-Turbo，但是每秒生成的速度远超GPT-3.5-Turbo。

GPT-4o mini模型价格
GPT-4o mini价格是100万tokens输入0.15美元，输出是100万tokens0.6美元，价格比GPT-3.5下降60%。如下图所示：

业务实施流程

需求调研 →

团队组建和动员 →

数据初始化 →

调试完善 →

解决方案和选型 →

硬件网络部署 →

系统部署试运行 →

系统正式上线 →

合作协议

系统开发/整合

制作文档和员工培训

售后服务

马上咨询： 如果您有业务方面的问题或者需求，欢迎您咨询！我们带来的不仅仅是技术，还有行业经验积累。
QQ: 39764417/308460098 Phone: 13 9800 1 9844 / 135 6887 9550 联系人：石先生/雷先生