微立顶科技

新闻资讯

创新 服务 价值

  OpenAI发布GPT-4o mini,比GPT-3.5价格下降60%,更快更强

发布日期:2024/7/19 7:10:23      浏览量:

OpenAI发布GPT-4o mini,比GPT-3.5价格下降60%,更快更强


刚才,OpenAI官方宣布即将推出GPT-4o mini模型,这是一个成本很低的AI大模型,是GPT-3.5的替代版本。OpenAI官方说,该模型最大的特点是很便宜,但是能力更强,因此可以极大提高AI在不同领域的应用。




GPT-4o mini模型简介
GPT-4o mini是一个多模态的大模型,支持文本、图片、视频和音频的输入和输出,最高支持128K超长上下文。训练的知识截止到2023年10月份。由于和GPT-4o一样的tokenizer,它在非英文文本上的表现也非常好。


GPT-4o mini模型的评测结果
尽管GPT-4o mini是一个规模较小的模型,它时延很小,但是能力却很强。根据官方的信息,GPT-4o mini模型的各方面评测都超过了GPT-3.5-Turbo,同时支持多模态。在函数调用等方面表现也很好。


根据评测结果,GPT-4o mini模型在MMLU评分是82分,超过了Gemini Flash的77.9和Claude Haiku的73.8%。在代码编程和数学方面也比对手好很多。下图是GPT-4o mini在所有模型的对比结果,按照MMLU排序。



推理任务:GPT-4o mini 在涉及文本和视觉的推理任务中优于其他小型模型,在 MMLU 上得分为 82.0%,而 Gemini Flash 为 77.9%,Claude Haiku 为 73.8%。 


数学和编码能力:GPT-4o mini 在数学推理和编码任务方面表现出色,超过了市场上先前的小型模型。在衡量数学推理的 MGSM 上,GPT-4o mini 得分为 87.0%,而 Gemini Flash 为 75.5%,Claude Haiku 为 71.7%。在衡量编码性能的 HumanEval 上,GPT-4o mini 得分为 87.2%,而 Gemini Flash 为 71.5%,Claude Haiku 为 75.9%。 

多模态推理:GPT-4o mini 在多模态推理评估 MMMU 上也表现出色,得分为 59.4%,而 Gemini Flash 得分为 56.1%,Claude Haiku 得分为 50.2%。


GPT-4o mini的输出速度大幅提升
GPT-4o mini一个显著的能力提示是它的推理速度。每秒可以达到200个tokens左右,超过了所有OpenAI此前的模型,是GPT-3.5-Turbo的速度的2倍!但是首字符时延表现似乎一般。GPT-4o mini的首字符延高于GPT-3.5-Turbo,但是每秒生成的速度远超GPT-3.5-Turbo。


GPT-4o mini模型价格
GPT-4o mini价格是100万tokens输入0.15美元,输出是100万tokens0.6美元,价格比GPT-3.5下降60%。如下图所示:




  业务实施流程

需求调研 →

团队组建和动员 →

数据初始化 →

调试完善 →

解决方案和选型 →

硬件网络部署 →

系统部署试运行 →

系统正式上线 →

合作协议

系统开发/整合

制作文档和员工培训

售后服务

马上咨询: 如果您有业务方面的问题或者需求,欢迎您咨询!我们带来的不仅仅是技术,还有行业经验积累。
QQ: 39764417/308460098     Phone: 13 9800 1 9844 / 135 6887 9550     联系人:石先生/雷先生