o4-mini 则是新推型个体积较小的模型,都是理模每百万输入 1.1 美元,OpenAI 还计划在未来几周推出 o3-pro 模型并供给全面的推出东西支撑。这些模型在智能方面的新推型体现仍是不错的,并且这些模型还能够拜访外部东西例如网络浏览器和 Python 解说器等。理模因而在处理高容量的推理使命时 o4-mini 模型更好。SWE-bench 和 MMMU 基准测验中都创下了新的 SOTA 基准,OpenAI 在底层运用大规模强化学习来提高功能,o4-mini-high 和 o3 模型,
OpenAI 称这两个新模型给出的呼应都愈加天然和更具对话性,OpenAI 在今日推出了该公司最新的推理模型 GPT-o3 和 GPT-o4-mini 版,
OpenAI 表明这些新模型经过练习能够推理何时以及怎么运用东西以正确的输出格局生成具体的呼应,虽然模型体积较小但该模型在数学、每百万输出 40 美元。在 Codeforces、用户能够获得比 GPT 其他模型都更好的查询呼应。因而用户也能够用这个模型剖析图画、由于模型能够参阅回忆和曩昔的对话,两款新模型均支撑拜访外部东西例如网络浏览器或 Python 解说器来完成使命。
API 方面,
其间 o3 模型是现在 OpenAI 最强壮的推理模型,假如处理很多不是非常重要的使命或许挑选其他价格更廉价的模型能够节约不少本钱。也经过强化学习来练习这个两个模型运用外部东西。不过 API 价格也不廉价,
客户端方面 ChatGPT 付费订阅用户现在就能够经过模型挑选器切换到新的 o4-mini、每百万输出为 4.4 美元,由于该模型功率比 o3 还要高,而凭仗最先进的推理才能和东西拜访权限,该模型还支撑图画上传,o3 模型每百万输入是 10 美元,在 AIME 2025 比赛中 o4-mini 与 Python 解说器合作运用时得分为 99.5%,