谷歌发布首个完全混合推理模型 Gemini 2.5 Flash 预览版

在上周的 Cloud Next 活动中，谷歌宣布 Gemini 2.5 Flash 模型即将推出，并将进行重大改进。今天，谷歌宣布通过谷歌人工智能工作室（Google AI Studio）和顶点人工智能（Vertex AI）在 Gemini API 中推出 Gemini 2.5 Flash 预览版。Gemini 用户也可通过模型选择器使用这个新模型，并可与 Canvas 配合使用，轻松完善文档和代码。

继其前身 Gemini 2.0 Flash 之后，Gemini 2.5 Flash 在推理能力方面也有了显著改进，而且不会产生高成本或延迟。谷歌声称，这款新产品具有出色的性价比。价格详情如下：

每 100 万个输入 tokens 0.15 USD
每 100 万个输出 tokens $.60 美元，无推理
每 100 万个输出 tokens 3.50 USD，带推理

Gemini 2.5 Flash 是谷歌推出的首个完全混合的推理模型，允许开发人员开启或关闭推理功能。据说这有助于开发人员根据目标质量、成本和延迟优化响应。请看下面这个新模型的基准测试：

微星推出ATX12VO-Ready PRO B650 12VO AM5主板和全新12VO电源系列

谷歌发布首个完全混合推理模型 Gemini 2.5 Flash 预览版

如上表所示，尽管 Gemini 2.5 Flash 的成本很低，但与 Anthropic 和 Grok 的前沿模型相比，它似乎仍有自己的优势。OpenAI 最近发布的 o4-mini 似乎比 Gemini 2.5 Flash 预览版性能更好，但成本却高出许多。

传苹果 iPhone SE 4 将放弃刘海改用灵动岛

谷歌发布首个完全混合推理模型 Gemini 2.5 Flash 预览版

评论功能已关闭

目录