news 2026/6/23 23:05:38

刚刚,谷歌发布 Gemini 3 Flash:最强牛马,吊打 Pro,免费!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
刚刚,谷歌发布 Gemini 3 Flash:最强牛马,吊打 Pro,免费!

你永远可以相信谷歌。

上个月刚发布Gemini 3 Pro,这个月就给你 Flash 版本。

几小时前,Gemini 3 Flash正式上线。

如果说 Pro 模型是旗舰,那 Flash 就是真正的主力。

它在 Gemini API 里的 token 消耗量是最大的,几百万开发者每天都在用。

谷歌官方说:Flash 系列才是真正的「workhorse model」,当代「牛马」。

这次的3 Flash有点狠。

它比2.5 Pro强,速度还快了 3 倍,但价格只要3 Pro的四分之一。

注意,是比2.5 Pro强。


直接上数据。

GPQA Diamond 测试博士级科学知识,3 Flash拿了 90.4%。

HLE(Humanity's Last Exam)是人类专家出的终极难题,3 Flash在不使用工具的情况下拿下 33.7% 的准确率。

作为对比,上一代2.5 Flash只有 11%。

MMMU-Pro 测试模型的多模态理解与推理,3 Flash得分 81.2%,这个分数直接超过了Gemini 3 ProGPT-5.2Claude Sonnet 4.5

代码就更有意思了。

SWE-bench Verified,测试 AI 写代码解决真实问题的能力,3 Flash拿到了 78%。

这个分数不仅吊打整个2.5系列,还比自家的3 Pro更高。

是的,你没有看错,比Gemini 3 Pro高。

这你敢信?

一个轻量版模型在代码任务上超过了「旗舰版」,这在以前简直难以想象。


价格呢?

Gemini 3 FlashAPI 输入 0.5 美元/百万 tokens,输出 3 美元/百万 tokens。

开启缓存再省 90%。

用 Batch API 可以再省 50%。

对比3 Pro的输入 2、输出 12 美元,3 Flash以四分之一的价格,在某些任务上表现更好。


谷歌产品负责人 Tulsee Doshi 说:3 Flash就是当代牛马。

当然,这是我翻译过来的。

批量任务、高频调用、实时交互,都是它的使用场景。

游戏公司 Latitude 用3 Flash做 AI 游戏引擎。

之前只有Sonnet 4.5这种顶级模型才能搞定,现在青春版的 Flash 就可以。

Resemble AI 用它做深度伪造检查,多模态分析速度比2.5 Pro快了 4 倍。

法律 AI 公司 Harvey 测了自家的 BigLaw Bench,3 Flash2.5 Flash提升了 7%,低延迟加强推理,完美适合大批量法律文档处理。

GitHub Copilot 官宣支持Gemini 3 Flash,VS Code 和移动端全覆盖。

JetBrains、Figma、Cursor 也都已经接入。


怎么用?

从今天开始,Gemini 3 Flash成为了 Gemini app 的默认模型。

全球所有用户自动升级。

你打开 Gemini,默认就是用它。

关键是,免费。

开发者这边,Google AI Studio、Gemini CLI、Vertex AI 都能用。

谷歌上个月发布的 agentic 开发平台反重力(Antigravity)也同步支持。

另外有个好消息。

Gemini 3 FlashAPI 免费层级也能调用!

前一阵谷歌取消了免费层级的2.5 ProAPI,3 Flash加回来了。

但,亲测 RPM(每分钟请求数)只有 5,RPD(每天请求数)只有 20。

聊胜于无吧。


12 月初,Sam Altman 给 OpenAI 团队发了「红色警戒」Code Red 的内部信。

暂停一切非核心项目。

GPT-5.2发布后,他又自信地表示,预计将于明年 Q1 解除 Code Red。

今天,谷歌发布Gemini 3 Flash

这下,OpenAI 的「红色警戒」又得继续下去了。


我是木易,一个专注 AI 领域的技术产品经理,国内 Top2 本科 + 美国 Top10 CS 硕士。

相信 AI 是普通人的“外挂”,致力于分享 AI 全维度知识。这里有最新的 AI 科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”,用 AI 为你的未来加速。


精选推荐

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/23 19:33:59

46、X 系统扩展与兼容性函数详解

X 系统扩展与兼容性函数详解 1. 扩展相关内容 1.1 协议请求与同步调用 每个协议请求都有所不同,若需更多信息,可查看 Xlib 源码示例。在同步调用方面,每个过程在返回给用户之前,都应调用一个名为 SyncHandle 的宏。若启用了同步模式(可参考 XSynchronize ),请求会…

作者头像 李华
网站建设 2026/6/23 19:33:19

31、Awk脚本语言快速参考指南

Awk脚本语言快速参考指南 1. 命令行语法 调用awk有两种基本形式: - awk [-v var=value] [-F re] [--] ’pattern { action }’ var=value datafile(s) - awk [-v var=value] [-F re] -f scriptfile [--] var=value datafile(s) awk命令行由命令、脚本和输入文件名组成…

作者头像 李华
网站建设 2026/6/23 19:35:56

Kotaemon如何平衡速度与精度?检索-重排协同机制

Kotaemon如何平衡速度与精度?检索-重排协同机制 在构建企业级智能问答系统时,我们常面临一个棘手的权衡:用户希望答案来得快,又要求内容足够准确。尤其在金融、医疗等高敏感领域,哪怕0.5秒的延迟或一次轻微的事实偏差&…

作者头像 李华
网站建设 2026/6/23 19:31:12

为什么越来越多开发者选择Kotaemon做知识问答系统?

为什么越来越多开发者选择Kotaemon做知识问答系统? 在企业智能化浪潮中,一个看似简单却长期困扰技术团队的问题正变得愈发紧迫:如何让AI真正“懂”自家的知识?不是靠泛泛而谈的通用模型生成似是而非的答案,而是精准、可…

作者头像 李华
网站建设 2026/6/23 21:29:24

Kotaemon能否用于专利检索?知识产权领域新应用

Kotaemon能否用于专利检索?知识产权领域新应用 在知识产权的世界里,时间就是竞争力。一家科技公司正准备推出新一代固态电池产品,法务团队却面临紧迫任务:必须在两周内完成全球相关专利的排查,避免侵权风险。传统方式下…

作者头像 李华