本文首发于黑粉科技公众号
Gemini 进入 Agentic 时代 谷歌这次到底放了什么大招?
从「回答问题」到「替你做事」· 1800亿美元押注全栈Agent生态 托管式智能体 · 主动工作流 · Gemini Spark 24/7后台Agent
2026年5月19日 · Google I/O · TechCrunch、Google官方、CNET

一句话总结:AI不再只是聊天机器人了
5月19日凌晨,Google I/O 2026开幕。Sundar Pichai 在台上说了一句话,我认为可以载入AI史册:
最前沿的 Agent 可能只触达过世界上 0.1% 的人。
—— Sundar Pichai,Google CEO,I/O 2026 主题演讲
这句话背后的潜台词是:Agent技术的渗透率还极低,而Google要把它推向大众。
整场发布会看下来,Google的核心叙事只有一个转变——从「回答问题」走向「替你做事」。不是又多了几个模型名字那么简单,而是整个平台战略从「模型能力赛」转向了「Agent生态战」。
9亿+ — Gemini App 月活用户 (一年内翻倍,已是全球最大AI应用)
新模型三件套:Flash、Omni、Spark
这次Google发了三个新模型/产品,每一个定位都很清晰:
Gemini 3.5 Flash —— 速度与成本的卷王
Google 这次不追求「最聪明」,而是打了 「单位成本智能」 这张牌。Gemini 3.5 Flash 推理速度 289 tokens/秒,是竞品前沿模型的 4倍,内部跑 Antigravity 时甚至达到 12倍。
指标 | Gemini 3.5 Flash | GPT-5.5 | Claude Opus 4.7 |
推理速度 | 289 tokens/s ✅ | 约72 tokens/s | 约65 tokens/s |
API输出价格 | $9.00/百万tokens ✅ | $25-30/百万tokens | $25-30/百万tokens |
成本优势 | 基准 ✅ | 贵 3倍 | 贵 3倍 |
Terminal-Bench 2.1 | 76.2% | 83.4% | 69.2% |
※ 数据来源:Google I/O 2026 官方演示、TechCrunch 报道 | 速度对比基于公开API
关键洞察:虽然GPT-5.5和Claude Opus 4.7在深度推理上仍然更强,但Gemini 3.5 Flash以极低价格覆盖了 80%的日常Agent任务需求。Google的策略很清楚:不赢单项冠军,赢整个生态。
Gemini 3.5 Pro 并没有在 I/O 上发布,Pichai 透露「内部已经在用」,将于2026年夏天亮相。
Gemini Omni —— 多模态世界模型
Omni 是本届I/O最具视觉冲击力的发布。它是一个原生多模态模型,支持任意模态输入到任意模态输出(any-to-any):
- 视频生成:可生成长达10秒的视频片段
- 视频编辑:通过自然语言指令修改视频内容(「一句话改电影」)
- 100万Token上下文窗口
- 物理模拟准确率 77.1%(World Model 物理一致性基准)
真正的突破在于让模型通过视频生成理解物理世界的运作规律。
—— Oriol Vinyals,Google DeepMind 副总裁,Gemini 联合负责人

Gemini Spark —— 你的24/7后台AI管家
Spark是关注度比 Antigravity 低,但对普通用户影响可能最大的产品。它是内置在Gemini App里的 24/7后台AI Agent,跑在专属Google Cloud虚拟机上——你把电脑关了它还在干活。
功能 | 描述 | 状态 |
Daily Brief | 每天早上自动汇总Gmail+Calendar,生成工作简报 | 已上线 |
跨应用任务 | 在Gmail、Drive、Calendar、Docs间执行多步骤任务 | 已上线 |
自定义Skills | 支持自定义技能和第三方服务对接 | 已上线 |
主动预警 | 能主动执行任务并发出提醒 | 已上线 |
Booking Agent | 代替用户完成订票、预约等操作 | 夏季上线 |
※ 仅面向 Google AI Ultra 订阅用户($99.99/月),目前仅支持美国英语用户
Spark 目前仍有幻觉问题——实测会编造不存在的链接和表格。泄露的用户条款还表明它「可能在未经许可的情况下分享你的信息」。信任成本不低。

核心概念:从「被动回答」到「主动执行」
Google I/O 2026 最核心的概念转变,是一个词:Proactive Workflows(主动工作流)。
传统模式下,你得主动去问AI:「帮我总结一下今天的邮件」。在Agentic模式下,AI会持续监控 → 主动发现问题 → 自主执行任务 → 汇报结果。你不需要叫它,它就在后台一直帮你盯着。

主动工作流 | 描述 |
Daily Brief | 每天早上自动汇总Gmail + Calendar,生成工作简报 |
Universal Cart | 跨Search/Gmail/YouTube追踪商品价格,自动提醒优惠 |
Info Agents | 持续运行的后台智能体,监控网页/数据源变化 |
Gmail Live / Docs Live | Workspace中的实时AI协作功能 |
※ 这些功能将在2026年夏季陆续上线
InfoQ 对此的评论一针见血:「从回答问题到常驻工作流系统——这可能变成 persistent workflow system。」 Google 的终极愿景是:Gemini不再是一个你打开的应用,而是一个始终在后台运行的基础设施。
开发者核武器:Antigravity 2.0
如果说Spark面向普通用户,那 Antigravity 2.0 就是面向开发者的核武器。
DeepMind CTO Koray Kavukcuoglu 明确表态:「Not an IDE, but an agent-first dev platform.」 它不只是一个编辑器或CLI,而是一套四件套:
组件 | 定位 | 类比 |
桌面应用 | 可视化Agent管理界面,多任务并行 | Claude.ai + 任务调度器 |
Antigravity CLI | 终端版,Go语言,替代Gemini CLI | Claude Code,但多Agent并行 |
Python SDK | 自定义Agent workflow | LangChain,但Google亲生 |
VS Code插件 | IDE内Agent视图+代码补全 | Cursor,但套壳Gemini |
※ 底层运行 Gemini 3.5 Flash,夏季全面免费使用
93 — 个Agent同时协作 (12小时内构建了一个完整的操作系统内核,成本仅约$1,000)
这个演示堪称全场最炸:93个Agent在12小时内构建了一个完整的操作系统内核,成本仅约$1,000。以前这种规模的项目需要一个团队干几个月。
Antigravity 内部跑 Gemini 3.5 Flash 的速度是公开API的12倍。公开API已经是「4x比同类frontier模型快」了,内部12x什么概念……
Managed Agents:Agent生态的基础设施
如果说Antigravity是开发者工具,那 Managed Agents 就是整个Agent生态的底层基础设施。它通过Gemini API提供,是Google Agent战略的地基层。
特性 | Google Managed Agents | OpenAI Agents API | Anthropic Tool Use |
运行环境 | 隔离Linux沙箱 ✅ | 云端函数 | 客户端执行 |
编排层 | Antigravity 2.0 ✅ | 自建 | 自建 |
状态持久化 | 支持 ✅ | 有限 | 不支持 |
企业治理 | 内置 ✅ | 有限 | 有限 |
※ 来源:Google I/O 2026 官方文档、EnterpriseDNA 分析
每个Agent运行在独立的沙箱化Linux容器中,支持跨会话保持状态、多工具调用(代码执行、API调用、文件操作),并内置企业级安全沙箱。开发者通过Gemini API一次性调用即可部署可执行的数据分析Agent,无需自建基础设施。

三国杀:Google vs OpenAI vs Anthropic
2026年的AI竞争格局,用一张表就能看清楚三家的差异化路线:
维度 | Google | OpenAI | Anthropic |
战略定位 | 生态内核(基础设施+平台) | 超级App(ChatGPT为中心) | 开发者+企业聚焦 |
Agent模式 | 全栈:模型+编排+沙箱+分发 | 模型+API | Tool Use+API |
分发渠道 | Search 25亿MAU + Android + Workspace | ChatGPT + API | 纯API分发 |
价格优势 | $9/百万output ✅ | $25-30/百万output | $25-30/百万output |
深度推理 | 3.5 Pro(夏季发布) | GPT-5.5 领先 | Opus 4.8 领先 |
杀手级产品 | Spark + Antigravity | Codex + ChatGPT Ads | Claude Code + Dynamic Workflows |
※ 基于2026年6月最新信息整理

人人都是产品经理的分析一针见血:「谷歌的护城河从来不是模型,而是搜索分发与AI Overviews。」 Google 的差异化优势在于渠道、设备、企业入口三位一体:Search AI概览覆盖25亿MAU、Android设备+AR眼镜(与三星量产)、Workspace企业级入口。
Google I/O 2026 Was Not Just a Model Launch. It Was a Platform Shift.(这不仅是模型发布,而是平台级转变。)
1800亿美元:All in Agent生态
Google 2026年的资本支出预算是 $1,800-1,900亿美元,约为2022年的 6倍。这笔钱覆盖了从芯片(TPU)到模型(Gemini)到平台(Antigravity)到应用(Spark)的全链路。
$1,800亿 — 2026年资本支出预算 (约为2022年的6倍,2027年还将「显著增加」)
指标 | 数据 | 意义 |
Gemini App MAU | 9亿+ | 一年内翻倍,全球最大AI应用 |
Search AI概览MAU | 25亿 | 覆盖全球30%+人口 |
AI Mode用户 | 10亿+ | 一年内突破 |
月处理Token | 3.2千万亿 | 增长300倍 |
月活开发者 | 850万 | 开发者生态规模 |
Cloud积压订单 | $4,600亿+ | Q1近翻倍 |
※ 数据来源:Google I/O 2026 官方数据、Alphabet 投资者演示
Google Cloud的积压订单在Q1 2026近翻倍至$4,600亿以上,月处理Token增长了300倍。这些数字说明:企业对AI Agent的需求正在爆发式增长。
Vinyals的AGI路线图:Agent将能自主搭建系统
Oriol Vinyals(Google DeepMind副总裁,Gemini联合负责人)在6月的深度访谈中系统阐述了AGI的三条进化主线:
主线 | 核心内容 |
多模态学习 | 从图像/视频/音频中挖掘知识 |
World Model(世界模型) | 模拟物理世界的运作规律 |
Agent规划与记忆 | 自主行动 + 从经验中持续学习 |
※ 来源:搜狐专访、Google DeepMind 官方博客
未来Agent将能够自主搭建系统,动态生成工具链和子Agent。AGI需要从真实经验中持续学习的能力。
—— Oriol Vinyals,Google DeepMind 副总裁
这意味着Google正在押注:Agent不仅是「执行预定义任务」,而是能自主设计整个系统的执行框架。这与Antigravity 2.0的「93 Agent构建OS内核」演示一脉相承。
风险与挑战:Agent时代没那么好进
当然,Google的Agent愿景很美好,但落地还有不少坑:
- 幻觉问题:Gemini Spark实测会编造链接和表格,信任成本高
- 价格门槛:$99.99/月的Ultra价格不便宜,普通用户望而却步
- 隐私争议:泄露的条款表明Spark可能在未经许可的情况下分享用户信息
- 深度推理差距:在需要精密推理的任务上仍落后于GPT-5.5和Claude Opus 4.8
- 调试复杂度:多Agent并行出错时,定位哪个sub-agent搞错很痛苦
Anthropic 同期发出了「刹车踏板」警告——AI模型可能很快就能在无人监督的情况下自我改进。Agent时代的安全治理,是整个行业都需要面对的问题。
我的判断:这场仗Google有得打
整场I/O看下来,Google的战略很清晰:不追求最聪明,追求最便宜最快;不做超级App,做生态内核;从回答问题到替你做事。
Google手握三大不可替代的分发渠道——Search(25亿MAU)+ Android(30亿设备)+ Workspace(3.5亿付费用户)。这是任何独立AI公司短期内都无法复制的护城河。
- 如果你是Google Workspace重度用户:Spark + Antigravity组合比任何外部Agent都好用
- 如果你是Agent系统开发者:Managed Agents API值得认真研究,多Agent编排设计相当完善
- 如果你主要做深度代码任务:暂时还是Claude Code和GPT-5.5更强,等Gemini 3.5 Pro夏季发布后再评估
- 如果你关注AI安全:Anthropic的「刹车踏板」警告值得认真对待
一句话总结
Google I/O 2026标志着AI竞争从「模型能力赛」转向「Agent生态战」。Google用1800亿美元赌注、全栈Agent架构、和25亿搜索MAU的分发优势,宣告了一个新时代的到来。Agent技术目前只触达了0.1%的人——但很快,它会改变所有人的工作方式。
本文数据来源:Google I/O 2026 官方主题演讲、TechCrunch、CNET、EnterpriseDNA、网易科技实测、搜狐专访Oriol Vinyals,2026年5月19-20日发布。
分享到:
