Google I/O 2026 深度解读:Gemini 进入 Agentic 时代

Google I/O 2026 深度解读:Gemini 进入 Agentic 时代

2026/06/109 分钟
分类:学习思考
标签:#Gemini#Google#AI#AI大模型#Agent#科技前沿
📡
本文首发于黑粉科技公众号

Gemini 进入 Agentic 时代 谷歌这次到底放了什么大招?

从「回答问题」到「替你做事」· 1800亿美元押注全栈Agent生态 托管式智能体 · 主动工作流 · Gemini Spark 24/7后台Agent
2026年5月19日 · Google I/O · TechCrunch、Google官方、CNET
Google I/O 2026 主题演讲现场 · 来源:The Verge
Google I/O 2026 主题演讲现场 · 来源:The Verge

一句话总结:AI不再只是聊天机器人了

5月19日凌晨,Google I/O 2026开幕。Sundar Pichai 在台上说了一句话,我认为可以载入AI史册:
最前沿的 Agent 可能只触达过世界上 0.1% 的人。
—— Sundar Pichai,Google CEO,I/O 2026 主题演讲
这句话背后的潜台词是:Agent技术的渗透率还极低,而Google要把它推向大众
整场发布会看下来,Google的核心叙事只有一个转变——从「回答问题」走向「替你做事」。不是又多了几个模型名字那么简单,而是整个平台战略从「模型能力赛」转向了「Agent生态战」。
🔢
9亿+ — Gemini App 月活用户 (一年内翻倍,已是全球最大AI应用)

新模型三件套:Flash、Omni、Spark

这次Google发了三个新模型/产品,每一个定位都很清晰:

Gemini 3.5 Flash —— 速度与成本的卷王

Google 这次不追求「最聪明」,而是打了 「单位成本智能」 这张牌。Gemini 3.5 Flash 推理速度 289 tokens/秒,是竞品前沿模型的 4倍,内部跑 Antigravity 时甚至达到 12倍
指标
Gemini 3.5 Flash
GPT-5.5
Claude Opus 4.7
推理速度
289 tokens/s ✅
约72 tokens/s
约65 tokens/s
API输出价格
$9.00/百万tokens ✅
$25-30/百万tokens
$25-30/百万tokens
成本优势
基准 ✅
贵 3倍
贵 3倍
Terminal-Bench 2.1
76.2%
83.4%
69.2%
※ 数据来源:Google I/O 2026 官方演示、TechCrunch 报道 | 速度对比基于公开API
关键洞察:虽然GPT-5.5和Claude Opus 4.7在深度推理上仍然更强,但Gemini 3.5 Flash以极低价格覆盖了 80%的日常Agent任务需求。Google的策略很清楚:不赢单项冠军,赢整个生态。
💡
Gemini 3.5 Pro 并没有在 I/O 上发布,Pichai 透露「内部已经在用」,将于2026年夏天亮相。

Gemini Omni —— 多模态世界模型

Omni 是本届I/O最具视觉冲击力的发布。它是一个原生多模态模型,支持任意模态输入到任意模态输出(any-to-any):
  • 视频生成:可生成长达10秒的视频片段
  • 视频编辑:通过自然语言指令修改视频内容(「一句话改电影」)
  • 100万Token上下文窗口
  • 物理模拟准确率 77.1%(World Model 物理一致性基准)
真正的突破在于让模型通过视频生成理解物理世界的运作规律。
—— Oriol Vinyals,Google DeepMind 副总裁,Gemini 联合负责人
Gemini Omni 多模态能力演示 · 来源:Google I/O 2026
Gemini Omni 多模态能力演示 · 来源:Google I/O 2026

Gemini Spark —— 你的24/7后台AI管家

Spark是关注度比 Antigravity 低,但对普通用户影响可能最大的产品。它是内置在Gemini App里的 24/7后台AI Agent,跑在专属Google Cloud虚拟机上——你把电脑关了它还在干活
功能
描述
状态
Daily Brief
每天早上自动汇总Gmail+Calendar,生成工作简报
已上线
跨应用任务
在Gmail、Drive、Calendar、Docs间执行多步骤任务
已上线
自定义Skills
支持自定义技能和第三方服务对接
已上线
主动预警
能主动执行任务并发出提醒
已上线
Booking Agent
代替用户完成订票、预约等操作
夏季上线
※ 仅面向 Google AI Ultra 订阅用户($99.99/月),目前仅支持美国英语用户
⚠️
Spark 目前仍有幻觉问题——实测会编造不存在的链接和表格。泄露的用户条款还表明它「可能在未经许可的情况下分享你的信息」。信任成本不低。
Gemini Spark 产品界面 · 来源:Engadget
Gemini Spark 产品界面 · 来源:Engadget

核心概念:从「被动回答」到「主动执行」

Google I/O 2026 最核心的概念转变,是一个词:Proactive Workflows(主动工作流)
传统模式下,你得主动去问AI:「帮我总结一下今天的邮件」。在Agentic模式下,AI会持续监控 → 主动发现问题 → 自主执行任务 → 汇报结果。你不需要叫它,它就在后台一直帮你盯着。
从被动聊天到主动执行 —— AI Agent 的范式转变
从被动聊天到主动执行 —— AI Agent 的范式转变
主动工作流
描述
Daily Brief
每天早上自动汇总Gmail + Calendar,生成工作简报
Universal Cart
跨Search/Gmail/YouTube追踪商品价格,自动提醒优惠
Info Agents
持续运行的后台智能体,监控网页/数据源变化
Gmail Live / Docs Live
Workspace中的实时AI协作功能
※ 这些功能将在2026年夏季陆续上线
InfoQ 对此的评论一针见血:「从回答问题到常驻工作流系统——这可能变成 persistent workflow system。」 Google 的终极愿景是:Gemini不再是一个你打开的应用,而是一个始终在后台运行的基础设施。

开发者核武器:Antigravity 2.0

如果说Spark面向普通用户,那 Antigravity 2.0 就是面向开发者的核武器。
DeepMind CTO Koray Kavukcuoglu 明确表态:「Not an IDE, but an agent-first dev platform.」 它不只是一个编辑器或CLI,而是一套四件套:
组件
定位
类比
桌面应用
可视化Agent管理界面,多任务并行
Claude.ai + 任务调度器
Antigravity CLI
终端版,Go语言,替代Gemini CLI
Claude Code,但多Agent并行
Python SDK
自定义Agent workflow
LangChain,但Google亲生
VS Code插件
IDE内Agent视图+代码补全
Cursor,但套壳Gemini
※ 底层运行 Gemini 3.5 Flash,夏季全面免费使用
📊
93 — 个Agent同时协作 (12小时内构建了一个完整的操作系统内核,成本仅约$1,000)
这个演示堪称全场最炸:93个Agent在12小时内构建了一个完整的操作系统内核,成本仅约$1,000。以前这种规模的项目需要一个团队干几个月。
Antigravity 内部跑 Gemini 3.5 Flash 的速度是公开API的12倍。公开API已经是「4x比同类frontier模型快」了,内部12x什么概念……

Managed Agents:Agent生态的基础设施

如果说Antigravity是开发者工具,那 Managed Agents 就是整个Agent生态的底层基础设施。它通过Gemini API提供,是Google Agent战略的地基层。
特性
Google Managed Agents
OpenAI Agents API
Anthropic Tool Use
运行环境
隔离Linux沙箱 ✅
云端函数
客户端执行
编排层
Antigravity 2.0 ✅
自建
自建
状态持久化
支持 ✅
有限
不支持
企业治理
内置 ✅
有限
有限
※ 来源:Google I/O 2026 官方文档、EnterpriseDNA 分析
每个Agent运行在独立的沙箱化Linux容器中,支持跨会话保持状态、多工具调用(代码执行、API调用、文件操作),并内置企业级安全沙箱。开发者通过Gemini API一次性调用即可部署可执行的数据分析Agent,无需自建基础设施。
Google 的 Agent 生态全栈架构 · 来源:Google I/O 2026
Google 的 Agent 生态全栈架构 · 来源:Google I/O 2026

三国杀:Google vs OpenAI vs Anthropic

2026年的AI竞争格局,用一张表就能看清楚三家的差异化路线:
维度
Google
OpenAI
Anthropic
战略定位
生态内核(基础设施+平台)
超级App(ChatGPT为中心)
开发者+企业聚焦
Agent模式
全栈:模型+编排+沙箱+分发
模型+API
Tool Use+API
分发渠道
Search 25亿MAU + Android + Workspace
ChatGPT + API
纯API分发
价格优势
$9/百万output ✅
$25-30/百万output
$25-30/百万output
深度推理
3.5 Pro(夏季发布)
GPT-5.5 领先
Opus 4.8 领先
杀手级产品
Spark + Antigravity
Codex + ChatGPT Ads
Claude Code + Dynamic Workflows
※ 基于2026年6月最新信息整理
2026年AI三巨头竞争格局
2026年AI三巨头竞争格局
人人都是产品经理的分析一针见血:「谷歌的护城河从来不是模型,而是搜索分发与AI Overviews。」 Google 的差异化优势在于渠道、设备、企业入口三位一体:Search AI概览覆盖25亿MAU、Android设备+AR眼镜(与三星量产)、Workspace企业级入口。
Google I/O 2026 Was Not Just a Model Launch. It Was a Platform Shift.(这不仅是模型发布,而是平台级转变。)

1800亿美元:All in Agent生态

Google 2026年的资本支出预算是 $1,800-1,900亿美元,约为2022年的 6倍。这笔钱覆盖了从芯片(TPU)到模型(Gemini)到平台(Antigravity)到应用(Spark)的全链路。
📈
$1,800亿 — 2026年资本支出预算 (约为2022年的6倍,2027年还将「显著增加」)
指标
数据
意义
Gemini App MAU
9亿+
一年内翻倍,全球最大AI应用
Search AI概览MAU
25亿
覆盖全球30%+人口
AI Mode用户
10亿+
一年内突破
月处理Token
3.2千万亿
增长300倍
月活开发者
850万
开发者生态规模
Cloud积压订单
$4,600亿+
Q1近翻倍
※ 数据来源:Google I/O 2026 官方数据、Alphabet 投资者演示
Google Cloud的积压订单在Q1 2026近翻倍至$4,600亿以上,月处理Token增长了300倍。这些数字说明:企业对AI Agent的需求正在爆发式增长

Vinyals的AGI路线图:Agent将能自主搭建系统

Oriol Vinyals(Google DeepMind副总裁,Gemini联合负责人)在6月的深度访谈中系统阐述了AGI的三条进化主线:
主线
核心内容
多模态学习
从图像/视频/音频中挖掘知识
World Model(世界模型)
模拟物理世界的运作规律
Agent规划与记忆
自主行动 + 从经验中持续学习
※ 来源:搜狐专访、Google DeepMind 官方博客
未来Agent将能够自主搭建系统,动态生成工具链和子Agent。AGI需要从真实经验中持续学习的能力。
—— Oriol Vinyals,Google DeepMind 副总裁
这意味着Google正在押注:Agent不仅是「执行预定义任务」,而是能自主设计整个系统的执行框架。这与Antigravity 2.0的「93 Agent构建OS内核」演示一脉相承。

风险与挑战:Agent时代没那么好进

当然,Google的Agent愿景很美好,但落地还有不少坑:
  • 幻觉问题:Gemini Spark实测会编造链接和表格,信任成本高
  • 价格门槛:$99.99/月的Ultra价格不便宜,普通用户望而却步
  • 隐私争议:泄露的条款表明Spark可能在未经许可的情况下分享用户信息
  • 深度推理差距:在需要精密推理的任务上仍落后于GPT-5.5和Claude Opus 4.8
  • 调试复杂度:多Agent并行出错时,定位哪个sub-agent搞错很痛苦
🚨
Anthropic 同期发出了「刹车踏板」警告——AI模型可能很快就能在无人监督的情况下自我改进。Agent时代的安全治理,是整个行业都需要面对的问题。

我的判断:这场仗Google有得打

整场I/O看下来,Google的战略很清晰:不追求最聪明,追求最便宜最快;不做超级App,做生态内核;从回答问题到替你做事。
Google手握三大不可替代的分发渠道——Search(25亿MAU)+ Android(30亿设备)+ Workspace(3.5亿付费用户)。这是任何独立AI公司短期内都无法复制的护城河。
  • 如果你是Google Workspace重度用户:Spark + Antigravity组合比任何外部Agent都好用
  • 如果你是Agent系统开发者:Managed Agents API值得认真研究,多Agent编排设计相当完善
  • 如果你主要做深度代码任务:暂时还是Claude Code和GPT-5.5更强,等Gemini 3.5 Pro夏季发布后再评估
  • 如果你关注AI安全:Anthropic的「刹车踏板」警告值得认真对待
📌
一句话总结 Google I/O 2026标志着AI竞争从「模型能力赛」转向「Agent生态战」。Google用1800亿美元赌注、全栈Agent架构、和25亿搜索MAU的分发优势,宣告了一个新时代的到来。Agent技术目前只触达了0.1%的人——但很快,它会改变所有人的工作方式。
本文数据来源:Google I/O 2026 官方主题演讲、TechCrunch、CNET、EnterpriseDNA、网易科技实测、搜狐专访Oriol Vinyals,2026年5月19-20日发布。
分享到:

相关文章

返回首页