AI Agent 生态速报 | 2026-05-20:Google I/O 落地,Gemini 3.5 Flash 重新定义 Agent 开发基线
Agent 生态周报
2026/05/20 10:05:26@chinamusk

AI Agent 生态速报 | 2026-05-20:Google I/O 落地,Gemini 3.5 Flash 重新定义 Agent 开发基线

Google I/O 2026 主题演讲落地:Gemini 3.5 Flash(4× 速度、<0.5× 成本)+ Antigravity 2.0(Agent 原生 IDE)+ Gemini Spark(24/7 个人 Agent)三件套,构成一条与 LangGraph/AutoGen 等开源框架完全不同的托管式 Agent 开发路径。Search 信息代理、Universal Commerce Protocol 购物 Agent、WebMCP Chrome 接入层同步上线,Google 正将搜索引擎重构为 AI Agent 编排层。

研究速览

本期覆盖 5/19 上午至 5/20 凌晨动态,核心是 Google I/O 2026 正式落地:Sundar Pichai 宣布进入「Agent Era」,用 Gemini 3.5 Flash + Antigravity 2.0 + Gemini Spark 三件套,把 Google 从搜索引擎重新定义为 AI 代理编排层。对于关注技术选型的开发者和产品团队而言,这次 I/O 提供了一条与 LangGraph / AutoGen 等开源框架完全不同的托管式 Agent 路径,值得评估。

Gemini 3.5 Flash:Google 押注 Agent-first 的模型层

Google 在 I/O 2026 发布 Gemini 3.5 Flash,定位是「最强编码与 Agent 模型」。核心数据:1
  • Terminal-Bench 2.1 得分 76.2%,MCP Atlas 达 83.6%,GDPval-AA 达 1656 Elo
  • 输出 token 速度是其他前沿模型的 4 倍;同等任务成本不足竞品的一半
  • 今日起全面可用:Gemini API、Gemini App、Search AI Mode,同时替换为全局默认模型
DeepMind 首席技术官 Koray Kavukcuoglu 表示,Gemini 3.5 Flash 在几乎所有基准上优于 Gemini 3.1 Pro,包括编码、Agent 任务和多模态推理。2
「3.5 Flash 的速度对 Agent 任务尤为关键——多个 AI Agent 同时运行长周期任务时,延迟会被乘数放大。」——Kavukcuoglu
内部演示中,Google 工程师 Varun Mohan 在 Antigravity 内用多 Agent 并发方式,从零构建了一个操作系统。模型可连续自主运行数小时,遇到需要判断或权限问题时会暂停等待用户输入。
Gemini 3.5 Pro 已在内部测试中,Google 的设计意图是 Flash 作为执行子 Agent、Pro 作为编排层 Planner,两者协同。预计下月发布。2

Antigravity 2.0:Agent 原生的开发 IDE

Antigravity 2.0 以独立桌面应用形式发布,定位是「Agent 原生开发环境」。3
Kavukcuoglu 描述 Flash 3.5 与 Antigravity 的协同关系为:为 Agent 提供「能够生活、工作和执行的原生环境」。与 Cursor / Windsurf 等 IDE 相比,Antigravity 的差异点在于内置了 Agent 集群编排能力,而非单一补全式助手。
内置优化版 Flash,速度比通用前沿模型快 12 倍,今日已向全体用户开放。

Gemini Spark:24/7 个人 Agent,下周 Beta

Gemini Spark 是 Google 推出的个人级 24 小时常驻 Agent,由 Gemini 3.5 Flash 和 Antigravity 驱动,运行在 Google Cloud 专用虚拟机上(无需本地设备持续开机)。4
关键能力和上线节奏:
  • 首批集成 Google 自有工具(Gmail、Calendar、Tasks 等)
  • 未来几周通过 MCP 支持第三方工具接入
  • 下周面向美国 Google AI Ultra 订阅用户开放 Beta
  • 今年夏天在 Chrome 内直接运行,覆盖全 Web
Android 方面,Google 同步宣布 Android Halo——在系统 UI 层展示 Spark 任务实时进度的界面空间,今年晚些时候上线。
Gemini Spark 与上期追踪的 Gemini Intelligence(Android 底层 Agent 层)形成层次关系:Halo 是 Agent 状态的系统级可见性入口,Spark 是具体执行 Agent 的承载体。

Search 的 Agent 化:信息代理 + 购物 Agent

Google Search 在本次 I/O 正式进入「Search Agents 时代」,首批推出两类 Agent:
信息代理(Information Agents):用户可创建、自定义、管理多个个性化 Agent,24 小时后台持续监测特定主题(博客、新闻、社交媒体、实时财经/购物/体育数据),在触发时推送整合好的更新并支持操作。5 今年夏季率先向美国 Google AI Pro 和 Ultra 用户推出。
这是对 2003 年 Google Alerts 的根本性升级——Alerts 只匹配关键词发送链接,信息代理会整合多源内容、对比观点、提供可执行洞察。6
Google 搜索信息 Agent 创建界面,用户输入「keep me updated when any of my favorite athletes announce sneaker collabs」,显示 Creating information agent|截图来自 TechCrunch
Google 搜索信息 Agent 创建界面,用户输入「keep me updated when any of my favorite athletes announce sneaker collabs」,显示 Creating information agent|截图来自 TechCrunch
购物 Agent:Google 同步发布了针对购物场景的 Agent 能力三件套:7
功能定位覆盖范围
Universal Cart(通用购物车)跨 Google 全平台聚合购物车,自动追踪价格、寻找优惠Search、Gemini、Gmail、YouTube
Universal Commerce Protocol(UCP)支持 AI Agent 直接代用户下单,对接零售商Shopify、Amazon、Walmart、Stripe 等
Agent Payments Protocol 2(AP2)用户设置 AI 可购买额度与品类上限,保留全操作记录Gemini Spark
这套购物 Agent 基础设施的意义,在于 AP2 首次将「用户授权边界」作为一等设计约束引入代理购物——上期 Cloudflare+Stripe 协议的凭据治理问题,Google 在自己的 Agent 购物层里给出了一个具体的产品级答案。

Chrome 的 Agent 化:WebMCP + DevTools Agent

Google 同步宣布 Chrome 的 Agent 接入层升级,目标是「让 Web 对 Agent 就绪」(agent-ready web):8
WebMCP:Chrome 即将支持 WebMCP API(源试用已从 Chrome 149 Beta 开始),允许网站向 Agent 暴露预设的 JavaScript 函数和 HTML 表单能力。相比 Agent 截图 + DOM 遍历的方式,WebMCP 的路径更直接,速度更快。Booking.com、Expedia、Instacart、Shopify、Redfin 均表示感兴趣。
Chrome DevTools Agent:支持开发者将自有 Agent 接入 DevTools,Agent 可直接访问控制台日志、网络流量、可访问性树,可自主观测并响应运行状态。已升级至 1.0,支持超过 20 个编码 Agent,通过 Chrome 内置 MCP 服务器或 Chrome DevTools CLI 运行。
WebMCP 与上期 Android 16 内嵌 @AppFunction 等价 MCP 机制形成呼应:Google 正在 Android 和 Chrome 两条线同步铺设 MCP 兼容接入层,为 Gemini 生态 Agent 提供跨平台的工具调用标准。

开发者选型:Antigravity vs 开源框架

本次 I/O 为开发者带来了一个此前不存在的选项:托管式 Agent 开发路径
现有主流路径(LangGraph、AutoGen、CrewAI 等)均要求开发者自行管理 Agent 编排逻辑、状态持久化、工具注册和运行时环境。Antigravity 2.0 + Gemini Spark 的组合把这些层封装为平台级能力,代价是深度绑定 Google 生态。
几个选型判断点:
  • 速度与成本敏感的 Agent 任务:Gemini 3.5 Flash 4× 速度 + <0.5× 成本的组合,直接挑战 GPT-4o / Claude 3.5 Sonnet 的定价,在多 Agent 并发场景下经济优势更明显
  • 需要 MCP 生态对接:Antigravity 原生支持 MCP,Gemini Spark 也将在未来几周接入;LangChain 和 LangGraph 同样支持 MCP,但 Antigravity 在 Google 生态工具(Gmail / Search / Shopping)的集成深度更高
  • 企业自部署和数据主权:Antigravity 当前为 Google 云托管,私有部署需求仍需评估;LangGraph / AutoGen 在这一维度仍有优势
Google 今年 API 每分钟处理约 190 亿 token,过去 12 个月企业 token 用量同比增长 7 倍,基础设施规模提供了一定的延迟稳定性背书。3
正在加载链接预览…

围绕这条内容继续补充观点或上下文。

  • 登录后可发表评论。