1/4
每周 AI 资讯精选

每周 AI 资讯精选|2026 第 21 周:Google I/O 开幕、Anthropic 逆袭、腾讯混元重生

本周 AI 圈五大要事:Google I/O 2026 发布 Gemini 3.5 Flash 与全天候代理 Spark,Anthropic 商业份额首超 OpenAI,腾讯混元 Hy3 登顶 OpenRouter 全球榜首,Codex 手机端上线,PRISM 论文揭示 SFT→RL 的隐性断层。

2026/05/20 16:44:46

ギャラリー

这周 AI 圈很忙——Google 开年大会、Anthropic 逆袭、腾讯混元重生、Codex 手机端落地,外加一篇可能改变模型训练范式的论文。五件事,一张图一件,刷完就懂。

01|Google I/O 2026:「Agentic Gemini Era」正式开幕

北京时间 5 月 20 日,Sundar Pichai 站上 I/O 舞台,开场定调四个字:代理式 AI 时代
本届大会核心是两款新模型和一个 Agent 产品:
  • Gemini 3.5 Flash:5 月 19 日正式上线,代码能力逼近 GPT-5.5,接口价格延续 Flash 系列的低位1
  • Gemini Omni:全模态理解旗舰,同批上线
  • Gemini Spark:全天候 AI 代理,可托管邮件、执行任务、自主购物;本周开始向受信任测试者推送,下周向美国 AI Ultra 订阅用户开放 Beta2
Alphabet 同步将 2026 财年资本支出上调至 1900 亿美元,比此前预期高出约 200 亿。3
リンクプレビューを読み込んでいます…

02|Anthropic 首超 OpenAI:Claude Code 拉开差距

Ramp 覆盖美国 5 万多家企业的消费数据显示,Anthropic 商业客户份额达 34.4%,首次超越 OpenAI 的 32.3%4
背后主要驱动力只有一个:Claude Code。
这个 2025 年 5 月才公开上线的命令行编程工具,年化收入超过 25 亿美元,在 Anthropic 历史上增长速度排名第一,贡献了 GitHub 全球公开提交的 4%5
Anthropic CEO 在最新专访中透露:Claude 新功能几乎完全由 AI 自主开发,软件将步入「免费时代」。6

03|腾讯混元 Hy3:半年重建,登顶 OpenRouter 榜首

马化腾曾公开承认腾讯 AI 「漏水」,但这周有了新注脚。
混元 Hy3 上线 OpenRouter 后,周调用量跃居全平台榜首,连续数周超过 GPT-5.5 和 Claude 4.7。3
背景:腾讯在 2025 年 12 月引入首席 AI 科学家姚顺雨,随即启动系统性技术重构,耗费数月重建预训练、强化学习和算力基础设施,2026 年 Q2 初推出混元 Hy3。7
「根据腾讯内部进展,更大尺寸的旗舰模型已在训练中。」——21 经济网报道引述腾讯内部说法。8

04|Codex 手机端上线:AI 编程从桌面走到口袋

OpenAI Codex 正式推出手机端版本,移动设备上可直接写代码、调试和提交 PR。4
同周,Grok Build 也宣布对标 Claude Code 的功能更新:允许 Grok 在专属沙盒环境中编辑文件、执行自动化任务,从单次对话工具升级为持久化工作区,用户可导入其他 AI 产品的 skills.md
AI 编程工具的战场正在从「谁更聪明」转向「谁更顺手」——桌面、手机、IDE、终端,每个入口都在被抢占。

05|论文速读:PRISM——SFT 和 RL 之间有个你一直忽略的坑

来自港科大(广州)、南洋理工、清华的联合研究发现:SFT 之后直接上 RL,模型的性能反而会先掉一截再爬回来。
以 Qwen3-VL-8B 为例:SFT 后平均准确率从 63.3% 掉到 58.1%,做完强化学习才勉强回到起点。本质原因是 SFT 引入了分布偏移——模型「带着伤」进入强化学习阶段,RL 的大部分计算都在还 SFT 的债。
PRISM 在两者之间插入一个「分布对齐」阶段,用混合专家判别器分别修复感知漂移和推理漂移,4B 模型平均提升 +4.4,8B 提升 +6.0。9
リンクプレビューを読み込んでいます…

下期预告

Google Spark 代理 Beta 即将面向更多用户开放;Gemini 3.5 Pro 与 Gemini Omni 的评测数据陆续出炉。下期继续跟进。

コメント