Scouts by Yutori 竞品情报简报 · 第 24 期

本期两条核心信号:Scouts agent 数骤降至 97(日环比 -40.1%),连续 3 日下行触及 5 月第二低值;此前 23 轮全部漏收的 eomag.io 深度访谈(5/9 发布)本轮完整抓取,Abhishek Das 系统阐述了「Broken Agents 批判 / Taste and Craft 差异化 / Dogfooding 文化 / Grad-CAM→Inspect Work 传承」等核心产品哲学。全渠道官方静默持续(Blog/Changelog 11 天、桌面端 16 天无更新),6 个追踪项均无突破,下一有时间坐标的节点为 5/19(FAANG 检查)和 5/20(n1.5 评测升级触发)。

覆盖时间:2026-05-16T00:37:17Z 至 2026-05-17T00:00+08:00(约 23 小时)
核心信号:本期有两条值得重点关注的信号。其一,Scouts agent 数骤降至 97,日环比 -40.1%,为 5 月 10 日以来第二低值,且已连续 3 日下行(185→162→97),值得持续观察。其二,此前 23 轮日报全部漏收的 eomag.io 深度访谈,本轮完整抓取:Abhishek Das(联合创始人/联合 CEO)于 5 月 9 日在访谈中首次系统阐述了 Yutori 的产品哲学、行业批判与技术传承路径,是迄今关于 Yutori 竞争逻辑最完整的一手文献。

一、eomag.io 访谈:Abhishek Das 产品哲学全景

Abhishek Das 肩部以上特写,戴圆形细框眼镜,穿蓝底红竖条纹立领衬衫
Abhishek Das 肩部以上特写,戴圆形细框眼镜,穿蓝底红竖条纹立领衬衫
eomag.io 于 2026 年 5 月 9 日发布长篇访谈「Why the Smartest People in AI Stopped Using Browsers」,由编辑 Jessica Lee 主持1。访谈分四章,覆盖 Abhishek Das 的个人历程、对 Web Agent 时机的判断、行业批判与产品哲学,以及可靠性论述与技术传承。这是第一篇完整记录 Yutori 内部竞争逻辑的外部媒体报道——出现时间恰在 n1.5 发布(5/6)后第三天,Together AI 合作性能数据公开(5/11)前两天,三者密集出现在同一周窗口内。

「Broken Agents」:行业容忍文化的批判

Abhishek Das 对当前 AI agent 市场的诊断直接而具体:
"There's basically a hundred different agent products out there that are saying that this can do anything on the web and you try it once and it doesn't really work."
「市面上基本有一百个不同的 agent 产品,都声称能在网页上做任何事,但试一次就不 work。」
他的论证重点不在单步能力,而在复合误差:「在一个 10 步、20 步或 50 步的工作流里,即使每步准确率达到 90%,10% 的错误率也会快速复合——最终成功率会很低。」1 这个论述的锋芒指向一个具体的接受门槛:「usually works」(10 次里 3-5 次成功)不应被接受。
其核心立场:
"It feels like we have started normalizing and developed a tolerance for non-determinism and low reliability in shipping products. I push back on that getting normalized."
「感觉我们已经开始将产品发布中的非确定性和低可靠性常态化,并发展出了对此的容忍。我反对这种常态化。」1

「Taste and Craft」:差异化的来源

在 coding LLM 把出原型变得极其容易的时代,Abhishek Das 认为真正的区分因素发生了转移:
"In a world where it's very easy to come up with first prototypes using coding LLMs, the true differentiator is in taste and craft in how intuitive and well-designed the product is."
「在用 coding LLM 出原型极其容易的时代,真正的区分因素在于产品直觉与工艺——产品有多直觉、多精心设计。」1
他举了 iOS/Android 短信验证码自动填充的例子:用户不会主动要求这个功能,但如果做出来了,用户会感到「被看见」、「有人在倾听」。这种「用户显性需求 + 产品直觉」的结合,被他定义为产品 taste 的来源。其信任建立逻辑也与此一脉相承:
"If we put attention to detail into parts of the product that users can see, then the user is more likely to trust the parts of the product that they cannot see."
「如果我们在用户看得见的部分投入细节关注,用户就更可能信任他们看不见的部分。」1
Abhishek Das 全身坐式肖像,办公室背景,后方白板写有笔记
Abhishek Das 全身坐式肖像,办公室背景,后方白板写有笔记

Dogfooding 文化:每周 1-1.5 小时的内部实验

Yutori 的内部产品优先级方法是 80/20:从 100 个候选功能中识别出最重要的 10 个,部分由用户需求驱动,部分由产品直觉驱动。执行层面,团队每周固定排出 1 到 1.5 小时专门用于 dogfooding 新功能1
更值得关注的是实验管线的规模:
"At any given point we're running like tens of experiments internally and maybe one of them will ship to the production version of the product that external users will see."
「任何给定时间点,我们内部同时运行着数十个实验,其中可能只有一个会发布到外部用户可见的生产版本。」1
结合近期 Blog/Changelog 11 天静默的外部表现,这段话给了一个合理解释框架:外部静默不等于内部停滞,密集的内部实验周期只有极少数会对外发布。

Grad-CAM 传承:从可解释性研究到「Inspect Work」

Abhishek Das 是 Grad-CAM 论文(引用量约 20,000-30,000 次,他本人评价为「quite non-trivial」)的支持作者,完成时他 25 岁1。Grad-CAM 的核心问题是:分类模型在预测图像类别时,模型实际在「看」图像的哪一部分?
这个可解释性问题在 Scouts 里有了产品化的延伸:
"With AI models, it is important for models to convey not just the final prediction or the final answer, but also the proof of work. What are the steps that went into arriving at this final answer?"
「对于 AI 模型而言,重要的不只是传达最终预测或答案,还要传达到达该答案的步骤——proof of work。」1
这正是 Scouts 「Inspect Work」按钮的底层逻辑:让用户看到 agent 访问了哪些网站、从哪里提取了信息,而不只是最终结果。从研究者视角来看,这是一条从 2016 年学术研究到 2026 年产品功能的直线传承。
Abhishek Das 坐式半身照,双手张开正在讲话,办公室背景
Abhishek Das 坐式半身照,双手张开正在讲话,办公室背景

5-10 年路线图信号

Abhishek Das 对产品路线的判断以 digital agents 为优先:「在 physical agents 成为现实之前,digital agents 将率先成为现实——digital agents 的时间线更短。」1 对未来 5-10 年 Web 交互形态的预测是:交互将在「稍高的抽象层级」进行,人们不再手动执行数字琐事,而是将 mundane stuff(日常琐事)委托给 AI agent,人机关系定位为「协同提升生产力,而非替代人类」。
访谈中还出现一处融资线索:Yutori 已从 Radical Ventures、Felicis,以及天使投资人李飞飞和 Jeff Dean 处筹集超过 1500 万美元1。这与此前 TipRanks 等渠道的报道一致,无新增金额信息。

二、产品侧:Agent 数骤降,官方渠道全线静默

Scouts 公开报告「AI LLMs Top News」2026-05-16 由 97 个 agent 生成,较 5/15 的 162 下降 -40.1%,较 5/14 的 185 下降 -47.6%2。8 日历史序列如下:
차트를 불러오는 중…
97 是 5 月 10 日(79 agents)以来第二低值。锯齿波动特征依然明显(峰谷差距最大为 79 到 185),单日读数不宜直接定性为趋势,但连续 3 日下行值得标注。
官方渠道方面,四个渠道同步静止:yutori.com/blog 最新条目仍为 5/6「Introducing Navigator n1.5」,已 11 天无新帖3;Changelog 同步4;桌面端 yutori-ai/desktop-releases v0.4.14 自 5/2 起已 16 天无新版本发布5;API 文档最新快照仍为 n1.5-202604286。社区与媒体侧同样静默:Reddit r/ArtificialInteligence 与 r/LocalLLaMA 前 25 条热帖零提及7,YouTube 搜索「Navigator n1.5 Yutori review」零结果8,ProductHunt 页面 followers 347 持平、评论归零依旧9。Together AI 博客仍未上线 Yutori 案例文章,自 @togethercompute 5/11 发帖预告「Full story →」链接已过 6 天10。n1.5(5/6 发布)的三项自评基准数据(Online-Mind2Web 94.5%、Navi-Bench v2 88.0%、Westworld 93.0%;均为 Yutori 自评,尚无第三方独立复现)发布 11 天后仍无任何独立评测报道11

三、追踪项状态表

追踪项状态持续本期判断
Scouts agent 数[连续下行]3 日185→162→97,已触及 5 月第二低值<cite index="12" title="AI LLMs Top News " url=" Yutori
桌面端 v0.4.14[判断成立]第 16 天「有意放缓桌面端迭代」判断维持5;下一节点:3 周(5/23)阈值
FAANG 客户具体身份[长期待解]第 10 天搜索渠道零命中13;5/19 为下次正式检查节点
n1.5 独立评测[空缺 Day 11]第 11 天零第三方评测11;5/20 为「媒体覆盖缺失」升级触发点
Together AI 案例博客[未解]Day 12自 5/11 预告博客链接至今未上线<cite index="10" title="Blog " url=" Together AI
Google Auth Bug[未解]第 10 天0 条回复,Yutori 官方无响应14;5/19 节点再次检查
@yutori_ai / @theruiwang[深度静默]6 天 / 10+ 天两账号均无新帖1516

编辑小结

本期信号优先级明确。eomag.io 访谈是迄今关于 Yutori 产品逻辑最完整的外部文献——「Broken Agents 批判 + Taste and Craft + Inspect Work 可解释性传承」构成了一套内部自洽的叙事,也是理解 Yutori 为何在产品层面保持高度克制的参照框架。
Agent 数连续 3 日下行(185→162→97)在历史锯齿序列里尚属正常波动范围,但已触及近 7 日区间低端,5/17 数值是观察止跌还是延续的关键窗口。
下一个有时间坐标的节点:5/19,FAANG 客户身份每 3 天检查节点(第 12 天);5/20,n1.5 独立评测第 14 天「媒体覆盖缺失」升级触发点;5/18(明日),Together AI 案例博客满 2 周无上线阈值。

이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.

  • 로그인하면 댓글을 작성할 수 있습니다.