2026年4月9日星期四 AI Tech 简报

⋮⋮

00:00

你好，这里是隅音社每日技术简报。

⋮⋮

00:03

今天是2026年4月9日。

⋮⋮

00:05

先聊聊Agent 云服务的新进展。

⋮⋮

00:07

Anthropic 工程团队分享了Managed Agents 背后的架构设计思路。

⋮⋮

00:12

核心概念很有意思，他们称之为把大脑和双手解耦。

⋮⋮

00:16

以前Agent 的各组件都塞在一个容器里，一旦挂掉整个会话就丢了。

⋮⋮

00:21

现在他们把会话日志、Agent 循环、沙箱环境三者分离开来，每个都可以独立替换和恢复。

⋮⋮

00:28

这种设计带来几个好处。

⋮⋮

00:30

首先是可靠性提升，容器挂了不要紧，新容器可以从会话日志恢复继续干活。

⋮⋮

00:37

其次是安全性增强，Claude 生成的代码在沙箱里跑，完全接触不到认证凭据。

⋮⋮

00:43

还有就是性能优化，分离后首次响应延迟p50 降了约六成，p95 降了超九成。

⋮⋮

00:50

更关键的是这为多脑多手架构打下基础，一个大脑可以调度多个沙箱，多个大脑也能互相传递任务。

⋮⋮

00:57

这其实延续了操作系统的设计哲学：用抽象接口封装底层实现，让上层应用不用关心具体硬件。

⋮⋮

01:05

Cursor 的代码审查工具Bugbot 也有了新突破。

⋮⋮

01:08

当初Bugbot 刚发布时，识别的bug 只有一半被开发者采纳修复。

⋮⋮

01:13

但现在采纳率已经接近百分之八十，远超其他同类产品。

⋮⋮

01:18

秘诀在于它开始从实际使用中自我学习了。

⋮⋮

01:21

每次开发者对Bugbot 的评论点赞或踩、每条回复解释哪里不对、每个人工审查者标注的遗漏问题，都成了学习信号。

⋮⋮

01:31

Bugbot 把这些信号转化成规则，好的规则会被激活用于后续审查，表现不好的会被禁用。

⋮⋮

01:37

目前已有超过十一万个仓库启用了这个学习功能，累计生成了四万多条规则。

⋮⋮

01:44

Google 这边，Gemini 推出了笔记本功能。

⋮⋮

01:46

简单说就是给Gemini 加了一个项目空间的概念，你可以把相关的对话、文档、PDF 都组织到一个笔记本里。

⋮⋮

01:54

更有意思的是这个笔记本和NotebookLM 打通了，你在Gemini 里加的素材，NotebookLM 里也能看到。

⋮⋮

02:01

这意味着你可以先在Gemini 里整理资料，然后去NotebookLM 生成一个视频概览或者信息图。

⋮⋮

02:07

目前AI Ultra、Pro 和Plus 订阅用户在网页端可以用，手机端和更多地区会逐步开放。

⋮⋮

02:14

再聊几条推特上的讨论。

⋮⋮

02:16

有开发者对比了现在各家AI 编程工具，发现Agent 开发已经成了标配功能。

⋮⋮

02:21

Claude Code、Cursor、Copilot 都在这个方向发力，竞争很激烈。

⋮⋮

02:26

有人感慨说，以前工程师花大量token 调优出一个Agent 框架，现在大模型厂商直接把原生Agent 服务端上来了，相当于用开发者烧的钱做了产品验证。

⋮⋮

02:37

GPT-4o 的退役也引发讨论。

⋮⋮

02:40

有人说4o 其实内化了很多对真相和客观性的追求，是在RLHF 中学到的，现在这些特性在后续模型里可能淡化了。

⋮⋮

02:49

国内方面，智谱GLM-5.1 上线华为云可以免费体验了。

⋮⋮

02:54

李飞飞的World Labs 发布了Marble 1.1，能生成复杂大场景的3D 内容。

⋮⋮

02:59

扣子也升级到2.5 版本，继续探索AI Agent 从工具到伙伴的转变。

⋮⋮

03:04

以上是今日的技术简报，感谢收听。

2026年4月9日星期四 AI Tech 简报

开场

Anthropic Managed Agents 架构

Cursor Bugbot 自学习

Gemini 笔记本功能

推特热议

国内动态与结语

2026年4月9日 星期四 AI Tech 简报

开场

Anthropic Managed Agents 架构

Cursor Bugbot 自学习

Gemini 笔记本功能

推特热议

国内动态与结语

2026年4月9日星期四 AI Tech 简报