00:00 / 3:07
返回首页

2026年4月9日 星期四 AI Tech 简报

2026年4月9日 星期四 · 3:07

开场

⋮⋮
00:00
你好,这里是隅音社每日技术简报。
⋮⋮
00:03
今天是2026年4月9日。

Anthropic Managed Agents 架构

⋮⋮
00:05
先聊聊Agent 云服务的新进展。
⋮⋮
00:07
Anthropic 工程团队分享了Managed Agents 背后的架构设计思路。
⋮⋮
00:12
核心概念很有意思,他们称之为把大脑和双手解耦。
⋮⋮
00:16
以前Agent 的各组件都塞在一个容器里,一旦挂掉整个会话就丢了。
⋮⋮
00:21
现在他们把会话日志、Agent 循环、沙箱环境三者分离开来,每个都可以独立替换和恢复。
⋮⋮
00:28
这种设计带来几个好处。
⋮⋮
00:30
首先是可靠性提升,容器挂了不要紧,新容器可以从会话日志恢复继续干活。
⋮⋮
00:37
其次是安全性增强,Claude 生成的代码在沙箱里跑,完全接触不到认证凭据。
⋮⋮
00:43
还有就是性能优化,分离后首次响应延迟p50 降了约六成,p95 降了超九成。
⋮⋮
00:50
更关键的是这为多脑多手架构打下基础,一个大脑可以调度多个沙箱,多个大脑也能互相传递任务。
⋮⋮
00:57
这其实延续了操作系统的设计哲学:用抽象接口封装底层实现,让上层应用不用关心具体硬件。

Cursor Bugbot 自学习

⋮⋮
01:05
Cursor 的代码审查工具Bugbot 也有了新突破。
⋮⋮
01:08
当初Bugbot 刚发布时,识别的bug 只有一半被开发者采纳修复。
⋮⋮
01:13
但现在采纳率已经接近百分之八十,远超其他同类产品。
⋮⋮
01:18
秘诀在于它开始从实际使用中自我学习了。
⋮⋮
01:21
每次开发者对Bugbot 的评论点赞或踩、每条回复解释哪里不对、每个人工审查者标注的遗漏问题,都成了学习信号。
⋮⋮
01:31
Bugbot 把这些信号转化成规则,好的规则会被激活用于后续审查,表现不好的会被禁用。
⋮⋮
01:37
目前已有超过十一万个仓库启用了这个学习功能,累计生成了四万多条规则。

Gemini 笔记本功能

⋮⋮
01:44
Google 这边,Gemini 推出了笔记本功能。
⋮⋮
01:46
简单说就是给Gemini 加了一个项目空间的概念,你可以把相关的对话、文档、PDF 都组织到一个笔记本里。
⋮⋮
01:54
更有意思的是这个笔记本和NotebookLM 打通了,你在Gemini 里加的素材,NotebookLM 里也能看到。
⋮⋮
02:01
这意味着你可以先在Gemini 里整理资料,然后去NotebookLM 生成一个视频概览或者信息图。
⋮⋮
02:07
目前AI Ultra、Pro 和Plus 订阅用户在网页端可以用,手机端和更多地区会逐步开放。

推特热议

⋮⋮
02:14
再聊几条推特上的讨论。
⋮⋮
02:16
有开发者对比了现在各家AI 编程工具,发现Agent 开发已经成了标配功能。
⋮⋮
02:21
Claude Code、Cursor、Copilot 都在这个方向发力,竞争很激烈。
⋮⋮
02:26
有人感慨说,以前工程师花大量token 调优出一个Agent 框架,现在大模型厂商直接把原生Agent 服务端上来了,相当于用开发者烧的钱做了产品验证。
⋮⋮
02:37
GPT-4o 的退役也引发讨论。
⋮⋮
02:40
有人说4o 其实内化了很多对真相和客观性的追求,是在RLHF 中学到的,现在这些特性在后续模型里可能淡化了。

国内动态与结语

⋮⋮
02:49
国内方面,智谱GLM-5.1 上线华为云可以免费体验了。
⋮⋮
02:54
李飞飞的World Labs 发布了Marble 1.1,能生成复杂大场景的3D 内容。
⋮⋮
02:59
扣子也升级到2.5 版本,继续探索AI Agent 从工具到伙伴的转变。
⋮⋮
03:04
以上是今日的技术简报,感谢收听。