2026年4月11日星期六 AI Tech 简报

⋮⋮

00:00

你好，这里是隅音社每日技术简报。

⋮⋮

00:03

今天是2026年4月11日。

⋮⋮

00:05

今天AI 领域最大的焦点，是Agent 生态的剧变。

⋮⋮

00:09

Hermes Agent 爆火、Anthropic 发布Managed Agents、以及一位北大博士用17 个Agent 造出了全球首个AI 开放世界。

⋮⋮

00:17

让我们一个个聊。

⋮⋮

00:18

Hermes Agent 爆火：GitHub 四万星的开源Agent】

⋮⋮

00:22

由Nous Research 推出的开源智能体Hermes，最近在GitHub 上狂揽四万星，更新速度超过大多数商业Agent 产品。

⋮⋮

00:30

全网都在高呼：切到Hermes 太爽了，OpenClaw 可以被换掉了。

⋮⋮

00:35

Hermes 和OpenClaw 最大的不同在于：它不是“做完就忘”的打工人，而是一个会复盘、会记笔记、会越用越强的老员工。

⋮⋮

00:44

它把一条真正的学习闭环做进了系统里。

⋮⋮

00:47

具体来说，Hermes 有三层闭环机制。

⋮⋮

00:50

第一层是记忆：它有两份长期记忆文件，支持跨会话检索，不会像其他智能体那样开了新会话就失忆。

⋮⋮

00:58

第二层是技能：当它完成复杂任务时，会把关键步骤和踩坑经验整理成结构化的技能文件，下次遇到类似任务直接调用。

⋮⋮

01:08

第三层更狠——训练数据：它内置了批量轨迹生成能力，你每天交给它的任务，不只是被完成，还可能变成下一代模型的训练素材。

⋮⋮

01:18

更重要的是，Hermes 可以在每月5 美元的VPS 上运行，支持Telegram、Discord 等多平台接入。

⋮⋮

01:26

用户反馈它可以自动在BOSS 直聘搜岗位、配置闲鱼客服机器人，稳定性远超OpenClaw。

⋮⋮

01:33

Anthropic Managed Agents：AI 架构的降维打击】

⋮⋮

01:36

就在Hermes 爆火的同时，Anthropic 甩出了一记重拳：Managed Agents。

⋮⋮

01:41

这份工程报告宣告：AI 架构从此进入操作系统化时代。

⋮⋮

01:45

核心思路是把大脑（模型逻辑）和双手（执行环境）彻底分开。

⋮⋮

01:52

Managed Agents 将Agent 拆解为三个标准组件：Session 会话层是一个“仅追加”的日志，记录发生的一切；Harness 框架层负责调用Claude 并分发指令；Sandbox 沙箱层是绝对隔离的计算环境。

⋮⋮

02:05

这种解耦带来了几个重要变化。

⋮⋮

02:08

首先，组件可以“牲畜化”，服务器不再是不可替代的“宠物”。

⋮⋮

02:12

其次，会话不是窗口而是日志，突破了上下文限制。

⋮⋮

02:17

第三，大脑和双手分离后，只有在真正需要执行时才分配容器，p50 首字延迟下降了约60%。

⋮⋮

02:25

最关键的是安全——Token 永远保存在沙箱外部的保险库中，AI 自己都看不见密钥，从结构上杜绝了私钥泄露。

⋮⋮

02:34

对于在传统操作系统上嫁接AI 的小龙虾来说，这就是降维打击。

⋮⋮

02:39

北大博士带17 个Agent：49 天造出AI 开放世界】

⋮⋮

02:43

接下来这个故事更震撼。

⋮⋮

02:45

一位北大美学博士刘耕，带着17 个Agent，爆肝49 天，写了30 万行代码，造出了全球首个“AI 开放世界”——Elseland。

⋮⋮

02:56

这个项目的开发成本仅5000 元，而在传统模式下，可能需要50 人的产研团队工作4-6 个月。

⋮⋮

03:03

开发效率被提升到了“传统管线”的百倍。

⋮⋮

03:06

他是怎么做到的？

⋮⋮

03:08

刘耕组建了一个17 Agent 的“超级军团”：6 个Claude Code 分别担任主架构师、游戏引擎工程师、智脑工程师、小游戏开发工程师、编辑器工程师和主测试；1 个Codex 做顾问；1 个Gemini CLI 负责UI。

⋮⋮

03:23

优化；1 个Kimi Code 机动配合。

⋮⋮

03:25

另外还有8 个Agent 负责故事和资产生成，分别叫Elser、虾酱、皮格马利翁、莎士比亚、魔术师等，各司其职。

⋮⋮

03:34

他积累了大量的Skill、Tool 和Workflow，配置给各个Agent，用调度师Agent 协助管理。

⋮⋮

03:41

有了这套协作机制，开发越来越快。

⋮⋮

03:44

他说，现在1 天的开发量就是一个独立小产品，一周可以完成一个高难度创新产品。

⋮⋮

03:50

这个案例告诉我们：当技术被AI 飞轮碾碎，一人就是一个“超级军团”的时代真的来了。

⋮⋮

03:57

Claude Code 新功能：ultraplan】

⋮⋮

03:59

Claude Code 推出了ultraplan 新命令，可以在网页端构建实现计划，用户可阅读编辑后在网页或终端执行。

⋮⋮

04:07

这个功能让复杂任务的规划和执行更加系统化。

⋮⋮

04:11

SBTI 人格测试爆红：Vibe Coding 的现象级案例】

⋮⋮

04:15

最后聊一个有趣的现象。

⋮⋮

04:17

全新的SBTI 人格测试在网络爆红，把MBTI 解构成“吗喽”“握草人”“死者”等荒诞标签，直接挤崩了服务器。

⋮⋮

04:25

更狠的是，不到48 小时，就有开发者用Claude Code 完成了完整逆向复刻。

⋮⋮

04:31

一个人，一个AI，一个周末，就把逆向算法、复刻产品、加新功能、部署上线全部搞定。

⋮⋮

04:39

放在三年前，这套动作至少要一个三人小组干两周。

⋮⋮

04:43

这就是Vibe Coding 时代的真实写照：从想法到能跑的代码之间的距离，正在以肉眼可见的速度坍缩。

⋮⋮

04:51

以上是今日的技术简报，感谢收听。

2026年4月11日星期六 AI Tech 简报

开场介绍

Hermes Agent 爆火

Anthropic Managed Agents

北大博士 17 Agent 造 AI 开放世界

Claude Code ultraplan

SBTI 人格测试爆红

结尾

2026年4月11日 星期六 AI Tech 简报

开场介绍

Hermes Agent 爆火

Anthropic Managed Agents

北大博士 17 Agent 造 AI 开放世界

Claude Code ultraplan

SBTI 人格测试爆红

结尾

2026年4月11日星期六 AI Tech 简报