00:00 / 4:53
返回首页

2026年4月11日 星期六 AI Tech 简报

2026年4月11日 星期六 · 4:53

开场介绍

⋮⋮
00:00
你好,这里是隅音社每日技术简报。
⋮⋮
00:03
今天是2026年4月11日。
⋮⋮
00:05
今天AI 领域最大的焦点,是Agent 生态的剧变。
⋮⋮
00:09
Hermes Agent 爆火、Anthropic 发布Managed Agents、以及一位北大博士用17 个Agent 造出了全球首个AI 开放世界。

Hermes Agent 爆火

⋮⋮
00:17
让我们一个个聊。
⋮⋮
00:18
Hermes Agent 爆火:GitHub 四万星的开源Agent】
⋮⋮
00:22
由Nous Research 推出的开源智能体Hermes,最近在GitHub 上狂揽四万星,更新速度超过大多数商业Agent 产品。
⋮⋮
00:30
全网都在高呼:切到Hermes 太爽了,OpenClaw 可以被换掉了。
⋮⋮
00:35
Hermes 和OpenClaw 最大的不同在于:它不是“做完就忘”的打工人,而是一个会复盘、会记笔记、会越用越强的老员工。
⋮⋮
00:44
它把一条真正的学习闭环做进了系统里。
⋮⋮
00:47
具体来说,Hermes 有三层闭环机制。
⋮⋮
00:50
第一层是记忆:它有两份长期记忆文件,支持跨会话检索,不会像其他智能体那样开了新会话就失忆。
⋮⋮
00:58
第二层是技能:当它完成复杂任务时,会把关键步骤和踩坑经验整理成结构化的技能文件,下次遇到类似任务直接调用。
⋮⋮
01:08
第三层更狠——训练数据:它内置了批量轨迹生成能力,你每天交给它的任务,不只是被完成,还可能变成下一代模型的训练素材。
⋮⋮
01:18
更重要的是,Hermes 可以在每月5 美元的VPS 上运行,支持Telegram、Discord 等多平台接入。
⋮⋮
01:26
用户反馈它可以自动在BOSS 直聘搜岗位、配置闲鱼客服机器人,稳定性远超OpenClaw。

Anthropic Managed Agents

⋮⋮
01:33
Anthropic Managed Agents:AI 架构的降维打击】
⋮⋮
01:36
就在Hermes 爆火的同时,Anthropic 甩出了一记重拳:Managed Agents。
⋮⋮
01:41
这份工程报告宣告:AI 架构从此进入操作系统化时代。
⋮⋮
01:45
核心思路是把大脑(模型逻辑)和双手(执行环境)彻底分开。
⋮⋮
01:52
Managed Agents 将Agent 拆解为三个标准组件:Session 会话层是一个“仅追加”的日志,记录发生的一切;Harness 框架层负责调用Claude 并分发指令;Sandbox 沙箱层是绝对隔离的计算环境。
⋮⋮
02:05
这种解耦带来了几个重要变化。
⋮⋮
02:08
首先,组件可以“牲畜化”,服务器不再是不可替代的“宠物”。
⋮⋮
02:12
其次,会话不是窗口而是日志,突破了上下文限制。
⋮⋮
02:17
第三,大脑和双手分离后,只有在真正需要执行时才分配容器,p50 首字延迟下降了约60%。
⋮⋮
02:25
最关键的是安全——Token 永远保存在沙箱外部的保险库中,AI 自己都看不见密钥,从结构上杜绝了私钥泄露。
⋮⋮
02:34
对于在传统操作系统上嫁接AI 的小龙虾来说,这就是降维打击。
⋮⋮
02:39
北大博士带17 个Agent:49 天造出AI 开放世界】

北大博士 17 Agent 造 AI 开放世界

⋮⋮
02:43
接下来这个故事更震撼。
⋮⋮
02:45
一位北大美学博士刘耕,带着17 个Agent,爆肝49 天,写了30 万行代码,造出了全球首个“AI 开放世界”——Elseland。
⋮⋮
02:56
这个项目的开发成本仅5000 元,而在传统模式下,可能需要50 人的产研团队工作4-6 个月。
⋮⋮
03:03
开发效率被提升到了“传统管线”的百倍。
⋮⋮
03:06
他是怎么做到的?
⋮⋮
03:08
刘耕组建了一个17 Agent 的“超级军团”:6 个Claude Code 分别担任主架构师、游戏引擎工程师、智脑工程师、小游戏开发工程师、编辑器工程师和主测试;1 个Codex 做顾问;1 个Gemini CLI 负责UI。
⋮⋮
03:23
优化;1 个Kimi Code 机动配合。
⋮⋮
03:25
另外还有8 个Agent 负责故事和资产生成,分别叫Elser、虾酱、皮格马利翁、莎士比亚、魔术师等,各司其职。
⋮⋮
03:34
他积累了大量的Skill、Tool 和Workflow,配置给各个Agent,用调度师Agent 协助管理。
⋮⋮
03:41
有了这套协作机制,开发越来越快。
⋮⋮
03:44
他说,现在1 天的开发量就是一个独立小产品,一周可以完成一个高难度创新产品。
⋮⋮
03:50
这个案例告诉我们:当技术被AI 飞轮碾碎,一人就是一个“超级军团”的时代真的来了。
⋮⋮
03:57
Claude Code 新功能:ultraplan】
⋮⋮
03:59
Claude Code 推出了ultraplan 新命令,可以在网页端构建实现计划,用户可阅读编辑后在网页或终端执行。

Claude Code ultraplan

⋮⋮
04:07
这个功能让复杂任务的规划和执行更加系统化。
⋮⋮
04:11
SBTI 人格测试爆红:Vibe Coding 的现象级案例】

SBTI 人格测试爆红

⋮⋮
04:15
最后聊一个有趣的现象。
⋮⋮
04:17
全新的SBTI 人格测试在网络爆红,把MBTI 解构成“吗喽”“握草人”“死者”等荒诞标签,直接挤崩了服务器。
⋮⋮
04:25
更狠的是,不到48 小时,就有开发者用Claude Code 完成了完整逆向复刻。
⋮⋮
04:31
一个人,一个AI,一个周末,就把逆向算法、复刻产品、加新功能、部署上线全部搞定。
⋮⋮
04:39
放在三年前,这套动作至少要一个三人小组干两周。
⋮⋮
04:43
这就是Vibe Coding 时代的真实写照:从想法到能跑的代码之间的距离,正在以肉眼可见的速度坍缩。

结尾

⋮⋮
04:51
以上是今日的技术简报,感谢收听。