00:00 / 4:17
返回首页
2026年4月7日 星期二 AI Tech 简报
开场
⋮⋮
00:00
你好,这里是隅音社每日技术简报。
⋮⋮
00:03
今天是2026年4月7日。
⋮⋮
00:05
先来看几个重要的一手消息。
Anthropic 签约算力
⋮⋮
00:07
Anthropic 宣布与谷歌和博通签署新协议,将在2027年获得多吉瓦级别的下一代TPU 算力。
⋮⋮
00:15
这是Anthropic 迄今为止最大的算力承诺,用于支撑Claude 模型的训练和部署。
⋮⋮
00:20
顺便提一下,Anthropic 的年化收入已经突破300亿美元,比2025年底的90亿翻了三倍多。
⋮⋮
00:28
企业客户中年消费超过100万美元的已超过1000家,两个月内翻了一倍。
Cursor 推理优化
⋮⋮
00:34
Cursor 团队发布了一篇关于MoE 模型推理优化的技术博客。
⋮⋮
00:38
他们提出了一种叫warp decode 的方法,核心思路是把并行化的单位从专家改成输出神经元。
⋮⋮
00:45
在Blackwell GPU 上,这个方法带来了1.84倍的吞吐提升,同时输出精度也更接近全精度参考值。
⋮⋮
00:53
这对Composer 的研发迭代有直接帮助,可以更快地训练和发布新版本。
Gemma 4 手机本地跑
⋮⋮
00:58
接下来聊聊端侧模型的进展。
⋮⋮
01:00
谷歌开源的Gemma 4 最近火了,因为它可以直接在手机上本地运行。
⋮⋮
01:06
有人在iPhone 上用苹果的MLX 框架跑出了超过40 token每秒的速度,支持图片、音频处理,甚至能控制手电筒开关。
⋮⋮
01:15
谷歌还发布了官方App叫AI Edge Gallery,下载就能用,不需要折腾配置。
⋮⋮
01:20
不过也有人指出,Gemma 4 在复杂的Agent 场景表现一般,工具调用和结构化输出还不够稳定。
⋮⋮
01:27
长期来看,端侧模型会逐步蚕食云端的简单任务,这对只卖token 的厂商是个警示。
Agent 工具生态
⋮⋮
01:34
说到Agent 生态,最近飞书、钉钉、企业微信不约而同地推出了CLI 工具,GitHub Star 数都上千了。
⋮⋮
01:42
CLI 对Agent 来说是天然友好的交互方式,因为纯文本是大模型的母语,比操作图形界面精准稳定得多。
⋮⋮
01:50
Karpathy 也强调过这一点。
⋮⋮
01:52
随着MCP 协议的普及,CLI 加MCP 可能会成为Agent 操作企业软件的标准组合。
玄甲安全系统
⋮⋮
01:59
另一个值得关注的是Agent 安全问题。
⋮⋮
02:01
清华大学团队发布了一个叫玄甲的智能体安全防御系统,覆盖从启动、感知、记忆、决策到执行的五个层面。
⋮⋮
02:11
它能防止提示注入、记忆投毒、意图偏移这些典型攻击,实测拦截了95%以上的安全风险。
⋮⋮
02:19
Agent 时代,安全不再只是内容合规,而是涉及整个执行链路。
Claude 封杀第三方
⋮⋮
02:24
Claude 这边有两个动态。
⋮⋮
02:26
一是Anthropic 封杀了订阅用户通过第三方框架调用Claude 的权限,必须改用API。
⋮⋮
02:32
小米大模型负责人罗福莉发了一篇分析,指出OpenClaw 这类框架的context 管理写得很差,一个请求会触发多轮低价值调用,每次都带着超过十万token 的上下文,成本是订阅价格的几十倍。
⋮⋮
02:47
她认为真正的出路不是更便宜的token,而是更省token 的框架配合更高效的模型。
⋮⋮
02:53
二是Claude Code 团队在招人调研token 消耗问题,邀请MAX 20x 用户分享使用情况。
学术研究进展
⋮⋮
03:00
研究方向上有几个有意思的工作。
⋮⋮
03:02
南加州大学发布了HumDex,一个人形机器人数据采集系统,用惯性动捕加学习算法实现全场景遥操作,成本不到200美元就能达到商业系统的水平。
⋮⋮
03:14
复旦大学提出了LifeSim,用于评测大模型的长期个性化能力。
⋮⋮
03:19
测试显示,当前模型处理显性需求还行,但对隐性意图的识别能力明显不足,随着对话变长还会进一步退化。
Obsidian 极简团队
⋮⋮
03:28
Obsidian 的招聘帖最近引发了很多讨论。
⋮⋮
03:31
这家估值3.5亿美元的公司只有3个全职工程师,零融资,不开会,完全靠用户付费维持运营。
⋮⋮
03:39
他们用一个叫碎碎念的内部频道机制取代会议,每个人只能在自己的频道发帖,其他人只能回复,默认静音,没有阅读义务。
⋮⋮
03:49
和Notion 相比,Obsidian 的核心差异是数据本地存储,隐私优先,插件生态完全开放。
独立开发出海指南
⋮⋮
03:56
最后是一个独立开发者出海指南,GitHub 上有2900颗星。
⋮⋮
04:01
整套流程包括注册Wyoming LLC、办EIN 税号、开Mercury 银行账户、接入Stripe,总成本只要193美元。
⋮⋮
04:10
对想做海外产品的开发者来说是个不错的参考。
⋮⋮
04:14
以上是今日的技术简报,感谢收听。