00:00 / 2:33
返回首页

2026年4月26日 星期日 AI Tech 简报

2026年4月26日 星期日 · 2:33

开场介绍

⋮⋮
00:00
你好,这里是隅音社每日技术简报。
⋮⋮
00:03
今天是2026年4月26日,星期六。
⋮⋮
00:06
今天给大家带来几条重要的AI 技术动态。
⋮⋮
00:09
首先是最重要的一条消息:OpenAI 在北京时间周五凌晨正式发布了GPT-5.5。

GPT-5.5 发布

⋮⋮
00:15
这是一次重大升级,不仅仅是模型变聪明了一点,更像是让人首次体验到了接近AGI 的感觉。
⋮⋮
00:22
新模型在多个维度都有显著提升:更强的推理能力——回答聪明的同时更加简洁;更稳定的代码能力;强大的知识整合能力;更好的工具调用能力,以及更强的长任务处理能力。

核心能力提升

⋮⋮
00:37
从数据来看,GPT-5.5 在大部分评测基准上领先Claude Opus 4.7 一个身位,而且在相同智力水平下token 消耗大约只有竞品的一半。
⋮⋮
00:47
这意味着虽然单价翻倍了——输入5 美元、输出30 美元每百万token——但实际使用成本可能差不多。
⋮⋮
00:55
特别值得一提的是代码能力。
⋮⋮
00:57
有英伟达工程师表示,失去对GPT-5.5 的访问权限,感觉就像被截肢了一样。

代码能力亮点

⋮⋮
01:03
模型能够帮助写CUDA 内核,能在20 分钟内完成包含数百个前端改动的分支合并。
⋮⋮
01:10
OpenAI 透露,目前超过85% 的员工每周都在使用基于GPT-5.5 的Codex。
⋮⋮
01:17
还有一个有趣的细节:GPT-5.5 被部署在英伟达最新的GB200 和GB300 服务器上,而且Codex 自己分析了数周的生产流量数据,编写了负载均衡算法,把token 生成速度提升了20% 以上。

基础设施优化

⋮⋮
01:32
这个模型帮助改进了运行它的基础设施。
⋮⋮
01:35
接下来是Anthropic 的消息。
⋮⋮
01:37
他们发布了一篇技术复盘,解释了过去一个月Claude Code 质量下降的原因。

Anthropic 复盘

⋮⋮
01:42
问题出在三个独立的改动上:第一个是把默认推理强度从高改成了中,虽然减少了延迟,但用户反映模型变笨了;第二个是一个缓存优化的bug,导致Claude 在长对话中不断丢失之前的思考记录,看起来健忘和重复。
⋮⋮
02:00
第三个是一个减少冗长的提示词修改,结果意外降低了代码质量。

Claude Code 修复

⋮⋮
02:05
好消息是这三个问题都已在4 月20 日的2.1.116 版本中修复。
⋮⋮
02:10
Anthropic 还宣布重置所有订阅用户的使用额度作为补偿。
⋮⋮
02:14
另外几条快讯:港大俞益洲团队发布了首篇“高效视频世界模型”的全面综述,为突破算力瓶颈提供了系统性的技术路线图。

其他快讯

⋮⋮
02:24
Gemini 这边则更新了一些生活化的功能,比如用AI 整理空间和生活的小技巧。

结尾

⋮⋮
02:30
以上是今日的技术简报,感谢收听。