返回首页

2026年4月26日星期日 AI Tech 简报

2026年4月26日星期日 · 2:33

开场介绍

⋮⋮

00:00

你好，这里是隅音社每日技术简报。

⋮⋮

00:03

今天是2026年4月26日，星期六。

⋮⋮

00:06

今天给大家带来几条重要的AI 技术动态。

⋮⋮

00:09

首先是最重要的一条消息：OpenAI 在北京时间周五凌晨正式发布了GPT-5.5。

GPT-5.5 发布

⋮⋮

00:15

这是一次重大升级，不仅仅是模型变聪明了一点，更像是让人首次体验到了接近AGI 的感觉。

⋮⋮

00:22

新模型在多个维度都有显著提升：更强的推理能力——回答聪明的同时更加简洁；更稳定的代码能力；强大的知识整合能力；更好的工具调用能力，以及更强的长任务处理能力。

核心能力提升

⋮⋮

00:37

从数据来看，GPT-5.5 在大部分评测基准上领先Claude Opus 4.7 一个身位，而且在相同智力水平下token 消耗大约只有竞品的一半。

⋮⋮

00:47

这意味着虽然单价翻倍了——输入5 美元、输出30 美元每百万token——但实际使用成本可能差不多。

⋮⋮

00:55

特别值得一提的是代码能力。

⋮⋮

00:57

有英伟达工程师表示，失去对GPT-5.5 的访问权限，感觉就像被截肢了一样。

代码能力亮点

⋮⋮

01:03

模型能够帮助写CUDA 内核，能在20 分钟内完成包含数百个前端改动的分支合并。

⋮⋮

01:10

OpenAI 透露，目前超过85% 的员工每周都在使用基于GPT-5.5 的Codex。

⋮⋮

01:17

还有一个有趣的细节：GPT-5.5 被部署在英伟达最新的GB200 和GB300 服务器上，而且Codex 自己分析了数周的生产流量数据，编写了负载均衡算法，把token 生成速度提升了20% 以上。

基础设施优化

⋮⋮

01:32

这个模型帮助改进了运行它的基础设施。

⋮⋮

01:35

接下来是Anthropic 的消息。

⋮⋮

01:37

他们发布了一篇技术复盘，解释了过去一个月Claude Code 质量下降的原因。

Anthropic 复盘

⋮⋮

01:42

问题出在三个独立的改动上：第一个是把默认推理强度从高改成了中，虽然减少了延迟，但用户反映模型变笨了；第二个是一个缓存优化的bug，导致Claude 在长对话中不断丢失之前的思考记录，看起来健忘和重复。

⋮⋮

02:00

第三个是一个减少冗长的提示词修改，结果意外降低了代码质量。

Claude Code 修复

⋮⋮

02:05

好消息是这三个问题都已在4 月20 日的2.1.116 版本中修复。

⋮⋮

02:10

Anthropic 还宣布重置所有订阅用户的使用额度作为补偿。

⋮⋮

02:14

另外几条快讯：港大俞益洲团队发布了首篇“高效视频世界模型”的全面综述，为突破算力瓶颈提供了系统性的技术路线图。

其他快讯

⋮⋮

02:24

Gemini 这边则更新了一些生活化的功能，比如用AI 整理空间和生活的小技巧。

结尾

⋮⋮

02:30

以上是今日的技术简报，感谢收听。

2026年4月26日 星期日 AI Tech 简报