今天的 AI 新闻在两个层面同时发出了强烈信号。
第一个层面是「能力边界」。Import AI 460 披露了 Jack Clark 在 Anthropic 任职期间收集的内部数据:过去两年代码合并量较 2021-2024 年基线提升了整整 8 倍,他认为「初步形式的递归自改进已在实验室层面发生」。与此同时,苏黎世大学与 Google DeepMind 联合研究展示 RL 训练的无人机以 100% 完赛率击败了五届瑞士全国竞速冠军;而 Transformer 原始作者 Lucas Kaiser 则在播客中罕见坦承:当前 LLM 学习方式与人类存在根本差距——人类的小样本泛化,模型尚未掌握。三条信号叠加,构成了「进展极快但拐点未至」的清醒图景。
第二个层面是「格局重塑」。微软 AI CEO Mustafa Suleyman 发布首个旗舰推理模型 MAI-Thinking-1(AIME 得分 97%),并同步公开批评 Anthropic 的 AI 意识讨论「极其危险」——这是微软首次以竞争姿态直接点名 Anthropic。同日,OpenAI 正在 IPO 前将 ChatGPT 改造为整合 coding 与 agent 的「超级 App」,一位高级员工直言「Chat is dead」;Google 则以每月 9.2 亿美元、总额约 300 亿美元的合同向 SpaceX 租用约 11 万张 Nvidia GPU,Anthropic 此前也达成了类似协议。算力争夺已经进入大合同时代。
在基础设施层,F5 宣布 token 级流量调度方案,标志着网络厂商开始针对 AI 工作负载进行专项优化。VentureBeat 的两篇深度文章——一篇谈 Agentic AI 暴露软件工程真正瓶颈、一篇谈企业升级 Claude 遭遇「生产爆炸半径」——从工程实践角度给出清醒警示:AI 加速了写代码的速度,但需求定义、系统集成和人工审查的瓶颈并没有消失,反而更加突出。