今天的 AI 世界被一场正面对决定义:OpenAI 发布 GPT-5.5,Anthropic 公开自我解剖,DeepSeek 预览 V4——三家前沿实验室在同一天各自亮出底牌,但打法截然不同。
OpenAI 选择了最直接的方式:用 GPT-5.5 在 Terminal-Bench 2.0 上以 82.7% 的准确率重夺榜首,超越 Claude Mythos Preview(82.0%),并在 ARC-AGI-2 等多项 agentic 基准上拉开差距。Sam Altman 和 Greg Brockman 高调宣传,行业 KOL 从 Aaron Levie 到 Dan Shipper 集体背书"执行力"是最大提升。但定价也同样激进——GPT-5.5 Pro 高达每百万 token $30/$180,约为上代的十二倍。Anthropic 则选择了一条反直觉的路径:发布详尽技术复盘,承认 Claude Code 近期性能下滑并非模型退化,而是三个产品层面的独立 bug 叠加所致,包括推理强度被调低、缓存优化引入的"健忘"bug、以及系统提示中过度限制输出长度。这种级别的透明度在行业中极为罕见。与此同时,DeepSeek 预览 V4,公开声称性能接近顶级闭源模型,且强调了华为昇腾芯片兼容性——开源阵营的追赶没有放慢。
三条线之外,今天还有几个值得注意的信号:Anthropic 的 Mythos 模型在发布当天就遭遇未授权访问,对其安全品牌形象造成打击;Meta 宣布裁员 10% 约 8000 人,同时与亚马逊签署大批量 AI CPU 采购协议,显示出"压缩人力、加注算力"的战略取向;Tim Cook 正式卸任 Apple CEO,AI 时代的 Apple 将由硬件出身的 John Ternus 掌舵。