今日 AI 圈在芯片与 Agent 训练两个基础层同时发生了代差事件。OpenAI 联合 Broadcom 发布首款自研推理芯片 Jalapeño,仅历时 9 个月,用 AI 加速了芯片设计,年底前将批量部署——这是一家亏损 209 亿美元的公司在成本结构上求活的战略押注,其信号意义比产品本身更重要。同日,IBM 发布纳米叠层芯片原型,将两层晶体管垂直堆叠在单块硅晶圆上实现约 1000 亿颗晶体管密度,TechInsights 副主席直接给出「为摩尔定律路线图再添十到十五年」的判断。两条消息叠加,宣告了 2026 年芯片领域已不只是 NVIDIA 的独角戏。
软件侧,阿里 Qwen 团队提交了今年最具颠覆意味的 agent 研究。Qwen-AgentWorld 把训练范式整个翻转:不训练策略,而是训练「语言世界模型」来模拟环境响应,在七项 agent 基准中全面提升,且三个从未见过的基准同样受益。范式转变带来的泛化能力,不是数据堆砌能复制的。35B 模型已以 Apache 2.0 开源。
应用侧有三件事值得并排读:一家 agent 公司把底层模型从 Claude 切换到 DeepSeek v4,年省数百万美元成本,实际迁移工程量却是预期的 100 倍;Claude Code 核心工程师公开给 agent 热潮踩刹车,直指「狂烧 token 时代已过,现在该算 ROI 了」;Shopify 构建的模型无关 AI 基础设施,用蒸馏实现最高 30 倍效率提升。三件事讲的是同一个道理:AI 基础设施已从算力堆砌进入效率精算阶段,谁能在模型调度、成本控制与能力保留之间找到平衡,才是下半场真正的玩家。