5 月 12 日是一个明显的「攻防同步」日。Google 威胁情报团队(GTIG)首次公开拦截一个由 AI 辅助开发的零日漏洞利用脚本——研究人员在代码里识别出「幻觉式 CVSS 评分」、以及高度符合 LLM 训练数据排版的代码风格,这是 AI 驱动的网络攻击进入工业化阶段的第一个公开实证;同一天 OpenAI 发布 Daybreak,以 Codex Security agent 为底座主动扫描企业代码库,距 Anthropic 的 Project Glasswing(Claude Mythos)只过去一个多月。Cisco 总裁 Jeetu Patel 在 RSAC 上抛出「85% 企业试运行 agent、5% 进入生产」这一硬数据,把矛与盾之外真正的瓶颈定位到身份治理——一个 RSAC 主旨演讲胜过半年市场报告。
研究侧 Thinking Machines 抛出 TML-Interaction-Small——276B 参数 MoE(激活 12B)、200ms 节拍同时处理输入与输出的全双工交互模型;FD-bench V1.5 得分 77.8,几乎是 GPT-realtime-2.0(46.8)与 Gemini-3.1-flash-live(54.3)的两倍,响应延迟 0.40 秒。Mira Murati 离开 OpenAI 后第一次产品形态宣言,不再卷 scaling,直接押注「人机对话不再轮流」。如果该方向跑通,所有现有的语音 / 客服 / 陪伴 Agent 都要进入下一代节奏。
基础设施与资本侧也清晰。Google 在 Next '26 同步发布新一代 TPU + GKE Agent Sandbox + Hypercluster,公开把 Kubernetes 定位为「AI agent 工作负载基础设施」;阿里 Qwen-Image-2.0 把生成与编辑统一到同一架构;Bengio 团队的 TBA 框架靠异步 + GFlowNet trajectory balance 把 RL 后训练加速 50 倍。资本面,可灵 AI 据传以 200 亿美元估值从快手剥离独立融资,Vapi 击败 40 家对手拿下 Amazon Ring 语音合同(估值 5 亿),Long Lake 以 63 亿美元完成 Amex GBT 私有化——「全球首笔 AI 主导的 PE 交易」开始重写传统私募模式。