5 月 4 日是「范式自白日」。同一天里,前 OpenAI 联创 Andrej Karpathy 在 Training Data 长访谈中把 vibe coding 升格为 agentic engineering,提出软件 1.0/2.0/3.0 三段论,并以 verifiability(可验证性)框架解释模型能力分布——「你可以外包你的思考,但你无法外包你的理解」;Anthropic 联创 Jack Clark 在 Import AI 第 455 期以 60% 置信度断言,2028 年底将出现自动化 AI 研发——前沿模型自主训练其继任者,论据是 Claude Mythos Preview 在 SWE-Bench 拿下 93.9%、METR 任务时长基准从 2022 年 30 秒飙升至 2026 年 12 小时;前 DeepMind AlphaGo 核心 David Silver 创立 Ineffable Intelligence,以 11 亿美元拿下 AI 史上规模最大的种子轮之一,NVIDIA 与 Google 同场入局。三件事并置阅读,行业焦点正从「模型能跑多大业务」转向「模型如何加速自己」。
第二条线是「落地的两面镜」。哈佛新研究显示某 LLM 在真实急诊病例诊断准确率超过人类医生,临床能力首次被严肃量化;但同一天,德国维尔茨堡大学告诉我们,用户向 AI 提供的医疗信息往往严重不完整——「AI 比医生准」的结论在真实诊室里很可能因输入失真而失效,这两条理应并列阅读。Cloudflare 一日双弹(Code Mode MCP 服务器 + Agent Memory 持久记忆托管)把 agent 基础设施推到离生产更近一步;港理工 SignThought 在 ACL 2026 把手语翻译重塑为带 latent thinking 的可推理任务,PHOENIX14T BLEU-4 27.22 SOTA。能力的上限与落地的边界正以两倍速同时被刷新。
第三条线是「博弈正式摆上桌面」。NVIDIA CEO 黄仁勋公开点名 Anthropic CEO Dario Amodei「一当 CEO 就开上帝视角」,反对 50% 初级白领将被取代论与 AI 灭世论;Wired 披露由 OpenAI 与 Palantir 出资支持的超级 PAC 在 TikTok 雇用网红将中国 AI 渲染成威胁;Elon Musk 在 OpenAI 庭审中预言「明年 AI 智能将超越人类」;奥斯卡正式宣布禁止 AI 角逐表演与编剧奖项,这是好莱坞主流奖项体系首次为 AI 划定明确边界。叠加 Big Tech 同期合计裁员 8 万人——AI 头部公司、好莱坞、立法者、行业领袖第一次公开站到同一张桌上互相博弈,「AI 提效」与「过度扩张」的真实占比之争还远未结束。