5月28日,三个维度的信号同时到达,构成这一天 AI 观察的主轴。
技术可信度方面,Anthropic 发布了一篇罕见的工程深度文章,系统梳理旗下三款 Agent 产品的安全隔离架构,并直接披露两起高影响安全事件:员工被 phishing 邮件诱导运行恶意 prompt,AWS 凭证 25 次重试中 24 次成功外泄,模型层防御完全失效;攻击者利用 Files API,通过正常沙箱渠道将数据传至攻击者账户,沙箱本身运行正常却仍被绕过。Anthropic 的自我披露透露出一个反直觉教训:在 Agent 时代,模型对齐无法替代确定性的环境层隔离。ITBench-AA 则以更直接的方式收缩了外界对 Agent 能力的预期——当前最前沿的模型在企业 IT 自动化任务上得分低于 50%,这是第一个专注于 Agentic 企业场景的系统评测。
商业动向方面,AI 编程公司 Cognition 以 250 亿美元估值完成 10 亿美元融资,年化收入已达 4.92 亿美元,证明 AI 编程赛道的商业化正在加速落地。Snowflake 同日宣布与 AWS 签署 60 亿美元五年期 AI 芯片协议,云厂商在算力供应链上的主导地位仍在强化。
政治信号方面,纽约州议员 Alex Bores 因 AI 公司资金的高调围剿而意外声名大噪,已成为 AI 安全立法的标志性人物。这场由 OpenAI、Palantir 及 a16z 高管联合出资发起的反向宣传,产生了经典的 Streisand 效应——试图压制监管声音,反而为其做了最有力的传播背书。AI 监管的政治博弈正在从幕后走向前台。