AI 主编日报 · 2026-06-03

01/11

微软Build 2026：MAI-Thinking-1首发+战略脱OpenAI，一天三连发重塑AI基础设施格局

微软此前的AI核心能力来自与OpenAI的独家合作，MAI-Thinking-1的发布标志着这一依赖关系开始发生结构性转变。更深层的意义在于：微软正在将AI能力嵌入操作系统（MXC）、硬件（Surface Dev Box）和企业数据层（IQ/Rayfin），构建的不是一个AI助手，而是一套围绕企业生产力的AI基础设施生态。这对OpenAI、Anthropic和Google来说都是新的竞争格局变量。

S 级 · 必须关注 2个来源 4 条新闻

大模型/LLMAgent芯片/硬件编程/Coding办公/生产力产品发布规模性信号性生态性

是什么

微软在Build 2026上发布首款自研推理模型MAI-Thinking-1，官方称其为「中等规模模型」，在软件工程关键基准上与行业领先模型持平，且完全从零训练、未使用第三方模型蒸馏。同日密集发布Surface RTX Spark Dev Box（本地AI推理专属硬件，128GB统一内存）、MXC（OS级Agent沙箱）、Project Solara（Agent专属新OS）以及Microsoft IQ与Rayfin（企业数据层），构成覆盖从芯片到操作系统到数据层的完整AI基础设施堆栈。

为什么重要

微软此前的AI核心能力来自与OpenAI的独家合作，MAI-Thinking-1的发布标志着这一依赖关系开始发生结构性转变。这次Build展示的纵深战略更值得关注：从芯片（RTX Spark）到OS（MXC/Solara）到数据层（IQ/Rayfin），微软正在把AI能力自底向上地内化为基础设施。这种布局如果成功，将让微软成为企业AI部署的不可绕过的节点，并在OpenAI的核心市场形成直接竞争。

不同来源

The Verge AI科技媒体

聚焦MAI-Thinking-1的战略象征意义，用「微软与OpenAI分手、准备开战」作为叙事框架，强调这是微软重夺AI叙事主导权的宣言，基调偏向竞争格局解读。

InfoQ 中国行业媒体

关注MAI-Thinking-1的技术细节，强调「性能追平Claude Opus 4.6，完全从零训练」的技术路线图，评价最高（★7），对模型自主研发能力的判断比Verge更为肯定。

MAI-Thinking-1的技术声明需要独立基准验证，「与领先模型持平」是营销语言而非科学结论。真正值得关注的不是这一个模型，而是微软通过本次Build展示的纵深战略：从芯片到OS到数据层，微软正在把AI能力自底向上地内化为基础设施。这种布局如果成功，将让微软成为企业AI部署的不可绕过的节点，而这是OpenAI和Anthropic目前都不具备的能力。

The Verge AI Microsoft 发布首款自研推理模型 MAI-Thinking-1

InfoQ 中国微软发布自研 MAI-Thinking-1：性能追平 Claude Opus 4.6，完全从零训练不依赖蒸馏

The Verge AI Microsoft Build 2026：七大重磅发布

The Verge AI Microsoft and OpenAI broke up — now they are ready to fight

02/11

OpenAI Codex企业平台化：500万周活用户，知识工作者增速超开发者3倍

Codex发布之初被定位为编程助手，但「非开发者占比20%且增速是开发者3倍」这组数据是一个清晰的拐点信号：AI代码工具正在跨越技术圈层，向数据分析师、产品经理、销售等知识工作者渗透。这一趋势的规模效应如果延续，将重新定义办公软件的边界——任何需要处理数据、生成报告、操作SaaS工具的工作，都可能被Codex类产品重塑。

S 级 · 必须关注 4个来源 5 条新闻

大模型/LLMAgent 编程/Coding办公/生产力产品发布规模性突破性信号性

是什么

OpenAI推出Codex重大升级，发布三项核心新功能：Annotations（精准文档局部编辑）、Sites（静态数据转为可分享的交互式内部Web应用，面向Business和Enterprise用户）以及6类角色专属Plugins（整合Snowflake、Figma、Salesforce等62款主流SaaS工具）。当前Codex每周活跃用户500万，非开发者占比约20%，增速是开发者的3倍以上，数据分析任务环比增长110%。

为什么重要

Codex的增量市场已经不在程序员里，而在2024年前几乎不被AI编程工具触达的白领群体中。「知识工作者占比20%且增速3倍于开发者」意味着OpenAI正在用数据告诉市场：下一个万亿市值赛道，不是代码，是知识工作者的生产力。Salesforce、ServiceNow、Notion等以知识工作者为主要用户群的SaaS平台，都应该感受到竞争压力。

不同来源

VentureBeat科技媒体

详细拆解三项新功能的技术架构，尤其关注Sites对企业内部工作流数字化的意义，以及Plugins对SaaS生态的整合逻辑。数据最为完整，是今日Codex报道的主要信息来源。

TechCrunch AI科技媒体

从产品策略角度解读OpenAI如何将Codex重新定位为企业白领通用平台，附内部报告数据，关注用户群体扩张的商业逻辑，视角偏商业而非技术。

GitHub Feeds社交媒体

Sottiaux（Codex工程师）直接发布新功能细节，Zara Zhang（开发者）引用内部数据可视化分析，两者合力构成今日Codex信息的最权威一手来源。

「知识工作者占比20%，增速3倍于开发者」这个数字比任何功能发布都更重要。它意味着Codex的增量市场已经不在程序员里，而在此前几乎不被AI编程工具触达的白领群体中。OpenAI在用数据告诉市场：下一个万亿市值赛道，不是代码，是知识工作者的生产力。Salesforce、ServiceNow、Notion，都应该感到压力。

VentureBeat OpenAI Codex 重大升级：企业级 Sites 托管与角色专属 Plugins 全面亮相

TechCrunch AI OpenAI 为白领知识工作推出新 Codex 工具

InfoQ 中国 OpenAI Codex 新升级：全面打通 Windows 生态，支持手机远程触发开发任务

GitHub Feeds GitHub Feeds: Thibault Sottiaux（OpenAI Codex工程师）宣布Business计划新功能

GitHub Feeds GitHub Feeds: Zara Zhang — Codex知识工作者数据+Frontend Slides破2万star

03/11

英国CMA全球首裁：出版商可退出Google AI搜索，内容权利博弈迎来历史性拐点

自AI搜索兴起以来，出版商面临内容被AI摘要使用、但从搜索引擎获得的流量持续下降的双重困境。CMA此次裁定提供了一个关键先例：AI搜索不能默认享有对内容的无限制使用权，且内容所有者有权独立授权其用途（搜索摘要 vs AI训练）。这一逻辑如果被欧盟、美国效仿，将从根本上改变AI搜索的内容获取成本。

S 级 · 必须关注 3个来源 3 条新闻

搜索/信息检索大模型/LLM 法律/合规政策/监管突破性争议性信号性

是什么

英国竞争和市场管理局（CMA）发布全球首例AI搜索内容权利行为准则，要求Google允许网站所有者将内容从AI Overviews等AI搜索功能中移除，并禁止将这些内容用于Google AI模型微调。Google须提供专门工具实现这一退出机制，方案将先在英国试点，随后向全球推广。

为什么重要

CMA裁定的核心法律逻辑在于确立：AI搜索不能默认享有对内容的无限制使用权，且内容所有者有权分别授权「搜索摘要使用权」和「AI训练使用权」。这一逻辑如果被欧盟和美国效仿，将打破Google此前「用AI爬取内容vs传统搜索排名」之间的捆绑逻辑，从根本上改变AI搜索的内容获取成本结构。

不同来源

The Verge AI科技媒体

从政策层面肯定了CMA裁定的历史意义，指出这是全球首例此类行为准则，重点关注其对出版商谈判权的影响，基调偏向历史性政策事件的记录。

Hacker News AI技术社区

引用The Guardian报道，提供出版商视角，社区讨论聚焦于退出机制的技术实现以及对Google现有opt-out工具（robots.txt）覆盖范围的补充意义。

TechCrunch AI科技媒体

关注裁定的执行机制和全球推广计划，补充了出版商对该方案在实际谈判中价值的预期，视角偏向政策执行层面的落地可行性。

CMA裁定更大的意义在于它确立的法律逻辑，而非具体的退出工具本身。「内容可以拒绝被纳入AI搜索摘要，但这不影响该内容在传统搜索中的排名」——如果这条原则被法院和监管机构广泛接受，将打破Google此前「AI爬取与搜索排名捆绑」的逻辑。接下来值得观察的是：欧盟和美国是否会跟进类似监管，以及Google是否会主动全球推行此机制或等待各市场强制要求。

The Verge AI 英国裁定 Google 必须允许出版商退出 AI 搜索功能

Hacker News AI UK媒体获权利可选择退出Google AI搜索摘要

TechCrunch AI 英国监管要求 Google 开放 AI 搜索功能的出版商退出选项

04/11

Claude Code Workflows 正式发布，Anthropic工程师称「自skills以来最大升级」

Claude Code自发布以来在编程Agent赛道占据主导地位（年化收入25亿美元，npm月下载量是Codex CLI的3倍多），Workflows的发布标志着Claude Code正从「个人编程助手」向「团队级工作流平台」转型，与OpenAI Codex向知识工作者扩张的战略方向形成正面竞争。

A 级 · 值得细读 1 个来源 2 条新闻

Agent大模型/LLM 编程/Coding 产品发布突破性实用性

是什么

Anthropic官方工程师Thariq宣布Claude Code Workflows正式发布，称其为「自skills和subagents以来Claude Code能力上最大的一次升级」。Workflows使Claude Code能够支持更复杂的多步骤、可协作、可治理的工作流场景，并被特别提及对非技术用户的潜在价值，相关最佳实践同步发布于Claude官方博客。

为什么重要

Claude Code在编程Agent赛道的市场份额已经建立（年化收入25亿美元），Workflows的发布是从「个人工具」向「团队工作流平台」的重要迭代。对企业买家而言，可协作的工作流比单机Agent工具更具粘性和议价能力。时机选择耐人寻味——恰好在OpenAI大规模宣传Codex企业扩张的同一天，Anthropic选择在工作流深度和可治理性上做文章。

不同来源

GitHub Feeds社交媒体

Thariq（官方工程师）第一手介绍，强调对非技术用户场景的新能力开拓；Dan Shipper（Every CEO）提供第三方社区视角，确认了Workflows在AI工程师圈层中的传播热度。

Anthropic的回应策略不是打价格战，而是在工作流深度和可治理性上做文章。Codex走的是「覆盖人群广」的路，Claude Code走的是「单次工作流的深度」。哪个模式能产生更强的企业买家粘性，将在未来6-12个月见分晓。

GitHub Feeds GitHub Feeds: Thariq（Anthropic Claude Code工程师）宣布Workflows正式发布

GitHub Feeds GitHub Feeds: Dan Shipper（Every CEO）转发Claude Code Workflows

05/11

Trump签署AI行政令：自愿审查框架上线，Sam Altman公开背书

美国AI监管方向从「拜登时代的限制性框架」转向「自愿、友好行业的协商框架」，这对AI公司的合规成本影响深远。自愿框架意味着领先公司可以自定义如何「共享」模型信息，监管约束力有限，但同时也预示着AI与国家安全基础设施的深度绑定将继续加深。

A 级 · 值得细读 4个来源 4 条新闻

大模型/LLM安全/对齐法律/合规政策/监管信号性争议性

是什么

特朗普总统签署新AI行政令，建立「自愿框架」，要求AI公司在发布前沿模型前30天主动与联邦政府共享，以促进安全创新和关键基础设施网络安全保护。行政令将指示多个联邦机构制定AI评估框架，但不引入强制性预发布审查机制，也不设许可证制度，较此前搁置的90天强制版本大幅收窄。Sam Altman公开背书称其「得到了正确的平衡」。

为什么重要

科技行业成功将强制审查改为自愿报备，说明AI公司对美国政策走向的影响力在加强。自愿框架意味着监管约束力有限，首发优先的竞争逻辑将持续主导。同时，行政令强调网络安全工具要交到「可信防御方手中」，预示AI与政府国防基础设施的深度绑定将继续深化。Anduril-Meta军用AR头盔的同日曝光，印证了这一趋势的加速。

不同来源

TechCrunch AI科技媒体

强调「在科技行业提出反对意见后」这一背景，呈现行业对监管的影响力，基调偏向行业视角。

The Verge AI科技媒体

关注行政令的政策机制和国家安全语境，指出「自愿框架」语言与行业关切的吻合之处，分析更为中立。

MIT Technology Review科技媒体

将AI行政令与Anduril-Meta军用AR头盔并列报道，提供了AI监管与AI军事化同步推进的宏观视图，视角最为宏观深入。

「自愿框架」是监管弱化的直接体现——AI公司成功说服白宫把强制审查改为自愿报备。在竞争压力下，「自愿」往往意味着「首发优先，报备在后」。需要关注的是：这一框架是否真正建立了有效的行业自律机制，还是只是一个政治上双赢的表态，而实际约束力近乎于零。

TechCrunch AI Trump 签署修订版 AI 监管行政令，放宽为自愿性审查

The Verge AI Trump 签署行政令，要求 AI 公司发布前预先报备前沿模型

MIT Technology Review Trump 签署新 AI 行政令，Anduril 与 Meta 合作研发战场 AR 头盔

GitHub Feeds GitHub Feeds: Sam Altman（OpenAI CEO）公开支持新AI行政令

06/11

阿里Qwen3.7-Plus：多模态+降价60%，但闭源转向打破开源承诺

Qwen系列此前以开源为核心竞争策略，赢得了Airbnb等大型企业的依赖。Qwen3.7-Plus的闭源转向，是阿里在「开源引流→商业变现」策略上的重大调整，对依赖开源版本做本地部署的企业用户构成直接影响。

A 级 · 值得细读 1 个来源 1 条新闻

大模型/LLM多模态通用/跨领域产品发布信号性争议性

是什么

阿里巴巴发布Qwen3.7-Plus，支持文本、视频和图像多模态输入，定价0.40/1.60美元（输入/输出每百万token），较仅支持文本的Qwen3.7-Max低60%，配备100万token上下文窗口。关键转变：该模型仅通过阿里云API和Qwen Chat提供，不再开源发布权重，与Qwen系列此前Apache 2.0开源策略形成显著战略转向。

为什么重要

Qwen系列此前以开源为核心竞争策略，赢得了Airbnb等大型企业的依赖。Qwen3.7-Plus的闭源转向，是阿里在「开源引流→商业变现」策略上的重大调整——用价格把企业用户锁定在API调用模式，而不是让他们在本地部署开源版后不再续费。这是一个合理的商业逻辑，但对生态的长期影响是负面的：过去Qwen开源模型催生了大量基于其权重的研究和产品，这条通路正在关闭。

不同来源

VentureBeat科技媒体

详细解读价格策略（较竞品低60%）、技术指标（ScreenSpot Pro以79.0分大幅领先GPT-5.4的67.4分）和闭源转向对企业用户的影响，分析最为全面。

低价+多模态是攻势，闭源是守势。值得观察的是，这一转向是否会引发阿里在开发者社区的信誉损失，以及Meta等继续开源的竞争者是否会借此扩大开源阵营影响力。长期而言，「闭源API」路线在有中国官方合规压力的国际市场上存在额外摩擦。

VentureBeat 阿里巴巴发布 Qwen3.7-Plus：支持多模态输入，价格较前代低 60%，但转为闭源

07/11

Surface RTX Spark Dev Box：本地运行120B大模型，挑战云端按token计费模式

128GB统一内存+120B参数是两个关键数字——意味着开发者可以在本地跑一个接近GPT-4规模的模型，不依赖任何云服务。这对隐私敏感的企业用户和预算受限的独立开发者都有吸引力。「价格暂未披露」是一个重要信息缺口，将影响这个赛道的实际规模。

A 级 · 值得细读 2个来源 2 条新闻

芯片/硬件大模型/LLM基础设施/MLOps 编程/Coding 产品发布突破性信号性

是什么

微软在Build 2026上发布Surface RTX Spark Dev Box，搭载NVIDIA Blackwell架构RTX Spark芯片、128GB统一内存，可本地加载并运行超120B参数的大模型，无需任何云端API调用。设备将于今年晚些时候在美国独家发售，预装Windows 11 Pro开发者镜像及完整开发工具链，价格暂未披露。

为什么重要

本地AI推理设备代表着对「AI=云服务」这一主流商业模式的直接挑战。高昂的云端token费用是开发者日常摩擦的主要来源之一——本地固定成本一旦可接受，将极大改变开发者调用大模型的行为模式。Perplexity同期在Computex发布混合本地-云端编排系统，两者共同指向：「端云混合」正在从技术愿景变为产品现实。

不同来源

The Verge AI科技媒体

关注产品外观和定位，强调这是高通Arm开发套件取消后的补位方案，对开发者迁移路径有实际参考价值，报道较为客观中立。

VentureBeat科技媒体

深度解读三层硬件战略（Surface Laptop Ultra → Dev Box → DGX Station for Windows）及其对云端按token计费模式的直接冲击，战略视角更为深入。

「价格暂未披露」是本次发布最重要的未知变量——如果定价超过3000美元，经济性就大打折扣。高通RTX Spark Dev Box能否在价格上做到真正的开发者友好，将是影响这个赛道规模的核心变量。值得持续关注的是定价时间和实际基准测试数据。

The Verge AI Microsoft 发布迷你 Surface RTX Spark Dev Box，专为开发者本地运行 AI 设计

VentureBeat Microsoft Surface RTX Spark Dev Box：挑战云端按 token 计费模式的本地 AI 推理设备

08/11

Microsoft MXC嵌入Windows内核+Project Solara新OS，OS级Agent治理生态成型

AI Agent的最大企业化障碍不是智能能力，而是「如何信任Agent的执行边界」。MXC在OS层面提供了一套Agent权限管控的系统性方案，且通过生态锁定效应（OpenAI、NVIDIA已接入），可能成为企业AI Agent部署的事实标准。

A 级 · 值得细读 3个来源 3 条新闻

Agent安全/对齐基础设施/MLOps 编程/Coding办公/生产力产品发布规模性生态性

是什么

微软在Build 2026发布Microsoft Execution Containers（MXC），一套内置于Windows内核的策略驱动执行层，开发者和IT管理员可声明AI Agent的文件访问、网络权限和UI交互边界，由操作系统强制执行，通过Entra身份绑定实现每条操作的可追溯审计。Project Solara是基于Android构建的Agent专属新OS，展示了桌面终端和可穿戴工牌两类概念设备。

为什么重要

MXC在OS层面提供了Agent权限管控的系统性方案，比应用层的「提示工程约束」更为可靠，让企业IT管理员可以在部署前声明并强制执行Agent行为边界。更重要的是：一旦大量企业在Windows上按MXC规范部署Agent，不符合MXC标准的第三方Agent将面临进入企业环境的摩擦——这是典型的「平台护城河」策略。

不同来源

VentureBeat科技媒体

深入解读MXC的技术架构和企业合规价值，关注可追溯审计能力和与现有企业安全基础设施（Defender、Entra、Intune）的整合路径，评价最为详尽。

The Verge AI科技媒体

重点介绍Project Solara的硬件概念和「从零构建Agent体验平台」的战略定位，关注微软在边缘AI设备层的野心。

TechCrunch AI科技媒体

关注开发者如何通过可移植策略文件为Agent定义跨团队通用行为规则，视角偏向开发者实用性。

MXC是这次Build最被低估的发布。表面上是权限管控工具，实质是微软在企业AI Agent治理层面设立的生态标准。一旦大量企业在Windows上按MXC规范部署Agent，不符合标准的第三方Agent将面临进入企业环境的摩擦。Project Solara的Android基础则意味着微软在边缘Agent设备层面的野心：不只是Windows PC，还有IoT、可穿戴和物理世界接入点。

VentureBeat Microsoft 发布 MXC：嵌入 Windows 内核的 AI agent 沙箱，OpenAI 与 Nvidia 已率先接入

The Verge AI Microsoft Project Solara：专为 AI agent 设备打造的新 OS

TechCrunch AI Microsoft 为开发者提供更精细的 AI agent 行为控制机制

09/11

Meta WhatsApp Business AI agent全球上线+Meta Skill发布，对话AI商业化加速

WhatsApp Business在全球拥有超过2亿企业账户、20亿活跃用户，是覆盖范围最广的商业通信平台之一。AI agent在WhatsApp Business的正式商用，意味着AI对话代理将直接进入拉美、印度、东南亚等高增长市场的B2C商业场景，规模化信号远超硅谷生态。

A 级 · 值得细读 2个来源 2 条新闻

Agent大模型/LLM 办公/生产力通用/跨领域产品发布规模性信号性

是什么

Meta旗下WhatsApp Business AI agent现已全球上线，按token用量计费，企业按实际使用量付费。同日Meta发布Skill功能，GitHub上随即出现热门开源仓库OpenSquilla，显示开发者社区的快速跟进。

为什么重要

WhatsApp全球25亿用户+AI Agent+按token计费，这个组合如果形成规模，将是Facebook Messenger之后Meta最重要的商业化支柱。对竞争对手来说，这意味着在新兴市场做AI商业对话的时间窗口可能正在快速收窄——先入场者将积累用户数据和模型调优优势。

不同来源

TechCrunch AI科技媒体

关注商业化进展和定价模式，分析这对WhatsApp Business平台生态的战略意义，报道重点在商业化里程碑。

量子位行业媒体

关注Meta Skill的发布信号及OpenSquilla开源仓库的快速响应，显示中国AI开发者社区对Meta生态的高度关注度。

WhatsApp全球覆盖+AI agent商业化，这是Meta今年最重要的产品信号之一。需要关注的是：token计费模式在低价值市场的实际商业转化率——WhatsApp的核心用户群在价格敏感的新兴市场，能否建立起有效的付费模型，将决定这一商业化路径的实际规模。

TechCrunch AI Meta 的 WhatsApp Business AI agent 正式向全球开放

量子位刚刚，Meta Skill 来了

10/11

Perplexity发布混合本地-云端推理编排器：敏感数据留本地，高智能任务路由云端

隐私和成本是企业AI部署的两大核心顾虑。混合本地-云端编排器试图用「自动路由」同时解决这两个问题，是一条比「全部本地」（Microsoft Dev Box）更灵活的中间路径，对无法承担高端本地硬件但有隐私需求的企业用户可能更实际。

A 级 · 值得细读 1 个来源 1 条新闻

推理优化大模型/LLM基础设施/MLOps 通用/跨领域产品发布突破性实用性

是什么

Perplexity AI在Computex 2026上展示了其称为「首个混合本地-云端推理编排器」的系统，能在任务执行中实时自主决定哪些AI工作负载留在本地设备、哪些路由至云端前沿模型，无需用户预先手动选择。CEO Aravind Srinivas与Intel CEO同台演示，本地模型自动判断敏感数据处理位置，并在发送至云端前征求用户许可。功能预计数周内推出，公司当前估值200亿美元。

为什么重要

隐私和成本是企业AI部署的两大核心顾虑。混合本地-云端编排器试图用「自动路由」同时解决这两个问题：敏感数据留在本地，需要高智能的任务调用云端，费用只在有必要时产生。与Microsoft Dev Box的「全部本地」路径不同，这是一条更灵活的中间路径，对无法承担高端本地硬件但有隐私需求的企业用户可能更实际。

不同来源

VentureBeat科技媒体

详细解读技术架构和演示场景，分析与微软Dev Box在本地AI推理策略上的战略差异，同时提及Perplexity当前面临来自CNN、纽约时报等9家机构的版权诉讼，报道兼具技术分析和公司背景。

Perplexity的挑战不在技术概念，而在实际体验：自动路由的决策质量（模型如何准确判断「这条数据是否敏感」），以及用户信任（用户是否真的相信「征求许可」机制有效）。Perplexity同时面临版权诉讼压力，这将成为其估值叙事的持续摩擦点。

VentureBeat Perplexity AI 在 Computex 2026 发布首个混合本地-云端推理编排系统

11/11

蚂蚁灵波LingBot-VA：仅需50条演示数据实现91%+机器人操控成功率

「只需50条演示数据」是关键突破点——当前通用机器人操控最大的工程瓶颈之一是数据标注成本。LingBot-VA在极少数据条件下实现高成功率，如果能在更多机器人平台复现，将显著降低机器人技能迁移的人力成本。

A 级 · 值得细读 1 个来源 1 条新闻

机器人/具身智能大模型/LLM多模态制造/工业科学研究研究成果突破性实用性

是什么

蚂蚁灵波科技联合香港科技大学在RSS 2026机器人学年会发表LingBot-VA，将视频动态预测与动作推理统一在自回归扩散框架下，实现「一边思考一边行动」。RoboTwin 2.0基准Easy/Hard双设置下成功率超91%，LIBERO基准达98.5%，每个真实任务仅需50条演示数据微调，控制频率约2Hz满足实际部署需求。

为什么重要

「只需50条演示数据」是关键突破——当前通用机器人操控最大的工程瓶颈之一是数据标注成本。消融实验中去掉视频预测模块后成功率从92.93%断崖下跌至48.31%，有力验证了因果世界建模的核心价值。RSS是机器人学最顶级的会议，在此场合发布意味着较高的学术可信度。

不同来源

机器之心行业媒体

详细报道技术架构和实验数据，尤其关注消融实验中视频预测模块的关键贡献，评价中肯严谨，是国内机器人学领域最专业的技术报道之一。

RSS是机器人学最顶级的会议，LingBot-VA的学术可信度较高。50条数据的泛化能力如果真实，将是一个重要的工程里程碑。接下来的关键是：这个方法能否扩展到更多操作任务类别（目前主要是桌面操作），以及在真实工厂或家庭环境的噪音条件下是否保持鲁棒。

机器之心 RSS 2026：蚂蚁灵波提出自回归因果世界模型 LingBot-VA，仅用 50 条数据实现通用机器人操控

AI 主编日报The Editor's Brief

微软Build 2026：MAI-Thinking-1首发+战略脱OpenAI，一天三连发重塑AI基础设施格局

OpenAI Codex企业平台化：500万周活用户，知识工作者增速超开发者3倍

英国CMA全球首裁：出版商可退出Google AI搜索，内容权利博弈迎来历史性拐点

Claude Code Workflows 正式发布，Anthropic工程师称「自skills以来最大升级」

Trump签署AI行政令：自愿审查框架上线，Sam Altman公开背书

阿里Qwen3.7-Plus：多模态+降价60%，但闭源转向打破开源承诺

Surface RTX Spark Dev Box：本地运行120B大模型，挑战云端按token计费模式

Microsoft MXC嵌入Windows内核+Project Solara新OS，OS级Agent治理生态成型

Meta WhatsApp Business AI agent全球上线+Meta Skill发布，对话AI商业化加速

Perplexity发布混合本地-云端推理编排器：敏感数据留本地，高智能任务路由云端

蚂蚁灵波LingBot-VA：仅需50条演示数据实现91%+机器人操控成功率

同一件事,不同说法

微软Rayfin SDK开放生态：Replit+OpenClaw+VentureBeat三方确认接入企业数据层

AI成本管控觉醒：Uber四个月耗尽全年预算+Cognizant CEO批判tokenmaxxing是虚荣指标

其余 25 条 · 知道有就行