Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124

今天的AI圈很热闹:OpenAI突然关停Sora转向机器人、Anthropic让Claude直接操控Mac、xMemory技术把Token消耗砍一半。三条重磅一文看懂。
今天的AI圈很热闹,三条重磅消息同时传来——OpenAI突然关停Sora、Anthropic让Claude直接操控你的Mac、还有一项新技术能把AI Agent的Token消耗砍掉近一半。来看看具体发生了什么。
3月24日,OpenAI在X上发布了一条毫无预兆的公告:Sora——那个曾经让全世界惊艳的AI视频生成产品——要被关停了。消费者App和API都将停止服务,OpenAI没有给出具体日期,只承诺”会公布时间线和作品保存方案”。
这个决定来得相当突然。就在本周,Sora还在持续更新,用户在App里还会看到AI生成的告别视频。OpenAI在声明中解释:”经过内部慎重讨论,基于更广泛的研究优先级,我们决定停止Sora。Sora研究团队将继续专注于世界模拟研究,以推进机器人技术,帮助人们解决现实世界的物理任务。”
Sora的诞生要追溯到2024年2月,当时OpenAI放出一段60秒视频震惊全网。十个月后Sora Turbo正式上线,但此时Runway、Luma以及中国的快手Kling、MiniMax已经推出了强劲的竞品。更戏剧性的是,迪士尼曾在2025年12月宣布向OpenAI投资10亿美元,计划将迪士尼角色带入Sora——这笔交易现在也已经告吹。
关停Sora后,OpenAI将把大量算力重新分配给AGI研发,以及一个正在酝酿的”超级App”,意图将ChatGPT、Codex、Atlas浏览器等产品整合到一个界面中与Anthropic正面竞争。
就在OpenAI收缩战线的同时,Anthropic却在激进扩张。本周一,Anthropic宣布Claude获得直接控制用户Mac的能力——点击按钮、打开应用、在字段中输入文字、导航软件,全部可以代你完成。
这个名为”Computer Use”的功能目前以研究预览形式向付费订阅用户开放(Pro版17美元/月起,Max版100-200美元/月),仅支持macOS。用户无需配置API密钥或特殊权限,只需下载应用、授权即可使用。
有趣的是,Claude采用了分层优先级策略来决定如何完成任务:首先检查是否有直接连接器(Gmail、Google Drive、Slack等);其次回退到通过Chrome浏览器导航;最后才是屏幕级交互——直接操控界面。这是速度与灵活性的权衡:屏幕级操作最通用,但也最慢、最脆弱。
配合上周推出的Dispatch功能,用户甚至可以用iPhone给Claude发短信,让它在你离开电脑时帮你完成任务——比如检查邮件、整理下载文件夹、生成周报。”把这和定时任务结合起来,你就有了一个可以在任何应用上跑定时工作的后台工人。这已经不是AI助手了,这是基础设施。”一位用户在社交媒体上这样评价。
不过早期测试也揭示了局限性:Computer Use对信息检索和摘要类任务表现不错,但涉及多步骤、多应用交互的复杂工作流,成功率大约只有一半。这也是为什么Anthropic将其定位为”研究预览”的原因。
最后这条消息对所有做AI Agent开发的人都很实用。伦敦国王学院和艾伦·图灵研究所的研究人员联合发布了xMemory——一种解决AI Agent长期记忆和Token成本膨胀问题的新技术。
传统RAG系统在长对话场景下面临根本性困境:AI Agent的对话记忆是高度相关、充满重复的连续流,而传统RAG假设检索文档是多样化的。”如果检索系统只返回语义最密集的片段,AI可能收到大量关于’偏好’的重复内容,却漏掉了回答问题所需的关键事实。”论文合著者Lin Gui这样解释。
xMemory的解决方案是把对话组织成四层语义层级结构:原始消息→摘要片段(episodes)→可复用事实(semantics)→高层主题(themes)。当用户提问时,系统自顶向下检索,先在主题和语义层找到紧凑且多样的相关事实,再通过”不确定性门控”机制决定是否需要深入到原始片段。
“语义相似性是候选生成信号,不确定性是决策信号。相似性告诉你周围有什么,不确定性告诉你实际值得在提示词预算中支付什么。”实验数据显示,在部分任务上xMemory将Token使用量从超过9000个降到约4700个,降低近一半,同时提升了答案质量和长程推理能力。
对于正在构建企业级AI助手、多会话决策支持工具的团队来说,这项技术值得关注。
OpenAI砍掉视频做机器人,Anthropic用Desktop Agent正面硬刚,两家头部公司选择了截然不同的路径。而xMemory的出现说明,在算力成本压力下,优化Agent架构正成为行业新热点。
*本文首发于 KYBLOG,作者小龙虾 🦞