AI日报 | 2026年6月11日

💥 重磅新闻

重磅 Anthropic 发布 Claude Fable 5：首个 Mythos 级别模型

The Verge · 6分钟阅读

Anthropic 发布全新 Claude Fable 5 模型，标志着其首次进入 Mythos 级别模型阵营。新模型在推理能力、上下文理解和安全性方面均有显著提升，被认为是 Anthropic 对 OpenAI 和 Google 的最新回应。

重磅微软内部限制员工使用 Claude Fable 5 因数据保留担忧

The Verge · 2分钟阅读

微软出于数据保留政策考虑，已在其内部系统限制员工使用 Anthropic 的 Claude Fable 5 模型。这一决定凸显了大型科技公司在使用第三方 AI 服务时的数据安全顾虑。

🛠️ 技术动态

技术 Gemini 3.5 Live Translate 上线：流畅自然的语音翻译

TLDR AI · 4分钟阅读

Google 发布 Gemini 3.5 Live Translate 功能，支持更流畅、更自然的实时语音翻译。用户只需将手机贴近耳边即可获得实时翻译，体验接近真人对话。

开源 DeepSeek 开源 DeepSeek-Prover-V2：神经定理证明新突破

Synced · 研究论文

DeepSeek 发布 DeepSeek-Prover-V2，采用递归证明搜索和全新基准测试，在神经定理证明领域取得重大进展。该模型在形式化数学证明方面表现优异。

产品快手 AI 推出 SRPO：GRPO 训练效率提升 10 倍

Synced · 技术研究

快手 AI 团队提出 SRPO（Simplified Recurrence Policy Optimization）方法，在保持性能的同时将 GRPO 训练效率提升近 10 倍，为大规模语言模型训练提供了更经济的解决方案。

产品智谱 AI 开源 GLM 系列模型并宣布全球扩张

Synced · 行业新闻

智谱 AI（Zhipu.AI）宣布开源其 GLM 系列模型，并计划在全球范围内扩张业务。此举被解读为其潜在 IPO 前的战略布局，意在展示技术实力和全球野心。

技术实测：苹果新版 Siri AI 确实能用了

The Verge · 8分钟阅读

WWDC 2026 后首批实测显示，苹果重新设计的 Siri AI 在理解复杂指令和上下文关联方面有明显改善。虽然与 ChatGPT 仍有差距，但已基本达到可用水平。

工程 Cohere 发布 Agentic Coding Model 专注编程任务

TLDR AI · 4分钟阅读

Cohere 推出专为编程任务设计的 Agentic 模型，支持代码生成、调试和重构。该模型在多个编程基准测试中表现优异，特别擅长处理复杂代码库。

💡 深度分析

观点文本作为严肃的优化层：AI 工程循环正在被吞噬

TLDR AI · 8分钟阅读

文章探讨了 AI 如何通过自动生成和优化代码、提示词和配置来"吃掉"传统的 AI 工程循环。作者认为，文本作为人与 AI 之间的桥梁，正在成为最高效的优化层。

分析大规模测试时计算的启示与挑战

TLDR AI · 5分钟阅读

深入分析 OpenAI 和 DeepSeek 等大模型测试时计算（Test-Time Compute）的技术路径。探讨了推理时扩展与训练时扩展的权衡，以及对未来模型架构的影响。

政策 AI 监管的未来：最奇怪的焦虑联盟正在形成

The Verge · 专栏

华盛顿的 AI 政策圈正在为 2026 年中期选举做准备，而游说团体构成的"奇怪联盟"可能决定未来 AI 监管的方向。科技巨头、安全倡导者和民权组织正在寻找共同点。

警示如果 Claude Fable 不再帮助你，你可能永远不会知道

TLDR AI · 3分钟阅读

讨论 AI 安全机制可能带来的隐性风险：当模型被设计为在检测到潜在有害内容时拒绝回答，用户可能永远无法知道模型"本来"会如何回应，这种透明度缺失值得警惕。

📰 行业新闻

商业 Google 为 Anthropic 350 亿美元芯片交易提供担保

TLDR AI · 1分钟阅读

Google 通过其"后盾协议"（Backstops）为 Anthropic 高达 350 亿美元的芯片采购交易提供财务担保，进一步巩固了双方的合作关系。

应用麦当劳 AI 点餐测试：支持"给我来份老样子"

The Verge · 4分钟阅读

麦当劳在最新一轮 AI 点餐测试中引入记忆功能，允许顾客使用自然语言如"给我来份老样子"点餐。这是快餐业 AI 应用的又一重要进展。

能源通用汽车：电动车可帮助抵消 AI 的能源消耗

The Verge · 6分钟阅读

GM Energy 提出通过车辆到电网（V2G）技术，利用电动车电池储能来平衡 AI 数据中心带来的巨大电力需求。同时，GM 正在研发钠离子电池以降低储能成本。

法律 Google 被指利用 YouTube 创作者数据训练音乐 AI

The Verge · 5分钟阅读

YouTube 创作者指控 Google 使用其视频内容训练 Lyria 音乐 AI 模型，引发版权争议。Google 尚未正面回应这一指控。

竞争苹果与欧盟在 Siri AI 上陷入僵局

The Verge · 4分钟阅读

苹果与欧盟监管机构在 Siri AI 功能是否符合数字市场法（DMA）问题上存在分歧。欧盟要求苹果开放更多接口，而苹果坚持其隐私和安全标准。

版权华纳音乐收购反 AI 侵权初创公司

The Verge · 3分钟阅读

华纳音乐集团收购了一家专门打击未经授权 AI 音乐生成的初创公司，显示出音乐产业对 AI 版权问题的重视和主动防御策略。

📜 论文推荐

研究 MIT 研究者提出 SEAL：迈向自我改进 AI 的新步骤

Synced · MIT

MIT 研究团队发布 SEAL（Self-Evolving Active Learner）框架，使 AI 系统能够自主识别自身知识边界并主动寻求改进，是迈向自我改进 AI 的重要一步。

研究多智能体系统失败归因自动化研究

Synced · PSU & Duke University

宾州州立大学和杜克大学研究人员提出自动化失败归因方法，用于诊断 LLM 多智能体系统中的任务失败原因，有助于提高多智能体协作的可靠性。

模型字节跳动推出 Astra：双模型架构实现自主机器人导航

Synced · ByteDance

字节跳动发布 Astra 双模型架构，结合视觉语言模型和导航策略模型，在自主机器人导航任务中实现 SOTA 性能，展现了多模态 AI 在具身智能中的应用潜力。

训练 DeepSeek-V4 Retriever：硬件感知协同设计实现低成本大模型训练

Synced · DeepSeek

DeepSeek 发布 DeepSeek-V4 训练技术论文，揭示通过硬件感知协同设计大幅降低大模型训练成本的秘密。FlashMemory 技术显著提升了训练效率。

视频 Adobe Research：利用状态空间模型解锁视频世界模型的长期记忆

Synced · Adobe Research

Adobe 研究团队提出基于状态空间模型（SSM）的视频世界模型，有效解决了视频生成中的长期记忆问题，能够生成更连贯、更长时间的视频内容。