AI日报 | 2026年6月12日

💥 重磅新闻

重磅亚马逊员工要求西雅图暂停新建数据中心

The Verge · 环境影响评估

亚马逊员工向西雅图市议会请愿，要求暂停新建数据中心项目，理由是巨大的能源消耗和水资源使用对当地环境造成压力。这一行动反映了科技行业员工对AI基础设施扩张带来的环境影响的担忧。

战略微软AI主管：称AI为"活着的"是危险的

The Verge Podcast · 观点访谈

微软AI CEO Mustafa Suleyman 在播客中表示，将AI描述为"活着的"或具有意识是危险的，会误导公众对AI本质的理解。他强调AI是工具而非生命形式，呼吁更负责任的技术传播。

Synced · 机器人技术

字节跳动推出 Astra 框架，采用双模型架构分离感知和决策，使机器人能够在复杂环境中实现更高效的自主导航。该技术结合了视觉语言模型和强化学习，在多个基准测试中表现优异。

模型 MIT 推出 SEAL：迈向自改进AI的新一步

Synced · 自改进系统

MIT研究人员发布SEAL（Self-Evolving Autonomous Learner），一种能够通过自我反思和错误修正持续改进性能的新型AI系统。该系统展示了无需人工标注数据即可实现能力迭代的潜力。

多智能体 PSU与杜克大学：多智能体系统故障自动归因研究

Synced · 可靠性研究

宾夕法尼亚州立大学和杜克大学研究人员提出"自动故障归因"新方法，解决了LLM多智能体系统中定位失败根源的难题。该方法可帮助开发者快速识别导致任务失败的特定智能体和时刻。

Synced · 视频生成

Adobe研究团队提出将状态空间模型（SSM）应用于视频世界模型，有效解决了长视频序列中的记忆衰减问题。该技术使AI能够生成长达数分钟的连贯视频内容，帧间一致性显著提升。

数学推理 DeepSeek 发布 Prover-V2：神经定理证明新突破

Synced · 数学AI

DeepSeek推出Prover-V2模型，采用递归证明搜索和新基准测试，在形式化数学定理证明任务上取得重大进展。该模型在多个数学竞赛级别的证明任务中达到新的SOTA水平。

训练优化快手AI提出SRPO：GRPO训练效率有望提升10倍

Synced · 训练效率

快手AI团队推出SRPO（Sample-efficient Reinforcement Policy Optimization），在保持GRPO（Group Relative Policy Optimization）效果的同时大幅降低样本需求，理论效率提升可达10倍。

Synced · 训练成本

DeepSeek团队发布V3模型技术论文，详细阐述了通过硬件感知协同设计大幅降低大模型训练成本的方法。该研究展示了如何在有限预算下训练出性能接近GPT-4级别的模型。

Synced · 开源生态

智谱AI宣布开源更轻量、更快的GLM模型版本，并计划在潜在IPO前加速全球扩张。该公司正在积极构建开源生态，与Llama、Qwen等开源模型展开竞争。

推理优化 DeepSeek下一代R2模型预告：SPCT方法革新推理扩展

Synced · 推理扩展

DeepSeek预告下一代R2模型，并推出SPCT（Self-Play Chain of Thought）方法，通过自博弈生成高质量推理数据，解决了大规模推理模型训练中的数据稀缺问题。

应用得来速聊天机器人只是开始

The Verge · 餐饮科技

麦当劳、Wendy's等快餐巨头正在加速部署AI得来速（drive-thru）点餐系统。文章分析了语音AI在餐饮业的应用现状，指出这只是AI重塑服务业的开始，更多自动化场景正在涌现。

苹果 WWDC 2026 技术对话：与 Craig Federighi 的独家访谈

The Verge · 苹果生态

苹果软件工程高级副总裁Craig Federighi在WWDC 2026技术对话中分享了苹果AI战略的最新进展，包括Apple Intelligence的下一步计划和Siri的改进路线图。