AI 日报 - 2026年06月04日

💥 重磅新闻

重磅 Microsoft 与 OpenAI 正式分道扬镳，AI 首席 Mustafa Suleyman 宣布"从零开始"

Microsoft 与 OpenAI 的战略合作关系发生根本性转变。Microsoft AI 负责人 Mustafa Suleyman 表示："我们必须证明自己能从零开始做好一切。"这标志着科技巨头与 AI 初创公司之间从蜜月期进入竞争阶段，Microsoft 将全力打造自有 AI 能力，不再依赖 OpenAI 的模型供应。

来源：The Verge

IPO 经济学人：股市能否吞下 Anthropic、SpaceX 和 OpenAI？

《经济学人》深度分析三大科技巨头同时推进 IPO 的市场冲击。Anthropic 已提交 S-1 草案，SpaceX 也在筹备上市，加上 OpenAI 的潜在 IPO 计划，市场面临前所未有的融资压力。HN 699票 1231评论热议，投资者担忧巨额 IPO 可能导致流动性虹吸效应。

来源：The Economist · HN 699票

监管英国裁定 Google 必须允许出版商退出 AI 搜索功能

英国竞争与市场管理局裁定，Google 必须允许出版商选择退出 AI 搜索摘要功能。这是全球首例要求 AI 搜索给予内容方选择权的监管决定，对 AI 训练数据版权争议具有里程碑意义。出版行业对此表示欢迎，认为这是保护原创内容的关键一步。

来源：The Verge

🛠️ 技术动态

模型 Microsoft 发布七款 MAI 新模型，支持开发者自定义权重微调

Microsoft Build 2026 大会上发布七款全新 MAI 系列模型，引入"Frontier Tuning"方法——通过强化学习环境让 AI 适应特定工作流。开发者可自行微调模型权重并集成到产品中。同时宣布与梅奥诊所合作开发医疗 AI 模型，通过 Azure Foundry 分发。HN 512票热议。

来源：Microsoft AI

开源 MiniMax M3：首个融合前沿编程+原生多模态+1M 上下文的开源权重模型

MiniMax 宣布将在10天内发布 M3 模型权重和技术报告。M3 是首个同时具备前沿编程、原生多模态和 1M token 上下文窗口的开源权重模型，API 保证 512K token 最低上下文。定价 $0.60/M 输入 + $2.40/M 输出，性价比极具竞争力。

来源：Implicator AI

产品 OpenAI Codex 全角色升级：六个职业专属插件上线

OpenAI 发布 Codex 新能力和六个角色专属插件，覆盖数据分析、创意制作、销售、产品设计、股权投资和投行领域。Codex 周活用户已达500万，OpenAI 强调它不仅是程序员工具。The Verge 同步报道了 Codex 在 Windows 上的计算机操控能力扩展。

来源：OpenAI

平台 Microsoft Project Solara：专为 AI Agent 硬件打造的操作系统

Microsoft Build 2026 上公布 Project Solara，这是专为 AI Agent 硬件设备设计的操作系统。同时推出 Microsoft Execution Containers，为 OpenClaw 等 AI Agent 在 Windows 上运行提供安全沙箱环境。AI Agent 从软件走向实体硬件的趋势愈发明显。

来源：The Verge

推理 Perplexity 推出本地-云端混合推理系统，Computex 2026 亮相

Perplexity 在 Computex 2026 发布混合推理系统，智能路由轻量任务至本地模型、复杂推理至云端模型。基于其 Personal Computer Agent 构建，标志着 AI 推理从纯云端走向端云协同的新阶段。

来源：Perplexity

开源 Wall Attention：通过"墙"记忆 Token 改进长上下文推理

新型注意力机制 Wall Attention 通过围绕持久"墙"记忆 Token 组织信息来改进长上下文推理。这是开源社区对大模型长上下文能力瓶颈的又一次技术突破尝试，为 RAG 和 Agent 系统的上下文管理提供了新思路。

来源：GitHub

💡 深度分析

分析开源与闭源模型处于不同的指数增长曲线

分析指出，很多企业想切换到开源模型，但当前在分布外任务上仍不够好。然而开源模型终将追上——开源生态将比闭源寡头更加多样和庞大，开源模型经济的总市场价值将远超 OpenAI 和 Anthropic 的累计价值。这一判断对企业在 AI 战略上的开源 vs 闭源选择有重要参考意义。

来源：Interconnects

观点 a16z：视觉 AI 的下一个前沿是"代码"，而非"像素"

a16z 提出视觉 AI 正从"生成最终像素"转向"生成可编辑源代码"的范式转变。代码原生生成产出 HTML/CSS、Blender 脚本等结构化表示，支持精确编辑和持续迭代。这对设计和3D建模工作流有深远影响，AI 创作将从"一次性成品"走向"可迭代资产"。

来源：a16z

警示 Larry Ellison："公民将循规蹈矩，因为我们一直在录像"

Oracle 创始人 Larry Ellison 的一番言论引发广泛争议——他声称监控技术将使公民"自觉遵守规则"，因为一切行为都在被记录和报告。HN 324票讨论中，许多人将其视为对隐私权的严重威胁，AI 监控社会的伦理边界再次成为焦点。

来源：TechRadar · HN 324票

⚡ 快讯

隐私 Meta 收回员工追踪工具：员工可暂停30分钟

Meta 在员工强烈反对下修改"模型能力计划"(MCI)，该工具记录员工电脑活动用于 AI 训练。现在员工可暂停 MCI 最多30分钟，处理敏感内容、远程办公或关注带宽/电池的员工可获豁免。HN 333票讨论，企业 AI 训练与员工隐私的矛盾日益尖锐。

来源：BBC · HN 333票

法律斯坦福法学院研究：AI 表现超越法学教授

斯坦福法学院发布研究表明 AI 在法律分析任务中表现超越法学教授。HN 359票 301评论，法律行业对 AI 替代的担忧进一步升级，也引发了关于法律教育和实务未来的深入讨论。

来源：Stanford Law · HN 359票

安全 VSCode 漏洞：一键窃取 GitHub Token

安全研究员发现 VSCode 扩展机制存在漏洞，攻击者可通过一键操作窃取用户的 GitHub Token。HN 570票，这对依赖 VSCode 的开发者群体构成严重安全威胁，也暴露了 AI 编程工具在安全设计上的薄弱环节。

来源：Ammar Askar · HN 570票

环保 AI 有个水资源问题，Google 说它有解决方案

Google 承诺到2030年补充比消耗更多的水资源。AI 数据中心冷却用水已成为科技行业环保的新焦点，Google 此举是大型科技公司首次对 AI 用水问题做出具体承诺。

来源：The Verge

Agent 斯坦福 CS336 课程发布 AI Agent 使用指南

斯坦福 CS336 课程发布了 AI Agent 在学术场景中的使用指南，明确了合规使用 AI 的边界和规范。HN 499票讨论，反映了教育界对 AI Agent 在教学中角色的重视和规范化需求。

来源：Stanford CS336 · HN 499票

产品 Google Phone App 新增 AI 诈骗来电检测

Google Phone 应用新增 AI 驱动的诈骗来电检测功能，可识别冒充联系人的 AI 语音诈骗。这是 AI 安全防御能力的实际应用，也侧面反映了 AI 语音诈骗已成为现实威胁。

来源：The Verge

📜 论文推荐

推理加速 Domino：解耦因果建模与自回归起草，投机解码实现 5.49× 加速

Domino 将投机解码中的因果建模与自回归起草解耦，提出全新推测生成框架。在保持输出质量前提下实现 5.49× 推理加速，对大模型推理成本优化有直接应用价值。HuggingFace 131票当日最高。

来源：arXiv 2605.29707 · HuggingFace 131票

RAG OCC-RAG：面向忠实问答的最优认知核心

OCC-RAG 证明紧凑的任务专用语言模型在多跳推理和忠实度方面优于大模型。这一发现对 RAG 系统的模型选择策略有重要启发——在某些场景下，小而专的模型可能比大而全的模型更可靠。HuggingFace 54票。

来源：arXiv 2606.00683 · HuggingFace 54票

搜索Agent Harness-1：强化学习训练搜索 Agent，状态外化框架

Harness-1 是一个 20B 参数的搜索 Agent，通过强化学习在有状态搜索框架中训练，在检索增强任务上展现出超越传统 RAG 的性能。状态外化设计使 Agent 能更有效地管理搜索过程。HuggingFace 34票。

来源：arXiv 2606.02373 · HuggingFace 34票

蒸馏 TrOPD：信任区域策略蒸馏，提升大模型蒸馏可靠性

Trust Region On-Policy Distillation (TrOPD) 通过信任区域约束改善大语言模型蒸馏中 token 级别监督的可靠性。在模型压缩越来越重要的当下，这项工作为如何更好地将大模型知识迁移到小模型提供了新方法。HuggingFace 31票。

来源：arXiv 2606.01249 · HuggingFace 31票