AI 日报 - 2026年05月09日

💥 重磅新闻

融资 Anthropic 估值飙升至 1.2 万亿美元，反超 OpenAI 成为全球 AI 新领跑者

全球 AI 大模型格局正在重塑。最新估值数据显示，Anthropic 估值已达 1.2 万亿美元，较 OpenAI 当前约 1 万亿美元的估值高出 20%。这打破了 OpenAI 的长期主导地位，推动行业进入多元化竞争阶段。如果 Anthropic 成功 IPO，将创下科技企业 IPO 纪录。

来源: 钛媒体

基建 Anthropic 租下 SpaceX 顶级数据中心：一口气拿下 22 万张 GPU

Anthropic 与 SpaceX 签约租用位于田纳西州孟菲斯的数据中心，获得超过 220,000 张 NVIDIA GPU 的算力资源。此前 Anthropic 公开算力估算不足 10 万 H100 当量，明显落后于 OpenAI 和 Google DeepMind。这次签约让 Anthropic 算力规模直接跃升至第一梯队。

来源: 重庆晨报

合作 Anthropic 承诺 5 年内向 Google Cloud 投入 2000 亿美元，与 Blackstone、Goldman Sachs 成立 AI 合资企业

Anthropic 与 Google 达成史无前例的云计算和芯片采购协议，同时推出 10 款金融 AI Agent。与 Blackstone、Goldman Sachs 成立 AI 合资企业，进一步巩固 Claude 在华尔街的地位。这是 AI 公司与云厂商之间最大规模的单笔合作。

来源: 头条

监管特朗普政府签署前沿 AI 模型安全审查协议，Google、Microsoft、xAI 首批加入

美国政府首次在 AI 模型公开发布前进行安全审查。Microsoft、Google DeepMind 和 xAI 已同意共享早期版本模型。这标志着白宫 AI 政策的重大转向，从"自愿框架"转向"事前审查"。Anthropic CEO 随后在白宫与高级官员会晤。

来源: 搜狐

产品 Anthropic Claude Mythos 模型引发市场震荡，OpenAI 火速上线 GPT-5.5-Cyber 网安模型应对

Anthropic 的 Claude Mythos 模型发布后引发市场震动和美国监管层高度关注。OpenAI 迅速推出 GPT-5.5-Cyber 作为回应，专门针对网络安全场景训练，放宽安全任务执行限制，方便合规资质团队开展漏洞识别、补丁验证、恶意软件分析等工作。

来源: 同花顺

模型 OpenAI 发布 GPT-5.5 Instant，取代 GPT-5.3 成为 ChatGPT 默认模型

5 月 6 日，OpenAI 正式发布 GPT-5.5 Instant 模型，面向所有用户全量推送。官方数据显示：医疗、法律、金融等高风险场景幻觉声明较前代减少 52.5%，用户标记错误对话中不准确声明降低 37.3%，长文本理解能力翻倍，推理速度提升 3 倍。

来源: 头条

🛠️ 技术动态

产品 OpenAI Codex 现已支持 Chrome 浏览器（macOS 和 Windows）

OpenAI Codex 现在可以直接在 Chrome 浏览器中运行，支持 macOS 和 Windows 系统。它可以在后台跨标签页并行工作，无需接管浏览器，能够快速处理结构化页面导航和复杂数据流等重复性浏览器任务。这是 Codex 向桌面端渗透的重要一步。

来源: OpenAI

API OpenAI 发布实时音频模型系列：GPT-Realtime-2、Translate、Whisper

OpenAI 发布一组新的实时音频模型：GPT-Realtime-2 用于对话推理，GPT-Realtime-Translate 用于实时多语言翻译，GPT-Realtime-Whisper 用于流式转录。对呼叫中心、陪伴类应用、实时会议转录等场景是直接红利。

来源: OpenAI

产品 Meta 准备推出 Hatch AI Agent：定位消费级 OpenAI 竞品

Meta 正在开发 Hatch，定位为消费级 AI Agent，与 OpenAI 竞争。功能包括图像/视频生成、购物、学习，深度集成 Instagram 和 Facebook。预计 6 月开始内部测试，通过 waitlist 控制发布节奏，同时计划 Q4 推出 Instagram 购物工具。

来源: Testing Catalog

研究 Google DeepMind AlphaEvolve：Gemini 驱动的算法设计编码 Agent

AlphaEvolve 是 Google DeepMind 推出的 Gemini 驱动编码 Agent，能够设计先进算法，在数学和计算机科学的开放问题上做出新发现。它还能帮助解释自然世界的物理规律，加速科学家和企业的进步。

来源: Google DeepMind

安全 Anthropic 发布自然语言自编码器：让模型"说出"自己在想什么

Anthropic 引入 Natural Language Autoencoders (NLAs)，将 AI 模型激活翻译成人类可读文本，帮助理解模型的想法。NLAs 已用于检测安全问题和隐藏动机，改进模型对齐审查。尽管存在幻觉和成本限制，但这是 AI 审计技术的重要进展。

来源: Anthropic

开源 ds4.c：DeepSeek V4 Flash 的轻量级本地推理引擎开源

ds4.c 是一个面向 DeepSeek V4 Flash 的原生推理引擎，设计目标是轻量、小型。目前仅支持 Metal 后端（Apple GPU），未来可能添加 CUDA 支持。项目尚处于 alpha 阶段，但对 Mac 用户的本地 AI 开发是实用工具。

来源: GitHub

💡 深度分析

深度中国 AI 实验室内部见闻：不同于美国"部落战争"的协作生态

中美 AI 实验室输出和成分相似，但组织和心态差异巨大。中国科学家更愿意做"不炫酷"的基础工作来改进模型，而非推销自己的 idea。结果是评测体系"游戏化"程度更低，适应新技术的灵活性更强。中国 AI 社区更像一个生态系统，而非交战部落。

来源: Interconnects

观点 Long AI, Short AGI：硅谷叙事 vs. 市场现实

硅谷叙事强调 AGI 是终极稀缺资源，但 AI 模型的快速商品化正在挑战这一假设。智能正沿着计算、带宽、存储的路径发展——市场力量推动竞争、压低成本。AI 的真正赢家不一定是拥有更优模型的一方，而是拥有客户关系和专有数据的一方。

来源: 1984

工程 GitHub Agentic Workflows 的 Token 效率优化实践

GitHub Agent Workflows 显著提升了代码库卫生和质量，但成本正成为开发者的核心关切。AI 任务如 Agentic Workflows 会自动调度触发，成本可能在不经意间累积。GitHub 上月开始系统优化多种工作流的 token 使用，这篇博客详述了具体措施和初步成果。

来源: GitHub Blog

趋势 AI Agent 突然来袭：为什么所有大厂都在押注"智能体"

2026 年科技风向彻底变了：大模型讨论逐渐降温，AI Agent 智能体成了大厂必争的新赛道。从"能听懂"走向"能办成事"，AI Agent 正成为互联网下半场的浪潮之一。互联网巨头、科技厂商、创投机构都在疯狂加码布局智能体。

来源: 头条

📜 论文推荐

MoE UniPool：MoE 全局共享专家池，打破"每层独占专家"的老套路

现代 MoE 架构通常是"每个 Transformer 层独占一组专家"，这让深度扩展与专家参数强绑定。UniPool 提出跨层共享的全局专家池，让不同层可复用同一批专家，从而把深度和专家规模解耦。在参数量相当的前提下可获得更好的效率/效果平衡。

来源: arXiv 2605.06665

对齐无基准时的 LLM 安全评分：对比式评测的新范式

当还没有标注好的 benchmark（如新语言、新行业、新监管区）时该如何比较候选模型的安全性？这篇论文把问题形式化为"benchmarkless comparative safety scoring"，提出用成对比较 + 统计检验在没有 ground truth 的情况下做可靠排序。

来源: arXiv 2605.06652

评测 Verifier-Backed Hard Problem Generation：让 LLM 自己造难题

LLM 做数学难题越来越强，但生成有效、新颖且真难的题反而很菜。本文引入"验证器后置"机制——先让 LLM 生成题，再用形式化/答案验证器过滤无效题，显著提升生成题的可用比例。对数学推理数据集的自动化扩充是实用技术。

来源: arXiv 2605.06660

优化用预训练时同一个 Optimizer 做 Finetune 更不容易遗忘

一个朴实但重要的观察：全量微调时，如果保持用和预训练完全相同的优化器（含超参），模型在下游任务上效果更好、对原有能力的遗忘也更少。论文给出了一系列实证和机理解释，对所有需要做 SFT / 全量微调的团队都是可直接落地的小贴士。

来源: arXiv 2605.06654

⚡ 快讯

基建新华三发布万卡级 AI 超节点 S80000，破局 GPU 利用率瓶颈

新华三在 NAVIGATE 2026 领航者峰会发布以 UniPoD S80000 超节点为核心的升级版 AI 基础设施全栈产品，解决 AI 大模型应用中算力利用率低及集群扩容等结构性矛盾。

来源: 凤凰网

芯片国产算力芯片图谱：寒武纪、摩尔线程、沐曦等全梳理

AI 浪潮下，算力芯片作为核心底座迎来需求爆发与国产替代双重红利。从云端训练到边缘推理，从通用 GPU 到定制 ASIC，AI 芯片产业链全面崛起。

来源: 头条

并购 OpenAI 与 Anthropic 分别通过合资企业洽谈收购 AI 服务公司

OpenAI 的合资企业 Deployment Company 已从 TPG、贝恩资本等投资者处筹集约 40 亿美元，估值达 100 亿美元；Anthropic 通过合资企业筹集约 15 亿美元，投资者包括黑石集团、高盛等。

来源: 36氪

工会 Google DeepMind 英国员工投票成立工会，抗议军事 AI 合同

DeepMind 伦敦员工因 Google 与五角大楼和以色列军方的 AI 合同而投票工会化，要求撤回军事 AI 承诺。这是 AI 伦理与商业利益冲突的标志性事件。

来源: 头条

应用 Claude "入侵" Office，微软 Copilot 正在变成多模型平台

微软不是在放弃 Copilot，而是在把它升级成多模型平台——GPT、Claude、Gemini 各司其职，用户看到的只是 Copilot 这个统一入口。

来源: 腾讯新闻