🤖 AI 日报

2026年05月10日

💥 重磅新闻

OpenAI 正式发布 Codex for Chrome 扩展程序,支持 macOS 和 Windows。该扩展允许 Codex 直接调用用户浏览器,在保留用户控制权的前提下,实现跨标签页读取上下文、调用开发者工具及测试 Web 应用等功能。AI 可以在后台并行处理重复性浏览器任务,无需接管浏览器。这是 AI 编程助手向全场景演进的重要里程碑。
来源: 品玩
北京时间 5 月 7 日凌晨,马斯克宣布 xAI 将作为独立公司解散,整体整合至 SpaceX 旗下并更名为 SpaceXAI。xAI 旗下大语言模型 Grok 及社交平台 X 相关 AI 业务一并纳入 SpaceXAI 体系。更引人注目的是,xAI 位于田纳西州孟菲斯数据中心的超过 22 万张 NVIDIA GPU 将租给 Anthropic,这是史上最大规模的算力合作之一。
来源: 新浪财经
全球 AI 大模型格局正在重塑。最新估值数据显示,Anthropic 估值已达 1.2 万亿美元,较 OpenAI 当前约 1 万亿美元的估值高出 20%。这打破了 OpenAI 的长期主导地位,推动行业进入多元化竞争阶段。Anthropic 在代码生成和 Agent 领域的优势正在转化为市场领先地位。
来源: 钛媒体
美国政府首次在 AI 模型公开发布前进行安全审查。Google、Microsoft、xAI 已同意共享早期版本模型。这标志着白宫 AI 政策的重大转向,从"自愿框架"转向"事前审查"。CAISI 已完成逾 40 项此类评估,其中包括对尚未发布模型的评估。OpenAI 与 Anthropic 早在两年前便签署了类似协议。
来源: 新浪科技
Anthropic 与 Google 达成史无前例的云计算和芯片采购协议。同时 Anthropic 推出 10 款金融 AI Agent,与 Blackstone、Goldman Sachs 成立 AI 合资企业,进一步巩固 Claude 在华尔街的地位。这是 AI 公司与云厂商之间最大规模的单笔合作,规模远超 OpenAI 与 Microsoft 的协议。
来源: 头条

🛠️ 技术动态

OpenAI 发布一组新的实时音频模型:GPT-Realtime-2 用于对话推理,GPT-Realtime-Translate 用于实时多语言翻译,GPT-Realtime-Whisper 用于流式转录。对呼叫中心、陪伴类应用、实时会议转录等场景是直接利好,标志着语音 AI 进入产品化落地阶段。
来源: OpenAI
Meta 正在开发 Hatch,定位为消费级 AI Agent,与 OpenAI 竞争。功能包括图像/视频生成、购物、学习,深度集成 Instagram 和 Facebook。预计 6 月开始内部测试,通过 waitlist 控制发布节奏,同时计划 Q4 推出 Instagram 购物工具。这是 Meta 在 AI Agent 领域的重要布局。
Anthropic 引入 Natural Language Autoencoders (NLAs),将 AI 模型激活翻译成人类可读文本,帮助理解模型的想法。NLAs 已用于检测安全问题和隐藏动机,改进模型对齐审查。尽管存在幻觉和成本限制,但这是 AI 审计技术的重要进展,为模型可解释性提供了新工具。
来源: Anthropic
ds4.c 是一个面向 DeepSeek V4 Flash 的原生推理引擎,由 Redis 作者 antirez 开发。设计目标是轻量、小型,目前仅支持 Metal 后端(Apple GPU),未来可能添加 CUDA 支持。项目尚处于 alpha 阶段,但对 Mac 用户的本地 AI 开发是实用工具。
来源: GitHub
英伟达在云端 AI 芯片市场获益颇丰,其 GPU 在数据中心各种模型训练中展现出显著性能优势。此次发布的边缘 AI 超级计算机进一步扩展了英伟达在边缘计算领域的布局,为 IoT 和端侧 AI 应用提供算力支持。
来源: 新浪

💡 深度分析

中美 AI 实验室输出和成分相似,但组织和心态差异巨大。中国科学家更愿意做"不炫酷"的基础工作来改进模型,而非推销自己的 idea。结果是评测体系"游戏化"程度更低,适应新技术的灵活性更强。中国 AI 社区更像一个生态系统,而非交战部落,各实验室之间互相尊重。这对理解中国 AI 发展路径有重要启示。
GitHub Agent Workflows 显著提升了代码库卫生和质量,但成本正成为开发者的核心关切。AI 任务如 Agentic Workflows 会自动调度触发,成本可能在不经意间累积。GitHub 上月开始系统优化多种工作流的 token 使用,包括压缩上下文、精简 prompt、缓存中间结果等策略,初步成果显著。
来源: GitHub Blog
当 GPT-5.4 和 Claude 4.5 的模型能力差距已不再是关键,Skill 生态正在成为 AI Agent 的核心竞争力。Cursor 的成功本质不是模型强,而是 Skill 做得足够深——理解光标位置、解析项目上下文、规划多步文件操作。未来的 Agent 竞争,将围绕 Skill 深度和生态壁垒展开。
来源: 稀土掘金

⚡ 快讯

美国检方正追查一起英伟达 AI 芯片大规模走私案,泰国 OBON 公司被指控与超微电脑相关人员联手完成 GPU 服务器的违规转运操作。
来源: 头条
英伟达并购 Groq,押注 LPU(语言处理单元)芯片架构,其设计路径与英伟达长期依赖的 GPU 体系截然不同,标志着 AI 推理芯片多元化时代来临。
来源: 百家号
美国国防部宣布与 SpaceX、OpenAI、Google、Microsoft、AWS、Nvidia、Reflection AI 七家企业签订涉密 AI 部署协议,Anthropic 被排除在外,覆盖 IL6 与 IL7 安全级别。
来源: 智源社区
Perplexity 发布 Personal Computer 桌面应用,Mac 用户可获得 AI Agent 对本地文件、应用程序、连接器和网页的访问能力,进一步扩展 AI 助手的本地化能力。
来源: Perplexity
OpenAI 引入 Trusted Contact 功能,允许成年用户指定联系人,当检测到严重自残风险时可向该联系人发送警报,这是 AI 安全功能的重要补充。
来源: OpenAI