AI 日报 - 2026年03月22日

💥 重磅新闻

OpenAI 将收购 Astral——uv、Ruff、ty 等 Python 明星开源工具的缔造者。Codex 目前周活用户已超 200 万，今年以来用户增长 3 倍、用量增长 5 倍。OpenAI 的目标是让 Codex 从「生成代码」进化为「参与完整开发流程」的 Agent——规划变更、修改代码库、运行工具、验证结果、持续维护。Astral 工具链的深度整合将让 AI Agent 直接操控开发者日常工具。收购尚需监管审批。

来源：OpenAI 官方

GTCNvidia GTC 发布 NemoClaw：给 OpenClaw 加上安全护城河

黄仁勋在 GTC 大会发布 NemoClaw，为开源 Agent 平台 OpenClaw 提供企业级安全层。单条命令即可部署 Nemotron 模型 + OpenShell 隔离沙箱，支持隐私路由、安全策略和网络隔离。可运行在 RTX PC、DGX Spark/Station 等平台。黄仁勋称「OpenClaw 是个人 AI 的操作系统」，CNBC 分析认为这是 Nvidia 从芯片商转型 AI 平台运营商的关键一步。

来源：NVIDIA Newsroom · CNBC 分析

战略Meta AI 审核全面上线，将逐步替代人工内容审核员

Meta 宣布其 AI 审核系统已在 Facebook 和 Instagram 全面部署，将在未来几年「减少对第三方外包商的依赖」。同时，Signal 创始人 Moxie Marlinspike 正与 Meta 合作，将其加密 AI 聊天技术 Confer 整合到 Meta AI 中——这是端到端加密与 AI 融合的重要探索。

来源：Meta Newsroom · Confer Blog

芯片三星宣布 730 亿美元 AI 芯片扩张计划

三星将 2026 年生产和研发投资提升 22%，总额超 730 亿美元，目标是在 AI 存储芯片领域赶超 SK Hynix 作为 Nvidia 主要供应商的地位。联席 CEO 表示 Agentic AI 需求正在推动订单激增，资金将倾注于先进机器人等「面向未来」的领域。

来源：WSJ · The Verge

🛠️ 技术动态

模型Cursor Composer 2 发布：前沿编码模型，$0.50/M 起步

Cursor 发布 Composer 2，SWE-bench Multilingual 73.7%，Terminal-Bench 2.0 61.7%，定价仅 $0.50/M 输入 $2.50/M 输出。基于首次持续预训练 + 强化学习，可解决需要数百步操作的复杂编码任务。HN 上有人指出底层疑似月之暗面 Kimi K2.5 + RL 微调。

来源：Cursor Blog · HN 讨论

产品WordPress.com 全面接入 AI Agent：可自动创建、发布和管理网站

占据全球 43% 网站份额的 WordPress.com 开放 AI Agent 能力：通过 MCP 协议，Claude/ChatGPT/Cursor 等工具可以起草和发布文章、管理评论、修复 SEO 元数据、调整网站结构。所有 AI 内容默认为草稿，需用户确认。这意味着 AI 驱动的「自动化建站」时代正式到来。

来源：TechCrunch

医疗Perplexity 推出健康 AI Agent，进军消费医疗

Perplexity Health 在美国上线，提供个性化健康数据中心和专业 Agent（营养、睡眠等）。与竞品主打问答不同，Perplexity 走「数据仪表盘 + 专业 Agent」路线，整合真实用户数据。

来源：Testing Catalog

图像微软发布 MAI-Image-2：第二代 AI 图像模型

微软推出 MAI-Image-2，在逼真度和图片内文字生成方面大幅提升。已开始在 Copilot 和 Bing Image Creator 中滚动上线。

来源：Microsoft AI

开源OpenCode：开源 AI 编码 Agent 火爆，HN 1200+ 分

支持终端/IDE/桌面多端的开源 AI 编码 Agent，GitHub 上迅速积累大量关注。可直接使用 GitHub Copilot、ChatGPT Plus 账号登录。HN Best 热度排名第一。

来源：OpenCode · HN 1211 分

硬件Tinybox：tinygrad 团队的深度学习专用硬件

tinygrad 团队推出 Tinybox——面向深度学习的高性能计算硬件方案。HN 热度 492 分，引发关于 AI 训练硬件民主化的热烈讨论。

来源：tinygrad.org · HN 492 分

💡 深度分析

深度黄仁勋不需要新芯片，他需要新护城河

CNBC 深度分析：AI 行业正从训练转向推理，推理不需要同样的锁定效应——Google、Amazon、Broadcom 都在造自己的推理芯片。黄仁勋通过 NemoClaw 免费分发 Agent 平台，「免费操作系统 + 付费算力」的商业模式，正是微软/Google 验证过的经典平台战略。同时这也是对 OpenAI/Anthropic 的降维打击：如果企业可以免费部署 AI Agent，大模型公司的高溢价就更难维持。

来源：CNBC

实验给 AI Agent 16 块 GPU 会怎样？Autoresearch 扩展实验

让 Claude Code 操控 16 GPU K8s 集群做自动研究：8 小时提交 910 个实验。单 GPU 只能贪心爬山，16 GPU 后变成每波 10-13 个实验的全因子网格搜索，捕获参数交互效应。并行计算从根本上改变了 AI 研究 Agent 的搜索策略——这暗示着 AI 科研自动化的真正门槛可能是算力而非智力。

来源：SkyPilot Blog

观点World Models：计算不可计算之物

96 分钟深度长文。World Models 通过动作条件神经网络模拟真实世界复杂性，在机器人和自动驾驶领域取得突破。General Intuition、World Labs 等获得大额融资。从游戏片段中学习决策，逐步逼近人类级别的世界理解能力。

来源：Not Boring

警示EFF：封禁 Internet Archive 挡不住 AI，只会抹掉互联网历史记录

EFF 发文警告，越来越多网站屏蔽 Internet Archive 的爬虫以防 AI 训练数据被使用，但这不仅无法阻止大型 AI 公司获取数据，反而正在侵蚀互联网最重要的公共历史档案。HN 热度 525 分。

来源：EFF

📜 论文推荐

对齐Google DeepMind：在线 RLHF 实现 10 倍数据效率

提出增量更新奖励模型和语言模型的在线 RLHF 算法，通过不确定性建模和信息导向探索，数据效率提升超 10 倍。对大模型对齐成本控制具有重要意义。

来源：arXiv 2603.17378

评测MultiTempBench：LLM 时间推理能力的多语言基准

横跨 5 种语言（含中文）和 3 种历法（公历/伊斯兰历/农历），包含 15,000 个测试样本。发现 Token 化质量是低资源语言时间推理的关键瓶颈，而在高资源语言中，时间线性表征才是最强预测因子。评估了 20 个 LLM。

来源：arXiv 2603.19017 · GitHub

3DDreamPartGen：语义驱动的部件级 3D 生成

提出 Duplex Part Latents（DPL）联合建模部件几何与外观，配合 Relational Semantic Latents（RSL）捕获部件间语义关系，通过同步去噪实现文本到 3D 的高保真生成。在多个基准上达到 SOTA。

来源：arXiv 2603.19216 · 项目主页

开源Moonshot AI：Attention Residuals

月之暗面（Moonshot AI）开源的注意力残差机制研究，HN 热度 235 分。提出新的注意力机制优化方法，引发社区对 Transformer 架构改进的广泛讨论。

来源：GitHub · HN 235 分

⚡ 快讯

🎮 黄仁勋回应 DLSS 5 争议：「他们完全错了」——DLSS 5 融合了几何可控性与生成式 AI

🏥 Google 正在测试 macOS 版 Gemini 独立应用，含 Desktop Intelligence 功能，可感知桌面上下文

🔐 Agent Auth Protocol 发布：为 AI Agent 提供身份注册、权限管理和生命周期控制的开放标准

🎬 已故演员 Val Kilmer 将以 AI 形象出演新电影，遗产委员会已授权

🛡️ Sony 开发「保护性 AI」模型，用吉卜力电影训练以阻止 AI 盗用受保护内容

🇬🇧 Alexa Plus AI 升级登陆英国，早期免费体验，后续 £19.99/月（Prime 用户免费）

🏬 Meta 纽约旗舰店转为永久门店，持续销售 AI 智能眼镜和 Quest 头显

🏷️ BBC：8 项倡议争相定义「人类创作」标签，但如何区分 AI 与人工仍无共识

🚀 GitHub：AI 时代需要重新定义开源导师制，提出 3C 框架（理解力、上下文、持续性）

📊 NanoGPT 慢跑实验：通过无限算力实现 10 倍数据效率——智能的瓶颈终将是数据而非算力