🤖 AI 日报

2026年03月22日 · 星期日

💥 重磅新闻

OpenAI 将收购 Astral——uv、Ruff、ty 等 Python 明星开源工具的缔造者。Codex 目前周活用户已超 200 万,今年以来用户增长 3 倍、用量增长 5 倍。OpenAI 的目标是让 Codex 从「生成代码」进化为「参与完整开发流程」的 Agent——规划变更、修改代码库、运行工具、验证结果、持续维护。Astral 工具链的深度整合将让 AI Agent 直接操控开发者日常工具。收购尚需监管审批。
来源:OpenAI 官方
黄仁勋在 GTC 大会发布 NemoClaw,为开源 Agent 平台 OpenClaw 提供企业级安全层。单条命令即可部署 Nemotron 模型 + OpenShell 隔离沙箱,支持隐私路由、安全策略和网络隔离。可运行在 RTX PC、DGX Spark/Station 等平台。黄仁勋称「OpenClaw 是个人 AI 的操作系统」,CNBC 分析认为这是 Nvidia 从芯片商转型 AI 平台运营商的关键一步。
Meta 宣布其 AI 审核系统已在 Facebook 和 Instagram 全面部署,将在未来几年「减少对第三方外包商的依赖」。同时,Signal 创始人 Moxie Marlinspike 正与 Meta 合作,将其加密 AI 聊天技术 Confer 整合到 Meta AI 中——这是端到端加密与 AI 融合的重要探索。
三星将 2026 年生产和研发投资提升 22%,总额超 730 亿美元,目标是在 AI 存储芯片领域赶超 SK Hynix 作为 Nvidia 主要供应商的地位。联席 CEO 表示 Agentic AI 需求正在推动订单激增,资金将倾注于先进机器人等「面向未来」的领域。
来源:WSJ · The Verge

🛠️ 技术动态

Cursor 发布 Composer 2,SWE-bench Multilingual 73.7%,Terminal-Bench 2.0 61.7%,定价仅 $0.50/M 输入 $2.50/M 输出。基于首次持续预训练 + 强化学习,可解决需要数百步操作的复杂编码任务。HN 上有人指出底层疑似月之暗面 Kimi K2.5 + RL 微调。
占据全球 43% 网站份额的 WordPress.com 开放 AI Agent 能力:通过 MCP 协议,Claude/ChatGPT/Cursor 等工具可以起草和发布文章、管理评论、修复 SEO 元数据、调整网站结构。所有 AI 内容默认为草稿,需用户确认。这意味着 AI 驱动的「自动化建站」时代正式到来。
来源:TechCrunch
Perplexity Health 在美国上线,提供个性化健康数据中心和专业 Agent(营养、睡眠等)。与竞品主打问答不同,Perplexity 走「数据仪表盘 + 专业 Agent」路线,整合真实用户数据。
微软推出 MAI-Image-2,在逼真度和图片内文字生成方面大幅提升。已开始在 Copilot 和 Bing Image Creator 中滚动上线。
来源:Microsoft AI
支持终端/IDE/桌面多端的开源 AI 编码 Agent,GitHub 上迅速积累大量关注。可直接使用 GitHub Copilot、ChatGPT Plus 账号登录。HN Best 热度排名第一。
来源:OpenCode · HN 1211 分
tinygrad 团队推出 Tinybox——面向深度学习的高性能计算硬件方案。HN 热度 492 分,引发关于 AI 训练硬件民主化的热烈讨论。
来源:tinygrad.org · HN 492 分

💡 深度分析

CNBC 深度分析:AI 行业正从训练转向推理,推理不需要同样的锁定效应——Google、Amazon、Broadcom 都在造自己的推理芯片。黄仁勋通过 NemoClaw 免费分发 Agent 平台,「免费操作系统 + 付费算力」的商业模式,正是微软/Google 验证过的经典平台战略。同时这也是对 OpenAI/Anthropic 的降维打击:如果企业可以免费部署 AI Agent,大模型公司的高溢价就更难维持。
来源:CNBC
让 Claude Code 操控 16 GPU K8s 集群做自动研究:8 小时提交 910 个实验。单 GPU 只能贪心爬山,16 GPU 后变成每波 10-13 个实验的全因子网格搜索,捕获参数交互效应。并行计算从根本上改变了 AI 研究 Agent 的搜索策略——这暗示着 AI 科研自动化的真正门槛可能是算力而非智力。
来源:SkyPilot Blog
96 分钟深度长文。World Models 通过动作条件神经网络模拟真实世界复杂性,在机器人和自动驾驶领域取得突破。General Intuition、World Labs 等获得大额融资。从游戏片段中学习决策,逐步逼近人类级别的世界理解能力。
来源:Not Boring
EFF 发文警告,越来越多网站屏蔽 Internet Archive 的爬虫以防 AI 训练数据被使用,但这不仅无法阻止大型 AI 公司获取数据,反而正在侵蚀互联网最重要的公共历史档案。HN 热度 525 分。
来源:EFF

📜 论文推荐

提出增量更新奖励模型和语言模型的在线 RLHF 算法,通过不确定性建模和信息导向探索,数据效率提升超 10 倍。对大模型对齐成本控制具有重要意义。
横跨 5 种语言(含中文)和 3 种历法(公历/伊斯兰历/农历),包含 15,000 个测试样本。发现 Token 化质量是低资源语言时间推理的关键瓶颈,而在高资源语言中,时间线性表征才是最强预测因子。评估了 20 个 LLM。
提出 Duplex Part Latents(DPL)联合建模部件几何与外观,配合 Relational Semantic Latents(RSL)捕获部件间语义关系,通过同步去噪实现文本到 3D 的高保真生成。在多个基准上达到 SOTA。
月之暗面(Moonshot AI)开源的注意力残差机制研究,HN 热度 235 分。提出新的注意力机制优化方法,引发社区对 Transformer 架构改进的广泛讨论。
来源:GitHub · HN 235 分

⚡ 快讯

🎮 黄仁勋回应 DLSS 5 争议:「他们完全错了」——DLSS 5 融合了几何可控性与生成式 AI
🏥 Google 正在测试 macOS 版 Gemini 独立应用,含 Desktop Intelligence 功能,可感知桌面上下文
🔐 Agent Auth Protocol 发布:为 AI Agent 提供身份注册、权限管理和生命周期控制的开放标准
🛡️ Sony 开发「保护性 AI」模型,用吉卜力电影训练以阻止 AI 盗用受保护内容
🇬🇧 Alexa Plus AI 升级登陆英国,早期免费体验,后续 £19.99/月(Prime 用户免费)
🏬 Meta 纽约旗舰店转为永久门店,持续销售 AI 智能眼镜和 Quest 头显
🏷️ BBC:8 项倡议争相定义「人类创作」标签,但如何区分 AI 与人工仍无共识
🚀 GitHub:AI 时代需要重新定义开源导师制,提出 3C 框架(理解力、上下文、持续性)
📊 NanoGPT 慢跑实验:通过无限算力实现 10 倍数据效率——智能的瓶颈终将是数据而非算力