AI 日报 - 2026年03月24日

💥 重磅新闻

Nvidia CEO 黄仁勋在 Lex Fridman 播客上语出惊人：「I think we've achieved AGI.」他以 OpenClaw 等 AI Agent 的爆发为例，认为 AI 已具备完成复杂任务的能力。不过他随后又收回了部分说法——「10 万个 Agent 造出 Nvidia 的概率是零」。这一声明引发行业热议，核心问题仍未解决：AGI 的定义本身就没有共识。

来源：The Verge · Lex Fridman Podcast

里程碑GPT-5.4 Pro 解决了一个前沿数学开放问题

Epoch AI 确认 GPT-5.4 Pro 成功解决了 FrontierMath 中的一道 Ramsey 超图开放问题——此前估计需要数学专家 1-3 个月才能攻克。问题贡献者 Will Brian 评价该解法「消除了已知下界构造中的低效性」，计划将 AI 的解法写成论文发表。随后 Opus 4.6 和 Gemini 3.1 Pro 也成功解出该题。HN 345 分。

来源：Epoch AI · HN 345 分

能源OpenAI 正与 Helion Energy 洽谈核聚变供电协议

Axios 报道 OpenAI 正在与核聚变初创公司 Helion Energy「深入谈判」电力供应合作。Sam Altman 同日宣布辞去 Helion 董事长职务并回避相关讨论。这在本质上是 Altman 的 AI 公司要向 Altman 的能源公司购电——利益关联引发争议。核聚变在科学上仍有重大突破待完成。

来源：Axios · Reuters

端侧iPhone 17 Pro 成功运行 400B 大模型

anemll 团队展示在 iPhone 17 Pro 上运行 400B 参数大语言模型，引发 HN 社区轰动（623 分）。这一突破性演示证明了端侧 AI 推理的巨大潜力——移动设备已不再是大模型的禁区。具体推理速度和量化方案引发热烈技术讨论。

来源：Twitter @anemll · HN 623 分

🛠️ 技术动态

推理Flash-MoE：笔记本跑 397B 参数 MoE 模型，4.4 tok/s

纯 C/Metal 推理引擎在 48GB MacBook Pro 上运行 Qwen3.5-397B-A17B。核心技术：209GB 模型从 SSD 流式加载、FMA 优化 Metal 着色器、「信任操作系统」页缓存策略（击败了所有自定义缓存方案）。24 小时内由一人一 AI 完成开发，论文含 90+ 实验。HN 393 分。

来源：GitHub · HN 393 分

创意Adobe Photoshop Beta 推出 Rotate Object 功能：2D 转 3D 旋转

Adobe 在 Photoshop Beta 中上线 Rotate Object 新功能，可将 2D 图像转换为 3D 可旋转物体。The Verge 实测评价：效果偏 AI 感，对普通物体会产生明显的「生成痕迹」。有趣但实用性有限——更像是技术展示而非生产工具。

来源：The Verge

平台WordPress.com 开放 MCP 接口：AI Agent 可直接撰写和发布博文

WordPress.com 正式允许 Claude、ChatGPT 等 AI Agent 通过 MCP 协议草拟和发布博客文章。所有 Agent 生成的内容默认为草稿状态，用户确认后才能发布。这是 MCP 在内容管理平台上的首个大规模落地案例。

来源：WordPress · TechCrunch

AI 诈骗男子用 AI 生成数十万首歌曲刷流量，骗取 800 万美元版税

北卡罗来纳州男子 Michael Smith 认罪：他创建了数十万首 AI 生成的歌曲，然后用机器人「数十亿次」播放这些歌曲，从流媒体平台骗取超过 800 万美元的版税。这是 DOJ 起诉的首个大规模 AI 音乐流量欺诈案。

来源：美国司法部

内容审核Meta 宣布 AI 审核将在未来几年取代外包审核员

Meta 宣布大规模部署 AI 内容审核系统，计划「减少对第三方供应商的依赖」。AI 将接管重复性审查（如暴力内容、诈骗信息）和对抗性场景。人类审核员仍保留，但角色将大幅缩减。此举引发对内容审核员权益的讨论——这些工人多年来面临 PTSD 等职业伤害。

来源：Meta 官方

💡 深度分析

安全OpenClaw 安全深度分析：「安全噩梦包装成美梦」

Composio 发布长文深度解剖 OpenClaw 的安全架构。核心观点：OpenClaw 能访问本地文件、终端、浏览器、邮箱、甚至家庭自动化——但缺乏基本安全隔离。文中引用真实案例：AI Agent 误读 Slack 消息后自动标记用户为 OOO 并在频道发通知。Brandon Wang 坦言「它能读我的短信、登录我的银行」。HN 391 分引发激烈安全讨论。

来源：Composio · HN 391 分

反思「代码已死」的报道被严重夸大了

Steve Krouse 发文反驳 Vibe Coding 取代传统编程的论调：AI 生成代码仍需精确理解和调试能力，纯粹的「氛围编程」在生产环境不可靠。GDC 上几乎所有受访游戏开发者都否认在项目中使用 AI。精确性仍是工程核心——AI 是加速器，不是替代品。HN 588 分。

来源：Steve Krouse · HN 588 分

研究Autoresearch：用 AI 重新验证一个旧研究想法

研究者分享了用 AI Agent 自动化完成一个搁置已久的研究项目的完整历程——从文献检索到实验设计到结果分析。反映了 AI 作为科研加速器的现实能力与局限。HN 372 分，引发「AI 能否做真正的科研」的深度讨论。

来源：ykumar.me · HN 372 分

职场WSJ：年轻人如何「AI-proof」自己的职业？

华尔街日报深度报道年轻职场人士应对 AI 冲击的策略：从选择 AI 难以替代的领域、到培养跨学科能力、再到主动拥抱 AI 工具成为「AI 增强型人才」。受访者指出，最安全的不是远离 AI，而是成为最会用 AI 的人。HN 221 分。

来源：WSJ · HN 221 分

📜 论文推荐

3DGLD：用几何基础模型重构多视图扩散的潜空间

KAIST 提出 Geometric Latent Diffusion（GLD）框架，将几何基础模型的特征空间作为多视图扩散的潜空间，而非传统 VAE 空间。实验证明 GLD 在 2D 图像质量和 3D 一致性上均超越 VAE/RAE，训练速度提升 4.4 倍。即使不使用文生图预训练，性能仍与 SOTA 方法竞争。

来源：arXiv 2603.22275 · 项目页

AgentOpenResearcher：完全开源的深度研究 Agent 训练流水线

TIGER-Lab 发布 OpenResearcher——可复现的离线深度研究 Agent 训练流水线。在 1500 万文档语料上合成 9.7 万条轨迹（含 100+ 工具调用的长序列），微调 30B 模型后在 BrowseComp-Plus 上提升 34 个百分点。完全离线运行，不依赖商业 API，全套代码、数据和模型检查点开源。

来源：arXiv 2603.20278 · GitHub

世界模型FluidWorld：用反应-扩散动力学取代 Transformer 做世界模型

提出 FluidWorld——用反应-扩散（Reaction-Diffusion）动力学作为世界模型的预测基底，挑战 Transformer 在世界模型中的主导地位。该方法具有显式的空间归纳偏置，避免了 O(N²) 的计算复杂度，为世界模型探索了全新的建模范式。

来源：arXiv 2603.21315

数学推理AI 解决前沿数学问题：Ramsey 超图下界改进

GPT-5.4 Pro 首次解决 FrontierMath 中关于超图分割的 Ramsey 问题，改进了已知下界。问题贡献者评价 AI 的解法「消除了现有构造中的低效性，与上界构造精妙呼应」。后续 Opus 4.6 max 和 Gemini 3.1 Pro 也独立求解成功。数学家预计人类专家需 1-3 个月完成此题。

来源：Epoch AI FrontierMath

⚡ 快讯

💻 Claude Code Cheat Sheet 发布，社区整理的 Claude Code 使用速查表，HN 424 分

🛡️ FCC 将外国制造的消费级路由器纳入管制清单，HN 327 分

🎬 已故演员 Val Kilmer 将以 AI 形象出演新电影，遗产委员会已授权

🛡️ Sony 训练「保护性 AI」对抗吉卜力风格盗用，但尚未决定具体用途

🏪 开发者为兄弟的汽修店搭建 AI 前台，实战案例引发讨论，HN 285 分

🔄 BitTorrent 创始人谈版本控制的未来，HN 648 分

📰 PC Gamer 用 37MB 的文章推荐 RSS 阅读器——讽刺的是这恰好证明了为什么需要 RSS，HN 824 分

🔬 英伟达 GTC 大会发布 Vera Rubin 架构算力平台，OpenAI 宣布收购 Python 工具公司 Astral