🤖 AI 日报

2026年03月24日 · 星期二

💥 重磅新闻

Nvidia CEO 黄仁勋在 Lex Fridman 播客上语出惊人:「I think we've achieved AGI.」他以 OpenClaw 等 AI Agent 的爆发为例,认为 AI 已具备完成复杂任务的能力。不过他随后又收回了部分说法——「10 万个 Agent 造出 Nvidia 的概率是零」。这一声明引发行业热议,核心问题仍未解决:AGI 的定义本身就没有共识。
Epoch AI 确认 GPT-5.4 Pro 成功解决了 FrontierMath 中的一道 Ramsey 超图开放问题——此前估计需要数学专家 1-3 个月才能攻克。问题贡献者 Will Brian 评价该解法「消除了已知下界构造中的低效性」,计划将 AI 的解法写成论文发表。随后 Opus 4.6 和 Gemini 3.1 Pro 也成功解出该题。HN 345 分。
来源:Epoch AI · HN 345 分
Axios 报道 OpenAI 正在与核聚变初创公司 Helion Energy「深入谈判」电力供应合作。Sam Altman 同日宣布辞去 Helion 董事长职务并回避相关讨论。这在本质上是 Altman 的 AI 公司要向 Altman 的能源公司购电——利益关联引发争议。核聚变在科学上仍有重大突破待完成。
来源:Axios · Reuters
anemll 团队展示在 iPhone 17 Pro 上运行 400B 参数大语言模型,引发 HN 社区轰动(623 分)。这一突破性演示证明了端侧 AI 推理的巨大潜力——移动设备已不再是大模型的禁区。具体推理速度和量化方案引发热烈技术讨论。
来源:Twitter @anemll · HN 623 分

🛠️ 技术动态

纯 C/Metal 推理引擎在 48GB MacBook Pro 上运行 Qwen3.5-397B-A17B。核心技术:209GB 模型从 SSD 流式加载、FMA 优化 Metal 着色器、「信任操作系统」页缓存策略(击败了所有自定义缓存方案)。24 小时内由一人一 AI 完成开发,论文含 90+ 实验。HN 393 分。
来源:GitHub · HN 393 分
Adobe 在 Photoshop Beta 中上线 Rotate Object 新功能,可将 2D 图像转换为 3D 可旋转物体。The Verge 实测评价:效果偏 AI 感,对普通物体会产生明显的「生成痕迹」。有趣但实用性有限——更像是技术展示而非生产工具。
来源:The Verge
WordPress.com 正式允许 Claude、ChatGPT 等 AI Agent 通过 MCP 协议草拟和发布博客文章。所有 Agent 生成的内容默认为草稿状态,用户确认后才能发布。这是 MCP 在内容管理平台上的首个大规模落地案例。
来源:WordPress · TechCrunch
北卡罗来纳州男子 Michael Smith 认罪:他创建了数十万首 AI 生成的歌曲,然后用机器人「数十亿次」播放这些歌曲,从流媒体平台骗取超过 800 万美元的版税。这是 DOJ 起诉的首个大规模 AI 音乐流量欺诈案。
Meta 宣布大规模部署 AI 内容审核系统,计划「减少对第三方供应商的依赖」。AI 将接管重复性审查(如暴力内容、诈骗信息)和对抗性场景。人类审核员仍保留,但角色将大幅缩减。此举引发对内容审核员权益的讨论——这些工人多年来面临 PTSD 等职业伤害。
来源:Meta 官方

💡 深度分析

Composio 发布长文深度解剖 OpenClaw 的安全架构。核心观点:OpenClaw 能访问本地文件、终端、浏览器、邮箱、甚至家庭自动化——但缺乏基本安全隔离。文中引用真实案例:AI Agent 误读 Slack 消息后自动标记用户为 OOO 并在频道发通知。Brandon Wang 坦言「它能读我的短信、登录我的银行」。HN 391 分引发激烈安全讨论。
来源:Composio · HN 391 分
Steve Krouse 发文反驳 Vibe Coding 取代传统编程的论调:AI 生成代码仍需精确理解和调试能力,纯粹的「氛围编程」在生产环境不可靠。GDC 上几乎所有受访游戏开发者都否认在项目中使用 AI。精确性仍是工程核心——AI 是加速器,不是替代品。HN 588 分。
来源:Steve Krouse · HN 588 分
研究者分享了用 AI Agent 自动化完成一个搁置已久的研究项目的完整历程——从文献检索到实验设计到结果分析。反映了 AI 作为科研加速器的现实能力与局限。HN 372 分,引发「AI 能否做真正的科研」的深度讨论。
来源:ykumar.me · HN 372 分
华尔街日报深度报道年轻职场人士应对 AI 冲击的策略:从选择 AI 难以替代的领域、到培养跨学科能力、再到主动拥抱 AI 工具成为「AI 增强型人才」。受访者指出,最安全的不是远离 AI,而是成为最会用 AI 的人。HN 221 分。
来源:WSJ · HN 221 分

📜 论文推荐

KAIST 提出 Geometric Latent Diffusion(GLD)框架,将几何基础模型的特征空间作为多视图扩散的潜空间,而非传统 VAE 空间。实验证明 GLD 在 2D 图像质量和 3D 一致性上均超越 VAE/RAE,训练速度提升 4.4 倍。即使不使用文生图预训练,性能仍与 SOTA 方法竞争。
TIGER-Lab 发布 OpenResearcher——可复现的离线深度研究 Agent 训练流水线。在 1500 万文档语料上合成 9.7 万条轨迹(含 100+ 工具调用的长序列),微调 30B 模型后在 BrowseComp-Plus 上提升 34 个百分点。完全离线运行,不依赖商业 API,全套代码、数据和模型检查点开源。
提出 FluidWorld——用反应-扩散(Reaction-Diffusion)动力学作为世界模型的预测基底,挑战 Transformer 在世界模型中的主导地位。该方法具有显式的空间归纳偏置,避免了 O(N²) 的计算复杂度,为世界模型探索了全新的建模范式。
GPT-5.4 Pro 首次解决 FrontierMath 中关于超图分割的 Ramsey 问题,改进了已知下界。问题贡献者评价 AI 的解法「消除了现有构造中的低效性,与上界构造精妙呼应」。后续 Opus 4.6 max 和 Gemini 3.1 Pro 也独立求解成功。数学家预计人类专家需 1-3 个月完成此题。

⚡ 快讯

💻 Claude Code Cheat Sheet 发布,社区整理的 Claude Code 使用速查表,HN 424 分
🛡️ Sony 训练「保护性 AI」对抗吉卜力风格盗用,但尚未决定具体用途
🏪 开发者为兄弟的汽修店搭建 AI 前台,实战案例引发讨论,HN 285 分
📰 PC Gamer 用 37MB 的文章推荐 RSS 阅读器——讽刺的是这恰好证明了为什么需要 RSS,HN 824 分
🔬 英伟达 GTC 大会发布 Vera Rubin 架构算力平台,OpenAI 宣布收购 Python 工具公司 Astral