AI 日报 - 2026年03月23日

💥 重磅新闻

WSJ 独家报道，扎克伯格正在开发一个 AI Agent 来辅助他担任 CEO 的日常工作——目前已用于快速检索信息，绕过层层汇报直接获取答案。这是他「每个人都应该有自己的 AI Agent」愿景的起点。The Verge 评论称：如果有一个职位人们最愿意被 AI 取代，那就是 CEO（尤其是 74% 不支持率的那位）。

来源：WSJ 独家 · The Verge

安全OpenClaw 安全问题爆发：HN 热帖直指「安全噩梦」

Composio 发布深度技术分析，指出 OpenClaw 存在严重安全漏洞：它可以访问本地文件系统、终端、浏览器、Gmail、Slack 甚至家庭自动化系统，但缺乏基本的安全隔离。文章回顾了 AutoGPT 时代的教训——模型更强了，但安全架构没跟上。HN 348 分引发激烈讨论。这也解释了为何 Nvidia 要推 NemoClaw 加安全层。

来源：Composio · HN 348 分

隐私Signal 创始人与 Meta 合作：端到端加密将进入 AI 聊天

Moxie Marlinspike（Signal 创始人）宣布将 Confer 的加密隐私技术整合到 Meta AI 中。10 年前他把 Signal 协议带进了 WhatsApp，现在要对 AI 聊天做同样的事。他指出 AI 聊天已成为「历史上最大的集中式数据湖」，包含人们最私密的想法、医疗记录和财务信息——而目前这些数据没有任何加密保护。

来源：Confer Blog

军事五角大楼反驳 Anthropic 诉讼：担心 AI 公司在战时「关闭模型」

美国国防部在法庭文件中反击 Anthropic 的「供应链风险」诉讼，称担心 Anthropic 可能在「认为红线被突破」时「试图禁用其技术或提前改变模型行为」——甚至在「正在进行的战斗行动中」。这是 AI 公司与军方关系中前所未有的对抗。

来源：法庭文件 · The Verge

🛠️ 技术动态

推理Flash-MoE：笔记本跑 397B 参数大模型，4.4 tok/s

纯 C/Metal 推理引擎，在 48GB MacBook Pro 上运行 Qwen3.5-397B-A17B（397B 参数 MoE 模型），实现 4.4+ tok/s。核心技术：209GB 模型从 SSD 流式加载、FMA 优化 Metal 着色器、「信任操作系统」的 LRU 页缓存策略。24 小时内由一人一 AI 完成开发，论文含 90+ 实验。HN 358 分。

来源：GitHub · HN 358 分

开源AI2 发布 MolmoPoint：开源视觉定位架构

Allen AI 推出 MolmoPoint——新一代开源 Grounding 架构，包含三个模型、36K GUI 图像数据集和视频/界面任务的追踪数据。为多模态 AI 的视觉理解和定位提供新的开源基础设施。

来源：Allen AI Blog

产品Google 正在测试 macOS 版 Gemini 应用

据报道 Google 正在开发 macOS 原生 Gemini 应用，不仅提供网页版的全部功能，还新增 Desktop Intelligence——让 Gemini 感知桌面上下文来增强响应。这是 Google 在桌面端与 ChatGPT、Copilot 竞争的重要一步。

来源：Engadget

浏览器Perplexity Comet 浏览器登陆 iOS

Perplexity 正式在 iOS 发布 Comet 浏览器，将 AI 搜索体验深度融入移动端浏览。这是 Perplexity 继健康 Agent 后又一产品扩张动作，目标是重新定义移动端信息获取方式。

来源：The Verge

认证Agent Auth Protocol：AI Agent 的身份认证开放标准

全新开放协议发布，让 AI Agent 成为一等公民身份主体——每个 Agent 拥有独立身份注册、特定权限授予、服务端控制的生命周期管理。设计兼容现有基础设施，即插即用。

来源：Agent Auth Protocol

图像微软 MAI-Image-2 发布：Arena.ai 排名第三

微软发布第二代 AI 图像模型 MAI-Image-2，在 Arena.ai 文生图排行榜跃居前三。增强了照片真实感和图中文字生成可靠性，已开始在 Copilot 和 Bing Image Creator 中部署。企业 API 也已向 WPP 等客户开放。

来源：Microsoft AI

💡 深度分析

深度黄仁勋不需要新芯片，他需要新护城河

CNBC 深度分析：NemoClaw 是黄仁勋最重要的战略转型信号。AI 行业从训练转向推理，推理芯片的锁定效应远不如训练——Google、Amazon、Broadcom 都在自研。Nvidia 选择「免费平台 + 付费算力」的经典路线（微软 IE、Google Android），通过开源 Agent 平台培育生态。一位 AI CEO 匿名称这是「经典的互补品商品化策略」：如果 Agent 免费部署，模型公司的高溢价就更难维持。

来源：CNBC

观点OpenAI：如何监控内部编码 Agent 的对齐风险

OpenAI 披露了其内部编码 Agent 的监控体系，用于检测对齐偏差和研究 Agent 在工具密集环境中的真实行为。文章详述了监控系统如何在不干预 Agent 正常工作的情况下发现潜在风险——这是 Agent 安全治理的重要实践样本。

来源：OpenAI

反思「代码已死」的报道被严重夸大了

Steve Krouse 发文反驳「Vibe Coding 将取代传统编程」的论调：AI 生成代码仍需精确理解和调试能力，纯粹的「氛围编程」在生产环境中不可靠。HN 419 分。同期 GDC 上几乎所有受访游戏开发者都否认在项目中使用 AI。精确性仍是工程的核心——AI 是加速器，不是替代品。

来源：Steve Krouse · HN 419 分

时间线Broad Timelines：AI 改变世界的时间表依然高度不确定

LessWrong 长文分析：专家们对 AI 何时「显著改变世界」分歧严重。最佳策略不是押注某一年，而是用宽时间线对冲——既准备短期剧变，也适应渐进发展。对决策者的建议：投资能适应两种情景的灵活策略。

来源：LessWrong

📜 论文推荐

视频编辑DynaEdit：无需训练的多功能视频编辑

提出 DynaEdit——基于预训练文生视频 Flow 模型的免训练编辑方法，可修改视频中的动作、插入与场景交互的物体、改变动态事件。通过 inversion-free 方法解决低频错位和高频抖动问题，在复杂文本驱动视频编辑任务上达到 SOTA。模型无关，适用于多种视频生成模型。

来源：arXiv 2603.17989

VLMVLM 还需要 Vision Transformer 吗？SSM 视觉编码器评估

系统评估状态空间模型（SSM）作为视觉语言模型的视觉骨干网络。在受控实验中，SSM 骨干在 VQA 和定位任务上均达到最强性能，且模型规模更小。重要发现：更高 ImageNet 精度或更大骨干并不一定带来更好的 VLM 表现。提出稳定化策略提升两类骨干的鲁棒性。

来源：arXiv 2603.19209 · GitHub

表格推理Deep Tabular Research：持续经验驱动的表格推理

腾讯提出 DTR 框架——将复杂表格推理视为闭环决策过程。构建层级元图捕获双向语义，引入期望感知选择策略，通过孪生结构化记忆实现持续改进。在非结构化表格基准上验证了将战略规划与底层执行分离对长时间跨度推理的必要性。

来源：arXiv 2603.09151 · Tencent

对齐Google DeepMind：在线 RLHF 实现 10 倍数据效率

提出在线 RLHF 算法，通过增量更新奖励模型和语言模型、不确定性建模和信息导向探索，数据效率提升超 10 倍。对降低大模型对齐成本具有重要意义。

来源：arXiv 2603.17378

⚡ 快讯

🎬 已故演员 Val Kilmer 将以 AI 形象出演新电影，遗产委员会已授权 AI 生成其虚拟形象

🛡️ Sony 训练「保护性 AI」模型对抗吉卜力风格盗用，用吉卜力电影训练以阻止 AI 仿冒受保护内容

🎮 黄仁勋回应 DLSS 5 争议：「他们完全错了」——DLSS 5 将几何可控性与生成式 AI 融合

📦 Character.ai 推出 Imagine Gallery，可管理、筛选、分享 AI 生成图片

🇬🇧 Alexa Plus AI 升级首登欧洲（英国），早期免费，后续 £19.99/月

⚖️ 引用 AI 虚构案例的律师被罚 $15K，法庭对 AI 幻觉法律文件的处罚力度加大

🏬 Meta 纽约旗舰店转为永久门店，持续销售 AI 智能眼镜和 Quest 头显

🏷️ 8 项倡议争相定义「人类创作」标签，但如何区分 AI 与人工仍无行业共识

📊 离开 OpenAI 的人去哪了？分析数百位前 OpenAI 员工，除头部 AI 实验室外，一家叫 Periodic Labs 的低调公司成为热门去处

🔄 GitHub：AI 时代需要重新定义开源导师制，提出 3C 框架应对 AI 贡献噪音