AI 日报 - 2026年04月02日

💥 重磅新闻

Anthropic 意外泄露的 Claude Code 源代码已被大量开发者镜像和分析。最重要的发现是其用于解决上下文熵问题的三层记忆架构（three-layer memory architecture）。此外，代码还揭示了专用工具系统（Grep、Glob、LSP）用于高效代码库导航、通过文件读取去重减少上下文膨胀、以及分叉子代理并行处理任务等设计。分析者指出 Claude Code 的性能更多来自精巧的软件工程而非模型本身。

来源：VentureBeat · Sebastian Raschka 分析

安全AI 招聘独角兽 Mercor 遭供应链攻击，LiteLLM 漏洞波及数千家公司

估值 100 亿美元的 AI 招聘创企 Mercor 确认遭受安全事件，源自开源项目 LiteLLM 的供应链攻击。攻击由黑客组织 TeamPCP 发起，勒索组织 Lapsus$ 声称获取了被盗数据，包括 Slack 数据和 AI 系统与承包商的对话录像。LiteLLM 每日下载量达数百万次，受影响公司数量仍在调查中。该事件已促使 LiteLLM 从 Delve 转向 Vanta 进行合规认证。

来源：TechCrunch

版权企鹅兰登书屋在德国起诉 OpenAI 侵犯版权

全球最大出版商企鹅兰登书屋上周在慕尼黑法院起诉 OpenAI。ChatGPT 在收到简单提示后，生成了与德国畅销儿童书"椰子龙"系列几乎无法区分的文本和封面插图，包括角色形象和出版提交说明。这是出版业首次在欧洲直接以版权法起诉生成式 AI 公司。

来源：The Verge · The Guardian

模型压缩Caltech 团队宣布 1-bit 极限压缩技术，AI 可在边缘设备本地运行

加州理工学院衍生公司 PrismML 发表了一种极端模型压缩技术，可将 AI 模型压缩为 1-bit 表示而不损失性能，使模型能够在边缘设备上本地运行。同样的效率提升也能让数据中心更高效运作。其核心数学方法属于专有技术，IP 归加州理工所有，PrismML 为独家授权方。该项目在 HN 获得 402 分讨论。

来源：WSJ · PrismML

🛠️ 技术动态

视频生成Google 发布 Veo 3.1 Lite：低成本视频生成模型

Google 推出 Veo 3.1 Lite，一个低成本视频生成模型，可通过 Gemini API 调用。与 Veo 3.1 Fast 保持相同速度，但成本降低一半以上，面向大规模视频生成应用场景。

来源：Google Blog

工具Claude Code 新增 Computer Use 能力

Anthropic 为 Claude Code 引入计算机操控能力（computer use），代理现在可以与应用程序交互、导航界面，并通过闭环工作流迭代测试和修复代码。这标志着 AI 编码工具从纯代码编辑向全系统操控迈进。

来源：Claude 官方

开发工具Google 发布 Gemini API Docs MCP 和 Agent Skills

编码代理使用过时训练数据生成 Gemini API 代码一直是个痛点。Google 推出 Gemini API Docs MCP 和 Developer Skills 两个工具，确保编码代理能访问最新 API 并使用最佳实践编码。两者结合在 Google 评估集上达到 96.3% 通过率。

来源：Google Blog

推理优化Together AI 发布 Aurora：在线 RL 推测解码框架

Aurora 是一个基于强化学习的推测解码框架，可从实时推理轨迹中学习并持续更新推测器，无需中断服务。它在不同流量域之间实现实时适应，比精心预训练的静态推测器额外提升 1.25 倍速度，展示了在线从零训练如何超越静态基线。

来源：Together AI Blog

语音Cohere 推出 Transcribe 语音识别服务

Cohere 发布 Transcribe 语音识别产品，在 HN 获得 217 分讨论。定位为企业级语音转文本服务，进一步扩展 Cohere 在企业 AI 市场的产品线。

来源：Cohere Blog · HN 讨论

训练框架微软开源 Agent Lightning：零代码改动把任何 Agent 变成可优化的

微软开源 Agent Lightning 训练框架，宣称可以不修改任何代码即将任意 AI Agent 转化为可通过训练优化的系统，降低 Agent 优化的工程门槛。

来源：GitHub

存储Google AI Pro 套餐存储升级至 5TB

Google One 负责人 Shimrit Ben-Yair 宣布，AI Pro 套餐（$19.99/月）的存储空间从 2TB 升级至 5TB，增加了 150% 的存储容量。

来源：The Verge

💡 深度分析

观点生成式 AI 经济学：两年后的复盘

半导体层仍然占据约 70% 的 AI 总收入，基础设施是目前唯一具有竞争壁垒的层级。AI 行业最赚钱的策略仍然是"卖铲子"。文章系统分析了 AI 产业链各层的经济模型变化，揭示了为什么应用层至今难以盈利。

来源：Apoorv's Newsletter

算力算力之战：OpenAI vs Anthropic

分析指出 Opus 4.5 是 Anthropic 的一次重大突破，得益于其计算能力翻倍。Anthropic 已接近 OpenAI 的总计算能力，有效可用计算能力可能已超过 OpenAI。不过 OpenAI 将在下半年通过新建数据中心拉开差距，2027 年双方将再次接近。OpenAI 目前规划的未来产能远高于 Anthropic。

来源：Peter Gostev

接口Claude Dispatch 与接口的力量：为什么 AI 让人失望的原因是接口

AI 能力一直跑在 AI 可用性前面——模型早已足够聪明可以做很多事，但访问方式主要局限于聊天机器人。大量"AI 令人失望"的声音本质上来自错误的接口。随着接口改进，更多人将看到 AI 的真正能力。Claude Dispatch 等新产品形态正在改变这一局面。

来源：One Useful Thing

趋势AI 种子轮估值确实在飞涨

AI 初创公司种子轮估值持续攀升，单轮融资额已达 1000 万美元、投后估值 4000-4500 万美元。投资者尤其追捧拥有 ex-OpenAI 背景团队的项目。Y Combinator Demo Day 展示了价格上涨的趋势，VC 也因此被迫在更早期的 pre-seed 阶段入局。

来源：TechCrunch

政策加利福尼亚州对 AI 政府合作提出新的隐私和安全标准

加利福尼亚州要求与其合作的 AI 公司必须满足新的隐私和安全标准。此举是美国州级政府首次系统性地为政府 AI 采购设定安全基线，可能成为其他州的参考模板。

来源：The Verge

⚡ 快讯

硬件Nothing 计划 2027 年上半年推出 AI 智能眼镜

据 Bloomberg 报道，Nothing 正在开发内置摄像头、麦克风和扬声器的 AI 智能眼镜，AI 处理将卸载至手机和云端。预计 2027 年上半年发布。

来源：The Verge

法律微软 Copilot 使用条款声明：仅供娱乐用途

微软在 Copilot 个人版使用条款中明确声明产品"仅供娱乐用途"（for entertainment purposes only），引发社区广泛讨论。该条款在 HN 获得 568 分，开发者质疑这是否意味着微软在法律上规避 AI 输出的可靠性责任。

来源：Microsoft · HN 讨论

安全Claude 独立编写 FreeBSD 远程内核 RCE 漏洞利用

安全研究机构披露，Claude 独立完成了一个完整的 FreeBSD 远程内核远程代码执行（RCE）漏洞利用，可获取 root shell（CVE-2026-4747）。该发现在 HN 获得 262 分讨论，引发对 AI 在安全攻防领域能力边界的关注。

来源：GitHub · HN 讨论

平台Apple Intelligence 误在中国上线后被紧急撤回

部分中国用户报告在 iPhone 上看到 Apple Intelligence 功能，Bloomberg 记者 Mark Gurman 证实这是"误操作"上线，Apple 已将其下架。中国政府要求 Apple 必须与本地公司（如阿里巴巴）合作才能在国内提供 AI 功能。

来源：The Verge

MCPElgato Stream Deck 7.4 更新加入 MCP 支持

Elgato 在 Stream Deck 7.4 更新中加入 MCP（Model Context Protocol）支持，硬件外设正式接入 AI Agent 生态。

来源：The Verge

📜 论文推荐

Agent 安全ClawKeeper：自主 Agent 的全面安全防护框架

针对开源 Agent 运行时在工具集成、本地文件访问、Shell 命令执行等方面的安全漏洞，提出三层防护框架：Skill 层（指令级策略注入）、Plugin 层（运行时配置加固和行为监控）、Watcher 层（系统级中间件实时验证 Agent 状态）。Watcher 范式被认为有潜力成为下一代自主 Agent 安全的基础构件。⭐ 162 upvotes，285 GitHub Stars。

来源：arXiv 2603.24414 · GitHub

推理Reasoning Shift：上下文如何悄然缩短 LLM 推理链

系统评估发现，推理模型在不同上下文条件下（长无关上下文、多轮对话、子任务嵌套）会将推理链压缩最多 50%，伴随自我验证和不确定性管理行为的减少。虽然简单问题不受影响，但复杂任务的性能可能因此下降。对 Agent 和长上下文推理场景有重要警示意义。⭐ 17 upvotes。

来源：arXiv 2604.01161

蒸馏大语言模型 On-Policy 蒸馏综述

首个系统梳理 LLM On-Policy 蒸馏（OPD）的综述。传统 off-policy 蒸馏存在暴露偏差问题，OPD 让学生模型在自身生成的轨迹上接收教师反馈。论文提出统一的 f-divergence 框架，从反馈信号、教师访问方式和损失粒度三个维度组织 OPD 方法全景，识别了蒸馏缩放定律和 Agent 级蒸馏等开放问题。

来源：arXiv 2604.00626

自动驾驶自动驾驶领域最新论文

HuggingFace Daily Papers 收录的自动驾驶方向研究，探索视觉-语言模型在端到端自动驾驶场景中的应用，涉及多视角 3D 感知和决策规划的联合优化。

来源：arXiv 2604.00590