🤖 AI 日报

2026年04月02日 · 星期四
💥 重磅新闻
Anthropic 意外泄露的 Claude Code 源代码已被大量开发者镜像和分析。最重要的发现是其用于解决上下文熵问题的三层记忆架构(three-layer memory architecture)。此外,代码还揭示了专用工具系统(Grep、Glob、LSP)用于高效代码库导航、通过文件读取去重减少上下文膨胀、以及分叉子代理并行处理任务等设计。分析者指出 Claude Code 的性能更多来自精巧的软件工程而非模型本身。
估值 100 亿美元的 AI 招聘创企 Mercor 确认遭受安全事件,源自开源项目 LiteLLM 的供应链攻击。攻击由黑客组织 TeamPCP 发起,勒索组织 Lapsus$ 声称获取了被盗数据,包括 Slack 数据和 AI 系统与承包商的对话录像。LiteLLM 每日下载量达数百万次,受影响公司数量仍在调查中。该事件已促使 LiteLLM 从 Delve 转向 Vanta 进行合规认证。
来源:TechCrunch
全球最大出版商企鹅兰登书屋上周在慕尼黑法院起诉 OpenAI。ChatGPT 在收到简单提示后,生成了与德国畅销儿童书"椰子龙"系列几乎无法区分的文本和封面插图,包括角色形象和出版提交说明。这是出版业首次在欧洲直接以版权法起诉生成式 AI 公司。
加州理工学院衍生公司 PrismML 发表了一种极端模型压缩技术,可将 AI 模型压缩为 1-bit 表示而不损失性能,使模型能够在边缘设备上本地运行。同样的效率提升也能让数据中心更高效运作。其核心数学方法属于专有技术,IP 归加州理工所有,PrismML 为独家授权方。该项目在 HN 获得 402 分讨论。
来源:WSJ · PrismML
🛠️ 技术动态
Google 推出 Veo 3.1 Lite,一个低成本视频生成模型,可通过 Gemini API 调用。与 Veo 3.1 Fast 保持相同速度,但成本降低一半以上,面向大规模视频生成应用场景。
来源:Google Blog
Anthropic 为 Claude Code 引入计算机操控能力(computer use),代理现在可以与应用程序交互、导航界面,并通过闭环工作流迭代测试和修复代码。这标志着 AI 编码工具从纯代码编辑向全系统操控迈进。
来源:Claude 官方
编码代理使用过时训练数据生成 Gemini API 代码一直是个痛点。Google 推出 Gemini API Docs MCP 和 Developer Skills 两个工具,确保编码代理能访问最新 API 并使用最佳实践编码。两者结合在 Google 评估集上达到 96.3% 通过率。
来源:Google Blog
Aurora 是一个基于强化学习的推测解码框架,可从实时推理轨迹中学习并持续更新推测器,无需中断服务。它在不同流量域之间实现实时适应,比精心预训练的静态推测器额外提升 1.25 倍速度,展示了在线从零训练如何超越静态基线。
Cohere 发布 Transcribe 语音识别产品,在 HN 获得 217 分讨论。定位为企业级语音转文本服务,进一步扩展 Cohere 在企业 AI 市场的产品线。
微软开源 Agent Lightning 训练框架,宣称可以不修改任何代码即将任意 AI Agent 转化为可通过训练优化的系统,降低 Agent 优化的工程门槛。
来源:GitHub
Google One 负责人 Shimrit Ben-Yair 宣布,AI Pro 套餐($19.99/月)的存储空间从 2TB 升级至 5TB,增加了 150% 的存储容量。
来源:The Verge
💡 深度分析
半导体层仍然占据约 70% 的 AI 总收入,基础设施是目前唯一具有竞争壁垒的层级。AI 行业最赚钱的策略仍然是"卖铲子"。文章系统分析了 AI 产业链各层的经济模型变化,揭示了为什么应用层至今难以盈利。
分析指出 Opus 4.5 是 Anthropic 的一次重大突破,得益于其计算能力翻倍。Anthropic 已接近 OpenAI 的总计算能力,有效可用计算能力可能已超过 OpenAI。不过 OpenAI 将在下半年通过新建数据中心拉开差距,2027 年双方将再次接近。OpenAI 目前规划的未来产能远高于 Anthropic。
来源:Peter Gostev
AI 能力一直跑在 AI 可用性前面——模型早已足够聪明可以做很多事,但访问方式主要局限于聊天机器人。大量"AI 令人失望"的声音本质上来自错误的接口。随着接口改进,更多人将看到 AI 的真正能力。Claude Dispatch 等新产品形态正在改变这一局面。
AI 初创公司种子轮估值持续攀升,单轮融资额已达 1000 万美元、投后估值 4000-4500 万美元。投资者尤其追捧拥有 ex-OpenAI 背景团队的项目。Y Combinator Demo Day 展示了价格上涨的趋势,VC 也因此被迫在更早期的 pre-seed 阶段入局。
来源:TechCrunch
加利福尼亚州要求与其合作的 AI 公司必须满足新的隐私和安全标准。此举是美国州级政府首次系统性地为政府 AI 采购设定安全基线,可能成为其他州的参考模板。
来源:The Verge
⚡ 快讯
据 Bloomberg 报道,Nothing 正在开发内置摄像头、麦克风和扬声器的 AI 智能眼镜,AI 处理将卸载至手机和云端。预计 2027 年上半年发布。
来源:The Verge
微软在 Copilot 个人版使用条款中明确声明产品"仅供娱乐用途"(for entertainment purposes only),引发社区广泛讨论。该条款在 HN 获得 568 分,开发者质疑这是否意味着微软在法律上规避 AI 输出的可靠性责任。
来源:Microsoft · HN 讨论
安全研究机构披露,Claude 独立完成了一个完整的 FreeBSD 远程内核远程代码执行(RCE)漏洞利用,可获取 root shell(CVE-2026-4747)。该发现在 HN 获得 262 分讨论,引发对 AI 在安全攻防领域能力边界的关注。
来源:GitHub · HN 讨论
部分中国用户报告在 iPhone 上看到 Apple Intelligence 功能,Bloomberg 记者 Mark Gurman 证实这是"误操作"上线,Apple 已将其下架。中国政府要求 Apple 必须与本地公司(如阿里巴巴)合作才能在国内提供 AI 功能。
来源:The Verge
Elgato 在 Stream Deck 7.4 更新中加入 MCP(Model Context Protocol)支持,硬件外设正式接入 AI Agent 生态。
来源:The Verge
📜 论文推荐
针对开源 Agent 运行时在工具集成、本地文件访问、Shell 命令执行等方面的安全漏洞,提出三层防护框架:Skill 层(指令级策略注入)、Plugin 层(运行时配置加固和行为监控)、Watcher 层(系统级中间件实时验证 Agent 状态)。Watcher 范式被认为有潜力成为下一代自主 Agent 安全的基础构件。⭐ 162 upvotes,285 GitHub Stars。
系统评估发现,推理模型在不同上下文条件下(长无关上下文、多轮对话、子任务嵌套)会将推理链压缩最多 50%,伴随自我验证和不确定性管理行为的减少。虽然简单问题不受影响,但复杂任务的性能可能因此下降。对 Agent 和长上下文推理场景有重要警示意义。⭐ 17 upvotes。
首个系统梳理 LLM On-Policy 蒸馏(OPD)的综述。传统 off-policy 蒸馏存在暴露偏差问题,OPD 让学生模型在自身生成的轨迹上接收教师反馈。论文提出统一的 f-divergence 框架,从反馈信号、教师访问方式和损失粒度三个维度组织 OPD 方法全景,识别了蒸馏缩放定律和 Agent 级蒸馏等开放问题。
HuggingFace Daily Papers 收录的自动驾驶方向研究,探索视觉-语言模型在端到端自动驾驶场景中的应用,涉及多视角 3D 感知和决策规划的联合优化。