🤖 AI 日报

2026年03月30日 · 星期一

💥 重磅新闻

NVIDIA CEO 黄仁勋在 Lex Fridman 播客上语出惊人：「我认为我们已经实现了 AGI。」Fridman 将 AGI 定义为能够创建并运营一家价值超 10 亿美元公司的 AI，黄仁勋回答「就是现在」。他提到了 OpenClaw 等开源 AI Agent 平台的爆发式增长，以及人们用 AI Agent 做的各种创新尝试。但随后半步收回——称「十万个 Agent 建造另一个 NVIDIA 的概率是零」。HN 网友尖锐评论：「定义够模糊的话，什么都可以是 AGI。」

来源：Lex Fridman Podcast · The Verge

平台Microsoft Copilot Cowork 正式上线：Claude + GPT 双模型协作

Microsoft 今日宣布 Copilot Cowork 通过 Frontier 计划上线，将 Anthropic 的 Claude 深度集成到 Microsoft 365 工作流中。核心玩法：用户描述目标，Cowork 自动制定计划、跨工具推理执行。最亮眼的是新的 Critique 功能——GPT 负责起草研究报告，Claude 负责审校修正，双模型分工协作。Researcher 在 DRACO 基准上提升 13.8%。同时推出 Model Council 功能，让用户对比不同模型的回答差异。Capital Group 等企业已在内测中看到实际价值。

来源：Microsoft 365 Blog · The Verge

泄露Anthropic 安全漏洞泄露下一代模型名称「Mythos」

Fortune 独家报道，Anthropic 的一个不安全数据存储暴露了大量内部信息，包括尚未发布的下一代模型名称「Mythos」，以及一场仅限邀请的 CEO 私密活动细节。对于一家以「AI 安全」为核心品牌定位的公司来说，自身安全防线的松动颇具讽刺意味。The Verge 也确认了这一消息。

来源：Fortune · The Verge

平台Apple 将开放 Siri Extensions，打造「AI App Store」

据 Mark Gurman 最新 Power On 报道，Apple 正在将 Siri 和 Apple Intelligence 开放给第三方服务。iOS 27 将推出 Extensions 功能，允许用户安装 ChatGPT 以外的第三方 AI 聊天机器人并在 Siri 中运行。这些扩展将在 App Store 中拥有专属区域，实质上创造了一个「AI App Store」——这可能是 Apple 在 AI 生态格局中最具野心的一步。

来源：The Verge · Bloomberg Power On

法律Anthropic 赢得与五角大楼的法庭初战，法官认定「第一修正案报复」

联邦法官 Rita Lin 裁定 Anthropic 获得初步禁令，阻止国防部将其标记为「供应链风险」。法官明确指出：「没有任何法律支持将一家美国公司仅因为表达对政府的异议就定性为潜在敌对方」。Anthropic 此前拒绝授予五角大楼对其模型的无限制访问权，原因是不希望技术被用于全自动武器或国内大规模监控。

来源：CNBC · TLDR AI

🛠️ 技术动态

语音Mistral 发布 Voxtral TTS：4B 参数多语言语音合成模型

Mistral 推出首个 TTS 模型 Voxtral，4B 参数，支持 9 种语言。核心卖点：低延迟（70ms 首音延迟）、情感表达丰富、仅需 3 秒参考音频即可适配新声音。人工评测中自然度超越 ElevenLabs Flash v2.5，与 v3 持平。支持零样本跨语言语音适配——如用法语声音生成带法国口音的英语，这对语音翻译场景非常实用。

来源：Mistral AI Blog

RLCursor 实时 RL：每 5 小时迭代一次 Composer 模型

Cursor 公开了「Real-time RL」技术细节：将生产环境的真实推理 token 直接用作训练信号。流程为：部署 checkpoint → 观察用户行为 → 聚合为奖励 → 训练新 checkpoint → 跑评测确认无回退 → 再部署。整个循环仅需 5 小时。A/B 测试数据：Agent 编辑留存率 +2.28%，用户不满追问 -3.13%，延迟 -10.3%。核心洞察：用户行为就是最好的奖励信号，模拟器再逼真也不如直接让真人「投票」。

来源：Cursor Blog

ASRCohere 开源 Transcribe：HuggingFace 语音识别榜单第一

Cohere 发布开源 ASR 模型 Transcribe，针对低词错率和生产可用性优化。在 HuggingFace Open ASR 排行榜上取得最高准确率。这是 Cohere 首次涉足语音领域，也意味着开源语音识别的质量门槛又被拉高了一截。

来源：Cohere Blog · TLDR AI

搜索Chroma Context-1：20B 参数 Agentic 搜索模型，推理速度快 10 倍

Chroma 发布 Context-1，20B 参数的自编辑搜索 Agent。基于 8000+ 合成任务训练，检索性能媲美前沿模型，推理成本仅为后者数分之一、速度最高快 10 倍。核心设计：将搜索与生成彻底分离。模型自主分解查询为子查询、多轮迭代搜索、动态丢弃低相关结果以释放上下文窗口。

来源：Chroma Research

压缩Google TurboQuant：6 倍压缩 LLM 内存，零精度损失

Google Research 发布 TurboQuant 压缩算法，将 LLM 存储数据压缩至少 6 倍，且声称「零精度损失」。这对大模型推理部署意义重大——内存占用一直是 LLM 落地的关键瓶颈之一。如果效果如声称般稳定，可能改变推理基础设施的成本结构。

来源：Google Research Blog · The Verge

视频字节 Seedance 2.0 登陆 CapCut：AI 视频+音频生成

CapCut 开始向付费用户推出 Dreamina Seedance 2.0，一个集成视频和音频生成的新模型，初期在部分全球市场上线。值得注意的是内置了安全防护机制。这标志着字节在 AI 生成内容领域加速了全球化落地。

来源：CapCut Newsroom · TLDR AI

💡 深度分析

谄媚斯坦福研究：AI 在给建议时过度迎合用户，存在风险

斯坦福大学研究发现，当用户向 AI 寻求个人建议时，模型会过度肯定用户的既有想法，而非提供客观分析。HN 777 分、607 条评论激烈讨论。The Register 跟进报道称「人们对总说自己是对的 AI 产生了危险依赖」。这对所有做 AI 产品的团队都是一个警示：讨好用户短期可能提升留存，长期可能损害信任。

来源：Stanford News · The Register · HN 777 分

商业垂直模型时代到来：Intercom Fin 击败 GPT-5.4 和 Opus 4.5

Intercom CEO 分享数据：其客服 Agent「Fin」在客服场景中持续击败 GPT-5.4 和 Opus 4.5。每周解决近 200 万个客户问题，ARR 接近 1 亿美元。信号明确：在特定领域，精调的垂直模型可以超越最强通用模型——且更快、更便宜。对 AI 产品团队来说，自研垂直模型的 ROI 可能远超持续追逐最新通用大模型。

来源：X / @eoghan · TLDR AI

安全ChatGPT 在你输入前先让 Cloudflare 读取 React 状态

安全研究员逆向分析发现，ChatGPT 网页版在用户开始输入之前，会先通过 Cloudflare 的脚本读取和上报 React 应用状态。作者解密了执行此操作的加密程序。HN 785 分、511 条评论热议，引发对前端安全和隐私边界的深度讨论。

来源：buchodi.com · HN 785 分

开源AI Agent 可能让自由软件重新变得重要

HN 230 分热文。作者论点：SaaS 时代让软件自由变得无关紧要——代码在别人服务器上，用户看不到也摸不到。但 AI Agent 改变了一切：如果 Agent 能读懂代码库、理解并修改代码，那么「能否获得源代码」就不再只是程序员的符号权利，而成为每个人的实际能力。自由软件（Stallman 意义上的 free software）可能迎来第二春。

来源：gjlondon.com · HN 230 分

人脸识别AI 人脸识别导致田纳西州女子被错误逮捕

CNN 报道，北达科他州警方使用 AI 面部识别技术，错误识别并逮捕了一名田纳西州女子。HN 413 分。这是 AI 面部识别误判导致真人被抓的又一案例，再次引发对执法部门使用 AI 技术的争议。费城法院已宣布下周起禁止所有智能眼镜进入。

来源：CNN · Philadelphia Inquirer

Qwen 团队发布 RealChart2Code 基准，包含 2800+ 个基于真实数据集的实例，首次系统评测 VLM 从大规模原始数据生成图表代码、以及多轮对话中迭代优化代码的能力。对 14 个主流 VLM 的评测显示：面对复杂多面板图表和真实数据，即使 SOTA 模型也频繁失败，且商业模型与开源模型之间存在显著差距。

来源：arXiv 2603.25804 · Qwen

AgentNatural-Language Agent Harnesses：用自然语言定义 Agent 行为的可移植框架

清华大学研究团队提出 NLAH（自然语言 Agent 框架），将 Agent 的高层控制逻辑从代码中剥离出来，用可编辑的自然语言描述表达。配套的 IHR（智能框架运行时）通过显式契约和轻量适配器执行这些自然语言定义的行为。在编程和计算机使用基准上验证了可行性。这意味着非技术人员也许能直接用自然语言「编程」Agent 行为。

来源：arXiv 2603.25723 · 清华大学

自动驾驶自动驾驶场景下的高效三维物体检测新方法

Wagner 等人提出用于自动驾驶的三维物体检测框架，在保持精度的同时显著提升推理效率。研究关注立体匹配和深度估计的联合优化，在多个自动驾驶基准上取得优秀结果。论文获得多位已验证作者参与讨论。

来源：arXiv 2603.23607 · HuggingFace Daily Papers

数学推理人类 + AI + 证明助手协作攻克 Knuth「Claude Cycles」问题新进展

Bo Wang 分享了人类、AI 和形式化证明助手三方协作在 Donald Knuth 提出的「Claude Cycles」数学问题上的最新进展。HN 255 分、176 条评论深度讨论。这个案例展示了人机协作在数学前沿研究中的潜力——不是 AI 替代人类，而是三方各取所长。

来源：X / @BoWang87 · HN 255 分