🤖 AI 日报

2026年03月26日 · 星期四

💥 重磅新闻

融资OpenAI 融资总额突破 1200 亿美元：a16z、DE Shaw 等追加 100 亿

OpenAI CFO 宣布，a16z、DE Shaw Ventures、MGX、TPG 和 T Rowe Price 新承诺 100 亿美元投资，使 OpenAI 创纪录的融资轮总额突破 1200 亿美元。OpenAI 已调整支出计划，目标在 2030 年前累计投入约 6000 亿美元算力。公司正将资源集中在最赚钱的业务线上，为年内 IPO 做准备。

来源：CNBC

法律法官称美国政府封禁 Anthropic「看起来像是惩罚」

美国北加州联邦法官 Rita F. Lin 在庭审中表示，美国政府禁止使用 Anthropic AI 模型的做法「看起来像是惩罚」。该禁令已导致 Anthropic 损失数亿美元的合同和客户协议。法官对特朗普政府的行为表达了严重质疑，但尚未作出裁决。这场诉讼将为 AI 公司与政府关系树立重要先例。

来源：WSJ · The Verge

裁员Meta 新一轮裁员波及 Reality Labs、招聘、社交和销售团队

Meta 最新一轮裁员影响了多个部门，包括 Reality Labs（元宇宙/AR/VR 硬件）、招聘、社交媒体和销售团队。在大力投入 AI 的同时，Meta 持续收缩非核心业务线。同时，Meta 宣布将用 AI 内容审核系统逐步替代第三方外包审核人员——这些此前因 PTSD 风险问题备受关注的岗位。

来源：The Verge

能源OpenAI 与 Helion 洽谈核聚变供电：Altman 已退出 Helion 董事会

Sam Altman 宣布退出核聚变初创公司 Helion Energy 的董事会，同时 Axios 报道 OpenAI 正与 Helion 进行「高级谈判」。核聚变一直被视为清洁能源的圣杯，但距离商业化仍需重大科学突破。Altman 退出董事会是为避免利益冲突——但他的公司正试图购买他曾参与管理的公司的电力，这种安排本身值得关注。

来源：Axios · The Verge

🛠️ 技术动态

AgentClaude 推出 Auto Mode：自主执行操作，内置安全防护

Anthropic 发布 Auto Mode 研究预览版，使 Claude 能够自主执行操作——不只是回答问题，而是直接帮你完成任务。内置安全防护机制可过滤风险行为和 prompt injection 攻击。这标志着 AI 从「对话助手」向「自主代理」的又一步迈进。

来源：Claude 官方博客 · TLDR AI

产品ChatGPT 放弃应用内结账，转向商品发现

OpenAI 放弃了 ChatGPT 内的「一键结账」功能（使用率太低），转而专注于商品发现和引导用户到商家官网完成购买。这是对 AI 电商路径的一次重要调整——AI 更适合做「购物顾问」而非「收银台」，与此前 Walmart 数据（ChatGPT 结账转化率比官网差 3 倍）的结论一致。

来源：OpenAI 官方 · TLDR AI

芯片Intel 发布 Arc Pro B70「Big Battlemage」AI GPU：32GB VRAM，起售 $949

Intel 推出 Arc Pro B70 桌面 GPU——32GB VRAM、32 个 Xe2 核心，参考设计售价 $949。同时发布了 B65 Pro（20 个 Xe2 核心）。这是 Intel 姗姗来迟的「大核」GPU，主打 AI 推理而非游戏。在 NVIDIA 主导的 AI 加速卡市场，Intel 正试图用专业级产品撕开一个口子。

来源：The Verge

压缩Google TurboQuant：极端向量压缩，重新定义 AI 效率

Google Research 发布 TurboQuant 量化方法，在保持性能的同时大幅减少向量内存开销。可显著提升 KV Cache 效率和向量搜索速度。HN 518 分热议。在推理成本仍是制约 AI 规模化部署的核心瓶颈时，这类研究具有重要的工程价值。

来源：Google Research · HN 518 分

推理Ray Data LLM：批量推理吞吐量达 vLLM 同步引擎的 2 倍

Anyscale 发布 Ray Data LLM——专为大规模 LLM 批量推理设计的库，在优先吞吐量而非单请求延迟的场景中，吞吐量达到 vLLM 同步引擎的 2 倍，同时具备生产级容错能力。越来越多的 LLM 工作负载（数据标注、内容生成、评估等）正从实时交互转向批处理模式。

来源：Anyscale 博客 · TLDR AI

开源Ossature：规格驱动的代码生成框架

Ossature 是一个开源项目，开发者编写描述「软件该做什么」的规格文件，Ossature 验证规格、让 LLM 审计歧义和缺漏、生成可编辑计划，然后按任务逐一生成代码——每个任务只获得必需的上下文。验证内置在构建循环中，失败时修复代理自动尝试修复。这是「规格先行」的 AI 辅助开发新范式。

来源：Ossature 官方 · TLDR AI

💡 深度分析

架构Anthropic 工程师的 Harness 设计：长时间运行 AI 应用的核心架构

Anthropic 的 Prithvi Rajasekaran 分享了一套多代理架构方案——受 GAN 启发，用「规划器 + 生成器 + 评估器」三代理协作来构建复杂前端和全栈应用。通过任务分解和结构化交接实现高质量输出。核心挑战仍在 context 管理和评估器调优上。这是目前看到的最实用的 AI 应用工程指南之一。

来源：Anthropic Engineering · TLDR AI

数据Anthropic 经济指数：Claude 用途从高价值任务向低薪个人查询转移

Anthropic 发布 3 月经济指数报告显示，Claude 的使用模式正在发生结构性变化：高价值专业任务占比下降，更多用户将其用于低薪岗位可处理的个人查询。这或许意味着 AI 的「杀手级应用」不是替代高薪专家，而是普惠化地降低信息获取门槛。

来源：Anthropic Research · TLDR AI

校准Apple Research：LLM 的语义校准能力竟是自然涌现的

Apple 机器学习研究团队发现，大型语言模型在仅进行 next-token prediction 训练后，就能展现出良好的语义校准能力——即能准确评估自己对开放域问答的置信度。这种能力并非显式训练的结果，而是训练的副产品。研究暗示 LLM 内部可能存在比我们理解的更深层的「自知之明」。

来源：Apple ML Research · TLDR AI

Agent时代Agent 时代不需要 App Store：为什么 Apple 模式无法复制

深度分析文章指出：App Store 是集中式分发平台对新计算平台的解决方案，但 Agent 时代需要的是 API 而非应用商店。Apple 通过强制所有应用内交易走自家支付系统获得了垄断收入，但 Agent 时代缺乏这种锁定机制——用户可以轻松切换平台。这意味着支付层将变得竞争激烈且低利润，而非垄断式暴利。

来源：Robonomics · TLDR AI

📜 论文推荐

量化6Bit-Diffusion：视频扩散模型的混合精度量化

清华大学提出 6Bit-Diffusion 框架，通过动态分配 NVFP4/INT8 混合精度量化，结合 Temporal Delta Cache（TDC）跳过时间冗余计算，实现视频 DiT 模型 1.92× 端到端加速和 3.32× 内存压缩，且不损失生成质量。核心发现：Transformer block 的输入输出残差与其量化敏感度存在强线性相关——据此设计的轻量预测器可在运行时动态调整精度。

来源：arXiv 2603.18742 · 清华大学

空间推理TRACE：让多模态 LLM 学会 3D 空间推理

清华大学提出 TRACE 提示方法，通过让 MLLM 先生成文本形式的 3D 环境表征（包括元上下文、相机轨迹、物体实体），再基于此进行空间推理。灵感来自认知科学的空间认知理论。在 VSI-Bench 和 OST-Bench 上，TRACE 在不同参数规模和训练模式的 MLLM 上均取得一致性提升。

来源：arXiv 2603.23404 · 清华大学

视频AgentEVA：高效强化学习视频理解 Agent

提出 EVA 框架——通过「规划先于感知」的迭代式「总结-规划-行动-反思」推理循环，Agent 自主决定看什么、什么时候看、怎么看，实现查询驱动的高效视频理解。不再被动处理整个视频或均匀采样帧，而是像人一样有目的地「看」。

来源：arXiv 2603.22918

具身智能StreamingClaw：实时流式视频理解与具身智能统一框架

理想汽车提出 StreamingClaw，集成实时流式推理、主动交互、多模态长期记忆和感知-决策-行动闭环。兼容 OpenClaw 开源框架。目标是让 Agent 在物理世界中持续感知、实时决策并直接控制，而非传统的离线视频理解。

来源：arXiv 2603.22120 · 理想汽车 Foundation Model

RLVRRLVR 方向性更新：更精准识别推理关键 token

研究表明 RLVR 中的方向性更新能更好地识别推理过程中的关键 token，进而支持测试时外推（test-time extrapolation）和训练时重加权，显著提升推理准确率。为如何更精细地训练推理模型提供了新思路。

来源：Qwen Research · TLDR AI

⚡ 快讯

🍎 Apple 使用 Google Gemini 蒸馏训练小模型，作为 1 月合作协议的一部分，Apple 在数据中心中可完全访问 Gemini

🛡️ Databricks 进军安全市场，推出 AI Agent 驱动的 SIEM 平台 Lakewatch，并收购 Antimatter 和 SiftD.ai

🎤 ServiceNow EVA 框架：评估语音 Agent 的完整多轮对话质量，采用 bot-to-bot 架构模拟真实场景

🔒 EU 仍坚持推进私人消息和照片扫描计划，HN 1199 分引发大规模反对，隐私争议持续升温

🧪 ARC-AGI-3 基准发布，HN 408 分，新一代 AGI 评测标准出炉

⚛️ 反物质首次实现运输，Nature 报道这一物理学里程碑，HN 391 分

🏛️ Meta 和 YouTube 在社交媒体成瘾案中被判疏忽，具有里程碑意义的判决，HN 453 分

📝 WordPress.com 支持 AI Agent 通过 MCP 撰写和发布博文，AI 生成内容默认为草稿，用户可先审核