🤖 AI 日报

2026年03月26日 · 星期四

💥 重磅新闻

OpenAI CFO 宣布,a16z、DE Shaw Ventures、MGX、TPG 和 T Rowe Price 新承诺 100 亿美元投资,使 OpenAI 创纪录的融资轮总额突破 1200 亿美元。OpenAI 已调整支出计划,目标在 2030 年前累计投入约 6000 亿美元算力。公司正将资源集中在最赚钱的业务线上,为年内 IPO 做准备。
来源:CNBC
美国北加州联邦法官 Rita F. Lin 在庭审中表示,美国政府禁止使用 Anthropic AI 模型的做法「看起来像是惩罚」。该禁令已导致 Anthropic 损失数亿美元的合同和客户协议。法官对特朗普政府的行为表达了严重质疑,但尚未作出裁决。这场诉讼将为 AI 公司与政府关系树立重要先例。
来源:WSJ · The Verge
Meta 最新一轮裁员影响了多个部门,包括 Reality Labs(元宇宙/AR/VR 硬件)、招聘、社交媒体和销售团队。在大力投入 AI 的同时,Meta 持续收缩非核心业务线。同时,Meta 宣布将用 AI 内容审核系统逐步替代第三方外包审核人员——这些此前因 PTSD 风险问题备受关注的岗位。
来源:The Verge
Sam Altman 宣布退出核聚变初创公司 Helion Energy 的董事会,同时 Axios 报道 OpenAI 正与 Helion 进行「高级谈判」。核聚变一直被视为清洁能源的圣杯,但距离商业化仍需重大科学突破。Altman 退出董事会是为避免利益冲突——但他的公司正试图购买他曾参与管理的公司的电力,这种安排本身值得关注。
来源:Axios · The Verge

🛠️ 技术动态

Anthropic 发布 Auto Mode 研究预览版,使 Claude 能够自主执行操作——不只是回答问题,而是直接帮你完成任务。内置安全防护机制可过滤风险行为和 prompt injection 攻击。这标志着 AI 从「对话助手」向「自主代理」的又一步迈进。
来源:Claude 官方博客 · TLDR AI
OpenAI 放弃了 ChatGPT 内的「一键结账」功能(使用率太低),转而专注于商品发现和引导用户到商家官网完成购买。这是对 AI 电商路径的一次重要调整——AI 更适合做「购物顾问」而非「收银台」,与此前 Walmart 数据(ChatGPT 结账转化率比官网差 3 倍)的结论一致。
来源:OpenAI 官方 · TLDR AI
Intel 推出 Arc Pro B70 桌面 GPU——32GB VRAM、32 个 Xe2 核心,参考设计售价 $949。同时发布了 B65 Pro(20 个 Xe2 核心)。这是 Intel 姗姗来迟的「大核」GPU,主打 AI 推理而非游戏。在 NVIDIA 主导的 AI 加速卡市场,Intel 正试图用专业级产品撕开一个口子。
来源:The Verge
Google Research 发布 TurboQuant 量化方法,在保持性能的同时大幅减少向量内存开销。可显著提升 KV Cache 效率和向量搜索速度。HN 518 分热议。在推理成本仍是制约 AI 规模化部署的核心瓶颈时,这类研究具有重要的工程价值。
来源:Google Research · HN 518 分
Anyscale 发布 Ray Data LLM——专为大规模 LLM 批量推理设计的库,在优先吞吐量而非单请求延迟的场景中,吞吐量达到 vLLM 同步引擎的 2 倍,同时具备生产级容错能力。越来越多的 LLM 工作负载(数据标注、内容生成、评估等)正从实时交互转向批处理模式。
来源:Anyscale 博客 · TLDR AI
Ossature 是一个开源项目,开发者编写描述「软件该做什么」的规格文件,Ossature 验证规格、让 LLM 审计歧义和缺漏、生成可编辑计划,然后按任务逐一生成代码——每个任务只获得必需的上下文。验证内置在构建循环中,失败时修复代理自动尝试修复。这是「规格先行」的 AI 辅助开发新范式。
来源:Ossature 官方 · TLDR AI

💡 深度分析

Anthropic 的 Prithvi Rajasekaran 分享了一套多代理架构方案——受 GAN 启发,用「规划器 + 生成器 + 评估器」三代理协作来构建复杂前端和全栈应用。通过任务分解和结构化交接实现高质量输出。核心挑战仍在 context 管理和评估器调优上。这是目前看到的最实用的 AI 应用工程指南之一。
来源:Anthropic Engineering · TLDR AI
Anthropic 发布 3 月经济指数报告显示,Claude 的使用模式正在发生结构性变化:高价值专业任务占比下降,更多用户将其用于低薪岗位可处理的个人查询。这或许意味着 AI 的「杀手级应用」不是替代高薪专家,而是普惠化地降低信息获取门槛。
来源:Anthropic Research · TLDR AI
Apple 机器学习研究团队发现,大型语言模型在仅进行 next-token prediction 训练后,就能展现出良好的语义校准能力——即能准确评估自己对开放域问答的置信度。这种能力并非显式训练的结果,而是训练的副产品。研究暗示 LLM 内部可能存在比我们理解的更深层的「自知之明」。
来源:Apple ML Research · TLDR AI
深度分析文章指出:App Store 是集中式分发平台对新计算平台的解决方案,但 Agent 时代需要的是 API 而非应用商店。Apple 通过强制所有应用内交易走自家支付系统获得了垄断收入,但 Agent 时代缺乏这种锁定机制——用户可以轻松切换平台。这意味着支付层将变得竞争激烈且低利润,而非垄断式暴利。
来源:Robonomics · TLDR AI

📜 论文推荐

清华大学提出 6Bit-Diffusion 框架,通过动态分配 NVFP4/INT8 混合精度量化,结合 Temporal Delta Cache(TDC)跳过时间冗余计算,实现视频 DiT 模型 1.92× 端到端加速和 3.32× 内存压缩,且不损失生成质量。核心发现:Transformer block 的输入输出残差与其量化敏感度存在强线性相关——据此设计的轻量预测器可在运行时动态调整精度。
来源:arXiv 2603.18742 · 清华大学
清华大学提出 TRACE 提示方法,通过让 MLLM 先生成文本形式的 3D 环境表征(包括元上下文、相机轨迹、物体实体),再基于此进行空间推理。灵感来自认知科学的空间认知理论。在 VSI-Bench 和 OST-Bench 上,TRACE 在不同参数规模和训练模式的 MLLM 上均取得一致性提升。
来源:arXiv 2603.23404 · 清华大学
提出 EVA 框架——通过「规划先于感知」的迭代式「总结-规划-行动-反思」推理循环,Agent 自主决定看什么、什么时候看、怎么看,实现查询驱动的高效视频理解。不再被动处理整个视频或均匀采样帧,而是像人一样有目的地「看」。
理想汽车提出 StreamingClaw,集成实时流式推理、主动交互、多模态长期记忆和感知-决策-行动闭环。兼容 OpenClaw 开源框架。目标是让 Agent 在物理世界中持续感知、实时决策并直接控制,而非传统的离线视频理解。
来源:arXiv 2603.22120 · 理想汽车 Foundation Model
研究表明 RLVR 中的方向性更新能更好地识别推理过程中的关键 token,进而支持测试时外推(test-time extrapolation)和训练时重加权,显著提升推理准确率。为如何更精细地训练推理模型提供了新思路。
来源:Qwen Research · TLDR AI

⚡ 快讯

🍎 Apple 使用 Google Gemini 蒸馏训练小模型,作为 1 月合作协议的一部分,Apple 在数据中心中可完全访问 Gemini
🛡️ Databricks 进军安全市场,推出 AI Agent 驱动的 SIEM 平台 Lakewatch,并收购 Antimatter 和 SiftD.ai
🎤 ServiceNow EVA 框架:评估语音 Agent 的完整多轮对话质量,采用 bot-to-bot 架构模拟真实场景
🔒 EU 仍坚持推进私人消息和照片扫描计划,HN 1199 分引发大规模反对,隐私争议持续升温
🧪 ARC-AGI-3 基准发布,HN 408 分,新一代 AGI 评测标准出炉
⚛️ 反物质首次实现运输,Nature 报道这一物理学里程碑,HN 391 分
🏛️ Meta 和 YouTube 在社交媒体成瘾案中被判疏忽,具有里程碑意义的判决,HN 453 分
📝 WordPress.com 支持 AI Agent 通过 MCP 撰写和发布博文,AI 生成内容默认为草稿,用户可先审核