🤖 AI 日报

2026年05月01日 · 星期五

💥 重磅新闻

Alphabet 宣布将其自研 TPU 卖给"精选客户"，允许他们把芯片装进自家数据中心。这是 Google 第一次让 TPU 走出自家云，已经和 Anthropic、Meta 达成供货协议。Nvidia 垄断加速卡市场的局面正被从第二端拉开——这不是新闻，这是结构变化。

来源：Yahoo Finance · TLDR AI

融资Anthropic 新一轮 500 亿美元融资或两周内落定，估值冲 9000 亿

TechCrunch 援引消息人士称，Anthropic 正在谈一轮 500 亿美元的新融资，估值约 9000 亿美元，最快两周内完成。这个估值已经逼近 OpenAI，也从侧面解释了为什么 Google 要把 TPU 卖给它——最大客户必须绑住。

来源：TechCrunch

庭审Musk 当庭承认：xAI 用 OpenAI 模型训练 Grok

Musk vs OpenAI 庭审第二天，Musk 在作证时承认 xAI 在早期训练 Grok 时使用了 OpenAI 模型做蒸馏/对齐参考。这一证词在同业竞争和知识产权角度都极其微妙——Musk 自己一边起诉 OpenAI 一边从它那儿"取料"。OpenAI 律师抓住这点反复追问。

来源：TechCrunch · The Verge · WSJ

战略OpenAI 实际上放弃了自建 Stargate 数据中心，改为租算力

Tom's Hardware 报道，Stargate 原计划自建 20 个数据中心，但合作方在谁掌握最终控制权上谈不拢，OpenAI 已转向直接租用算力。Stargate 目前更像一个"伞形品牌"。分析师估计 OpenAI 如果增速跟不上，2027 年中可能烧完现金——这给前几天的 WSJ KPI 未达标报道加了一层压力。

来源：Tom's Hardware

🛠️ 技术动态

产品Mistral Medium 3.5 推出 Vibe 远程 Agent：长异步编码任务上云

Mistral 发布 128B dense 模型 Medium 3.5，驱动 Vibe 远程 Agent 处理长异步编码任务。Le Chat 新增 Work 模式，用这个模型执行跨工具多步任务。SWE-Bench Verified 分数较高，4 张 GPU 可跑。Mistral 正在走"模型+Agent 产品"双路线，不只是在卖 API。

来源：Mistral 官方

开源IBM Granite 4.1 LLM 开源：8B 顶上代 32B

IBM 发布 Granite 4.1 系列开源模型（3B/8B/30B），训练 15 万亿 token，五阶段预训练。8B 模型通过多阶段 RL 优化数据质量，性能对齐上代 32B MoE。这是企业级 LLM 的实用路线——不追参数规模，追性价比和稳定性。

来源：HuggingFace Blog

支付Stripe Link 对 AI Agent 开放：数字钱包自动消费

Stripe 发布 Link 数字钱包，支持 AI Agent 自动发起支付。Agent 可以"自己买东西"了——这对"完全自主 Agent"是基础设施级更新，Stripe 抢了先发。支付流被打通，意味着 AI Agent 商业化闭环真正跑通。

来源：TechCrunch

产品Gemini 上车：Google AI 助手将部署数百万辆汽车

Google 宣布 Gemini AI 助手将在数百万辆汽车上落地。车载 AI 从"语音助手"升级为"多模态助手"，导航、娱乐、信息查询一体化。这一步 Google 走得比 Apple CarPlay 还早，可能抢占智能座舱心智。

来源：TechCrunch

安全OpenAI + Yubico：ChatGPT 新增硬件密钥等高级安全功能

OpenAI 宣布为高风险账户引入硬件密钥（YubiKey）、生物识别等高级安全特性。这是针对记者、活动人士等容易被黑客锁定的用户。安全是 ChatGPT 企业化必须补的课，OpenAI 正在走完它。

来源：TechCrunch

平台X 重建 AI 广告平台：自动创意生成+智能投放

X（原 Twitter）宣布基于 AI 重构广告平台，支持自动生成广告创意、智能投放优化。这是社交平台"AI 广告化"的标准动作——Meta 已经跑通，X 也在跟进。广告是 X 最难搞的钱包，AI 能否帮它扳回一局？

来源：TechCrunch

商业Meta 商业 AI 每周处理 1000 万次对话

Meta 宣布其 Business AI 每周处理 1000 万次对话，覆盖电商、客服等场景。这是 Meta 把 AI 落地到中小商家的重要进展，也是它在 WhatsApp/Messenger 商业化上押的注。

来源：TechCrunch

财报Google Cloud 季度营收破 200 亿，但受算力产能制约

Google Cloud 单季营收突破 200 亿美元，但高管承认增长被算力产能拖累。AI 需求太旺，GPU 供应跟不上。侧面印证：云厂商都在疯狂买卡，Nvidia、AMD、Google TPU 一起吃红利。

来源：TechCrunch

产品Microsoft：2000 万付费 Copilot 用户，且留存率不错

Microsoft 宣布付费 Copilot 用户超 2000 万，并强调活跃度和留存率数据亮眼。这是 AI 助手从尝鲜走向刚需的标志——企业愿意为效率付费。

来源：TechCrunch

💡 深度分析

瓶颈HuggingFace：AI 评估成本正在成为新的算力瓶颈

AI 评估成本已经飞涨，单次跑评测可能花几万美元，在某些场景下比训练成本还高。模型和任务的成本分布极不均匀，标准化文档和数据复用成为破局关键。如果评估成本不降下来，外部验证和公平竞争会被锁死。

来源：HuggingFace Blog

趋势推理市场"达尔文式专业化"：细分赛道出现多个赢家

推理市场正在碎片化——延迟敏感型、多模态、边缘部署，每种模型都有不同服务要求，基础设施也随之分化。这意味着不会再有一个赢家通吃的推理平台，而是一群垂直玩家的天下。

来源：Tom Tunguz Blog

📜 论文推荐

3DWorld-R1：用 RL 提升 3D 一致性视频生成

Microsoft 提出 World-R1 框架，用强化学习接收 3D 和 VLM 反馈，在不改动基座架构的前提下提升视频生成的 3D 一致性。这是一个轻量级的训练后优化方案，适合现有视频模型快速升级。

来源：Microsoft Research · arXiv

推理Apple LaDiR：潜在扩散增强文本推理

Apple 发布 LaDiR（Latent Diffusion Reasoner），把连续潜在空间的表达力与扩散模型的迭代修正结合，用于增强现有 LLM 的文本推理。可以并行生成多样化推理路径，提升准确性、多样性和可解释性。这是用扩散做推理的新范式。

来源：Apple ML Research

评测DataPRM：环境感知过程奖励模型，改进数据分析 Agent

DataPRM 是一个环境感知的过程奖励模型，专门用来检测数据分析 Agent 的"静默错误"，提供更好的监督。在多个基准上提升了下游性能和泛化能力——这是让数据分析 Agent 走出 Demo 的关键一步。

来源：arXiv

训练AutoSP：自动序列并行，长上下文 LLM 训练更省心

PyTorch 团队推出 AutoSP，把标准 Transformer 训练代码自动转换成序列并行代码，集成 DeepSpeed。多 GPU 上训练超长序列不需要复杂的代码改动，运行开销小。这是工程友好的长上下文训练工具。

来源：PyTorch Blog

⚡ 快讯

产品ChatGPT Images 2.0 在印度爆火，其他地区尚未大规模普及

OpenAI 图像生成工具 Images 2.0 在印度用户量激增，成为主要市场，欧美用户反响平平。市场分化是预料之中的事——文化偏好+定价策略不同。

来源：TechCrunch

融资Legal AI 初创 Legora 估值 56 亿，与 Harvey 战事升温

Legal AI 赛道再添巨子，Legora 完成新一轮融资，估值达 56 亿美元，与行业龙头 Harvey 正面对抗。法务 AI 正在变成硬赛道。

来源：TechCrunch

战略SoftBank 组建机器人+数据中心公司，目标 1000 亿美元 IPO

SoftBank 宣布创建新公司，专攻机器人和数据中心建设，已经瞄准 1000 亿美元 IPO。这是孙正义对"机器人+AI 基建"的再一次大押注。

来源：TechCrunch

路线Salesforce 众包 AI 路线图：让客户参与产品决策

Salesforce 宣布开始与客户共同制定 AI 产品路线图，通过众收集需求。这是企业 SaaS 在 AI 时代的新玩法——从"我给你什么"变成"你想要什么"。

来源：TechCrunch

安全AI 逆向工程挖出 GitHub 高危漏洞

研究人员用 AI 工具逆向分析 GitHub，发现并披露高危漏洞 CVE-2026-3854，影响 GitHub Enterprise Server 等产品，可通过被篡改的 git push 选项实现远程代码执行。AI 在安全领域的应用正从"防守"扩展到"进攻"。

来源：Dark Reading