💥 重磅新闻
Alphabet 宣布将其自研 TPU 卖给"精选客户",允许他们把芯片装进自家数据中心。这是 Google 第一次让 TPU 走出自家云,已经和 Anthropic、Meta 达成供货协议。Nvidia 垄断加速卡市场的局面正被从第二端拉开——这不是新闻,这是结构变化。
来源:Yahoo Finance · TLDR AI
TechCrunch 援引消息人士称,Anthropic 正在谈一轮 500 亿美元的新融资,估值约 9000 亿美元,最快两周内完成。这个估值已经逼近 OpenAI,也从侧面解释了为什么 Google 要把 TPU 卖给它——最大客户必须绑住。
来源:TechCrunch
Musk vs OpenAI 庭审第二天,Musk 在作证时承认 xAI 在早期训练 Grok 时使用了 OpenAI 模型做蒸馏/对齐参考。这一证词在同业竞争和知识产权角度都极其微妙——Musk 自己一边起诉 OpenAI 一边从它那儿"取料"。OpenAI 律师抓住这点反复追问。
来源:TechCrunch · The Verge · WSJ
Tom's Hardware 报道,Stargate 原计划自建 20 个数据中心,但合作方在谁掌握最终控制权上谈不拢,OpenAI 已转向直接租用算力。Stargate 目前更像一个"伞形品牌"。分析师估计 OpenAI 如果增速跟不上,2027 年中可能烧完现金——这给前几天的 WSJ KPI 未达标报道加了一层压力。
来源:Tom's Hardware
🛠️ 技术动态
Mistral 发布 128B dense 模型 Medium 3.5,驱动 Vibe 远程 Agent 处理长异步编码任务。Le Chat 新增 Work 模式,用这个模型执行跨工具多步任务。SWE-Bench Verified 分数较高,4 张 GPU 可跑。Mistral 正在走"模型+Agent 产品"双路线,不只是在卖 API。
来源:Mistral 官方
IBM 发布 Granite 4.1 系列开源模型(3B/8B/30B),训练 15 万亿 token,五阶段预训练。8B 模型通过多阶段 RL 优化数据质量,性能对齐上代 32B MoE。这是企业级 LLM 的实用路线——不追参数规模,追性价比和稳定性。
来源:HuggingFace Blog
Stripe 发布 Link 数字钱包,支持 AI Agent 自动发起支付。Agent 可以"自己买东西"了——这对"完全自主 Agent"是基础设施级更新,Stripe 抢了先发。支付流被打通,意味着 AI Agent 商业化闭环真正跑通。
来源:TechCrunch
Google 宣布 Gemini AI 助手将在数百万辆汽车上落地。车载 AI 从"语音助手"升级为"多模态助手",导航、娱乐、信息查询一体化。这一步 Google 走得比 Apple CarPlay 还早,可能抢占智能座舱心智。
来源:TechCrunch
OpenAI 宣布为高风险账户引入硬件密钥(YubiKey)、生物识别等高级安全特性。这是针对记者、活动人士等容易被黑客锁定的用户。安全是 ChatGPT 企业化必须补的课,OpenAI 正在走完它。
来源:TechCrunch
X(原 Twitter)宣布基于 AI 重构广告平台,支持自动生成广告创意、智能投放优化。这是社交平台"AI 广告化"的标准动作——Meta 已经跑通,X 也在跟进。广告是 X 最难搞的钱包,AI 能否帮它扳回一局?
来源:TechCrunch
Meta 宣布其 Business AI 每周处理 1000 万次对话,覆盖电商、客服等场景。这是 Meta 把 AI 落地到中小商家的重要进展,也是它在 WhatsApp/Messenger 商业化上押的注。
来源:TechCrunch
Google Cloud 单季营收突破 200 亿美元,但高管承认增长被算力产能拖累。AI 需求太旺,GPU 供应跟不上。侧面印证:云厂商都在疯狂买卡,Nvidia、AMD、Google TPU 一起吃红利。
来源:TechCrunch
Microsoft 宣布付费 Copilot 用户超 2000 万,并强调活跃度和留存率数据亮眼。这是 AI 助手从尝鲜走向刚需的标志——企业愿意为效率付费。
来源:TechCrunch
📜 论文推荐
Microsoft 提出 World-R1 框架,用强化学习接收 3D 和 VLM 反馈,在不改动基座架构的前提下提升视频生成的 3D 一致性。这是一个轻量级的训练后优化方案,适合现有视频模型快速升级。
来源:Microsoft Research · arXiv
Apple 发布 LaDiR(Latent Diffusion Reasoner),把连续潜在空间的表达力与扩散模型的迭代修正结合,用于增强现有 LLM 的文本推理。可以并行生成多样化推理路径,提升准确性、多样性和可解释性。这是用扩散做推理的新范式。
来源:Apple ML Research
DataPRM 是一个环境感知的过程奖励模型,专门用来检测数据分析 Agent 的"静默错误",提供更好的监督。在多个基准上提升了下游性能和泛化能力——这是让数据分析 Agent 走出 Demo 的关键一步。
来源:arXiv
PyTorch 团队推出 AutoSP,把标准 Transformer 训练代码自动转换成序列并行代码,集成 DeepSpeed。多 GPU 上训练超长序列不需要复杂的代码改动,运行开销小。这是工程友好的长上下文训练工具。
来源:PyTorch Blog