💥 重磅新闻
美国国防部宣布与 Nvidia、Microsoft、AWS、OpenAI、Google 达成协议,在机密网络上部署 AI 能力。Anthropic 明显缺席——此前 CEO Dario Amodei 多次公开反对把模型用于大规模监控。一纸合同画出了两种立场:愿意进五角大楼的,和不愿意的。
据 TechCrunch 消息人士,Anthropic 正在推进一轮约 500 亿美元规模的融资,估值可能达到 9000 亿美元,预计两周内落地。投资人对公司近 400 亿美元年化收入的增速寄予厚望。若成行,Anthropic 将跻身全球估值最高的私营公司之列。
Meta 宣布收购一家机器人初创公司,强化人形机器人与具身 AI 的布局。扎克伯格已经把 AR/VR 烧光一大半钱,现在要从 Reality Labs 转向"有身体的 AI"——这次押注能不能回血,就看硬件+大模型这条线能不能接上。
AI 代码编辑器 Cursor 被 xAI 以 600 亿美元收购。分析指出,Cursor 的创始团队算过通往 $100B 的路——觉得自己撑不起那笔投入,于是选择卖给 xAI。对 xAI 来说,得到的是进入 SpaceX IPO 前可以摆在公众投资人面前的应用门面;对 Cursor 来说,得到的是算力和一个不跟自己抢模型的金主。
在 Musk 诉 Altman 案庭审中,Musk 作证确认 xAI 使用了 OpenAI 的模型来训练 Grok。庭审同一天,The Verge 还曝出"jury 离场时最疯狂的一幕"——xAI 的 Jared Birchall 在作证时被问到四辆 Tesla Model 3 的细节。新公开的证据(Exhibit 844)显示,2018 年 Musk 给 Valve 联创 Gabe Newell 的邮件里自陈对 OpenAI 的介入"此时非常有限"。
🛠️ 技术动态
Anthropic 把 Claude Security 面向 Claude Enterprise 客户开放公测,底层用的是 Opus 4.7,主打代码漏洞识别与修补。产品已和 Microsoft Security、Palo Alto Networks 的工具链对接——企业不用写自定义 API,就能对代码做持续扫描。团队说已经收到数百家组织的反馈。
xAI 推出 Grok 4.3。与上一代 Grok 4.20 0309 v2 相比,Intelligence Index 得分更高、跑完全套基准的成本更低——xAI 将其定位为"同一智能层级里成本最低的模型之一"。官方强调它在指令遵循和 agentic 客服任务上表现突出。
OpenAI 宣布为 ChatGPT 账户推出一批新的高级安全选项,和硬件安全密钥厂商 Yubico 达成合作,支持 YubiKey 作为二次验证手段。近期多起账户被盗与 prompt 滥用事件之后,这是 OpenAI 在账户维度的明显补课。
Google 宣布 Gemini AI 助手将进入数百万辆汽车,作为车机原生的语音与对话层。对车厂而言,这相当于把 Google Assistant 升级到了大模型;对 Google 来说,也是把 Gemini 塞进一个高频、低干扰的新入口。
Stripe 更新 Link 数字钱包,显式支持"自主 AI agent"作为付款主体完成购物。这意味着支付环节开始把"人类用户"和"代表用户的 agent"当成两种不同但都合法的付款角色——是 AI 电商基建里一个不起眼但关键的步子。
阿里开源 Qwen-Scope——一套基于 Qwen3 和 Qwen3.5 训练的可解释性工具包,用来看模型内部机制。用途涵盖可控推理、数据分类与合成、模型训练与优化,以及评测样本分布分析。对做 finetune 和对齐的团队来说,这是一张新的分析图。
AWS 在 Neuron SDK 里开源了一批 agent skills,让 AI 编码助手直接给 Trainium / Inferentia 写 NKI kernel——覆盖 kernel 编写、调试、文档查询、profile 抓取与分析。底层逻辑是:自家芯片要用起来,工具链也得靠 AI 助手降低门槛。
💡 深度分析
同一批 GPU、同一个模型、同一批请求,吞吐和时延会因为"哪台 GPU 拿到哪条请求"而明显不同。作者指出:当每条请求都带着几千个 token、而这些 token 可能已经在集群里某台机器被缓存过,"负载均衡"和"最省钱"就不是同一件事。文章讲了重算成本怎么衡量、负载均衡器理解 token 局部性之后该怎么变。
Latch Bio 跑 SpatialBench 的结论很直白:GPT-5.5 比 GPT-5.4 几乎快了一半,Opus 4.7 也和 Opus 4.6 打平——但准确率都没动。作者认为,空间生物学这种领域,想再往上走不能只靠通用推理能力,得显式训练统计设计、平台专属分析流程、重复可知的差异检验这些专业知识。对做垂直领域 AI 的团队是个现实提醒。
OpenAI 公开了一项溯源分析:GPT-5.1 明显增多的"goblin 风格"比喻,来自人格微调时的奖励信号。一个听起来很小的激励,就能在模型输出里塑造出明显的语言风格偏好。对要做定制 persona 或担心风格漂移的团队来说,这是一个很好的警示案例。
美国电影艺术与科学学院更新规则,纯 AI 生成的演员(例如此前引发争议的虚拟演员 Tilly Norwood)和剧本将不再有资格角逐奥斯卡。学院承认 AI 可以作为辅助工具,但关键的"人"必须在场。这是好莱坞面对生成式 AI 给出的第一道正式边界。
WSJ:AI 热潮把存储芯片行业推进了一个超级景气周期。三星公布一季度净利润折合超 300 亿美元,一个季度就干掉了过去任何一个季度的纪录,接近公司全年利润高点。文章认为供需紧张还会恶化到明年——这不是短期波动,是结构性缺货。
⚡ 快讯
SoftBank 宣布新建一家机器人公司,主业是用机器人建数据中心。TC 报道说它已经把目标放在千亿美元级 IPO——这是孙正义在 AI 基建上的又一记大注。
Perplexity 拓展到企业自动化:新增工作流、企业数据连接器,集成到 Teams 和 Excel。方向很明确——瞄准结构化业务任务和连续自动化,而不仅是问答搜索。
Meta 宣布其商业 AI 工具每周已促成 1000 万次对话,用来自动化客服和销售。这一量级相比去年同期有显著增长——说明企业对 AI 客服的付费意愿在兑现。
Legal AI 初创公司 Legora 完成新一轮,估值 56 亿美元。和主要竞争对手 Harvey 的大厂客户争夺战变得更热——双方都宣称自己的模型在法律文档分析上更准。
X 宣布重构整个广告平台,新系统用 AI 处理投放、定向、创意生成。Musk 时代的核心命题是把广告效率拉上来——这是最直接的一步。
Apple 在财报电话会上坦承,Mac 因为 AI 功能带来的需求增长超出了预期。新一代芯片的算力优势,吸引了开发者和创意人士提前换机。
Cursor 发文总结自家 agent harness 的持续优化:用视觉驱动开发、A/B 测试、动态上下文适配这套组合拳,把模型表现往上提。对做 agent 工程的团队来说,这篇是不错的实践参考。
Silico 是一个 AI 建模平台,卖点是可以让研究者看清模型内部、调试失败、从零开始有意识地设计模型。对做对齐、可解释性和调试的团队来说,是新的工具选项。
Amazon 财报:AWS 增长强劲,同时资本支出也大幅上扬——钱主要砸在 AI 基建上。这和微软、Google 的节奏一致:云端巨头的军备赛还在加速。
论文探索把 speculative decoding 用到 RL rollouts 里,在不改变输出分布的前提下,最多带来 1.8 倍吞吐提升,端到端有望加速 2.5 倍。对跑强化学习成本高的团队有直接参考价值。