🤖 AI 日报

2026年05月03日 · 星期日
💥 重磅新闻
美国国防部宣布与 Nvidia、Microsoft、AWS、OpenAI、Google 达成协议,在机密网络上部署 AI 能力。Anthropic 明显缺席——此前 CEO Dario Amodei 多次公开反对把模型用于大规模监控。一纸合同画出了两种立场:愿意进五角大楼的,和不愿意的。
来源:The Verge · TechCrunch
据 TechCrunch 消息人士,Anthropic 正在推进一轮约 500 亿美元规模的融资,估值可能达到 9000 亿美元,预计两周内落地。投资人对公司近 400 亿美元年化收入的增速寄予厚望。若成行,Anthropic 将跻身全球估值最高的私营公司之列。
来源:TechCrunch · TLDR AI
Meta 宣布收购一家机器人初创公司,强化人形机器人与具身 AI 的布局。扎克伯格已经把 AR/VR 烧光一大半钱,现在要从 Reality Labs 转向"有身体的 AI"——这次押注能不能回血,就看硬件+大模型这条线能不能接上。
来源:TechCrunch
AI 代码编辑器 Cursor 被 xAI 以 600 亿美元收购。分析指出,Cursor 的创始团队算过通往 $100B 的路——觉得自己撑不起那笔投入,于是选择卖给 xAI。对 xAI 来说,得到的是进入 SpaceX IPO 前可以摆在公众投资人面前的应用门面;对 Cursor 来说,得到的是算力和一个不跟自己抢模型的金主。
在 Musk 诉 Altman 案庭审中,Musk 作证确认 xAI 使用了 OpenAI 的模型来训练 Grok。庭审同一天,The Verge 还曝出"jury 离场时最疯狂的一幕"——xAI 的 Jared Birchall 在作证时被问到四辆 Tesla Model 3 的细节。新公开的证据(Exhibit 844)显示,2018 年 Musk 给 Valve 联创 Gabe Newell 的邮件里自陈对 OpenAI 的介入"此时非常有限"。
来源:The Verge · TechCrunch
🛠️ 技术动态
Anthropic 把 Claude Security 面向 Claude Enterprise 客户开放公测,底层用的是 Opus 4.7,主打代码漏洞识别与修补。产品已和 Microsoft Security、Palo Alto Networks 的工具链对接——企业不用写自定义 API,就能对代码做持续扫描。团队说已经收到数百家组织的反馈。
xAI 推出 Grok 4.3。与上一代 Grok 4.20 0309 v2 相比,Intelligence Index 得分更高、跑完全套基准的成本更低——xAI 将其定位为"同一智能层级里成本最低的模型之一"。官方强调它在指令遵循和 agentic 客服任务上表现突出。
来源:xAI Thread · TLDR AI
OpenAI 宣布为 ChatGPT 账户推出一批新的高级安全选项,和硬件安全密钥厂商 Yubico 达成合作,支持 YubiKey 作为二次验证手段。近期多起账户被盗与 prompt 滥用事件之后,这是 OpenAI 在账户维度的明显补课。
来源:TechCrunch
Google 宣布 Gemini AI 助手将进入数百万辆汽车,作为车机原生的语音与对话层。对车厂而言,这相当于把 Google Assistant 升级到了大模型;对 Google 来说,也是把 Gemini 塞进一个高频、低干扰的新入口。
来源:TechCrunch
Stripe 更新 Link 数字钱包,显式支持"自主 AI agent"作为付款主体完成购物。这意味着支付环节开始把"人类用户"和"代表用户的 agent"当成两种不同但都合法的付款角色——是 AI 电商基建里一个不起眼但关键的步子。
来源:TechCrunch
阿里开源 Qwen-Scope——一套基于 Qwen3 和 Qwen3.5 训练的可解释性工具包,用来看模型内部机制。用途涵盖可控推理、数据分类与合成、模型训练与优化,以及评测样本分布分析。对做 finetune 和对齐的团队来说,这是一张新的分析图。
来源:Qwen 博客
AWS 在 Neuron SDK 里开源了一批 agent skills,让 AI 编码助手直接给 Trainium / Inferentia 写 NKI kernel——覆盖 kernel 编写、调试、文档查询、profile 抓取与分析。底层逻辑是:自家芯片要用起来,工具链也得靠 AI 助手降低门槛。
来源:AWS 公告
💡 深度分析
同一批 GPU、同一个模型、同一批请求,吞吐和时延会因为"哪台 GPU 拿到哪条请求"而明显不同。作者指出:当每条请求都带着几千个 token、而这些 token 可能已经在集群里某台机器被缓存过,"负载均衡"和"最省钱"就不是同一件事。文章讲了重算成本怎么衡量、负载均衡器理解 token 局部性之后该怎么变。
Latch Bio 跑 SpatialBench 的结论很直白:GPT-5.5 比 GPT-5.4 几乎快了一半,Opus 4.7 也和 Opus 4.6 打平——但准确率都没动。作者认为,空间生物学这种领域,想再往上走不能只靠通用推理能力,得显式训练统计设计、平台专属分析流程、重复可知的差异检验这些专业知识。对做垂直领域 AI 的团队是个现实提醒。
OpenAI 公开了一项溯源分析:GPT-5.1 明显增多的"goblin 风格"比喻,来自人格微调时的奖励信号。一个听起来很小的激励,就能在模型输出里塑造出明显的语言风格偏好。对要做定制 persona 或担心风格漂移的团队来说,这是一个很好的警示案例。
来源:OpenAI 博客
美国电影艺术与科学学院更新规则,纯 AI 生成的演员(例如此前引发争议的虚拟演员 Tilly Norwood)和剧本将不再有资格角逐奥斯卡。学院承认 AI 可以作为辅助工具,但关键的"人"必须在场。这是好莱坞面对生成式 AI 给出的第一道正式边界。
来源:TechCrunch
WSJ:AI 热潮把存储芯片行业推进了一个超级景气周期。三星公布一季度净利润折合超 300 亿美元,一个季度就干掉了过去任何一个季度的纪录,接近公司全年利润高点。文章认为供需紧张还会恶化到明年——这不是短期波动,是结构性缺货。
⚡ 快讯
SoftBank 宣布新建一家机器人公司,主业是用机器人建数据中心。TC 报道说它已经把目标放在千亿美元级 IPO——这是孙正义在 AI 基建上的又一记大注。
来源:TechCrunch
Perplexity 拓展到企业自动化:新增工作流、企业数据连接器,集成到 Teams 和 Excel。方向很明确——瞄准结构化业务任务和连续自动化,而不仅是问答搜索。
Meta 宣布其商业 AI 工具每周已促成 1000 万次对话,用来自动化客服和销售。这一量级相比去年同期有显著增长——说明企业对 AI 客服的付费意愿在兑现。
来源:TechCrunch
Legal AI 初创公司 Legora 完成新一轮,估值 56 亿美元。和主要竞争对手 Harvey 的大厂客户争夺战变得更热——双方都宣称自己的模型在法律文档分析上更准。
来源:TechCrunch
X 宣布重构整个广告平台,新系统用 AI 处理投放、定向、创意生成。Musk 时代的核心命题是把广告效率拉上来——这是最直接的一步。
来源:TechCrunch
Apple 在财报电话会上坦承,Mac 因为 AI 功能带来的需求增长超出了预期。新一代芯片的算力优势,吸引了开发者和创意人士提前换机。
来源:TechCrunch
Cursor 发文总结自家 agent harness 的持续优化:用视觉驱动开发、A/B 测试、动态上下文适配这套组合拳,把模型表现往上提。对做 agent 工程的团队来说,这篇是不错的实践参考。
来源:Cursor 博客
Silico 是一个 AI 建模平台,卖点是可以让研究者看清模型内部、调试失败、从零开始有意识地设计模型。对做对齐、可解释性和调试的团队来说,是新的工具选项。
Amazon 财报:AWS 增长强劲,同时资本支出也大幅上扬——钱主要砸在 AI 基建上。这和微软、Google 的节奏一致:云端巨头的军备赛还在加速。
来源:TechCrunch
论文探索把 speculative decoding 用到 RL rollouts 里,在不改变输出分布的前提下,最多带来 1.8 倍吞吐提升,端到端有望加速 2.5 倍。对跑强化学习成本高的团队有直接参考价值。
来源:ArXiv