🤖 AI 日报

2026年04月27日 · 周一
💥 重磅新闻
Google 与 Anthropic 谈判一笔规模最高达 400 亿美元的新投资,混合现金与 TPU/云算力额度。这进一步把 Anthropic 与 Google 云生态深度绑定,也让谷歌、亚马逊在 Anthropic 上的押注合计已超千亿美元级别。
来源:TechCrunch
Forge Global 数据显示 Anthropic 估值达 1 万亿美元,超过 OpenAI 的 8800 亿美元。背后驱动力是可流通股票稀缺、Claude Code 商业化提速、与 Google/Amazon 战略合作的预期。注意这是私募/二级市场报价,并非新一轮一级融资定价。
DeepSeek 正在洽谈首轮外部融资,估值从 100 亿数日内升至 200 亿美元;腾讯希望拿 20% 股份,但 DeepSeek 不愿让出过多控制权。这是国内 AI 大模型公司目前最高的私有估值之一。
加拿大企业 AI 厂商 Cohere 与德国大模型公司 Aleph Alpha 合并,目标是组建一个更具规模的"非美超大厂"企业 AI 联盟,对抗 OpenAI/Anthropic 的客户挤压。具体股权结构与领导班子尚未公开。
来源:TechCrunch
中国市场监管部门否决了 Meta 此前宣布的 Manus 收购案,未公开具体理由。Manus 已部分整合进 Meta 的产品栈,被否后双方需要重新规划技术合作路径,也让"中美 AI 互投"再添一个标志性受阻案例。
来源:The Verge(综合报道)
Oracle 与 OpenAI 的 3000 亿美元数据中心租赁大单,使银行难以分散背后的债务风险。数家银行的资产负债表已被 Oracle 在德州、威斯康星州的相关贷款占用,AI 算力扩张带来的金融杠杆问题开始显性化。
🛠️ 技术动态
GPT-5.5 在 agentic 推理、工具调用、效率三个维度提升,延迟与 GPT-5 持平,但代码与知识任务的 benchmark 全面上一个台阶。OpenAI 强调它"更接近 super app 形态",可在同一会话内连续编排多步骤工具调用。
距离 R1/V3 一周年之际,DeepSeek 放出 V4 预览,主打与 GPT-5.5/Claude 4.5 的差距进一步收窄,并继续维持开源 + 低成本路线。技术细节论文尚未发布,行业关注其 MoE 结构与训练成本是否再创新低。
来源:The Verge · TechCrunch
Anthropic 推出 Personal App Connectors,让 Claude 可以直接读写你账户里的歌单、外卖订单、报税资料等。这是把"agent + 真实账号操作"从演示推进到 C 端日常使用的一步,但也再次把权限边界、隐私风险摆到了前台。
来源:The Verge
Microsoft 在 Office 三件套里上线 Agent Mode("vibe working"),用户用自然语言下达高层目标,agent 直接动手编辑文档、生成表格、改 PPT 版式。对标 Cursor 的"vibe coding"思路,把 Office 改造成 agent-first 工作台。
来源:The Verge
Anthropic 上线一个面向开发者的测试市场,让 agent 之间相互购买/出售 API 调用、数据、子任务执行能力。核心问题是:当 agent 自己掏"钱包"调度其他 agent,谁来负责合规、审计与争议处理?这是把 agent 经济从概念推向沙盒的一次尝试。
来源:TechCrunch
OpenAI 发布开放权重的小模型,专门用来在文本中检测、脱敏 PII(姓名、住址、证件号等),主打本地、低延迟、上下文感知。适合接入数据管道做合规前处理,是少见的 OpenAI 主动开源动作。
来源:OpenAI 官方
Meta 与 AWS 签约,采购数百万颗 Amazon 自研 AI CPU 用于推理。背景是 GPU 仍紧俏、Meta 希望降本并多元化算力来源。这也强化了"超大厂自研 AI 芯片 + 跨厂商互供"的新格局——不再只有 NVIDIA 一家说了算。
来源:TechCrunch
Amazon 研究院公开一种 MoE 训练方法:在训练中途复制并专项化已有专家,实现"边训边扩容",性能提升的同时推理成本不变。对正在追求 MoE 路线的厂商(包括 DeepSeek、Mistral、Qwen 等)有直接参考价值。
来源:GitHub
Google 把 AI 摘要带进企业版 Gmail,用户可以用自然语言跨多封邮件提问,无需逐封点开。对企业 IT 是新一轮"信息检索 + DLP"的考验。
💡 深度分析
Verge 复盘 Anthropic 与 OpenAI 的最新涨价/限额动作:在补贴、囤客户阶段过去后,token 单价下降的红利期正在结束,AI 应用层正在被迫重新设计成本模型。对做 AI 产品的人来说,"调用 LLM 像免费水电"的假设要改了。
来源:The Verge
面对用户反馈 Claude 表现变差,Anthropic 4/20 修复并发布 11 分钟长文复盘:问题源自三处独立改动,分别影响 Claude Code、Agent SDK 和 Claude Cowork,但 API 端未受影响。亮点是 Anthropic 详细公开了内部排查路径,对其他大模型公司的事故沟通是一次很好的范本。
Verge 长篇复盘 Project Maven——美国国防部与硅谷之间的 AI 合作样本。文章梳理了从早期 Google 抗议、到如今 Palantir、Anduril、Anthropic 都拿下国防合同的转折,讨论 AI 在军事供应链中已经走到了哪一步。
来源:The Verge
白宫公开指责中国通过模型蒸馏(用前沿模型输出训练廉价小模型)系统性"窃取"美国 AI 资产,并承诺与三家头部美国实验室共享情报。这是把"模型蒸馏"从学术议题升级到地缘安全议题的第一次官方表态,未来出口管制和 API 反爬可能更紧。
作者认为,agent 规格写法存在 code-maximalism(强制代码、稳定但僵硬)与 markdown-maximalism(灵活但易错)两极,现实中靠谱的 agent 架构都在做混合:底层用代码框骨架,顶层用 prompt/markdown 表达策略。对正在搭 agent 平台的团队是一次很值的方法论梳理。
⚡ 快讯
开源节点式工作流工具 ComfyUI 拿到新一轮融资,估值 5 亿美元,反映专业创作者对"黑盒生成"不满,愿意为可拼装、可调试的 pipeline 付费。
来源:TechCrunch
AI 编码公司 Cognition 正洽谈新一轮融资,估值翻倍到 250 亿美元,主打 B 端代码调试与自动化。条款仍可能调整。
微软宣布在澳大利亚追加 18 亿美元投资,用于扩建云计算与 AI 训练/推理基础设施。
Sierra(企业 agent 平台)收购同为 YC 系的 Fragment,继续在企业 agent 工具链做横向整合。
来源:TechCrunch
Meta 全员邮件确认新一轮裁员,规模约 10%,AI Research 与 Reality Labs 是相对保留的部分——资源继续向 AI 倾斜。
来源:The Verge
Nothing 手机发布 AI-powered Dictation,官方演示强调本地化处理与低延迟。硬件厂商把 AI 入口直接放进系统层的又一例。
来源:TechCrunch
📜 论文推荐
一篇系统化讨论"agent 如何建立世界模型"的综述/立场论文,把能力层级、学习定律与评估范式整理成可对齐的框架,适合想给自己的 agent 技术栈画骨架的团队阅读。
来源:arXiv cs.AI
提出不依赖符号正则匹配的数学推理评测框架,用 LLM 作为鲁棒判官,缓解"正确答案因格式不一致被判错"的问题,对数学/代码类 benchmark 的可信度有现实意义。
来源:arXiv cs.AI
用控制论与马尔可夫诊断,系统分析 LLM 自我纠错什么时候真的有效、什么时候只是"越改越错"。给基于 self-refine、reflection 架构做产品的团队一个理论判断依据。
来源:arXiv cs.AI
针对"前沿模型表现出策略性推理能力"这一风险,提出分类法 + 评测框架,覆盖博弈、诱导、长线规划等维度。对做 AI Safety、红队评估的工程师是实操性较强的参考。
来源:arXiv cs.AI
提出一种带类型的语义记忆结构,配合基于信息论的检索策略,面向长时段 agent 任务——比传统向量检索在信息保真度、调用成本上更可控。
来源:arXiv cs.AI