🤖 AI 日报

2026年04月22日

💥 重磅新闻

贝索斯旗下 AI 初创公司 Project Prometheus 即将完成 100 亿美元新一轮融资,JPMorgan 和 BlackRock 领投。该公司志在开发能理解物理世界的大模型,应用于航天、汽车等工程制造领域,此前已获得初始 62 亿美元融资(贝索斯本人出资一部分)。这是继 Ilya 的 SSI、Mira Murati 的 Thinking Machines 之后又一家估值数百亿的 AI 物理世界玩家。
来源:Bloomberg
Anthropic 与 AWS 宣布深化战略合作,Amazon 追加 50 亿美元投资,Anthropic 承诺未来在 AWS 上花费 1000 亿美元云服务费用。作为交换,双方将共同部署最高 5GW 的新增算力(相当于几个核电站的规模)用于 Claude 的训练和部署。这笔钱几乎是循环注资——Amazon 出钱,Anthropic 花回 Amazon,继续绑定 Trainium 芯片生态。
来源:Anthropic · TechCrunch
SpaceX 据报已与 AI 代码编辑器 Cursor 达成深度合作,并在协议中保留以 600 亿美元估值收购 Cursor 的选择权。此消息紧接着上周 Cursor 刚刚传出正与投资人洽谈 500 亿估值、筹资 20 亿美元。若收购最终落地,将使马斯克系进一步渗透进 AI 编程工具赛道,与 xAI 形成互补。
来源:TechCrunch · The Verge
Anthropic 此前只向少数大客户与美国政府机构预览的顶级网安模型 Mythos,据报已被一个未授权团体获取。Mythos 原本是 Anthropic 修复与特朗普政府关系、争取国防订单的战略武器(NSA 此前也被曝正在使用它),如今却先一步流出,直接引发对前沿模型访问控制的信任危机。Sam Altman 借机公开讽刺 Anthropic 的「恐惧营销」。
来源:The Verge · TechCrunch

🛠️ 技术动态

Moonshot 在 kimi.com 与 API 上线 Kimi K2.6,权重同步开放到 Hugging Face。产品线一次性覆盖四档:K2.6 Instant(快速对话)、K2.6 Thinking(深度推理)、K2.6 Agent(文档/网页任务)、K2.6 Agent Swarm(大规模并发 Agent)。编码与 Agent 能力是本次主打,官方声称在 SWE-bench Multilingual、BrowseComp 等评测上刷新开源 SOTA,并超过 GPT-5.4 与 Claude Opus 4.6。
Qwen3.6-Max-Preview 带来更扎实的世界知识与指令跟随能力,Agentic 编码表现在多项基准上大幅提升。模型仍在持续迭代,目前用户可在 Qwen Studio 交互体验,API 很快将登陆阿里云 Model Studio。和 Kimi K2.6 同一天发布,中国开源 / 闭源模型对顶级能力的追赶节奏明显加快。
来源:Qwen Blog
Chronicle 面向 ChatGPT Pro 的 macOS 用户开放,作为 Codex 的增强层:通过读取屏幕上下文构建长期工作记忆,让 Codex 理解正在进行的任务,用户不用反复把背景复述一遍。记录本地加密存储。配合 OpenAI 此前发布的 Codex 升级,被视为对 Claude Code 的正面反击。
来源:The Verge
OpenAI 更新图像生成模型,新版本能直接从 Web 获取信息(例如某品牌最新 Logo、当天的新闻标题),并在生成图像中嵌入可读的长段文字。TechCrunch 实测显示新模型在文字渲染、版面设计上表现惊艳,对 Midjourney、Ideogram、Flux 等专业产品形成直接竞争。
来源:The Verge · TechCrunch
Gemini CLI 原生支持子代理(subagents),可将一个编码任务拆分成前端更新、后端改动、测试等角色并行执行,每个子代理独立上下文和权限,主代理负责编排。与 Claude Code 的子任务架构正面对标,也呼应了业界从「单 Agent → 多 Agent 编排」的演进方向。
来源:Google(转载 TLDR AI)
Claude 新增 Live Artifacts 能力,允许用户生成连接到应用和文件、自动读取当前数据的 Dashboard 与 Tracker。相当于把过去只做一次性渲染的 Artifact 升级成可以持续刷新的轻量应用,进一步压缩了「Claude + 工作数据」之间的摩擦。
来源:Anthropic(转载 TLDR AI)
以「全晶圆级 AI 芯片」著称的 Cerebras Systems 正式向 SEC 递交 IPO 文件,有望成为 Nvidia 之外首个登陆美股的专用 AI 加速器公司。公司主打超大芯片(WSE 系列)和推理云服务,近年来与 G42 等中东资本的深度绑定曾多次延迟上市进程。AI 基础设施叙事今年将迎来新的公开市场 benchmark。
来源:TechCrunch
微软计划将 GitHub Copilot 的计费模式由月费改为按 Token 消耗计算,并短期暂停个人账号新注册。原因是 Copilot 背后的推理成本自年初以来已经翻倍,现有定价难以覆盖。动向释放一个明确信号:再强的巨头也开始为 LLM 推理算力「摊成本」。
Meta 宣布将开始系统性地采集员工在内部工具上的键盘输入,用作 AI 训练数据。公司内部把这一项目定位为提升 Workplace Copilot 的「真实任务数据」,但外界普遍关注员工隐私边界、敏感信息泄露等问题。在行业高质量训练数据枯竭的大背景下,自有员工数据正成为巨头的新弹药。
来源:TechCrunch
YouTube 将此前只在创作者中测试的 AI 面部/嗓音相似度检测系统扩展到名人用户,让他们能主动发现并申请下架平台上的 deepfake 内容。和 Meta、TikTok 近期的类似动作一起,释放出头部平台正在把「肖像权」升级为一项新的平台能力。
来源:TechCrunch · The Verge

💡 深度分析

Epoch AI 系统梳理了 OpenAI、Oracle、软银联合投入的 5000 亿美元超大规模 AI 基础设施计划「Stargate」——目前官方已确认 7 个美国站点,每个站点在土地、电力、冷却、变电站审批上进度不同。文章指出真正的瓶颈不是芯片,而是电网接入与变压器交付周期。对判断 2027-2028 模型训练的「算力上限」很有参考价值。
来源:Epoch AI
TechCrunch 观点文:围绕「让 AI 多写代码、多跑 Agent」而形成的「Tokenmaxxing」文化——即鼓励大量并发 AI 任务、堆叠 Agent——在多项研究中被证明反而拖慢了整体交付。作者认为开发者在反复审阅 AI 输出、修复隐性 bug、追忆上下文上花费的时间远超节省下来的写代码时间。对评估「AI 生产力」的方法论是一次重要反思。
来源:TechCrunch
morgin.ai 的研究发现:即便是标称「uncensored」的开源模型,在生成某些敏感词汇时概率分布依然会被无声地推离——没有拒答、没有警告,只是「句子本该落到的词」被悄悄替换。这种隐性偏移比显式拒答更难被发现,也更难被评测捕捉,对安全对齐与模型透明度提出新挑战。
来源:morgin.ai
The Verge 分析:Ternus 是苹果硬件工程的明面功臣,但他接手 CEO 后要面对的第一个真正棘手的问题来自软件——Siri 的 LLM 改造、Apple Intelligence 的商业化进度、以及与 OpenAI / Anthropic / Google 的战略合作边界。Cook 留下的苹果最强的是利润机器,最弱的是 AI 产品节奏。这一节奏问题不会因为 CEO 换人就自动解决。
来源:The Verge