💥 重磅新闻
贝索斯旗下 AI 初创公司 Project Prometheus 即将完成 100 亿美元新一轮融资,JPMorgan 和 BlackRock 领投。该公司志在开发能理解物理世界的大模型,应用于航天、汽车等工程制造领域,此前已获得初始 62 亿美元融资(贝索斯本人出资一部分)。这是继 Ilya 的 SSI、Mira Murati 的 Thinking Machines 之后又一家估值数百亿的 AI 物理世界玩家。
Anthropic 与 AWS 宣布深化战略合作,Amazon 追加 50 亿美元投资,Anthropic 承诺未来在 AWS 上花费 1000 亿美元云服务费用。作为交换,双方将共同部署最高 5GW 的新增算力(相当于几个核电站的规模)用于 Claude 的训练和部署。这笔钱几乎是循环注资——Amazon 出钱,Anthropic 花回 Amazon,继续绑定 Trainium 芯片生态。
SpaceX 据报已与 AI 代码编辑器 Cursor 达成深度合作,并在协议中保留以 600 亿美元估值收购 Cursor 的选择权。此消息紧接着上周 Cursor 刚刚传出正与投资人洽谈 500 亿估值、筹资 20 亿美元。若收购最终落地,将使马斯克系进一步渗透进 AI 编程工具赛道,与 xAI 形成互补。
Anthropic 此前只向少数大客户与美国政府机构预览的顶级网安模型 Mythos,据报已被一个未授权团体获取。Mythos 原本是 Anthropic 修复与特朗普政府关系、争取国防订单的战略武器(NSA 此前也被曝正在使用它),如今却先一步流出,直接引发对前沿模型访问控制的信任危机。Sam Altman 借机公开讽刺 Anthropic 的「恐惧营销」。
🛠️ 技术动态
Moonshot 在 kimi.com 与 API 上线 Kimi K2.6,权重同步开放到 Hugging Face。产品线一次性覆盖四档:K2.6 Instant(快速对话)、K2.6 Thinking(深度推理)、K2.6 Agent(文档/网页任务)、K2.6 Agent Swarm(大规模并发 Agent)。编码与 Agent 能力是本次主打,官方声称在 SWE-bench Multilingual、BrowseComp 等评测上刷新开源 SOTA,并超过 GPT-5.4 与 Claude Opus 4.6。
Qwen3.6-Max-Preview 带来更扎实的世界知识与指令跟随能力,Agentic 编码表现在多项基准上大幅提升。模型仍在持续迭代,目前用户可在 Qwen Studio 交互体验,API 很快将登陆阿里云 Model Studio。和 Kimi K2.6 同一天发布,中国开源 / 闭源模型对顶级能力的追赶节奏明显加快。
Chronicle 面向 ChatGPT Pro 的 macOS 用户开放,作为 Codex 的增强层:通过读取屏幕上下文构建长期工作记忆,让 Codex 理解正在进行的任务,用户不用反复把背景复述一遍。记录本地加密存储。配合 OpenAI 此前发布的 Codex 升级,被视为对 Claude Code 的正面反击。
OpenAI 更新图像生成模型,新版本能直接从 Web 获取信息(例如某品牌最新 Logo、当天的新闻标题),并在生成图像中嵌入可读的长段文字。TechCrunch 实测显示新模型在文字渲染、版面设计上表现惊艳,对 Midjourney、Ideogram、Flux 等专业产品形成直接竞争。
Gemini CLI 原生支持子代理(subagents),可将一个编码任务拆分成前端更新、后端改动、测试等角色并行执行,每个子代理独立上下文和权限,主代理负责编排。与 Claude Code 的子任务架构正面对标,也呼应了业界从「单 Agent → 多 Agent 编排」的演进方向。
Claude 新增 Live Artifacts 能力,允许用户生成连接到应用和文件、自动读取当前数据的 Dashboard 与 Tracker。相当于把过去只做一次性渲染的 Artifact 升级成可以持续刷新的轻量应用,进一步压缩了「Claude + 工作数据」之间的摩擦。
以「全晶圆级 AI 芯片」著称的 Cerebras Systems 正式向 SEC 递交 IPO 文件,有望成为 Nvidia 之外首个登陆美股的专用 AI 加速器公司。公司主打超大芯片(WSE 系列)和推理云服务,近年来与 G42 等中东资本的深度绑定曾多次延迟上市进程。AI 基础设施叙事今年将迎来新的公开市场 benchmark。
微软计划将 GitHub Copilot 的计费模式由月费改为按 Token 消耗计算,并短期暂停个人账号新注册。原因是 Copilot 背后的推理成本自年初以来已经翻倍,现有定价难以覆盖。动向释放一个明确信号:再强的巨头也开始为 LLM 推理算力「摊成本」。
Meta 宣布将开始系统性地采集员工在内部工具上的键盘输入,用作 AI 训练数据。公司内部把这一项目定位为提升 Workplace Copilot 的「真实任务数据」,但外界普遍关注员工隐私边界、敏感信息泄露等问题。在行业高质量训练数据枯竭的大背景下,自有员工数据正成为巨头的新弹药。
YouTube 将此前只在创作者中测试的 AI 面部/嗓音相似度检测系统扩展到名人用户,让他们能主动发现并申请下架平台上的 deepfake 内容。和 Meta、TikTok 近期的类似动作一起,释放出头部平台正在把「肖像权」升级为一项新的平台能力。
💡 深度分析
Epoch AI 系统梳理了 OpenAI、Oracle、软银联合投入的 5000 亿美元超大规模 AI 基础设施计划「Stargate」——目前官方已确认 7 个美国站点,每个站点在土地、电力、冷却、变电站审批上进度不同。文章指出真正的瓶颈不是芯片,而是电网接入与变压器交付周期。对判断 2027-2028 模型训练的「算力上限」很有参考价值。
TechCrunch 观点文:围绕「让 AI 多写代码、多跑 Agent」而形成的「Tokenmaxxing」文化——即鼓励大量并发 AI 任务、堆叠 Agent——在多项研究中被证明反而拖慢了整体交付。作者认为开发者在反复审阅 AI 输出、修复隐性 bug、追忆上下文上花费的时间远超节省下来的写代码时间。对评估「AI 生产力」的方法论是一次重要反思。
morgin.ai 的研究发现:即便是标称「uncensored」的开源模型,在生成某些敏感词汇时概率分布依然会被无声地推离——没有拒答、没有警告,只是「句子本该落到的词」被悄悄替换。这种隐性偏移比显式拒答更难被发现,也更难被评测捕捉,对安全对齐与模型透明度提出新挑战。
The Verge 分析:Ternus 是苹果硬件工程的明面功臣,但他接手 CEO 后要面对的第一个真正棘手的问题来自软件——Siri 的 LLM 改造、Apple Intelligence 的商业化进度、以及与 OpenAI / Anthropic / Google 的战略合作边界。Cook 留下的苹果最强的是利润机器,最弱的是 AI 产品节奏。这一节奏问题不会因为 CEO 换人就自动解决。