🛠️ 技术动态
Google 推出 Veo 3.1 Lite,一个低成本视频生成模型,可通过 Gemini API 调用。与 Veo 3.1 Fast 保持相同速度,但成本降低一半以上,面向大规模视频生成应用场景。
Anthropic 为 Claude Code 引入计算机操控能力(computer use),代理现在可以与应用程序交互、导航界面,并通过闭环工作流迭代测试和修复代码。这标志着 AI 编码工具从纯代码编辑向全系统操控迈进。
编码代理使用过时训练数据生成 Gemini API 代码一直是个痛点。Google 推出 Gemini API Docs MCP 和 Developer Skills 两个工具,确保编码代理能访问最新 API 并使用最佳实践编码。两者结合在 Google 评估集上达到 96.3% 通过率。
Aurora 是一个基于强化学习的推测解码框架,可从实时推理轨迹中学习并持续更新推测器,无需中断服务。它在不同流量域之间实现实时适应,比精心预训练的静态推测器额外提升 1.25 倍速度,展示了在线从零训练如何超越静态基线。
Cohere 发布 Transcribe 语音识别产品,在 HN 获得 217 分讨论。定位为企业级语音转文本服务,进一步扩展 Cohere 在企业 AI 市场的产品线。
微软开源 Agent Lightning 训练框架,宣称可以不修改任何代码即将任意 AI Agent 转化为可通过训练优化的系统,降低 Agent 优化的工程门槛。
Google One 负责人 Shimrit Ben-Yair 宣布,AI Pro 套餐($19.99/月)的存储空间从 2TB 升级至 5TB,增加了 150% 的存储容量。
💡 深度分析
半导体层仍然占据约 70% 的 AI 总收入,基础设施是目前唯一具有竞争壁垒的层级。AI 行业最赚钱的策略仍然是"卖铲子"。文章系统分析了 AI 产业链各层的经济模型变化,揭示了为什么应用层至今难以盈利。
分析指出 Opus 4.5 是 Anthropic 的一次重大突破,得益于其计算能力翻倍。Anthropic 已接近 OpenAI 的总计算能力,有效可用计算能力可能已超过 OpenAI。不过 OpenAI 将在下半年通过新建数据中心拉开差距,2027 年双方将再次接近。OpenAI 目前规划的未来产能远高于 Anthropic。
AI 能力一直跑在 AI 可用性前面——模型早已足够聪明可以做很多事,但访问方式主要局限于聊天机器人。大量"AI 令人失望"的声音本质上来自错误的接口。随着接口改进,更多人将看到 AI 的真正能力。Claude Dispatch 等新产品形态正在改变这一局面。
AI 初创公司种子轮估值持续攀升,单轮融资额已达 1000 万美元、投后估值 4000-4500 万美元。投资者尤其追捧拥有 ex-OpenAI 背景团队的项目。Y Combinator Demo Day 展示了价格上涨的趋势,VC 也因此被迫在更早期的 pre-seed 阶段入局。
加利福尼亚州要求与其合作的 AI 公司必须满足新的隐私和安全标准。此举是美国州级政府首次系统性地为政府 AI 采购设定安全基线,可能成为其他州的参考模板。