🛠️ 技术动态
Google 发布 Gemini 3.1 Flash Live,专注于低延迟、自然对话的实时语音模型。已在 Google 开发者 API、企业工具和消费产品中全面上线。这是 Google 在实时语音 AI 领域的重要布局——直接对标 OpenAI 的实时语音功能。
Cursor 团队公开了「Real-time RL」技术——将真实推理 token 用于训练。做法是:把模型 checkpoint 部署到生产环境 → 观察用户响应 → 将用户反馈聚合为奖励信号。这种方法使 Composer 的模型迭代周期缩短到最快每 5 小时一次,将用户行为直接转化为模型优化方向。这对所有做 AI 产品的团队都是一个值得深思的范式。
Chroma 发布 Context-1,一个 20B 参数的自编辑搜索 Agent 模型,基于 8000+ 合成任务训练。检索性能媲美前沿模型,成本仅为后者的几分之一,推理速度最高快 10 倍。核心设计:将搜索与生成彻底分离——模型将高层查询分解为子查询,多轮迭代搜索语料库,并主动丢弃无关结果以释放上下文窗口容量。
知名风投 USV(Union Square Ventures)公开了其内部 AI Agent 体系的演进历程。最初只是一个会议回顾邮件,后来演变为定制 CRM——Agent 会消化会议纪要、邮件和日历,创建结构化「提及」并关联到公司和人物,形成持续更新的内部知识库。关键改进:给 Agent 命名、赋予角色和工具访问权、嵌入邮件线程以收集反馈。
David Sacks 正式结束了作为白宫 AI 和加密货币政策顾问的角色,将远离华盛顿权力中心。他在任期间推动了多项 AI 政策框架的制定。TechCrunch 指出,他的离开意味着美国 AI 政策的方向可能出现调整。
AI 编码工具 Cline 推出 Kanban 功能——一个看板式界面,用于管理多个 AI 编码 Agent 的任务状态和依赖关系。支持各种 CLI Agent,不限于 Cline 自身。这反映了一个趋势:随着 AI 编码 Agent 越来越多,「管理 Agent」本身正在成为新的产品赛道。