🛠️ 技术动态
微软为 365 Copilot 引入两个新模式:Critique 模式使用双模型系统(GPT 生成 + Claude 校审),在 DRACO 基准上比单模型方案高出 13.88%;Council 模式则支持使用 Anthropic 和 OpenAI 模型并行生成研究报告,实现多模型对比与洞察聚合。此外还引入了 Copilot Cowork 功能,支持 Claude 处理多步骤长时间任务。
OpenAI 发布 Claude Code 的 Codex 插件,允许在 Claude Code 工作流中直接调用 Codex 进行代码审查。支持常规审查、对抗性审查和任务交接三种模式,通过本地 Codex CLI 和 App Server 运行,复用现有认证和 MCP 配置。
Ollama 宣布在 Apple Silicon 平台上集成 MLX 推理框架(预览版)。此前 Ollama 使用 llama.cpp 进行推理,MLX 是 Apple 专为自家芯片优化的深度学习框架,有望在 Mac 上实现更高效的本地模型推理。该消息在 HN 获得 620 分和 346 条讨论。
Google Research 开源 TimesFM,一个预训练时间序列基础模型,采用 patched-decoder 注意力架构,支持 16K 上下文窗口。在不同时间粒度、预测长度和历史长度下均表现良好,可用于通用时间序列预测任务。
Google 研究团队发布 TurboQuant 压缩算法,通过压缩大语言模型存储数据,在零精度损失条件下将内存占用降低至少 6 倍。被网友戏称为现实版「Pied Piper」(《硅谷》中虚构的超级压缩算法)。
HuggingFace 发布 Transformers.js v4 版本,新增 WebGPU Runtime,使同一套 transformers.js 代码可以在多种 JavaScript 环境中运行,包括浏览器和 Node.js,大幅提升了前端 AI 推理的跨平台能力。
Salesforce 宣布对 Slack 进行大规模 AI 改版,一次性推出超过 30 项新功能。包括 AI 驱动的对话摘要、智能搜索、自动任务分配等,标志着企业协作工具全面拥抱 AI。
广泛使用的 HTTP 库 Axios 在 NPM 上被发现存在恶意版本,会下载并执行远程访问木马(RAT)。该事件在 HN 获得 1848 分,引发对供应链安全的广泛讨论。开发者需检查依赖版本,确保未引入受感染包。
💡 深度分析
一篇引发 HN 370 分和 518 条讨论的深度文章,分析了 AI 泡沫可能的破裂路径。作者认为过度竞争、过剩算力和投资者趋于谨慎是三大风险信号,与 The Verge「Too much compute, too much competition, and skeptical investors」的判断不谋而合。
文章指出,第一代 AI 以更大权重和更多数据为特征,而新一代 AI 需要在真实世界场景中落地。当前针对规模和效率优化的基础设施已经不够——需要面向运营场景、现实体验和持续学习的新型基础设施。
越来越多 AI 应用公司走向"全栈":向下整合模型层(如 Cursor、Intercom 自研模型降低成本),或向上整合服务层(如 Crosby AI 提供端到端服务)。随着 AI 能力演进,垂直整合成为差异化竞争和成本控制的关键策略。
微软更新 Copilot 个人版服务条款,将其定位为「仅供娱乐用途」(entertainment purposes only),引发 HN 社区热议。批评者指出,一边大力推广 AI 生产力工具,一边在法律文件中声明不保证准确性且仅供娱乐,存在明显矛盾。
Fortune 报道 Anthropic 存在安全疏忽,一个未加密的数据存储中暴露了下一代模型名称「Mythos」及仅限受邀 CEO 活动的内部信息。这是 Anthropic 本月第二次安全事件——此前 Claude Code 源代码也被泄露。