🛠️ 技术动态
Anthropic 发布 Auto Mode 研究预览版,使 Claude 能够自主执行操作——不只是回答问题,而是直接帮你完成任务。内置安全防护机制可过滤风险行为和 prompt injection 攻击。这标志着 AI 从「对话助手」向「自主代理」的又一步迈进。
OpenAI 放弃了 ChatGPT 内的「一键结账」功能(使用率太低),转而专注于商品发现和引导用户到商家官网完成购买。这是对 AI 电商路径的一次重要调整——AI 更适合做「购物顾问」而非「收银台」,与此前 Walmart 数据(ChatGPT 结账转化率比官网差 3 倍)的结论一致。
Intel 推出 Arc Pro B70 桌面 GPU——32GB VRAM、32 个 Xe2 核心,参考设计售价 $949。同时发布了 B65 Pro(20 个 Xe2 核心)。这是 Intel 姗姗来迟的「大核」GPU,主打 AI 推理而非游戏。在 NVIDIA 主导的 AI 加速卡市场,Intel 正试图用专业级产品撕开一个口子。
Google Research 发布 TurboQuant 量化方法,在保持性能的同时大幅减少向量内存开销。可显著提升 KV Cache 效率和向量搜索速度。HN 518 分热议。在推理成本仍是制约 AI 规模化部署的核心瓶颈时,这类研究具有重要的工程价值。
Anyscale 发布 Ray Data LLM——专为大规模 LLM 批量推理设计的库,在优先吞吐量而非单请求延迟的场景中,吞吐量达到 vLLM 同步引擎的 2 倍,同时具备生产级容错能力。越来越多的 LLM 工作负载(数据标注、内容生成、评估等)正从实时交互转向批处理模式。
Ossature 是一个开源项目,开发者编写描述「软件该做什么」的规格文件,Ossature 验证规格、让 LLM 审计歧义和缺漏、生成可编辑计划,然后按任务逐一生成代码——每个任务只获得必需的上下文。验证内置在构建循环中,失败时修复代理自动尝试修复。这是「规格先行」的 AI 辅助开发新范式。