🛠️ 技术动态
Claude Opus 4.8带来基准测试改进、可调节的努力程度控制、动态工作流,以及更快且更便宜的快速模式。
来源:Anthropic · 阅读时间:4分钟
Jarred Sumner使用动态工作流在11天内将Bun从Zig重写为Rust,75万行代码实现99.8%测试通过率。动态工作流让Claude将任务拆分为子任务,多代理并行运行。
来源:Anthropic · 阅读时间:3分钟
MiniMax预告M3系列将采用新的稀疏注意力方法,在长上下文场景下解码速度最高可提升15.6倍。
来源:VentureBeat · 阅读时间:12分钟
SpaceX用C语言编写的内部AI训练栈V1.0即将完成。该系统映射到22万块GB300显卡,潜在速度提升超过一个数量级。
来源:X/Twitter · 阅读时间:2分钟
NVIDIA γ-World是生成式世界模型,支持独立可控的多代理实时推演,支持从双人场景零样本泛化到四人场景。
来源:NVIDIA Research · 阅读时间:3分钟
Mistral AI CEO表示公司计划设计定制芯片以控制基础设施并降低部署成本,同时扩大在欧洲的数据中心布局。
来源:CNBC · 阅读时间:4分钟
Sakana Labs将网络分成块独立训练,关键技巧是将前向传播视为扩散模型去噪信号,大幅降低训练深度模型所需的内存。
来源:X/Twitter · 阅读时间:1分钟
模型利用更多上下文理解代码库,这降低了成本。上下文驱动方法改善了代码校准,提高了开发者生产力。
来源:Cursor · 阅读时间:1分钟