🤖 AI日报

2026年5月21日 · 周四

💥 重磅新闻

重磅

DeepSeek发布V3新论文，揭秘低成本大模型训练的硬件感知协同设计

DeepSeek-V3新论文揭示了通过硬件感知协同设计实现低成本大模型训练的秘密，为模型训练和推理效率优化提供了新的技术路径。

来源：Synced

重磅

DeepSeek暗示下一代R2模型，推出SPCT推理扩展新方法

DeepSeek Signals Next-Gen R2 Model，并推出了用于推理扩展的新方法SPCT（Self-Play Consistency Training），为提升模型推理能力开辟新方向。

来源：Synced

🛠️ 技术动态

技术

DeepSeek发布Prover-V2，递归证明搜索实现神经定理证明突破

DeepSeek-Prover-V2通过递归证明搜索和新基准测试，在神经定理证明领域取得重要进展，展示了AI在数学推理方面的潜力。

来源：Synced

技术

快手AI提出SRPO：GRPO效率提升10倍的新方法

Can GRPO be 10x Efficient? Kwai AI的SRPO给出了肯定答案，通过新方法显著提升了GRPO算法的训练效率。

来源：Synced

技术

字节跳动推出Astra双模型架构，实现自主机器人导航

ByteDance Astra采用双模型架构，专为自主机器人导航设计，为具身智能领域提供了新的技术方案。

来源：Synced

技术

MIT研究者推出SEAL，迈向自我改进AI的新一步

MIT Researchers Unveil "SEAL"，这是一个新的自我改进AI系统，展示了AI自主学习和进化的可能性。

来源：Synced

💡 深度分析

研究

PSU和杜克大学研究者探索LLM多智能体系统自动故障归因

Which Agent Causes Task Failures and When? 研究者开发了自动化故障归因方法，帮助理解和改进多智能体系统的可靠性。

来源：Synced

行业

智谱AI开源发力：极速GLM模型与全球化扩张，或为IPO铺路

Zhipu.AI在开源模型和全球化布局上持续发力，其超高速GLM模型和国际化战略被认为是在为潜在IPO做准备。

来源：Synced