🤖 AI日报

2026年5月21日 · 周四
💥 重磅新闻
重磅
DeepSeek发布V3新论文,揭秘低成本大模型训练的硬件感知协同设计
DeepSeek-V3新论文揭示了通过硬件感知协同设计实现低成本大模型训练的秘密,为模型训练和推理效率优化提供了新的技术路径。
来源:Synced
重磅
DeepSeek暗示下一代R2模型,推出SPCT推理扩展新方法
DeepSeek Signals Next-Gen R2 Model,并推出了用于推理扩展的新方法SPCT(Self-Play Consistency Training),为提升模型推理能力开辟新方向。
来源:Synced
🛠️ 技术动态
技术
DeepSeek发布Prover-V2,递归证明搜索实现神经定理证明突破
DeepSeek-Prover-V2通过递归证明搜索和新基准测试,在神经定理证明领域取得重要进展,展示了AI在数学推理方面的潜力。
来源:Synced
技术
快手AI提出SRPO:GRPO效率提升10倍的新方法
Can GRPO be 10x Efficient? Kwai AI的SRPO给出了肯定答案,通过新方法显著提升了GRPO算法的训练效率。
来源:Synced
技术
字节跳动推出Astra双模型架构,实现自主机器人导航
ByteDance Astra采用双模型架构,专为自主机器人导航设计,为具身智能领域提供了新的技术方案。
来源:Synced
技术
MIT研究者推出SEAL,迈向自我改进AI的新一步
MIT Researchers Unveil "SEAL",这是一个新的自我改进AI系统,展示了AI自主学习和进化的可能性。
来源:Synced
💡 深度分析
研究
PSU和杜克大学研究者探索LLM多智能体系统自动故障归因
Which Agent Causes Task Failures and When? 研究者开发了自动化故障归因方法,帮助理解和改进多智能体系统的可靠性。
来源:Synced
行业
智谱AI开源发力:极速GLM模型与全球化扩张,或为IPO铺路
Zhipu.AI在开源模型和全球化布局上持续发力,其超高速GLM模型和国际化战略被认为是在为潜在IPO做准备。
来源:Synced