🛠️ 技术动态
DeepSeek-Prover-V2通过递归证明搜索和新基准测试,在神经定理证明领域取得重要进展,展示了AI在数学推理方面的潜力。
来源:Synced
Can GRPO be 10x Efficient? Kwai AI的SRPO给出了肯定答案,通过新方法显著提升了GRPO算法的训练效率。
来源:Synced
ByteDance Astra采用双模型架构,专为自主机器人导航设计,为具身智能领域提供了新的技术方案。
来源:Synced
MIT Researchers Unveil "SEAL",这是一个新的自我改进AI系统,展示了AI自主学习和进化的可能性。
来源:Synced