🛠️ 技术动态
Synced · 机器人技术
字节跳动推出 Astra 框架,采用双模型架构分离感知和决策,使机器人能够在复杂环境中实现更高效的自主导航。该技术结合了视觉语言模型和强化学习,在多个基准测试中表现优异。
Synced · 自改进系统
MIT研究人员发布SEAL(Self-Evolving Autonomous Learner),一种能够通过自我反思和错误修正持续改进性能的新型AI系统。该系统展示了无需人工标注数据即可实现能力迭代的潜力。
Synced · 可靠性研究
宾夕法尼亚州立大学和杜克大学研究人员提出"自动故障归因"新方法,解决了LLM多智能体系统中定位失败根源的难题。该方法可帮助开发者快速识别导致任务失败的特定智能体和时刻。
Synced · 视频生成
Adobe研究团队提出将状态空间模型(SSM)应用于视频世界模型,有效解决了长视频序列中的记忆衰减问题。该技术使AI能够生成长达数分钟的连贯视频内容,帧间一致性显著提升。
Synced · 数学AI
DeepSeek推出Prover-V2模型,采用递归证明搜索和新基准测试,在形式化数学定理证明任务上取得重大进展。该模型在多个数学竞赛级别的证明任务中达到新的SOTA水平。
Synced · 训练效率
快手AI团队推出SRPO(Sample-efficient Reinforcement Policy Optimization),在保持GRPO(Group Relative Policy Optimization)效果的同时大幅降低样本需求,理论效率提升可达10倍。
Synced · 训练成本
DeepSeek团队发布V3模型技术论文,详细阐述了通过硬件感知协同设计大幅降低大模型训练成本的方法。该研究展示了如何在有限预算下训练出性能接近GPT-4级别的模型。
Synced · 开源生态
智谱AI宣布开源更轻量、更快的GLM模型版本,并计划在潜在IPO前加速全球扩张。该公司正在积极构建开源生态,与Llama、Qwen等开源模型展开竞争。
Synced · 推理扩展
DeepSeek预告下一代R2模型,并推出SPCT(Self-Play Chain of Thought)方法,通过自博弈生成高质量推理数据,解决了大规模推理模型训练中的数据稀缺问题。