🛠️ 技术动态
Google 正在将设计工具 Stitch 升级为 3D 工作区,支持语音控制、对话式 AI 代理,可直接从设计生成可用的 React 应用。预计在 Google I/O 2026 亮相。
来源:Testing Catalog · TLDR AI
Z.ai 发布 GLM-5-Turbo,提供简洁的文本生成 API,支持可定制角色、实时流式输出、可调节的温度参数控制创意度。专为 Agent 场景优化。
来源:Z.ai Docs · TLDR AI
AWS 将部署 Cerebras CS-3 系统,通过 AWS Bedrock 提供最快的 AI 推理服务,支持开源 LLM 和 Amazon Nova 模型。采用解耦架构:AWS Trainium 负责 prefill,Cerebras WSE 负责 decode,吞吐量提升 5 倍。
来源:Cerebras Blog · TLDR AI
清华团队开源 IndexCache,通过跨层复用 top-k token 索引(而非每层重新计算)来降低 DeepSeek 稀疏注意力的计算成本,在保持模型质量的同时移除大部分索引计算。
来源:GitHub · TLDR AI
AMD 正在推广一种新设备类别"Agent Computer"——持续运行的本地硬件,可在你睡觉或工作时后台运行 AI Agent,通过 Slack、WhatsApp 或 iMessage 委派任务。
来源:X/Twitter · TLDR AI
💡 深度分析
当前行业热衷 CLI,就像几个月前热衷 MCP 一样。CLI 确实能节省 token,但自定义 CLI 面临与 MCP 相同的上下文问题,且缺乏结构化优势。个人使用和企业采用的场景差异巨大——MCP 是企业和组织级用例的现在和未来。
来源:chrlschn.dev · TLDR AI
Transformer 可以在推理循环中高效执行程序。这为 AI 系统在单一计算基底中集成学习表征与编译算法开辟了道路。解决人类最棘手的问题需要既能灵活推理又能可靠计算的系统——未来 AI 系统将把软件作为模型的一部分。
来源:Percepta AI · TLDR AI
AMI Labs 和 World Labs 都以"世界模型"融资超 10 亿美元,但这个术语涵盖五种不同方法:JEPA、空间智能、学习模拟、物理 AI 基础设施、主动推理。文中最亮眼的结果是 V-JEPA 2,仅用 62 小时领域数据训练就实现了零样本机器人规划。
来源:X/Twitter · TLDR AI