🤖 AI 日报

2026年03月18日 · 星期二

💥 重磅新闻

OpenAI 推出 GPT-5.4 系列的两款轻量模型:Mini 专为高吞吐量场景优化,性能接近完整版 GPT-5.4;Nano 则面向分类、数据提取、排序等轻量任务,主打低延迟和低成本。两款模型均支持 40 万 token 上下文和图像输入。
来源:OpenAI Blog
Mistral Forge 允许企业和政府机构基于自有数据从零训练定制 AI 模型,提供比微调和 RAG 更可控的替代方案,支持领域专属训练和强化学习,降低对第三方模型的依赖。
来源:Mistral AI
微软将 M365 Copilot 和消费端 Copilot 团队合并,由 Jacob Andreou 领导。Mustafa Suleman 将专注于微软自有模型和「超级智能」研究。此举旨在提供更统一的产品体验。
来源:WSJ

🛠️ 技术动态

Aristotle Agent 是一个自主数学智能体,能够解决和形式化世界上最具挑战性的数学研究问题。它可以不间断运行 24 小时自主证明和形式化,支持 Web、CLI 和 API,目前免费使用。
来源:Thread Reader
Cursor 的 Composer 模型学会在长时间编码过程中自动总结自己的上下文,将早期步骤压缩为更短的表示以扩展有效工作记忆。该方法在多步骤编程任务上显著提升表现,同时控制 token 使用量。
来源:Cursor Blog
Unsloth 推出 Studio,一个无代码 Web UI,支持本地训练、运行和导出开源模型。兼容 Mac/Windows/Linux,支持文本、视觉、TTS 和嵌入模型,可从 PDF/CSV/JSON 等文件自动创建数据集。
来源:Unsloth
在 GTC 2026 上,Nvidia 宣布推出 NemoClaw,为 OpenClaw 智能体平台增加隔离沙箱环境,提供数据隐私和安全保护,支持策略级安全、网络和隐私护栏。
来源:Nvidia News

💡 深度分析

DeepMind 发布论文提出衡量 AI 通向 AGI 进展的认知分类法,识别出感知、学习、推理等 10 项关键认知能力。配套 Kaggle 黑客松(奖金 20 万美元)邀请研究者为 5 项尚未充分评估的能力开发测试。
来源:Google Blog
Anthropic 内部框架将 AI「技能」定义为包含脚本和资产的功能文件夹,使用文件系统进行上下文工程。研究识别出 9 大核心类别,其中产品验证和「Gotchas」部分被认为对提升输出可靠性价值最高。
来源:X (Twitter)
五角大楼在法庭文件中回应 Anthropic 的诉讼,指出该公司可能在作战行动中「禁用技术或预先改变模型行为」,认为这对国家安全构成不可接受的风险。

⚡ 快讯

📱 Dispatch:Claude Desktop 的移动端伴侣 App,可远程发消息和运行任务
🌐 Comet Enterprise:Perplexity 推出企业版 AI 浏览器,含治理和部署工具
☁️ OpenAI 与 AWS 达成合作,通过 AWS 向政府客户分发产品
📈 OpenAI 计划年底 IPO,内部强调 ChatGPT 必须成为生产力工具
🎮 Nvidia 重启中国 H200 芯片生产,黄仁勋称中国需求信号走强
🏪 Meta Lab NYC 成为永久旗舰店,继续销售 AI 智能眼镜
🤖 Moltbook 更新服务条款:用户对 AI Agent 行为承担全部责任
🥑 Meta 推迟 Avocado AI 模型至少到 5 月,性能落后竞品