AI 日报 - 2026年03月18日

💥 重磅新闻

OpenAI 推出 GPT-5.4 系列的两款轻量模型：Mini 专为高吞吐量场景优化，性能接近完整版 GPT-5.4；Nano 则面向分类、数据提取、排序等轻量任务，主打低延迟和低成本。两款模型均支持 40 万 token 上下文和图像输入。

Mistral Forge 允许企业和政府机构基于自有数据从零训练定制 AI 模型，提供比微调和 RAG 更可控的替代方案，支持领域专属训练和强化学习，降低对第三方模型的依赖。

微软将 M365 Copilot 和消费端 Copilot 团队合并，由 Jacob Andreou 领导。Mustafa Suleman 将专注于微软自有模型和「超级智能」研究。此举旨在提供更统一的产品体验。

来源：WSJ

Aristotle Agent 是一个自主数学智能体，能够解决和形式化世界上最具挑战性的数学研究问题。它可以不间断运行 24 小时自主证明和形式化，支持 Web、CLI 和 API，目前免费使用。

Cursor 的 Composer 模型学会在长时间编码过程中自动总结自己的上下文，将早期步骤压缩为更短的表示以扩展有效工作记忆。该方法在多步骤编程任务上显著提升表现，同时控制 token 使用量。

Unsloth 推出 Studio，一个无代码 Web UI，支持本地训练、运行和导出开源模型。兼容 Mac/Windows/Linux，支持文本、视觉、TTS 和嵌入模型，可从 PDF/CSV/JSON 等文件自动创建数据集。

来源：Unsloth

在 GTC 2026 上，Nvidia 宣布推出 NemoClaw，为 OpenClaw 智能体平台增加隔离沙箱环境，提供数据隐私和安全保护，支持策略级安全、网络和隐私护栏。

DeepMind 发布论文提出衡量 AI 通向 AGI 进展的认知分类法，识别出感知、学习、推理等 10 项关键认知能力。配套 Kaggle 黑客松（奖金 20 万美元）邀请研究者为 5 项尚未充分评估的能力开发测试。

Anthropic 内部框架将 AI「技能」定义为包含脚本和资产的功能文件夹，使用文件系统进行上下文工程。研究识别出 9 大核心类别，其中产品验证和「Gotchas」部分被认为对提升输出可靠性价值最高。

五角大楼在法庭文件中回应 Anthropic 的诉讼，指出该公司可能在作战行动中「禁用技术或预先改变模型行为」，认为这对国家安全构成不可接受的风险。

📱 Dispatch：Claude Desktop 的移动端伴侣 App，可远程发消息和运行任务

🌐 Comet Enterprise：Perplexity 推出企业版 AI 浏览器，含治理和部署工具

☁️ OpenAI 与 AWS 达成合作，通过 AWS 向政府客户分发产品

📈 OpenAI 计划年底 IPO，内部强调 ChatGPT 必须成为生产力工具

🎮 Nvidia 重启中国 H200 芯片生产，黄仁勋称中国需求信号走强

🏪 Meta Lab NYC 成为永久旗舰店，继续销售 AI 智能眼镜

🤖 Moltbook 更新服务条款：用户对 AI Agent 行为承担全部责任

🥑 Meta 推迟 Avocado AI 模型至少到 5 月，性能落后竞品