🤖 AI 日报

2026年04月01日 · 星期三
💥 重磅新闻
OpenAI 宣布完成创纪录的 1220 亿美元融资,投后估值达 8520 亿美元。SoftBank 联合领投,Amazon 投 500 亿、Nvidia 投 300 亿、SoftBank 投 300 亿,另有 30 亿来自个人投资者。目前 ChatGPT 周活跃用户超 9 亿,订阅用户超 5000 万,月收入 20 亿美元。公司正为潜在 IPO 做准备,同时收缩 Sora 等非核心业务以控制成本。
来源:CNBC
Anthropic 的 Claude Code 工具源代码因 NPM 包中包含 source map 文件而被公开。泄露的 51.2 万行代码揭示了多项内部机制,包括 fake tools(伪工具调用)、frustration regexes(检测用户挫败感的正则表达式)、undercover mode(隐蔽模式)等。该事件在 HN 引发近 1000 条讨论,成为近 48 小时最热门话题。
Oracle 大规模裁员数千至 3 万人。该公司此前拥有约 16.2 万名员工,同时计划今年筹集 450-500 亿美元用于 AI 基础设施建设。裁员被认为是公司向 AI 和云业务转型过程中的结构性调整。
阿里通义千问发布 Qwen3.5-Omni,一个原生全模态大语言模型,支持文本、图像、音频和音视频输入。可处理超过 10 小时音频和 400 秒 720P 视频,支持 113 种语言和方言的语音识别及 36 种语言的语音生成。在超过 1 亿小时的音视频数据上训练,标志着国产大模型向 AGI 迈进一大步。
🛠️ 技术动态
微软为 365 Copilot 引入两个新模式:Critique 模式使用双模型系统(GPT 生成 + Claude 校审),在 DRACO 基准上比单模型方案高出 13.88%;Council 模式则支持使用 Anthropic 和 OpenAI 模型并行生成研究报告,实现多模型对比与洞察聚合。此外还引入了 Copilot Cowork 功能,支持 Claude 处理多步骤长时间任务。
OpenAI 发布 Claude Code 的 Codex 插件,允许在 Claude Code 工作流中直接调用 Codex 进行代码审查。支持常规审查、对抗性审查和任务交接三种模式,通过本地 Codex CLI 和 App Server 运行,复用现有认证和 MCP 配置。
来源:TLDR AI
Ollama 宣布在 Apple Silicon 平台上集成 MLX 推理框架(预览版)。此前 Ollama 使用 llama.cpp 进行推理,MLX 是 Apple 专为自家芯片优化的深度学习框架,有望在 Mac 上实现更高效的本地模型推理。该消息在 HN 获得 620 分和 346 条讨论。
Google Research 开源 TimesFM,一个预训练时间序列基础模型,采用 patched-decoder 注意力架构,支持 16K 上下文窗口。在不同时间粒度、预测长度和历史长度下均表现良好,可用于通用时间序列预测任务。
Google 研究团队发布 TurboQuant 压缩算法,通过压缩大语言模型存储数据,在零精度损失条件下将内存占用降低至少 6 倍。被网友戏称为现实版「Pied Piper」(《硅谷》中虚构的超级压缩算法)。
HuggingFace 发布 Transformers.js v4 版本,新增 WebGPU Runtime,使同一套 transformers.js 代码可以在多种 JavaScript 环境中运行,包括浏览器和 Node.js,大幅提升了前端 AI 推理的跨平台能力。
来源:GitHub
Salesforce 宣布对 Slack 进行大规模 AI 改版,一次性推出超过 30 项新功能。包括 AI 驱动的对话摘要、智能搜索、自动任务分配等,标志着企业协作工具全面拥抱 AI。
来源:TechCrunch
广泛使用的 HTTP 库 Axios 在 NPM 上被发现存在恶意版本,会下载并执行远程访问木马(RAT)。该事件在 HN 获得 1848 分,引发对供应链安全的广泛讨论。开发者需检查依赖版本,确保未引入受感染包。
💡 深度分析
一篇引发 HN 370 分和 518 条讨论的深度文章,分析了 AI 泡沫可能的破裂路径。作者认为过度竞争、过剩算力和投资者趋于谨慎是三大风险信号,与 The Verge「Too much compute, too much competition, and skeptical investors」的判断不谋而合。
文章指出,第一代 AI 以更大权重和更多数据为特征,而新一代 AI 需要在真实世界场景中落地。当前针对规模和效率优化的基础设施已经不够——需要面向运营场景、现实体验和持续学习的新型基础设施。
来源:NextBigTeng
越来越多 AI 应用公司走向"全栈":向下整合模型层(如 Cursor、Intercom 自研模型降低成本),或向上整合服务层(如 Crosby AI 提供端到端服务)。随着 AI 能力演进,垂直整合成为差异化竞争和成本控制的关键策略。
来源:tanayj.com
微软更新 Copilot 个人版服务条款,将其定位为「仅供娱乐用途」(entertainment purposes only),引发 HN 社区热议。批评者指出,一边大力推广 AI 生产力工具,一边在法律文件中声明不保证准确性且仅供娱乐,存在明显矛盾。
Fortune 报道 Anthropic 存在安全疏忽,一个未加密的数据存储中暴露了下一代模型名称「Mythos」及仅限受邀 CEO 活动的内部信息。这是 Anthropic 本月第二次安全事件——此前 Claude Code 源代码也被泄露。
来源:Fortune · The Verge
⚡ 快讯
彭博社 Mark Gurman 报道,Nothing 计划推出内置摄像头、麦克风和扬声器的 AI 智能眼镜,AI 处理将分流到手机和云端。
来源:The Verge
中国 AI 公司 DeepSeek 自 R1 和 V3 模型上线以来遭遇最长时间的服务中断,持续超过 8 小时后恢复。
Starcloud 完成 1.7 亿美元 A 轮融资,估值 11 亿美元,用于在太空中建设数据中心,探索太空算力新方向。
来源:TechCrunch
在超过 150 万 PR 被注入广告引发强烈反对后,GitHub 宣布撤回 Copilot 在 Pull Request 中的广告投放。
Nebius 宣布在芬兰建设欧洲最大规模的 AI 算力工厂,响应欧洲对本土 AI 计算能力的迫切需求。
来源:CNBC
部分中国用户在 iPhone 上看到 Apple Intelligence 功能,Bloomberg Mark Gurman 确认为「错误上线」,Apple 已紧急下架。中国市场要求苹果与本土公司(如阿里巴巴)合作部署 AI 功能。
来源:The Verge
Composer 2 通过持续预训练 + 强化学习两阶段训练方法,在软件工程基准测试中取得了优异的长时编码任务表现。
来源:arXiv
📜 论文推荐
研究提出 Abstract Compression 方法,将对话历史中的音频部分替换为固定数量的学习型潜在 token,同时保留文本转录,有效降低多轮对话 ASR 中的计算开销,同时保持对上下文实体的识别能力。
作者:Shashi Kumar 等 · arXiv:2603.26246
将 Mistral Large 3(675B)的隐私评估能力蒸馏到仅 150M 参数的轻量编码器模型中,在 10 个领域的隐私标注数据上训练,保持了与人类标注的高度一致性,同时大幅降低计算需求,可作为去标识化系统的评估指标。
作者:Gabriel Loiseau 等 · arXiv:2603.29497 · GitHub
发布首个大规模标注的移动全波形 LiDAR 数据集 Ghost-FWL,包含 2.4 万帧、75 亿点级标注,比现有数据集大 100 倍。提出的基线模型和 FWL-MAE 自监督方法可将 SLAM 轨迹误差降低 66%,3D 目标检测误报减少 50 倍。
作者:Kazuma Ikeda 等 · 项目主页 · GitHub