🤖 AI 日报

2026年04月01日 · 星期三

💥 重磅新闻

OpenAI 宣布完成创纪录的 1220 亿美元融资，投后估值达 8520 亿美元。SoftBank 联合领投，Amazon 投 500 亿、Nvidia 投 300 亿、SoftBank 投 300 亿，另有 30 亿来自个人投资者。目前 ChatGPT 周活跃用户超 9 亿，订阅用户超 5000 万，月收入 20 亿美元。公司正为潜在 IPO 做准备，同时收缩 Sora 等非核心业务以控制成本。

来源：CNBC

安全Claude Code 源代码通过 NPM 包泄露，暴露内部机制

Anthropic 的 Claude Code 工具源代码因 NPM 包中包含 source map 文件而被公开。泄露的 51.2 万行代码揭示了多项内部机制，包括 fake tools（伪工具调用）、frustration regexes（检测用户挫败感的正则表达式）、undercover mode（隐蔽模式）等。该事件在 HN 引发近 1000 条讨论，成为近 48 小时最热门话题。

来源：alex000kim.com · HN 讨论 (1191 分)

裁员Oracle 裁员 3 万人

Oracle 大规模裁员数千至 3 万人。该公司此前拥有约 16.2 万名员工，同时计划今年筹集 450-500 亿美元用于 AI 基础设施建设。裁员被认为是公司向 AI 和云业务转型过程中的结构性调整。

来源：Rolling Out · HN 讨论 (874 分)

模型通义千问发布 Qwen3.5-Omni 全模态大模型

阿里通义千问发布 Qwen3.5-Omni，一个原生全模态大语言模型，支持文本、图像、音频和音视频输入。可处理超过 10 小时音频和 400 秒 720P 视频，支持 113 种语言和方言的语音识别及 36 种语言的语音生成。在超过 1 亿小时的音视频数据上训练，标志着国产大模型向 AGI 迈进一大步。

来源：Qwen 官方博客

🛠️ 技术动态

产品Microsoft 365 Copilot 推出 Critique 和 Council 模式

微软为 365 Copilot 引入两个新模式：Critique 模式使用双模型系统（GPT 生成 + Claude 校审），在 DRACO 基准上比单模型方案高出 13.88%；Council 模式则支持使用 Anthropic 和 OpenAI 模型并行生成研究报告，实现多模型对比与洞察聚合。此外还引入了 Copilot Cowork 功能，支持 Claude 处理多步骤长时间任务。

来源：TestingCatalog · The Verge

工具Codex Plugin for Claude Code 发布

OpenAI 发布 Claude Code 的 Codex 插件，允许在 Claude Code 工作流中直接调用 Codex 进行代码审查。支持常规审查、对抗性审查和任务交接三种模式，通过本地 Codex CLI 和 App Server 运行，复用现有认证和 MCP 配置。

来源：TLDR AI

开源Ollama 在 Apple Silicon 上支持 MLX 推理引擎

Ollama 宣布在 Apple Silicon 平台上集成 MLX 推理框架（预览版）。此前 Ollama 使用 llama.cpp 进行推理，MLX 是 Apple 专为自家芯片优化的深度学习框架，有望在 Mac 上实现更高效的本地模型推理。该消息在 HN 获得 620 分和 346 条讨论。

来源：Ollama 官方博客 · HN 讨论

模型Google TimesFM：2 亿参数时间序列基础模型

Google Research 开源 TimesFM，一个预训练时间序列基础模型，采用 patched-decoder 注意力架构，支持 16K 上下文窗口。在不同时间粒度、预测长度和历史长度下均表现良好，可用于通用时间序列预测任务。

来源：GitHub · HN 讨论 (301 分)

压缩Google TurboQuant 算法：零精度损失下内存降 6 倍

Google 研究团队发布 TurboQuant 压缩算法，通过压缩大语言模型存储数据，在零精度损失条件下将内存占用降低至少 6 倍。被网友戏称为现实版「Pied Piper」（《硅谷》中虚构的超级压缩算法）。

来源：Google Research · The Verge

前端Transformers.js v4 发布，支持 WebGPU Runtime

HuggingFace 发布 Transformers.js v4 版本，新增 WebGPU Runtime，使同一套 transformers.js 代码可以在多种 JavaScript 环境中运行，包括浏览器和 Node.js，大幅提升了前端 AI 推理的跨平台能力。

来源：GitHub

产品Salesforce 为 Slack 推出 AI 大改版，新增 30+ 功能

Salesforce 宣布对 Slack 进行大规模 AI 改版，一次性推出超过 30 项新功能。包括 AI 驱动的对话摘要、智能搜索、自动任务分配等，标志着企业协作工具全面拥抱 AI。

来源：TechCrunch

安全Axios NPM 包被投毒，植入远程访问木马

广泛使用的 HTTP 库 Axios 在 NPM 上被发现存在恶意版本，会下载并执行远程访问木马（RAT）。该事件在 HN 获得 1848 分，引发对供应链安全的广泛讨论。开发者需检查依赖版本，确保未引入受感染包。

来源：StepSecurity · HN 讨论 (1848 分)

💡 深度分析

观点AI 泡沫如何破裂

一篇引发 HN 370 分和 518 条讨论的深度文章，分析了 AI 泡沫可能的破裂路径。作者认为过度竞争、过剩算力和投资者趋于谨慎是三大风险信号，与 The Verge「Too much compute, too much competition, and skeptical investors」的判断不谋而合。

来源：martinvol.pe · HN 讨论 (370 分)

趋势AI 基础设施路线图：2026 五大前沿

文章指出，第一代 AI 以更大权重和更多数据为特征，而新一代 AI 需要在真实世界场景中落地。当前针对规模和效率优化的基础设施已经不够——需要面向运营场景、现实体验和持续学习的新型基础设施。

来源：NextBigTeng

策略AI 应用的垂直整合趋势

越来越多 AI 应用公司走向"全栈"：向下整合模型层（如 Cursor、Intercom 自研模型降低成本），或向上整合服务层（如 Crosby AI 提供端到端服务）。随着 AI 能力演进，垂直整合成为差异化竞争和成本控制的关键策略。

来源：tanayj.com

争议微软声明：Copilot 仅供「娱乐用途」

微软更新 Copilot 个人版服务条款，将其定位为「仅供娱乐用途」（entertainment purposes only），引发 HN 社区热议。批评者指出，一边大力推广 AI 生产力工具，一边在法律文件中声明不保证准确性且仅供娱乐，存在明显矛盾。

来源：Microsoft · HN 讨论 (523 分)

泄露Anthropic 安全漏洞泄露下一代模型「Mythos」

Fortune 报道 Anthropic 存在安全疏忽，一个未加密的数据存储中暴露了下一代模型名称「Mythos」及仅限受邀 CEO 活动的内部信息。这是 Anthropic 本月第二次安全事件——此前 Claude Code 源代码也被泄露。

来源：Fortune · The Verge

⚡ 快讯

硬件Nothing 计划 2027 上半年推出 AI 智能眼镜

彭博社 Mark Gurman 报道，Nothing 计划推出内置摄像头、麦克风和扬声器的 AI 智能眼镜，AI 处理将分流到手机和云端。

来源：The Verge

事故DeepSeek 罕见宕机超 8 小时

中国 AI 公司 DeepSeek 自 R1 和 V3 模型上线以来遭遇最长时间的服务中断，持续超过 8 小时后恢复。

来源：Silicon Republic

融资Starcloud 融资 1.7 亿美元建太空数据中心

Starcloud 完成 1.7 亿美元 A 轮融资，估值 11 亿美元，用于在太空中建设数据中心，探索太空算力新方向。

来源：TechCrunch

平台GitHub 撤回 Copilot PR 广告

在超过 150 万 PR 被注入广告引发强烈反对后，GitHub 宣布撤回 Copilot 在 Pull Request 中的广告投放。

来源：The Register · HN 讨论 (585 分)

算力Nebius 计划建设欧洲最大 AI 算力工厂

Nebius 宣布在芬兰建设欧洲最大规模的 AI 算力工厂，响应欧洲对本土 AI 计算能力的迫切需求。

来源：CNBC

苹果Apple Intelligence 误在中国上线后紧急下架

部分中国用户在 iPhone 上看到 Apple Intelligence 功能，Bloomberg Mark Gurman 确认为「错误上线」，Apple 已紧急下架。中国市场要求苹果与本土公司（如阿里巴巴）合作部署 AI 功能。

来源：The Verge

报告Composer 2 技术报告：强化学习提升长程编码

Composer 2 通过持续预训练 + 强化学习两阶段训练方法，在软件工程基准测试中取得了优异的长时编码任务表现。

来源：arXiv

📜 论文推荐

语音对话音频的抽象压缩：面向 LLM 语音识别

研究提出 Abstract Compression 方法，将对话历史中的音频部分替换为固定数量的学习型潜在 token，同时保留文本转录，有效降低多轮对话 ASR 中的计算开销，同时保持对上下文实体的识别能力。

作者：Shashi Kumar 等 · arXiv:2603.26246

隐私从 LLM 蒸馏隐私敏感度评估能力

将 Mistral Large 3（675B）的隐私评估能力蒸馏到仅 150M 参数的轻量编码器模型中，在 10 个领域的隐私标注数据上训练，保持了与人类标注的高度一致性，同时大幅降低计算需求，可作为去标识化系统的评估指标。

作者：Gabriel Loiseau 等 · arXiv:2603.29497 · GitHub

3DGhost-FWL：大规模全波形 LiDAR 幽灵点检测数据集

发布首个大规模标注的移动全波形 LiDAR 数据集 Ghost-FWL，包含 2.4 万帧、75 亿点级标注，比现有数据集大 100 倍。提出的基线模型和 FWL-MAE 自监督方法可将 SLAM 轨迹误差降低 66%，3D 目标检测误报减少 50 倍。

作者：Kazuma Ikeda 等 · 项目主页 · GitHub