💥 重磅新闻
OpenAI 宣布关闭最新一轮融资,总额 1220 亿美元,投后估值 8520 亿美元。参投方包括 Amazon、NVIDIA、SoftBank、Microsoft 等。ChatGPT 周活跃用户超 9 亿,付费订阅用户超 5000 万,月营收已达 20 亿美元——增速是 Alphabet 和 Meta 同期的 4 倍。同时 OpenAI 宣布终止视频生成工具 Sora,将聚焦打造以 ChatGPT 为核心的「超级应用」,整合 Codex、搜索和 Agent 功能。广告试点 6 周 ARR 即突破 1 亿美元。
OpenAI 收购了硅谷热门科技脱口秀 TBPN(Technology Business Programming Network),这是其首次收购媒体公司。TBPN 由 John Coogan 和 Jordi Hays 主持,年收入预计超 3000 万美元,被称为「科技界的 SportsCenter」,曾吸引 Zuckerberg、Nadella 等顶级 CEO 做客。收购后 TBPN 将汇报给 OpenAI 首席政治运营官 Chris Lehane,但声称保持编辑独立。外界担忧:一家即将 IPO 的 AI 实验室收购经常讨论自身的媒体节目,潜在利益冲突明显。
Google DeepMind 发布 Gemma 4 系列开源模型,基于 Gemini 3 研究构建,追求极致的每参数智能密度。最大亮点是从此前饱受批评的自定义许可证转向 Apache 2.0,对开发者更友好。旗舰版 Gemma 4 31B 在 AIME 2026 数学测试中达 89.2%,LiveCodeBench 编程达 80%,支持 140 种语言、原生函数调用和多模态推理。在 Hacker News 获得 1503 分热议。
阿里巴巴发布 Qwen3.6-Plus,定位为面向真实世界 Agent 场景的推理模型。该模型在 Hacker News 上获得 534 分关注,被认为是中国开源模型在 Agent 能力方面的重要进展。Qwen 系列持续在国际开源社区保持影响力。
🛠️ 技术动态
Microsoft AI 发布三款基础模型:MAI-Transcribe-1(25 语言语音转文字,速度 2.5 倍于 Azure Fast)、MAI-Voice-1(1 秒生成 60 秒音频,支持自定义声音)、MAI-Image-2(图像/视频生成)。三款模型由 Mustafa Suleyman 领导的超级智能团队开发,通过 Microsoft Foundry 提供,定价策略主打比 Google 和 OpenAI 更便宜。尽管自建模型,Suleyman 仍重申与 OpenAI 的合作关系。
AI 编程工具 Cursor 发布第三代产品,从零构建全新界面,核心设计围绕 Agent 工作流。支持多仓库布局、本地与云端 Agent 无缝切换、并行运行多个 Agent、云端 Agent 自动生成 demo 和截图供审阅。内置 Composer 2 前沿编码模型。支持从移动端、Web、Slack、GitHub、Linear 等多入口启动 Agent。在 HN 获得 430 分讨论。
语音 AI 公司 ElevenLabs 发布 iOS 应用 ElevenMusic,用自然语言提示生成音乐。免费用户每天可生成 7 首,Pro 版 $9.99/月支持 500 首。应用设有电台、排行榜、每日推荐,并支持对他人作品进行 remix。ElevenLabs 在今年 2 月以 110 亿美元估值完成 5 亿美元 C 轮,正从语音 AI 公司向全方位创意工具平台转型。
Arcee AI 发布 Trinity-Large-Thinking,定位为中国以外最强的开源推理模型,专注复杂长程 Agent 场景和多轮工具调用。训练重点在跨轮次连贯性、工具使用准确性、约束下指令遵循和质量-成本平衡。模型权重以 Apache 2.0 许可在 Hugging Face 开放,同时通过 Arcee API 提供服务。
AMD 发布 Lemonade,一个快速、开源的本地大模型推理服务器,同时利用 GPU 和 NPU 加速。项目在 Hacker News 获得 521 分关注,被视为本地推理领域的重要工具,降低了在 AMD 硬件上运行大模型的门槛。
富士通发布 OneComp(One Compression),一个开源 Python 库,实现大模型后训练量化。支持 GPTQ 和 DBF 等先进量化算法,已验证 TinyLlama、Llama-2/3、Qwen3-0.6B~32B 系列模型。其他 Hugging Face 兼容模型可能可用但尚未正式测试。
Google 的 AI 视频编辑工具 Google Vids 迎来升级,新增 Veo 3.1 视频模型和 Lyria 3 音频模型支持。用户现在可以指导和自定义 AI 生成的虚拟形象,通过 Chrome 扩展录屏,并直接上传视频到 YouTube。