1606 字
8 分钟
AI Daily · 每天一篇AI新鲜事 (2026.04.17)

今日摘要#

微软预装AI助手,Cursor被曝套壳Claude,DeepMind首设AI哲学家,MiniMax升级跨平台Agent

近期AI研究聚焦错罚记忆优化、注意力机制解析、3D检测、工业模型、文本定律、群体智能、RL模板病及可控图像生成等方向

AI行业竞争加剧,多模态Agent、测评标准与车载语音成焦点,内容安全治理同步推进

Anthropic、Jamie Pine等发布Claude教程、语音合成、设计系统等五大开源项目

AI工具需人机协作,过度依赖或完全放手均难获高质量成果,结对开发才是正途

🚀 产品与功能更新#

1. OpenAI 内部信炮轰 Anthropic:虚增 80 亿,营收未超我方#

OpenAI首席营收官德尼塞尔在内部备忘录中炮轰Anthropic虚增80亿美元营收,指控其采用”总额法”统计导致年化收入300亿美元数据注水,若按”净额法”计算实际仅约220亿美元,仍落后于OpenAI。


2. DeepMind CEO Hassabis 重磅预言:AGI 五年内到来!AI 不是普通升级,而是“十倍速工业革命”#

DeepMind CEO Demis Hassabis 预言 AGI 五年内到来,警告 AI 正处”短期过度炒作、长期严重低估”阶段,强调此次变革是”十倍工业革命以十倍速度发生”,人类需在短时间内消化以往百年的社会冲击。


3. 爆火Hermes的10个问题,90%的人都搞错了#

Hermes 并非”爱马仕”而是古希腊信使神赫尔墨斯,其 Agent 产品近期全球爆火,但90%的人对其存在理解误区,文章通过10个常见问题澄清了核心概念与使用认知。


🔬 前沿研究#

1. 2026.03.31 | 任务对齐提效TAPS;AI科研自治写医学论文#

本期聚焦两大突破:TAPS通过任务感知提案分布优化对齐效率,大幅提升AI训练速度;同时AI系统实现科研自治,独立完成医学论文从假设到撰写的全流程,标志AI科研自治迈入新阶段。


2. 2026.04.09 | RL智能体模板病;分步生图更可控#

本期AI每周谈聚焦两大热点:RAGEN-2揭示强化学习智能体存在”模板病”推理崩溃现象,以及分步生成技术让AI图像生成更可控。


🌐 行业展望与社会影响#

1. AI 电影时代倒计时!爱奇艺龚宇:3 至 6 个月内或产出 AI 商业大片#

爱奇艺CEO龚宇预测,随着视频生成大模型技术爆发,真正意义上的AI商业大片将在3至6个月内问世,标志着AI影视制作从实验阶段跨入商业化前夜,同时媒体平台也将向非中心化公共服务提供者转型。


2. 掘金大模型基建!开源中国完成数亿元 C+ 轮融资,加速打造 AI 开发者“模力方舟”#

开源中国完成数亿元C+轮融资,由苏创投跟投,加速从代码托管向模力方舟大模型托管平台转型,目前已汇聚超万个优质模型,打造AI时代开源基建底座。


3. OpenAI 内部信炮轰 Anthropic:虚增 80 亿,营收未超我方#

OpenAI首席营收官在内部备忘录中炮轰Anthropic,指控其采用”总额法”虚增80亿美元收入,若按”净额法”计算,Anthropic真实年化收入远低于官宣的300亿美元,实际并未超越OpenAI。


4. 谷歌 AI 研究推出 Vantage:基于大语言模型的协作与创造力测评新方法#

谷歌研究团队推出Vantage,一种基于大语言模型的创新测评方法,通过模拟真实群体互动来评估协作、创造力和批判性思维等”持久技能”,解决了传统标准化测试难以测量这些关键能力的难题。


5. 对话即办公:阿里千问上线表格 Agent,支持直接生成与编辑 Excel#

阿里千问上线表格 Agent功能,用户通过自然语言对话即可直接生成、检索和编辑 Excel 文件,实现从”文本答案”到”直接成果”的跨越,大幅降低表格处理门槛。


6. 阿里巴巴首款具身机器人曝光:高德具身业务部将发布四足机器人#

阿里巴巴旗下高德具身业务部即将发布首款硬件产品——四足机器人,这是阿里集团首款具身机器人,标志着高德在具身智能领域布局加速,此前已发布自研导航与操作基座模型实现”双SOTA”表现。


📦 开源 TOP 项目#

1. jamiepine/voicebox#

Voicebox 是一款基于 TypeScript 开发的开源语音合成工作室,GitHub 获 19,044 Star 和 2,194 Fork,致力于为用户提供高质量的 AI 语音生成与编辑工具。


2. Yeachan-Heo/oh-my-codex#

OmX 是一款基于 TypeScript 的开源工具,为 codex 添加 hooks、智能体团队、HUD 等扩展功能,GitHub 获 1.6 万星标,旨在增强代码交互体验。


3. HKUDS/DeepTutor#

DeepTutor 是一款基于 Agent-Native 架构的个性化 AI 学习助手,通过多智能体协作实现深度知识辅导,GitHub 获 1.7 万星标,成为教育 AI 领域热门开源项目。


💬 社媒分享#

1. 很难想象微软到现在才推出这个 AI 操作 Word 的功能,还没 Anthropic 快😂 不过没关系,Gemini 还不能操作 Google Docs(只读,如果我没记错的话)#

微软终于推出AI直接操作Word文档的功能,支持追踪修改和添加批注,但进度已落后于Anthropic,而Gemini目前仍无法编辑Google Docs。


2. RT 响马: 没有谁该 first,至少很长一段时间,AI 和人类在开发中的关系,是结对关系。谁也离不开谁。 哪种完全撒手让 AI 从头干到尾的,看起来很潮,实际上是执…#

AI 与人类在开发中应是结对关系,而非完全放手让 AI 独干;后者看似新潮,实则暴露执行者缺乏清晰目标与过程理解,对 AI 产出盲目满意。


AI Daily · 每天一篇AI新鲜事 (2026.04.17)
https://ldwai.cn/posts/202604/20260417/
作者
刘大文Daven
发布于
2026-04-17
许可协议
CC BY-NC-SA 4.0