1600 字
8 分钟
AI Daily · 每天一篇AI新鲜事 (2026.04.16)

今日摘要#

AI投毒与蒸馏成打工人新日常,Meta 24小时炼化老板,OpenAI阴阳Claude泄露内部信,PRM-as-a-Judge革新具身评测

WildDet3D、FORGE、文本频率定律、群体外挂、RL模板病、Video-MME-v2、Claw-Eval等AI前沿技术密集突破,涵盖3D检测、工业模型、编程、多模态评估与可信代理审计

AI产业加速全球布局,技术突破与人身安全事件交织,数字人应用引发社会关注

Anthropic 发布 Claude 官方教程库,语音克隆、AI 播客、设计系统及多智能体框架等开源项目受关注

社媒分享功能引发争议,多款AI工具被曝技术依赖或额度消耗异常,设计能力获认可

🚀 产品与功能更新#

1. 二元成功率已经过时!PRM-as-a-Judge才是你需要的具身操作评测框架#

针对具身操作任务从短程单步向长程复杂演进的需求,研究团队提出PRM-as-a-Judge轨迹级评测框架,突破二元成功率局限,实现过程质量评估与细粒度失败定位,为机器人策略优化提供更精准的反馈信号。


2. OpenAI 确定英国永久总部:2027 年启用,可容纳超 500 名员工#

OpenAI确定英国首个永久总部落户伦敦国王十字区,预计2027年启用,可容纳544名员工,标志其海外业务进入稳定扩张期,并将强化该区域”全球AI中心”地位。


3. 日本 Rapidus 正式启用 10 倍 AI 芯片生产效率封装线,力争赶超台积电#

日本半导体制造商 Rapidus 正式启用新型封装试产线,采用 600mm×600mm 玻璃基板技术使 AI 芯片中介层产量提升十倍,同步启用 2nm 晶圆厂分析中心,加速追赶台积电。


🔬 前沿研究#

1. 【周末特辑】4月第1周最火AI论文 | FIPO破推理长度瓶颈;CARLA-Air空地仿真合一#

本周AI论文聚焦两大突破:FIPO通过未来KL影响策略优化破解大模型推理长度瓶颈,CARLA-Air实现空地仿真环境统一,为无人机与自动驾驶协同研究开辟新路径。


2. 2026.03.31 | 任务对齐提效TAPS;AI科研自治写医学论文#

本期聚焦两大突破:TAPS通过任务感知提议分布优化推测采样效率,以及AI科研自治系统实现医学论文全流程自动化生成,推动AI从工具向自主科研主体演进。推测采样技术成为大模型推理加速的关键路径。


🌐 行业展望与社会影响#

1. 性价比之王:微软开源 Phi-4-reasoning-vision-15B,主打轻量化多模态推理#

微软开源15B参数多模态推理模型Phi-4-reasoning-vision-15B,以200B token轻量训练实现高性能低成本平衡,为资源受限场景的视觉推理任务提供高效解决方案。


2. 软银等巨头联手成立新公司 计划打造日本 AI 基础模型#

软银、NEC、本田和索尼等日本企业联合成立”日本 AI 基础模型开发公司”,计划汇聚约100名开发人员打造AI基础模型,旨在应对中美领先局面,获政府及多家银行支持投资。


3. 日本 AI “国家队”正式集结!软银、索尼、本田联手,豪掷万亿日元打造国产大模型#

日本AI”国家队”正式成军,软银、索尼、本田等巨头联合成立新公司,应征政府国产AI开发项目,未来五年有望获1万亿日元财政支持,计划集结百名顶尖人才打造自主大模型。


4. 日本 Rapidus 正式启用 10 倍 AI 芯片生产效率封装线,力争赶超台积电#

日本半导体制造商 Rapidus 正式启用新型封装试产线,采用 600mm×600mm 玻璃基板技术使 AI 芯片中介层产量提升十倍,同步启用 2nm 晶圆厂分析中心,加速追赶台积电。


5. 紫荆智康发布“紫荆AI医院”虚拟诊室,支持医生构建专属分身智能体#

紫荆智康发布紫荆AI医院虚拟诊室,支持医生构建专属分身智能体,与AI患者智能体进行全流程模拟诊疗,实现诊疗决策的数字化沉淀与同步进化。


6. 小鹏 GX 技术发布会定档 4 月 15 日:首发图灵芯片与线控转向#

小鹏汽车宣布小鹏 GX 技术发布会定档4月15日,新车将首发搭载4颗自研图灵AI芯片及博世新一代线控转向系统,从安全、底盘、智驾、空间四大维度重塑新科技旗舰标准。


📦 开源 TOP 项目#

1. tobi/qmd#

qmd 是一款基于 TypeScript 的本地 CLI 搜索工具,专为文档、知识库和会议笔记设计,在完全本地运行的同时追踪当前最优技术方案。


2. jqlang/jq#

jq 是一款用 C 语言编写的命令行 JSON 处理器,GitHub 获星 3.4 万,拥有 1761 个分支,是处理 JSON 数据的高效工具。


3. zai-org/GLM-OCR#

GLM-OCR 是一款基于 Python 开发的 OCR 工具,以准确、快速、全面为核心优势,GitHub 获 5136 Star 和 450 Fork,适用于多场景文档识别需求。


💬 社媒分享#

1. Re 澄清一下,这个选项默认确实是关闭的,所以我不认为作者是恶意启用这个功能,可能只是bug或者我自己修改配置导致的#

作者澄清该选项默认处于关闭状态,因此不认为开发者是恶意启用此功能,推测可能是bug或个人配置修改所致。


2. 昨天在测试一款 Markdown 编辑器,结果发现我的 claude code 5小时额度很快没了,一开始我没联系起来,还在想是不是我自己用多了,然后刚才用 claude —resume …#

用户测试Markdown编辑器时,Claude Code的5小时额度被迅速耗尽,后发现该软件在后台静默调用CLI分析所有Markdown文档,用户对此缺乏感知感到担忧。


AI Daily · 每天一篇AI新鲜事 (2026.04.16)
https://ldwai.cn/posts/202604/20260416/
作者
刘大文Daven
发布于
2026-04-16
许可协议
CC BY-NC-SA 4.0