1965 字
10 分钟
AI Daily · 每天一篇AI新鲜事 (2026.05.12)

今日摘要#

OpenClaw发布 AI风险引关注 粤新增AI服务 预测AI致失业 支付宝AI代买

AI周报音乐舞蹈拆分流匹配蒸馏开源机器人自学狼人杀规则

AI服务新增购物代买电池支持店小蜜发布失业预测

AI开源项目与开发工具合集

Agent Pet依赖MCP可能干扰任务执行AI工作方式引争议Yuri尤栗首次线下演出唢呐合奏效果佳

🚀 产品与功能更新#

1. Linux 内核首现 AI 亲笔驱动!AMD 芯片组温度监控迈入“智造”时代#

Linux内核代码库首次正式接纳由AI生成的代码,完成关键驱动补丁集成。此举标志着人工智能在系统底层开发中从概念验证转向实质应用,为开源协作与硬件适配开辟了新路径。


2. OpenClaw终于长出手和眼!Peter正式发布Peekaboo v3,一日三更#

OpenClaw 通过发布 Peekaboo v3 工具,为其 AI 系统注入了视觉与操作能力,现在能直接读取屏幕信息、触发界面元素并控制桌面环境。该版本迅速迭代,一日之内完成三次更新,显著提升了 AI 在真实计算场景中的交互水平。


3. 福耀科技大学正式开设五个新兴本科专业,未来机器人、人工智能等#

福耀科技大学获批新增五个前沿本科招生方向,聚焦未来机器人、人工智能等战略新兴领域。这些专业紧密对接科技发展趋势,旨在培养兼具创新能力与实践素养的跨学科人才。


🔬 前沿研究#

1. 2026.05.11 | 音乐驱舞拆分专家;流匹配蒸馏全科状元#

人工智能生成内容领域取得新进展。音乐驱动舞蹈技术通过运动与外观级联专家模型,实现了更自然流畅的舞蹈视频合成。同时,流匹配方法结合知识蒸馏策略,在多任务基准测试中表现优异,为全场景应用提供了高效解决方案。


2. 【周末特辑】5月第2周最火AI论文 | MolmoAct2开源机器人大脑;长文狼人杀自练暗规则#

最新一周的AI前沿研究聚焦于机器人智能与策略学习。其中,MolmoAct2作为面向真实世界部署的开源动作推理模型,显著提升了机器人执行复杂任务的能力。同期,利用长文本交互自动学习规则的狼人杀游戏研究,也为智能体在动态环境中的策略适应提供了新思路。


🌐 行业展望与社会影响#

1. 火山引擎发布业界首个Agent套餐包:整合多模态模型与联网工具#

火山引擎近期推出业内首个Agent套餐包,该方案通过整合多模态AI模型与联网工具,推动应用从编程辅助向通用智能体演进。它突破了传统订阅模式的限制,深度结合自研技术,加速智能体在多元场景中的落地,为AI领域开辟了新方向。


2. Linux 内核首现 AI 亲笔驱动!AMD 芯片组温度监控迈入“智造”时代#

近日,Linux 内核正式整合了首个由人工智能编写的驱动程序代码,即 prom21-xhci 补丁,专门用于实时监控 AMD 芯片组温度。此举标志着 AI 生成的代码 从实验阶段迈入系统底层实用化,不仅填补了硬件监控的空白,更推动开源生态向智能化演进,为技术发展注入新动能。


3. Google 升级 Gemini API 文件搜索:多模态 RAG 能力实现全方位跨越#

谷歌为其 Gemini API 的文件搜索工具带来重要升级,大幅增强了面向开发者的多模态 RAG能力。此次更新突破了单一文本检索的框架,将人工智能对图像及复杂文档的理解与整合提升到新层次,为构建更强大的企业级人工智能应用奠定了关键基础。


4. ​佛罗里达州立大学枪击案受害者家属起诉 OpenAI,称 ChatGPT 助长犯罪#

围绕一起校园枪击案的争议升级,受害者家属对ChatGPT的开发商提起诉讼。指控指出,这款人工智能聊天机器人被卷入案件,其生成内容被质疑与暴力事件存在不当关联。诉讼核心在于探讨AI工具在极端事件中可能扮演的角色及其引发的责任边界问题,引发了科技伦理与法律责任的激烈讨论。


5. Linux内核首个AI生成驱动诞生:由Codex GPT-5.5辅助开发,支持AMD芯片组温控#

5月11日,Linux内核正式引入首款明确标注AI生成代码的硬件驱动prom21-xhci。该驱动由开源开发者Jihong Min牵头,核心代码借助Codex GPT-5.5工具生成,主要实现对AMD芯片组温度的精准管控。这一进展充分表明,AI技术已开始深入系统级底层软件的开发流程。


6. 支付宝“AI付”发布新能力,支持淘宝AI购物实现“AI代买”#

支付宝的AI付功能近期进行了重要更新,正式推出面向委托代办场景的智能支付服务。用户可通过“一次指令、一次授权、用完失效”的流程,在接入通义千问的淘宝AI购物中,设定目标由AI完成低价代买。该服务旨在将复杂或重复的支付事项,如周期缴费、自动还款等,通过AI代理实现自动化处理,简化用户的操作流程。


📦 开源 TOP 项目#

1. yikart/AiToEarn#

一项开源项目提出了利用人工智能创造收益的新途径。该项目以 AiToEarn 为核心理念,旨在探索AI在收益领域的应用潜力。技术上主要采用TypeScript进行构建,并凭借其创新性获得了开源社区的广泛关注。


2. jundot/omlx#

针对Apple Silicon的LLM推理服务器优化方案,通过连续批处理与SSD缓存技术提升计算效率,并集成macOS菜单栏实现便捷管理。该工具为本地大模型部署提供了高效且易用的性能支持。


3. tinyhumansai/openhuman#

OpenHuman是一个开源个人AI超级智能平台,专注于隐私性、简洁设计与卓越性能。该系统基于Rust语言开发,保障了高效与安全性,目前在GitHub上已获得超过1400个星标和近200个分叉,彰显了其在开发者社区中的广泛关注与活跃参与。


💬 社媒分享#

1. http://x.com/i/article/2053376950094249984#

新发布的Sora模型展现出超越文生视频的深层潜力。其核心突破在于能够模拟物理世界的交互规律与物体状态,这标志着其对真实环境具备了初步的推演与理解能力。这项能力将为需要环境感知的通用智能体发展,开辟全新路径。


2. RT Hwang: http://x.com/i/article/2053813863792140288#

RT Hwang 所引发的广泛关注,凸显了特定科技观点或行业动态在专业社区内的快速传播。这一现象表明,相关讨论内容触及了当前技术领域的焦点或争议,能够迅速吸引同行及观察者的注意力,其背后的观点碰撞值得深入审视。


AI Daily · 每天一篇AI新鲜事 (2026.05.12)
https://ldwai.cn/posts/202605/20260512/
作者
刘大文Daven
发布于
2026-05-12
许可协议
CC BY-NC-SA 4.0