2038 字
10 分钟
AI Daily · 每天一篇AI新鲜事 (2026.05.14)

今日摘要#

AI周报字节腾讯视觉生成新突破应用门槛再降AIGC峰会来袭

数学家闭门考大模型同时生图模型千字成画

AI领域动态:模型升级、人才竞争、财务表现亮眼

智能体科学技能音频优化区块链规范工具

Claude Code订阅更新字幕SRT制作技巧游戏项目幕后故事创作心法方法论

🚀 产品与功能更新#

1. 软银因 OpenAI 股权增值,利润激增至 116 亿美元!这背后有哪些秘密?#

软银集团本季度利润飙升至116亿美元,同比增幅超两倍。这一亮眼表现主要归功于其持有的OpenAI股权价值大幅上扬。作为人工智能领域的领头羊,该公司的技术突破与商业化前景持续推高其估值,从而为软银带来了可观的投资回报。


2. 微信聊天记录喂AI(腾讯官方版)#

腾讯官方推出新工具,可将微信聊天记录作为本地AI训练素材。该方案支持用户在设备端直接处理数据,生成个性化智能助手,有效解决海量对话记录难以结构化利用的痛点,兼顾了实用性与隐私安全。


3. 失控的风险:OpenAI 前研究员揭露人工智能“公开的秘密”#

人工智能领域正面临一场失控危机。行业在缺乏充分理解与控制的前提下展开无序竞赛,构建日益强大的系统。当前最核心的挑战在于“对齐问题”,即如何确保AI的行为始终符合人类意图与价值。这种对安全基石的忽视,可能让技术发展偏离可控轨道,酿成不可预测的风险。


🔬 前沿研究#

1. 2026.05.12 | 数学家闭门出题考倒大模型;生图模型千字提示精准成画#

数学家构建了Soohak这一高难度测试集,旨在评估大语言模型在前沿研究级数学问题上的真实推理能力,结果显示当前模型仍面临显著挑战。与此同时,图像生成领域取得进展,模型现在能够依据极为冗长、细节丰富的文本提示,创作出高度吻合描述的视觉作品。这两项进展分别聚焦于模型的逻辑严谨性与创意精确度。


🌐 行业展望与社会影响#

1. 警惕“股权代持”陷阱:Anthropic 官方点名多家非法份额交易平台#

Anthropic 官方近日发出严正警示,揭露市场中存在大量以 股权代持 为名的非法投资平台,这些平台声称提供其公司股份却未获任何授权。在人工智能赛道持续升温的背景下,此类骗局利用投资热潮设陷,投资者应通过正规渠道核实信息,避免财产受损。


2. 小米MiMo登顶OpenRouter全球调用量榜首,国产大模型首次问鼎#

近期,在全球AI模型API聚合平台OpenRouter的调用量榜单上,小米MiMo跃居首位,成为首个在该维度登顶的国产大模型。过去一个月,其累计完成1.45万亿次Token调用,在超过300个模型的激烈角逐中胜出。该模型采用端云协同架构,着重提升了推理效率与性能表现。


3. 腾讯云:部分DeepSeek模型升级及切换安排公告#

腾讯云将于2026年5月22日起,对其智能体开发平台所搭载的DeepSeek系列模型进行版本迭代。此次升级主要涉及DeepSeek-V3-0324、V3.1-Terminus以及R1-0528三款模型,平台用户需关注后续的兼容性说明及配置调整指南。


4. Rivian 智能车载助手正式上线:深度集成与第三方生态联动#

Rivian 近日向用户推送了基于自研统一智能系统的全新车载语音助手。该AI助手面向订阅了Connect Plus服务的车主开放,月费为15美元,其突出特点在于能深度整合车辆控制功能并支持与第三方应用生态进行交互。


5. 普渡机器人发布 PuduFM 1.0 与 PuduAgent,开启具身智能新纪元#

普渡机器人近期在具身智能领域取得突破,发布PuduFM 1.0与PuduAgent两款重磅技术。这标志着其在环境感知、决策与执行能力上实现系统性升级,有望革新商用服务机器人的商业化路径。


6. 苹果本地 AI 强势逆袭!oMLX 0.3.9 重磅更新:Gemma 4 视觉加速 + 一键 Copilot,云端大模型优势被全面拉平#

本地AI生态正迎来关键跃进。oMLX框架最新版本通过优化图文处理速度与集成便捷的Copilot功能,显著增强了在苹果设备上运行大模型的效率与易用性。这不仅提升了端侧性能,也让本地体验开始具备与云端服务抗衡的实力,预示着移动AI计算格局的深刻演变。


📦 开源 TOP 项目#

1. github/spec-kit#

GitHub 社区近期涌现了一款名为 spec-kit 的 Python 工具包,旨在降低规范驱动开发的实践门槛。该项目自发布以来热度极高,已获得超过 9.8 万个星标与 8500 余次分叉,显示出开发者对系统化开发方法的强烈兴趣。它通过提供标准化的启动脚手架,帮助团队更高效地落实代码规范与设计先行理念,从而提升项目质量与协作效率。


2. K-Dense-AI/scientific-agent-skills#

近日,一套基于Python的智能体技能工具集在技术社区引发广泛关注。该集合专为研究、科学、工程、分析、金融及写作等专业领域设计,提供即开即用的解决方案,助力用户提升工作效率。自开源以来,在GitHub平台上已积累超过2.1万星标和2300余次分叉,彰显了其在开发者中的高度认可度。


3. supertone-inc/supertonic#

这款名为本地化多语言TTS的语音合成引擎,以极致运行效率与设备端原生执行为核心优势。其技术栈采用ONNX推理框架与Swift语言深度整合,实现了多语种文本的实时高质量转换。开源社区反响热烈,已吸引超四千名开发者关注,为移动端及边缘计算场景提供了低延迟的语音交互解决方案。


💬 社媒分享#

1. Codex App 可以当 Typeless 用,开启全局快捷键设置正确权限后就可以在任意输入位置语音输入,效果还不错。 比如说这一段文字就是Codex帮忙输入的。#

Codex App 现可扮演类Typeless的语音输入工具角色。用户仅需配置全局快捷键并授权相关权限,便能在任何文字输入区域调用语音转写功能,识别准确率令人满意。以上实测文字即由该应用语音输入生成。


2. RT Rainier: 我并不太认同,吴恩达的观点。 这个可能是AI行业在美国的一种PR。 事实上来讲,美国很多行业确实对AI大规模使用非常忧虑,阻碍了AI在美国的落地。 …#

关于AI在美国的产业化进程,业界存在分歧。有观点指出,吴恩达所描绘的乐观图景可能掺杂了行业PR宣传成分。现实情况是,美国众多行业对大规模部署人工智能抱有深层忧虑,这正成为其快速落地的阻碍。与此同时,AI技术正在导致代码等基础资源成本骤降,加速了文职等入门岗位的自动化替代。


AI Daily · 每天一篇AI新鲜事 (2026.05.14)
https://ldwai.cn/posts/202605/20260514/
作者
刘大文Daven
发布于
2026-05-14
许可协议
CC BY-NC-SA 4.0