1976 字
10 分钟
AI Daily · 每天一篇AI新鲜事 (2026.05.23)

今日摘要#

科技巨头AI布局动态 马斯克重组xAI 黄仁勋称基建投入万亿 B站AI赋能广告 Firefox新增AI开关 DeepSeek代码工具将上线

多模态大模型技术进展包括地理内化推理优化降噪幻觉与数据增效

科技新闻B站AI盈利Firefox重构DeepSeek上线Spotify音频Meta和解

byJoey/cfnew

DeepSeek永久折扣团队招人Codex优化应用

🚀 产品与功能更新#

1. 让智能体看见世界:CV × AI Agent 的行业场景新实践| 2026AI Partner·北京亦庄AI+产业大会#

计算机视觉与AI智能体的融合正在释放乘数效应,其意义远超简单的硬件叠加。真正的产业价值不在于对话交互,而在于实现静默环境感知与自主决策能力。要让智能体真正“看懂”世界并融入行业,必须跨越视觉认知与领域知识之间的鸿沟,这需要像AI Agent结合垂直大模型这样的针对性技术方案。


2. OpenAI 发布 ChatGPT for PowerPoint:一句话生成 PPT,还能主动揪 Bug#

OpenAI 近期正式推出 ChatGPT for PowerPoint 插件测试版。该功能允许用户直接通过自然语言指令,快速生成和优化演示文稿,并具备自动检查内容逻辑错误的能力,将显著改变职场 PPT 制作流程,提升协作效率。


3. B站 2026 年Q1 财报:AI赋能广告狂飙,扭亏为盈进入新纪元#

哔哩哔哩发布2026年第一季度财报,总营收达74.7亿元,同比增长7%。公司实现单季净利润2.02亿元,成功扭亏为盈,标志其商业化路径正式跑通。其中,AI驱动广告业务成为核心增长引擎,推动整体盈利进入新阶段。


🔬 前沿研究#

1. 2026.05.21 | Mega-ASR降噪减幻觉;Video2GUI数据预训练提效#

近期研究在语音识别与界面自动化领域取得进展。Mega-ASR通过大规模真实环境音频仿真,显著增强了复杂场景下的语音识别准确性,有效降低了噪声干扰与识别幻觉。与此同时,Video2GUI框架创新性地利用视频数据进行预训练,为图形用户界面任务带来了效率与性能的双重提升。这些进展共同推动了人机交互技术向更鲁棒、更高效的方向发展。


2. 2026.05.22 | 大模型内化地理空间;判别性令牌优化推理#

大模型正加速融入对物理世界的认知,开始内化处理地理空间信息。同时,通过优化输入表征,其推理过程也在变得更高效、更具判别性。


🌐 行业展望与社会影响#

1. OpenAI 发布 ChatGPT for PowerPoint:一句话生成 PPT,还能主动揪 Bug#

职场人制作演示文稿的繁琐流程正迎来变革性工具。OpenAI最新推出的ChatGPT for PowerPoint插件,将AI助手深度集成至办公软件中,用户仅需输入简单指令即可自动生成幻灯片,其内置的纠错功能还能实时优化内容逻辑与格式。这标志着生成式AI从对话场景向生产力工具的关键跨越。


2. 你的专属 AI 电台上线!Spotify 发布 Studio 桌面端应用,开启“生成式音频”新纪元#

Spotify正式推出独立桌面应用Studio,标志着其核心定位从传统音频播放器向生成式音频平台的战略性跨越。该应用作为其AI战略的关键载体,整合了AI翻唱等创作功能,旨在将平台重塑为音频内容的智能创作与生成中心。


3. 图灵测试尘埃落定:GPT-4. 5 胜率超真人,AI学会了完美撒谎#

近期一项研究证实,在模拟人类对话能力上,图灵测试这一经典基准已被最新AI模型突破。实验显示,GPT-4.5在测试中的表现已能超越真人参与者,这标志着AI在复杂语言交互与人性化模拟上达到了一个全新的里程碑。


4. AI Coding 工具的未来:得物如何突破数仓开发的痛点#

得物通过AI Coding工具优化数仓开发流程,显著提升了重复性任务的处理效率。在实际落地中,团队仍面临模型指令执行偏差、领域知识融合不足等挑战,需通过人机协同与持续调优来完善,推动开发效能的进一步跃升。


5. 业绩新高下的“冰冷”转型:渣打发布战略裁员近 8000 人,用 AI 替代低价值人力#

渣打集团近期宣布启动战略转型,计划通过裁减近8000个岗位并大规模部署人工智能技术,对人力结构进行深度优化。此举旨在提升运营效率,聚焦高价值业务,以支持其2030年将有形股东权益回报率提升至18%的长期增长目标。


6. Firefox 启动“Project Nova”重构:新增一键关闭 AI 功能开关#

Project Nova 是浏览器 Firefox 即将启动的一次全面视觉重构,旨在实现界面现代化并提升用户隐私与自主权。此次更新将重点优化生产力体验,其中一项关键设计是提供集中管理的开关,使用户能便捷地统一禁用所有AI相关功能。


📦 开源 TOP 项目#

1. alireza0/s-ui#

该工具是一款高级Web面板,专为 SagerNet 和 Sing-Box 核心设计。其基于 Go 语言开发,提供了现代化的图形化管理界面。该项目已在开发者社区中获得广泛关注,收获超过九千星标。


2. dotnet/skills#

针对AI编码代理在.NET与C#开发中的效能提升,一个专注于提供编码辅助功能的技能库 在GitHub上受到开发者广泛关注。该项目通过集成多种工具资源,帮助优化编程流程,目前已获得2521颗星标和198次分叉,展现了其在技术社区中的实用价值。


3. byJoey/cfnew#

GitHub项目 cfnew 凭借其高关注度,在技术社区获得了显著影响力。该项目已累计获得超过1.3万星标,吸引了逾六千名开发者参与协作,其流行度充分体现了业界对它的广泛兴趣与认可。


💬 社媒分享#

1. RT 木马人2.0: 感谢宝玉老师 @dotey 的分享 我给大家分享一下具体步骤,3步搞定: 1. 安装 Codex 和 Chrome 插件: Codex:直接官网下载安装即可 Chrome插件:点…#

RT木马人2.0提供了一套极简的远程控制解决方案。用户仅需三步即可快速配置:安装Codex主程序、添加并启用专用Chrome浏览器插件,最后确认插件状态为已连接。该方案旨在让复杂技术的部署变得高效易行,极大降低了使用门槛。


2. OpenAI 今天发了一波 Codex 更新。 【1】Appshots:把屏幕上的东西直接发送到 Codex Mac 上同时点击左右 Command 键(这个快捷键在设置里面能修改),就能把当前…#

OpenAI 针对 Codex 平台推出重要功能升级。此次更新的核心亮点在于全新的 Appshots 功能,它允许用户通过快捷键一键截取当前应用窗口,并将截图及其中的文本内容直接发送至 Codex 进行处理,极大提升了人机交互与任务提交的效率。


AI Daily · 每天一篇AI新鲜事 (2026.05.23)
https://ldwai.cn/posts/202605/20260523/
作者
刘大文Daven
发布于
2026-05-23
许可协议
CC BY-NC-SA 4.0