2084 字
10 分钟
AI Daily · 每天一篇AI新鲜事 (2026.05.26)

今日摘要#

AI安全指引价格降治理严自动化火融入日常

本周特辑热门AI论文聚焦CiteVQA归因幻觉及代码智能体框架

AI行业动态涵盖标准制定价格调整内容治理科研突破与企业策略

开源项目涵盖加密品味技能免费应用优化内容知识插件

Agent Harness重在基于成熟方案做应用而非自建底层并关注任务进度管理与追踪功能

🚀 产品与功能更新#

1. Codex自我蒸馏玩法火了!OpenAI员工亲授:复制粘贴就能让AI消灭重复劳动#

近日,一种名为自我蒸馏的AI应用技巧引发开发者社区热议。该方法允许用户通过一个提示指令,使Codex自动分析历史交互记录,识别用户频繁进行的手动操作,并将其整合为可重复调用的自动化工具。这一实践显著提升了AI处理重复性任务的效率,展现了其在优化工作流方面的潜力。


2. 国家标准委发布《AI伦理安全指引1.0》,为大模型落地装上“安全闸”#

全国网络安全标准化技术委员会联合头部科技企业及科研机构,正式发布《人工智能应用伦理安全指引1.0》。该文件为技术研发与应用提供了明确的伦理安全规范,标志着我国人工智能应用伦理安全指引1.0建设正从宏观倡议向具体技术标准扎实落地,为产业健康发展设立了关键护栏。


3. 人类56年解不出,谷歌AI一夜连破9道世纪难题!#

谷歌DeepMind最新推出的谷歌AI数学智能体取得突破性进展,一举破解了9道长期未解的数学世纪难题,其中最老的一道已困扰学术界56年之久。所有证明均经形式化验证,标志着人工智能在复杂数理推理上迈出了关键一步。


🔬 前沿研究#

1. 【周末特辑】5月第4周最火AI论文 | CiteVQA揭示归因幻觉;代码成为智能体框架#

本期前沿研究显示,面向文档智能的 CiteVQA 基准测试,正系统性地揭示当前模型在证据归因环节存在的“幻觉”风险。与此同时,代码正超越单纯工具属性,演进为构建与驱动智能体的核心架构。这两项进展共同指向AI系统向更可靠、更自主方向发展的关键路径。


🌐 行业展望与社会影响#

1. 高德“问店选址”Skill接入钉钉悟空,AI赋能商家开店决策#

高德问店选址智能助手已集成至钉钉悟空技能广场,为连锁加盟及中小商家提供AI驱动的选址方案。通过自然语言对话,该工具可实时推荐位置、评估点位并对比数据,同时生成结构化立项报告,将传统依赖人工蹲点的流程智能化,显著提升开店决策的效率与科学性。


2. 国家标准委发布《AI伦理安全指引1.0》,为大模型落地装上“安全闸”#

近日,我国正式发布《人工智能应用伦理安全指引1.0》,标志着AI治理从理念倡导进入标准化落地阶段。该文件由产业界与学术界共同制定,为大模型的可靠应用构建了系统性规范,有助于在技术创新与安全可控之间建立平衡,推动行业健康有序发展。


3. 面壁智能联合清华大学发布中国首个1.58-bit大模型BitCPM-CANN#

最新发布的三值大模型BitCPM-CANN,由面壁智能与清华大学联合团队基于华为昇腾平台训练完成,是中国首个该比特级别的开源模型。该成果在低比特大模型训练领域实现关键突破,标志着三值大模型研发与硬件适配取得重要进展。


4. OpenAI斥巨资在新加坡建实验室,开启首个海外AI大本营#

OpenAI携手新加坡政府,在其本土外首个海外应用人工智能实验室正式落户狮城,投资额达2.34亿美元。这一布局标志着公司全球战略的深化,实验室未来将围绕核心战略方向,推动AI技术的本地化创新与区域合作。


5. 蚂蚁灵波LingBot-VA论文被机器人顶会RSS2026接收,让机器人边推演、边行动#

蚂蚁灵波科技与香港科技大学联合提出的因果世界模型研究成果,已被机器人顶会RSS2026收录。该技术突破使机器人具备边推演边行动的能力,显著提升复杂任务执行效率。这一进展标志着机器人智能控制领域的重要创新。


6. 谷歌重拳治理“AI 投毒”:GEO 垃圾内容将遭降权与移除#

谷歌近期强化了对搜索生态的治理,明确将生成式引擎优化(GEO)中的恶意操纵行为界定为“垃圾内容”。新规旨在打击通过预编信息污染数据流、误导AI生成结果的违规行为,涉及相关操作的网站与内容将面临搜索排名降权甚至移除的处置,以保障信息的真实与准确。


📦 开源 TOP 项目#

1. hardikpandya/stop-slop#

stop-slop 这一 GitHub 项目为写作者提供了实用技能文件,专注于从文本中剥离 AI 生成的生硬特征,让散文更显自然流畅。凭借其创新功能,它已在开发者社区引发热议,收获逾四千星标和近四百次分支,凸显了市场对提升内容人性化工具的旺盛需求。


2. anthropics/knowledge-work-plugins#

知识工作插件库是一个面向内容创作者和知识工作者的开源项目,旨在扩展Claude Cowork的应用功能。该项目基于Python构建,以超过1.5万的星标和近两千次分支,展现了开发者社区对其协作工具增强潜力的高度关注。


3. earendil-works/pi#

AI agent toolkit 为开发者提供了一套完整的智能体开发环境,涵盖从命令行编码助手、统一的大模型接口,到终端及网页图形界面库与Slack机器人集成等多种模块。该项目采用TypeScript构建,凭借其全面的功能与活跃的社区支持,已在GitHub上获得极高关注。


💬 社媒分享#

1. 去做一个 Agent Harness 这种事情价值不大了,怎么做也做不过模型公司,模型一升级好多活都白干了。 但是基于成熟的 Agent Harness 去做方案,大有可为。 MCP 只…#

开发通用型智能体框架的价值正逐渐收窄,独立研发者难以与大模型企业竞争,技术迭代易造成开发资源浪费。然而,依托成熟框架构建垂直领域智能方案则潜力巨大。现有协议解决了基础连接与知识注入问题,但在行业适配、流程整合与长期维护等方面,仍存在广阔的创新空间。


2. 一个正在进行中的 /goal 任务,如何知道进展如何了?如何暂停、继续、添加更新? 有时候一个长任务,执行很久了,也不知道进展如何了,这时候可以借助 /side 指…#

当前长时间运行的任务管理可通过/side指令实现动态监控与交互。用户能在不中断主进程的前提下,随时查询进度、暂停或恢复任务,并实时添加更新指令。该机制通过独立会话同步上下文,有效解决了传统模式下任务执行“黑箱化”的问题,提升了复杂操作的可控性与透明度。


AI Daily · 每天一篇AI新鲜事 (2026.05.26)
https://ldwai.cn/posts/202605/20260526/
作者
刘大文Daven
发布于
2026-05-26
许可协议
CC BY-NC-SA 4.0