今日摘要
科技领域创新实践与前沿思考
5月第2周AI论文特辑涵盖开源机器人与AI游戏学习
AI技术多维突破涵盖解释性数学法律及游戏
涵盖机器学习代理记忆工具DNS网络和3D技术
Yuri尤栗首次线下演出成功后用GPT Image Prompt生成水墨风格Slides
🚀 产品与功能更新
1. ChatGPT 5.5 Pro一小时搞定博士级数学难题,AI原创能力已进化到这种地步?
近日,菲尔兹奖得主蒂莫西·高尔斯通过未公开版本的AI工具,在极短时间内解决了一道悬而未决的组合数学难题。这一突破表明,人工智能在复杂数学推理与AI原创能力层面已逼近专业学者水平,或将深刻改变基础科学的研究范式与协作方式。
2. 浙大推出让AI会「导演」的角色扮演框架!四通道消息沉浸式交互|ACL 2026
角色扮演框架通过四通道消息机制,为AI赋予了“导演式”的交互能力。该框架让AI不仅能扮演角色,还能像导演一样主动调度和推进剧情,从而在复杂叙事中实现更沉浸、更具掌控感的对话体验。
3. DeepSeek塞进苹果本儿,分币不花实现“龙虾自由”
在智能代理应用中,token消耗成本高昂,重度用户月支出常达数万元。开发者开源了DeepSeek本地化方案,只需一台苹果笔记本即可部署,彻底免除额外费用,实现“龙虾自由”,让用户能无限执行任务,显著降低运营成本。
🔬 前沿研究
1. 【周末特辑】5月第2周最火AI论文 | MolmoAct2开源机器人大脑;长文狼人杀自练暗规则
在5月第2周的AI前沿研究中,开源机器人大脑MolmoAct2成为焦点,其动作推理模型专为真实场景部署设计,大幅提升机器人在复杂环境中的操作与决策能力。同时,论文还涵盖长文狼人杀游戏中暗规则的自动学习等创新实验,展现了AI在复杂交互领域的应用潜力。
🌐 行业展望与社会影响
1. Cloudflare 因 AI 效率提升裁员 1100 人,收入却创历史新高
科技公司Cloudflare宣布裁员约20%,约1100人。此次调整旨在通过AI效率提升优化运营结构。尽管人员规模缩减,该公司近期营收反而创下新高,延续了科技行业“增长与裁员并行”的趋势。
2. 百度发布文心大模型5.1:搜索能力位居国内首位,预训练成本仅为业界6%
百度推出全新基础大模型文心大模型5.1,其在中文搜索能力上位列国内第一,同时将预训练成本大幅降低至行业平均水平的6%,展现出卓越的性价比。目前,该模型已面向企业级用户与开发者全面开放。
3. 暴涨981%!三七互娱投资智谱“大获全胜”,游戏巨头正集体押注AI下半场
2026年第一季度,三七互娱凭借对智谱的投资,录得高达3.59亿元的收益,同比飙升超过981%。这笔惊人的回报,直观印证了资本市场对顶尖AI资产的激烈追捧,也标志着传统游戏巨头正将战略重心明确转向AI技术领域,以抢占未来发展的制高点。
4. 马斯克诉OpenAI案庭审现场,一份 2017 年的总裁日记揭开了哪些秘密?
在加州奥克兰法院,马斯克与OpenAI的法律对决正式进入庭审阶段,OpenAI总裁格雷戈里·布罗克曼连续两日出庭作证。其2017年的总裁日记被作为关键证据当庭出示,披露了公司初创时期的诸多隐秘信息,成为案件焦点。
5. 梁文锋豪掷 200 亿!DeepSeek启动 500 亿创纪录融资,V4. 1 定档 6 月
国内大模型公司 DeepSeek 正筹划首轮大规模融资,拟筹集高达500亿元人民币,若成功将创下行业单轮融资新高。该公司以颠覆性定价策略著称,创始人梁文锋据报也将投入200亿。与此同时,其新一代模型V4.1已定于6月发布,显示出在激烈的技术与资本竞赛中加速冲刺的战略意图。
6. ChatGPT 5.5 Pro:一小时破解博士级数学难题,AI 数学能力再创高峰
菲尔兹奖得主蒂莫西·高尔斯教授试用未发布的 ChatGPT 5.5 Pro 时,这款模型在一小时内攻克了一个组合数学领域的开放性难题。这一突破性表现迅速引发学界热议,标志着 AI数学能力 迈入了处理复杂研究问题的新阶段。
📦 开源 TOP 项目
1. datawhalechina/easy-vibe
在GitHub上广受关注的vibe coding 2026是一款专为编程新手设计的现代教程,采用JavaScript语言,通过系统化的逐步指导帮助用户从基础开始掌握编程技能。该课程仓库已获得超过9000颗星和近900次分叉,彰显其在初学者社区中的高人气和实用价值。
2. masterking32/MasterDnsVPN
这款工具利用DNS隧道技术,在受限制的网络环境中建立隐蔽通信通道。它通过优化数据传输效率与连接稳定性,实现了低开销的可靠数据传输,并提升了在复杂网络条件下的适应性。
3. playcanvas/supersplat
由PlayCanvas团队推出的这款开源编辑器,专注于3D高斯泼溅这一前沿渲染技术。采用TypeScript语言开发,项目在GitHub上已获得超过6700颗星,表明其受到开发者社区的高度关注,为创建和编辑高质量的三维辐射场提供了高效工具。
💬 社媒分享
1. http://x.com/i/article/2053376950094249984
量子计算正从实验室走向产业化的关键阶段。量子计算 通过特定算法的示范性应用,已展现出超越传统超算的潜力。当前挑战集中于硬件稳定性与纠错技术,但云平台访问降低了研究门槛,推动了跨领域合作与创新生态的形成。
2. GPT Image 2 Prompt:水墨风格 Slides/PPT 可以把下面的提示词模板发给 Agent,让 Agent 帮你生成每一页 Slides 的画图 Prompt,Codex 这样有画图能力的直接出图…
通过AI Agent与图像生成模型的协作,用户现可高效制作具有水墨风格的幻灯片。该流程的核心在于利用水墨风格的提示词模板,由Agent为每页PPT自动生成对应的绘图指令,进而驱动Codex等具备视觉创作能力的AI工具直接产出图像,极大简化了传统设计流程,实现了风格化演示文稿的自动化创作。