今日摘要
Claude 4小时攻破全球安全系统,AI日曝10漏洞;清明游戏推荐多样,90后创始人道歉,短视频成瘾源于迷茫
本周AI前沿聚焦:FIPO突破推理瓶颈,CARLA-Air空地仿真融合,DataFlex灵活编排数据,智能体安全与终端轻量化并进,多模态统一与科研自治加速落地
科技巨头加速布局多模态AI与视频生成技术,融资热潮与监管争议并存,北京新增15款生成式AI服务登记
开源社区本周活跃项目涵盖多模态模型、即时通讯、编辑器插件、屏幕共享及代码管理工具
🚀 产品与功能更新
1. 最后的波折:iPhone折叠屏延期
苹果折叠屏iPhone因OPPO、vivo等国产厂商已将其核心卖点”折痕控制”做到极致而陷入尴尬,被迫延期发布,成为新系列中唯一亮点却面临鸡肋困境。
2. 告别昂贵账单,Token直降68%,多智能体动态协作编程来了
上海交通大学团队推出**多智能体动态协作编程**框架,通过智能体自主组队、动态协作,实现Token成本直降68%,让AI编程告别昂贵账单。
3. 一年一度最值得关注的AI榜单来啦!申报即日启动
第四届中国AIGC产业峰会启动年度AI榜单申报,聚焦生成式AI在产业深水区的实际落地,评选涵盖企业、产品等多维度表现,申报通道已正式开启。中国AIGC产业峰会将揭晓年度最具价值AI力量。
🔬 前沿研究
1. 2026.03.13 | 流式空间记忆2B小模型逆袭;AI“蛮力”翻页不敌人类策略
2B参数的Spatial-TTT小模型通过流式空间记忆实现视觉空间智能逆袭,而研究发现AI”蛮力”搜索在复杂导航任务中效率远不及人类策略性推理。
2. 【周末特辑】3月第5周最火AI论文 | 扩散OCR逆向渲染;世界模型交互大考
本周AI论文聚焦两大突破:MinerU-Diffusion将文档OCR重构为扩散解码的逆向渲染任务,显著提升复杂文档识别精度;Omni-WorldBench则为世界模型推出首个交互式多模态基准测试,推动具身智能发展。
🌐 行业展望与社会影响
1. 千问App上线Wan2.7视频模型:几句话搞定视频编辑和动作续写
千问App上线全新Wan2.7视频模型,支持视频编辑、续写与动作模仿三大功能,用户仅需几句话即可完成角色替换、画面修改、风格切换及剧情调整,大幅降低视频创作门槛。
2. 儿童安全联盟背后暗藏玄机:OpenAI 悄然出资引发质疑
OpenAI 秘密资助”父母与儿童安全 AI 联盟”,借儿童安全之名推动加州 AI 立法,多家组织因不知情其深度参与而退出,引发利益冲突质疑。
3. AI 搜索引擎 Perplexity 被控隐私侵犯,用户数据疑遭泄露
AI搜索引擎Perplexity因”隐身模式”被指形同虚设遭集体诉讼,用户聊天记录被曝完整共享给谷歌和Meta用于广告投放,隐私保护措施遭质疑为骗局。
4. 谷歌发布 Gemini API 新定价策略,推理服务按需计费
谷歌更新 Gemini API 计费结构,推出标准、弹性、优先、批量和缓存版五大档位,其中弹性档位利用非高峰闲置算力提供五折优惠,延迟1-15分钟,适合时间要求宽松的场景。
5. 蚂蚁GPASS再拓智能眼镜场景:一句话解锁共享单车
千问AI眼镜接入蚂蚁GPASS,用户通过语音指令即可解锁共享单车、自动还车结算,并支持停车缴费功能,实现全流程无感化出行体验。
6. 阿里通义实验室发布Wan2.7-Video视频生成模型
阿里通义实验室发布Wan2.7-Video视频生成模型,支持全模态输入与精准控制,解决AI视频生成不专业和修改困难两大痛点,让用户能像编辑文档一样灵活创作与修改视频。
📦 开源 TOP 项目
1. Dimillian/Skills
Dimillian/Skills 是一个 Shell 语言编写的开源项目,在 GitHub 上获得 3047 个 Star 和 156 次 Fork,展示了开发者的技术能力集合。
2. siddharthvaddem/openscreen
OpenScreen 是一款开源免费的 屏幕录制工具,基于 TypeScript 开发,无需订阅、无水印、可商用,是 Screen Studio 的免费替代方案,GitHub 已获 2.4 万星标。
3. zai-org/GLM-OCR
GLM-OCR 是一款基于 Python 开发的 OCR 工具,以准确、快速、全面为核心优势,GitHub 获 5136 Star 和 450 Fork,适用于多场景文档识别需求。