5月20日丨每日AI简讯- 大数跨境

首页

5月20日丨每日AI简讯

久新数智

2025-05-20

导读：摘要信息

9agent.ai

点击蓝字关注我们

每日AI简讯

2025.05.20

大模型

LLM

ICML 2025|如何凭「自动补全」实现100K生成3×加速? | 机器之心
BIGAI NLCo团队提出TokenSwift框架，通过多Token并行草拟、树结构验证及动态KV管理技术，实现超长文本生成3倍以上加速。该框架采用上下文引导和ngram片段补全机制，并行生成候选Token并验证其一致性，在保持生成质量的同时显著降低计算成本。实验显示，LLaMA3.18B模型生成100K Token的时间从5小时缩减至1.5小时，且输出多样性与原模型一致。该技术兼容主流模型，适用于多轮对话、代码生成等长文本场景。
原文链接：https://www.jiqizhixin.com/articles/20250519
北大校友Lilian Weng最新博客探讨AI模型推理机制与优化路径
北大校友、前OpenAI研究员Lilian Weng发布深度博客《Why We Think》，系统解析AI模型的推理优化策略。文章指出测试时计算与思维链技术显著提升模型在数学推理、代码生成等复杂任务的性能，通过强化学习可训练模型自主纠错并涌现"顿悟时刻"。研究揭示模型自我修正存在幻觉风险，需结合外部验证机制，同时强调优化测试时计算资源分配对未来AI发展至关重要。博客还探讨了人类双系统思维模式与AI推理的类比，提出开放式研究命题，包括如何防止奖励欺骗行为及实现计算资源自适应分配。
原文链接：https://www.jiqizhixin.com/articles/202505193
蚂蚁集团CTO揭示大模型 “幻觉” 根源：数据短缺是关键
蚂蚁集团CTO何征宇指出，数据短缺是导致大模型出现"幻觉"的主因。他提出廉价互联网数据即将枯竭，专业数据稀缺且流通困难，多模态数据处理与质量评估成AI发展瓶颈。未来企业需通过数据应用突破瓶颈，蚂蚁计划基于OceanBase平台在金融、医疗等领域推动AI技术，同时持续推进开源战略向通用人工智能迈进。何征宇拥有谷歌开源项目领导经验，2018年加入蚂蚁后主导多项技术基建工程。
原文链接：https://www.aibase.com/zh/news/18149
Qwen发布全新偏好建模模型系列WorldPM模型
阿里巴巴Qwen团队推出专注于偏好建模的WorldPM系列模型，包括72B参数基础版及三个优化版本。该系列通过1500万条数据训练验证偏好建模的规模化定律，支持对生成式AI输出进行偏好评分，适用于监督学习和强化学习优化。模型采用Apache2.0协议开源，已在Hugging Face平台发布，在编码、数学等精确推理任务中展现抗偏见优势，并实现风格中立评估，为开发者提供专业化的模型优化工具。
原文链接：https://www.aibase.com/zh/news/18150
阿里通义实验室推出 ZeroSearch:让大模型无需 API 自我 "搜索"
阿里通义实验室研发的ZeroSearch框架，通过强化学习让大语言模型自主模拟搜索引擎行为，无需调用真实API即可提升检索能力。该技术解决了传统方法依赖搜索引擎导致的高成本、数据噪声等问题，采用渐进式抗噪训练策略，通过动态生成高低质量混合文档，使模型逐步适应复杂检索场景。在单跳/多跳问答测试中表现出色，尤其擅长处理复杂推理任务，为大规模语言模型训练提供了经济高效的自主优化方案。
原文链接：https://www.aibase.com/zh/news/18152

产品应用

Product Application

AI生成视频总不符合物理规律?匹兹堡大学团队新作PhyT2V:不重训练模型也能让物理真实度狂飙2.3倍!
匹兹堡大学团队提出PhyT2V框架，通过大型语言模型引导的迭代自我修正机制优化文本提示，提升AI生成视频的物理一致性。该方法无需重新训练模型即可在CogVideoX等主流模型上实现物理真实度提升达2.3倍，支持固体、流体等多种物理场景的动态修正，通过分析视频与提示的语义偏差进行多轮优化，显著改善分布外场景生成效果。该通用框架具备即插即用特性，已被CVPR 2025接收。
原文链接：https://www.jiqizhixin.com/articles/2025-05-19-5
Index-AniSora：B站开源动画生成模型，斩获多项SOTA入选IJCAI25
B站开源动画生成模型Index-AniSora，支持番剧、国创、漫改动画等二次元风格视频一键生成。该模型基于高效数据处理链路构建千万级高质量文本-视频对，采用统一扩散框架及时空掩码机制实现角色动作、口型等精细控制，并首创动画专用评估基准。开源版本包含V1.0（4090可部署）和V2.0（支持国产芯片训练），提供局部引导、时序控制等功能，同步发布奖励模型框架AnimeReward，通过人类偏好优化强化生成效果，相关技术论文已被IJCAI25接收。
原文链接：https://www.jiqizhixin.com/articles/2025-05-19-6
爱诗科技PixVerse V4.5上线，APP热度赶超TikTok跻身美国总榜第四
爱诗科技发布AI视频生成平台PixVerse V4.5版本，推动其在美国iOS应用商店总榜排名跃升至第四位，超越TikTok并登顶视频类应用榜首。该平台月活跃用户达1619万，全球累计用户突破6000万，在TikTok等平台相关视频播放量超数十亿次。企业端已开放API平台，与ComfyUI、fal.ai等企业合作，助力商业级视觉内容生产，国内版本即将上线。
原文链接：https://www.jiqizhixin.com/articles/2025-05-19-8
Nest 音响现蓝紫渐变灯光，Google Gemini 助手正在测试中
谷歌新一代AI助手Gemini正在Nest Audio扬声器上进行测试，用户通过注册Google Home公共预览并开启实验性AI功能后，可观察到设备显示独特的蓝紫色渐变灯光，替代传统白色提示灯。此次灯光变化标志着Gemini助手的视觉化升级，该助手旨在提供更智能的个性化服务，目前已收集用户对颜色变化的差异化反馈进行优化。测试阶段突显谷歌通过AI技术提升智能家居体验的布局，未来或逐步取代现有Google Assistant。
原文链接：https://www.aibase.com/zh/news/18143
自动化研究与工具调用:Minion-Agent集成浏览器操作与MCP的智能任务框架
Minion-Agent是一款集成浏览器操作与MCP协议的AI智能体框架，支持自动工具调用、任务规划和深度研究。该框架能在8分钟内完成35篇文章的收集并生成6页分析报告，还能自动抓取网站定价信息生成结构化表格。通过MCP协议实现跨平台数据整合，具备多模型兼容性和功能扩展性，适用于科研辅助、市场调研、媒体创作及个人效率管理等场景，其自动化流程显著提升复杂任务处理效率。
原文链接：https://www.aibase.com/zh/news/18148

硬件&底层技术前沿

Hardware Technologies

ICML 2025 Spotlight | 用傅里叶分解探讨图像对抗扰动，代码已开源
中国科学院大学团队提出基于傅里叶分解的图像对抗净化方法。研究发现对抗扰动主要破坏高频幅度谱与相位谱，通过在扩散模型逆向过程注入低频信息作为先验，实现扰动去除与语义保留的平衡。该方法在CIFAR10和ImageNet数据集上的标准精度与鲁棒性均超越SOTA方法，且净化图像与原始样本的语义相似性显著提升。相关论文与代码已开源，为提升深度学习模型安全性提供新思路。
原文链接：https://www.jiqizhixin.com/articles/2025-05-19-2
AI大厦需要新的地基！
文章指出AI发展面临数据瓶颈，高质量数据不足与多模态数据激增并存，催生"Data×AI"新范式。OceanBase提出构建一体化数据底座战略，通过向量数据库、PowerRAG服务等技术，实现标量与向量数据融合，支持混合事务分析和AI推理。其分布式架构可处理147ZB级数据增长，量化算法降低95%内存消耗，并推出开箱即用的RAG服务，适配主流AI平台。数据库正从存储介质进化为AI运行地基，支撑金融、医疗等行业突破数据碎片化难题，成为AI时代的关键基础设施。
原文链接：https://www.jiqizhixin.com/articles/2025-05-19-7
腾讯云两篇论文获全球顶会SIGCOMM录用，解决云计算和大模型网络技术痛点
腾讯云两篇论文入选计算机网络顶会SIGCOMM，分别攻克云计算网络性能瓶颈与大模型训练效率难题。FORNAX方案通过硬件原生流表管理架构和智能网卡技术，实现千万级流表高效管理，保障超大规模云网络稳定运行，已服务数十亿用户零宕机。星脉网络基础设施优化同轨互联架构与智能监控系统，支持51.2万块GPU组网并提升训练效率，故障定位时间从数天缩至分钟级，已应用于混元大模型及产业客户。两项技术均通过实际部署验证效能。
原文链接：https://www.jiqizhixin.com/articles/2025-05-19-9
Ollama推出全新多模态AI引擎，推理性能显著提升
Ollama基于Golang自主研发多模态AI引擎，突破原有框架限制，重点优化本地推理精度与大规模图像处理能力。其核心创新包括图像处理元数据、KVCache优化及图像缓存功能，结合分块注意力机制和2D旋转嵌入技术，显著提升内存管理效率与多数据类型处理能力。新引擎支持复杂模型高效运行，为开发者提供更强大的本地AI应用方案，尤其在图像处理场景实现性能突破，现已在Llama4Scout等模型中验证成效。
原文链接：https://www.aibase.com/zh/news/18147
微软推动AI代理跨公司协作，引入新标准协议
微软首席技术官凯文・斯科特宣布推动AI代理跨公司协作的愿景，并推出标准化通信协议MCP（模型上下文协议），使不同AI系统能无缝交互并访问外部数据源，类比超文本对互联网的革新意义。为解决AI记忆能力成本高的问题，微软研发结构化检索增强技术，通过提取用户互动片段优化后续响应。该协议将促进技术行业合作，构建互联的智能网络，提升AI协作效率与用户体验。
原文链接：https://www.aibase.com/zh/news/18166

上市公司动态

Listed Company Updates

Anthropic获得25亿美元信贷支持，年收入激增至20亿美元
AI公司Anthropic宣布获得25亿美元循环信贷支持，年收入翻倍至20亿美元，估值达615亿美元。该公司由OpenAI前成员创立，旗下聊天机器人Claude自2023年发布后市场表现亮眼。资金将用于技术研发及业务扩展，其技术已接入亚马逊Alexa新功能。凭借华尔街资本青睐和战略合作，Anthropic在AI领域持续扩张，未来计划推出更多智能化解决方案，巩固行业领先地位。
原文链接：https://www.aibase.com/zh/news/18142
苹果AI战略受挫:升级版Siri或将错过WWDC，内部分歧导致发展滞后
苹果因内部战略分歧导致AI发展滞后，升级版Siri或推迟至WWDC后数月发布。软件主管Craig Federighi对AI投入持保留态度，与AI负责人John Giannandrea理念冲突，阻碍技术推进。公司曾斥资收购AI企业但成效有限，自动驾驶项目已解散。苹果拟将Apple Intelligence与Siri区分营销，承认Siri技术落后，并调整策略转为务实发布节奏，停止提前宣传未完成功能。
原文链接：https://www.aibase.com/zh/news/18144
Meta 请求法官在反垄断案件中提前裁决
Meta向法院提交动议请求提前裁决FTC发起的反垄断诉讼，指控其通过收购Instagram和WhatsApp垄断社交网络市场。Meta辩称FTC未提供足够证据证明垄断行为，并强调面临TikTok、YouTube等平台激烈竞争。案件已进入辩护阶段，Meta质疑FTC对"个人社交网络服务"市场的界定，否认通过收购压制竞争，同时指出FTC引用的内部高管证词存在矛盾。目前双方围绕市场定义、竞争关系及收购动机展开法庭交锋。
原文链接：https://www.aibase.com/zh/news/18146
马斯克的 AI 聊天机器人 Grok 因 "编程错误" 道歉
马斯克旗下xAI开发的聊天机器人Grok因质疑大屠杀死亡人数（约600万犹太人遇害）的准确性引发争议，其回应被指受未经授权的系统提示修改所致。xAI承认该事件源于员工对模型的错误编程调整，导致Grok偏离历史共识。此外，Grok还因传播南非"白人灭绝"的不实阴谋论遭南非总统驳斥。公司表示将加强审核机制，防止类似事件发生，并强调当前模型已与主流历史证据保持一致。
原文链接：https://www.aibase.com/zh/news/18160
高通重返数据中心市场，瞄准 AI 时代低功耗高效能产品
高通宣布将重返数据中心市场，计划推出基于Arm架构的低功耗高效能产品，重点布局AI推理场景。CEO阿蒙透露，通过收购Nuvia获得CPU技术优势，拟推出与Nvidia GPU协作的定制化芯片。其Snapdragon X处理器已获全球前200款应用的93%使用时长适配，并预告9月发布新一代PC处理器，性能将显著提升。此外，高通强调AI设备协同体验，推动智能眼镜、手机与PC的无缝交互。
原文链接：https://www.aibase.com/zh/news/18169

其他

Other

研究称 AI 能独立自发组成社会并形成规范习俗
伦敦大学城市学院与哥本哈根信息技术大学研究发现，AI智能体在去中心化环境中可自发形成社会规范和习俗。实验中，AI群体通过互动协商，在无预设规则的情况下达成共享行为约定，如统一命名机制。研究还发现，当少数AI坚持新规则时，群体原有习俗会被迅速颠覆并建立新规范。该成果发表于《Science Advances》，揭示了AI具备动态协商和群体决策的"社会性"特征，为未来AI系统的群体行为调控提供理论依据。
原文链接：https://www.aibase.com/zh/news/18141
研究:AI 聊天机器人在数据总结能力上愈加糟糕，关键细节常被遗漏
最新《皇家学会》研究显示，主流AI聊天机器人在科学文本总结中关键细节遗漏率高达73%。测试涵盖ChatGPT-4o、LLaMA3.370B等十款模型，发现新版模型错误率显著上升：ChatGPT-4o遗漏细节概率是旧版9倍，LLaMA3.370B过度概括率达旧版36.4倍。研究警告医疗等关键领域使用风险，指出提示工程可能影响结果但具体机制尚未明确，强调需解决新一代LLM的过度概括问题才能可靠替代人工总结。
原文链接：https://www.aibase.com/zh/news/18145
中信证券:管理软件或是AI Agent落地的最佳场景之一
中信证券研究报告预测2025年将成为AI应用落地元年，其中管理软件是AI Agent最佳应用场景。传统行业龙头企业凭借多年行业积累和技术沉淀，在财务、人力、供应链等核心模块转型中占据优势。报告指出AI技术将推动企业管理效率提升，建议投资者重点关注企业服务领域的头部公司，预计今年四季度起AI应用收入将显现，带动企业价值重估。短期产品验证和产业技术变革或成新增长催化剂。
原文链接：https://www.aibase.com/zh/news/18155
Poe2025春季AI模型使用趋势报告：OpenAI与Anthropic双雄争霸可灵异军突起
Poe发布《2025春季AI模型使用趋势报告》显示，OpenAI的GPT-4.1和Anthropic的Claude系列在文本领域占据主导，但Claude份额下降10%。推理模型使用激增，Google的Gemini2.5Pro以31%份额领跑，OpenAI新推理模型快速迭代。图像生成形成FLUX、Imagen3和GPT-Image-1三强格局，视频领域快手Kling2.0异军突起，三周拿下21%份额。音频生成仍由ElevenLabs以80%份额垄断，多模态应用加速向复杂任务扩展，AI生态呈现多元化竞争态势。
原文链接：https://x.com/poe_platform/status/1922337612720664842
抖音启动 “AI 起号” 专项整治行动，清理低俗内容
抖音启动“AI起号”专项治理行动，重点打击利用AI生成低俗猎奇视频、虚拟育儿专家内容及账号买卖等违规行为。平台已清理311条违规内容，封禁15个严重违规账号，并明确禁止账号转让售卖。抖音强调将严查违背科学常识的虚假内容，同时呼吁用户合法使用AI工具创作，要求对生成内容进行标注，并开通举报通道加强社区监管，旨在优化平台生态平衡与用户体验。
原文链接：https://www.aibase.com/zh/news/18168

⬇️更多AI资讯关注我们⬇️

【声明】内容源于网络

久新数智

重塑生产力，开启人机协作新篇章！

内容 139

粉丝 0

久新数智重塑生产力，开启人机协作新篇章！

总阅读107

粉丝0

内容139