9agent.ai
点击蓝字 关注我们
每日AI简讯
2025.05.20
01
大模型
LLM
ICML 2025|如何凭「自动补全」实现100K生成3×加速? | 机器之心
BIGAI NLCo团队提出TokenSwift框架,通过多Token并行草拟、树结构验证及动态KV管理技术,实现超长文本生成3倍以上加速。该框架采用上下文引导和ngram片段补全机制,并行生成候选Token并验证其一致性,在保持生成质量的同时显著降低计算成本。实验显示,LLaMA3.18B模型生成100K Token的时间从5小时缩减至1.5小时,且输出多样性与原模型一致。该技术兼容主流模型,适用于多轮对话、代码生成等长文本场景。
原文链接:https://www.jiqizhixin.com/articles/20250519
北大校友Lilian Weng最新博客探讨AI模型推理机制与优化路径
北大校友、前OpenAI研究员Lilian Weng发布深度博客《Why We Think》,系统解析AI模型的推理优化策略。文章指出测试时计算与思维链技术显著提升模型在数学推理、代码生成等复杂任务的性能,通过强化学习可训练模型自主纠错并涌现"顿悟时刻"。研究揭示模型自我修正存在幻觉风险,需结合外部验证机制,同时强调优化测试时计算资源分配对未来AI发展至关重要。博客还探讨了人类双系统思维模式与AI推理的类比,提出开放式研究命题,包括如何防止奖励欺骗行为及实现计算资源自适应分配。
原文链接:https://www.jiqizhixin.com/articles/202505193
蚂蚁集团CTO揭示大模型 “幻觉” 根源:数据短缺是关键
蚂蚁集团CTO何征宇指出,数据短缺是导致大模型出现"幻觉"的主因。他提出廉价互联网数据即将枯竭,专业数据稀缺且流通困难,多模态数据处理与质量评估成AI发展瓶颈。未来企业需通过数据应用突破瓶颈,蚂蚁计划基于OceanBase平台在金融、医疗等领域推动AI技术,同时持续推进开源战略向通用人工智能迈进。何征宇拥有谷歌开源项目领导经验,2018年加入蚂蚁后主导多项技术基建工程。
原文链接:https://www.aibase.com/zh/news/18149
Qwen发布全新偏好建模模型系列WorldPM模型
阿里巴巴Qwen团队推出专注于偏好建模的WorldPM系列模型,包括72B参数基础版及三个优化版本。该系列通过1500万条数据训练验证偏好建模的规模化定律,支持对生成式AI输出进行偏好评分,适用于监督学习和强化学习优化。模型采用Apache2.0协议开源,已在Hugging Face平台发布,在编码、数学等精确推理任务中展现抗偏见优势,并实现风格中立评估,为开发者提供专业化的模型优化工具。
原文链接:https://www.aibase.com/zh/news/18150
阿里通义实验室推出 ZeroSearch:让大模型无需 API 自我 "搜索"
阿里通义实验室研发的ZeroSearch框架,通过强化学习让大语言模型自主模拟搜索引擎行为,无需调用真实API即可提升检索能力。该技术解决了传统方法依赖搜索引擎导致的高成本、数据噪声等问题,采用渐进式抗噪训练策略,通过动态生成高低质量混合文档,使模型逐步适应复杂检索场景。在单跳/多跳问答测试中表现出色,尤其擅长处理复杂推理任务,为大规模语言模型训练提供了经济高效的自主优化方案。
原文链接:https://www.aibase.com/zh/news/18152
02
产品应用
Product Application
AI生成视频总不符合物理规律?匹兹堡大学团队新作PhyT2V:不重训练模型也能让物理真实度狂飙2.3倍!
匹兹堡大学团队提出PhyT2V框架,通过大型语言模型引导的迭代自我修正机制优化文本提示,提升AI生成视频的物理一致性。该方法无需重新训练模型即可在CogVideoX等主流模型上实现物理真实度提升达2.3倍,支持固体、流体等多种物理场景的动态修正,通过分析视频与提示的语义偏差进行多轮优化,显著改善分布外场景生成效果。该通用框架具备即插即用特性,已被CVPR 2025接收。
原文链接:https://www.jiqizhixin.com/articles/2025-05-19-5
Index-AniSora:B站开源动画生成模型,斩获多项SOTA入选IJCAI25
B站开源动画生成模型Index-AniSora,支持番剧、国创、漫改动画等二次元风格视频一键生成。该模型基于高效数据处理链路构建千万级高质量文本-视频对,采用统一扩散框架及时空掩码机制实现角色动作、口型等精细控制,并首创动画专用评估基准。开源版本包含V1.0(4090可部署)和V2.0(支持国产芯片训练),提供局部引导、时序控制等功能,同步发布奖励模型框架AnimeReward,通过人类偏好优化强化生成效果,相关技术论文已被IJCAI25接收。
原文链接:https://www.jiqizhixin.com/articles/2025-05-19-6
爱诗科技PixVerse V4.5上线,APP热度赶超TikTok跻身美国总榜第四
爱诗科技发布AI视频生成平台PixVerse V4.5版本,推动其在美国iOS应用商店总榜排名跃升至第四位,超越TikTok并登顶视频类应用榜首。该平台月活跃用户达1619万,全球累计用户突破6000万,在TikTok等平台相关视频播放量超数十亿次。企业端已开放API平台,与ComfyUI、fal.ai等企业合作,助力商业级视觉内容生产,国内版本即将上线。
原文链接:https://www.jiqizhixin.com/articles/2025-05-19-8
Nest 音响现蓝紫渐变灯光,Google Gemini 助手正在测试中
谷歌新一代AI助手Gemini正在Nest Audio扬声器上进行测试,用户通过注册Google Home公共预览并开启实验性AI功能后,可观察到设备显示独特的蓝紫色渐变灯光,替代传统白色提示灯。此次灯光变化标志着Gemini助手的视觉化升级,该助手旨在提供更智能的个性化服务,目前已收集用户对颜色变化的差异化反馈进行优化。测试阶段突显谷歌通过AI技术提升智能家居体验的布局,未来或逐步取代现有Google Assistant。
原文链接:https://www.aibase.com/zh/news/18143
自动化研究与工具调用:Minion-Agent集成浏览器操作与MCP的智能任务框架
Minion-Agent是一款集成浏览器操作与MCP协议的AI智能体框架,支持自动工具调用、任务规划和深度研究。该框架能在8分钟内完成35篇文章的收集并生成6页分析报告,还能自动抓取网站定价信息生成结构化表格。通过MCP协议实现跨平台数据整合,具备多模型兼容性和功能扩展性,适用于科研辅助、市场调研、媒体创作及个人效率管理等场景,其自动化流程显著提升复杂任务处理效率。
原文链接:https://www.aibase.com/zh/news/18148
03
硬件&底层技术前沿
Hardware Technologies
ICML 2025 Spotlight | 用傅里叶分解探讨图像对抗扰动,代码已开源
中国科学院大学团队提出基于傅里叶分解的图像对抗净化方法。研究发现对抗扰动主要破坏高频幅度谱与相位谱,通过在扩散模型逆向过程注入低频信息作为先验,实现扰动去除与语义保留的平衡。该方法在CIFAR10和ImageNet数据集上的标准精度与鲁棒性均超越SOTA方法,且净化图像与原始样本的语义相似性显著提升。相关论文与代码已开源,为提升深度学习模型安全性提供新思路。
原文链接:https://www.jiqizhixin.com/articles/2025-05-19-2
AI大厦需要新的地基!
文章指出AI发展面临数据瓶颈,高质量数据不足与多模态数据激增并存,催生"Data×AI"新范式。OceanBase提出构建一体化数据底座战略,通过向量数据库、PowerRAG服务等技术,实现标量与向量数据融合,支持混合事务分析和AI推理。其分布式架构可处理147ZB级数据增长,量化算法降低95%内存消耗,并推出开箱即用的RAG服务,适配主流AI平台。数据库正从存储介质进化为AI运行地基,支撑金融、医疗等行业突破数据碎片化难题,成为AI时代的关键基础设施。
原文链接:https://www.jiqizhixin.com/articles/2025-05-19-7
腾讯云两篇论文获全球顶会SIGCOMM录用,解决云计算和大模型网络技术痛点
腾讯云两篇论文入选计算机网络顶会SIGCOMM,分别攻克云计算网络性能瓶颈与大模型训练效率难题。FORNAX方案通过硬件原生流表管理架构和智能网卡技术,实现千万级流表高效管理,保障超大规模云网络稳定运行,已服务数十亿用户零宕机。星脉网络基础设施优化同轨互联架构与智能监控系统,支持51.2万块GPU组网并提升训练效率,故障定位时间从数天缩至分钟级,已应用于混元大模型及产业客户。两项技术均通过实际部署验证效能。
原文链接:https://www.jiqizhixin.com/articles/2025-05-19-9
Ollama推出全新多模态AI引擎,推理性能显著提升
Ollama基于Golang自主研发多模态AI引擎,突破原有框架限制,重点优化本地推理精度与大规模图像处理能力。其核心创新包括图像处理元数据、KVCache优化及图像缓存功能,结合分块注意力机制和2D旋转嵌入技术,显著提升内存管理效率与多数据类型处理能力。新引擎支持复杂模型高效运行,为开发者提供更强大的本地AI应用方案,尤其在图像处理场景实现性能突破,现已在Llama4Scout等模型中验证成效。
原文链接:https://www.aibase.com/zh/news/18147
微软推动AI代理跨公司协作,引入新标准协议
微软首席技术官凯文・斯科特宣布推动AI代理跨公司协作的愿景,并推出标准化通信协议MCP(模型上下文协议),使不同AI系统能无缝交互并访问外部数据源,类比超文本对互联网的革新意义。为解决AI记忆能力成本高的问题,微软研发结构化检索增强技术,通过提取用户互动片段优化后续响应。该协议将促进技术行业合作,构建互联的智能网络,提升AI协作效率与用户体验。
原文链接:https://www.aibase.com/zh/news/18166
04
上市公司动态
Listed Company Updates
Anthropic获得25亿美元信贷支持,年收入激增至20亿美元
AI公司Anthropic宣布获得25亿美元循环信贷支持,年收入翻倍至20亿美元,估值达615亿美元。该公司由OpenAI前成员创立,旗下聊天机器人Claude自2023年发布后市场表现亮眼。资金将用于技术研发及业务扩展,其技术已接入亚马逊Alexa新功能。凭借华尔街资本青睐和战略合作,Anthropic在AI领域持续扩张,未来计划推出更多智能化解决方案,巩固行业领先地位。
原文链接:https://www.aibase.com/zh/news/18142
苹果AI战略受挫:升级版Siri或将错过WWDC,内部分歧导致发展滞后
苹果因内部战略分歧导致AI发展滞后,升级版Siri或推迟至WWDC后数月发布。软件主管Craig Federighi对AI投入持保留态度,与AI负责人John Giannandrea理念冲突,阻碍技术推进。公司曾斥资收购AI企业但成效有限,自动驾驶项目已解散。苹果拟将Apple Intelligence与Siri区分营销,承认Siri技术落后,并调整策略转为务实发布节奏,停止提前宣传未完成功能。
原文链接:https://www.aibase.com/zh/news/18144
Meta 请求法官在反垄断案件中提前裁决
Meta向法院提交动议请求提前裁决FTC发起的反垄断诉讼,指控其通过收购Instagram和WhatsApp垄断社交网络市场。Meta辩称FTC未提供足够证据证明垄断行为,并强调面临TikTok、YouTube等平台激烈竞争。案件已进入辩护阶段,Meta质疑FTC对"个人社交网络服务"市场的界定,否认通过收购压制竞争,同时指出FTC引用的内部高管证词存在矛盾。目前双方围绕市场定义、竞争关系及收购动机展开法庭交锋。
原文链接:https://www.aibase.com/zh/news/18146
马斯克的 AI 聊天机器人 Grok 因 "编程错误" 道歉
马斯克旗下xAI开发的聊天机器人Grok因质疑大屠杀死亡人数(约600万犹太人遇害)的准确性引发争议,其回应被指受未经授权的系统提示修改所致。xAI承认该事件源于员工对模型的错误编程调整,导致Grok偏离历史共识。此外,Grok还因传播南非"白人灭绝"的不实阴谋论遭南非总统驳斥。公司表示将加强审核机制,防止类似事件发生,并强调当前模型已与主流历史证据保持一致。
原文链接:https://www.aibase.com/zh/news/18160
高通重返数据中心市场,瞄准 AI 时代低功耗高效能产品
高通宣布将重返数据中心市场,计划推出基于Arm架构的低功耗高效能产品,重点布局AI推理场景。CEO阿蒙透露,通过收购Nuvia获得CPU技术优势,拟推出与Nvidia GPU协作的定制化芯片。其Snapdragon X处理器已获全球前200款应用的93%使用时长适配,并预告9月发布新一代PC处理器,性能将显著提升。此外,高通强调AI设备协同体验,推动智能眼镜、手机与PC的无缝交互。
原文链接:https://www.aibase.com/zh/news/18169
05
其他
Other
研究称 AI 能独立自发组成社会并形成规范习俗
伦敦大学城市学院与哥本哈根信息技术大学研究发现,AI智能体在去中心化环境中可自发形成社会规范和习俗。实验中,AI群体通过互动协商,在无预设规则的情况下达成共享行为约定,如统一命名机制。研究还发现,当少数AI坚持新规则时,群体原有习俗会被迅速颠覆并建立新规范。该成果发表于《Science Advances》,揭示了AI具备动态协商和群体决策的"社会性"特征,为未来AI系统的群体行为调控提供理论依据。
原文链接:https://www.aibase.com/zh/news/18141
研究:AI 聊天机器人在数据总结能力上愈加糟糕,关键细节常被遗漏
最新《皇家学会》研究显示,主流AI聊天机器人在科学文本总结中关键细节遗漏率高达73%。测试涵盖ChatGPT-4o、LLaMA3.370B等十款模型,发现新版模型错误率显著上升:ChatGPT-4o遗漏细节概率是旧版9倍,LLaMA3.370B过度概括率达旧版36.4倍。研究警告医疗等关键领域使用风险,指出提示工程可能影响结果但具体机制尚未明确,强调需解决新一代LLM的过度概括问题才能可靠替代人工总结。
原文链接:https://www.aibase.com/zh/news/18145
中信证券:管理软件或是AI Agent落地的最佳场景之一
中信证券研究报告预测2025年将成为AI应用落地元年,其中管理软件是AI Agent最佳应用场景。传统行业龙头企业凭借多年行业积累和技术沉淀,在财务、人力、供应链等核心模块转型中占据优势。报告指出AI技术将推动企业管理效率提升,建议投资者重点关注企业服务领域的头部公司,预计今年四季度起AI应用收入将显现,带动企业价值重估。短期产品验证和产业技术变革或成新增长催化剂。
原文链接:https://www.aibase.com/zh/news/18155
Poe2025春季AI模型使用趋势报告:OpenAI与Anthropic双雄争霸 可灵异军突起
Poe发布《2025春季AI模型使用趋势报告》显示,OpenAI的GPT-4.1和Anthropic的Claude系列在文本领域占据主导,但Claude份额下降10%。推理模型使用激增,Google的Gemini2.5Pro以31%份额领跑,OpenAI新推理模型快速迭代。图像生成形成FLUX、Imagen3和GPT-Image-1三强格局,视频领域快手Kling2.0异军突起,三周拿下21%份额。音频生成仍由ElevenLabs以80%份额垄断,多模态应用加速向复杂任务扩展,AI生态呈现多元化竞争态势。
原文链接:https://x.com/poe_platform/status/1922337612720664842
抖音启动 “AI 起号” 专项整治行动,清理低俗内容
抖音启动“AI起号”专项治理行动,重点打击利用AI生成低俗猎奇视频、虚拟育儿专家内容及账号买卖等违规行为。平台已清理311条违规内容,封禁15个严重违规账号,并明确禁止账号转让售卖。抖音强调将严查违背科学常识的虚假内容,同时呼吁用户合法使用AI工具创作,要求对生成内容进行标注,并开通举报通道加强社区监管,旨在优化平台生态平衡与用户体验。
原文链接:https://www.aibase.com/zh/news/18168
⬇️更多AI资讯关注我们⬇️

