9agent.ai
点击蓝字 关注我们
每日AI简讯
2025.05.27
01
大模型
LLM
ACL 2025 高分接收高感情语音技术:逻辑智能小语种TTS破局之道
北京深度逻辑智能科技与宁波东方理工团队提出低资源泰语TTS解决方案,构建覆盖语音、文本、音素的多维数据集(500+小时语音、百万级文本),开发声调感知模型与混合式预处理流程。该框架通过LLM增强的停顿预测、音调标注优化及GAN解码器,实现高保真合成与零样本声音克隆能力。实验显示其WER低至6.3%,自然度评分达4.4,超越Google/Microsoft商业方案,为小语种TTS提供了数据驱动的高效工程化路径,获ACL 2025高分收录。
原文链接:https://www.jiqizhixin.com/articles/20250526
微软副总裁X上「开课」连更RL知识,解析LLM强化学习核心方法论
微软副总裁Nando de Freitas在X平台开设强化学习(RL)系列课程,系统讲解单步/多步RL、策略梯度、PPO算法及其在大语言模型(LLM)中的应用。内容涵盖监督学习与RL差异、分布式系统设计、离线RL应用场景(如自动驾驶)等核心技术,并深度解析DeepSeekR1等案例的实现原理。课程强调RL在LLM训练中通过自我迭代提升模型性能的核心优势,同时指出基础设施成本与数据陈旧问题,为从业者提供兼顾理论与工程实践的指导。
原文链接:https://www.jiqizhixin.com/articles/202505262
昆仑万维发布天工超级智能体Skywork,颠覆Office办公场景
昆仑万维推出全球首款AI Agent架构的Office智能体应用——天工超级智能体(Skywork Super Agents),集成5个专家级AI Agent和1个通用Agent,支持文档、表格、PPT、播客、网页等内容的智能生成,并在GAIA、SimpleQA等基准测试中超越OpenAI等竞品。该产品通过开源框架和MCP接口赋能开发者,提供0.96元/任务的低成本服务,实现多模态内容生成、数据溯源及知识库管理,可直接生成可编辑的办公文档与可玩性网页游戏,推动办公场景智能化变革。
原文链接:https://www.jiqizhixin.com/articles/202505263
Claude 4登陆Amazon Bedrock:Agentic AI迈入企业级应用阶段
Anthropic推出的Claude 4系列模型(Opus 4与Sonnet 4)正式登陆Amazon Bedrock平台,标志着Agentic AI进入企业级应用。Opus 4作为全场景模型,具备领先的代码生成、复杂推理和长文本处理能力,适用于跨部门数据整合等高复杂度任务;Sonnet 4针对生产环境优化,支持高并发场景下的多任务处理。两款模型均支持200K token上下文窗口及动态切换响应模式,在工具使用、任务执行精度等测试中超越GPT4.1等竞品。开发者可通过Bedrock统一API快速构建应用,结合企业级安全防护,推动Agentic AI从实验走向工程化落地。
原文链接:https://www.jiqizhixin.com/articles/202505264
阿里妈妈在TongAI大会推出全新URM通用召回大模型,重塑购物体验
阿里妈妈在首届TongAI大会上发布URM通用召回大模型,该模型属于LMA2广告大模型系列,首次应用于生成式推荐领域。通过深度学习与大数据分析,URM能精准预测消费者潜在需求,实时解析用户行为数据,为商家提供智能广告投放策略,提升转化率及投资回报。同时,模型支持个性化推荐,优化消费者购物体验,帮助商家洞察市场趋势并调整产品布局,推动电商行业智能化升级,现已在阿里妈妈平台投入应用。
原文链接:https://www.aibase.com/zh/news/18360
02
产品应用
Product Application
Youware重磅更新:MCP加持一键生成复杂网页,AI建站进入新时代!
Youware通过集成Model Context Protocol(MCP)实现智能化建站升级,支持用户通过自然语言提示一键生成复杂网页。新功能可自动调用Figma设计稿、Hugeicons图标库和FLUX图片生成工具,解决素材整合难题。新增积分系统允许用户通过作品浏览量兑换奖励,并推出社区分类筛选与随机推荐功能,构建创作者生态。该工具目前免费开放,支持Google Maps等API接入,在复杂布局还原与动态组件处理上表现突出,推动AI建站向零门槛智能化发展。
原文链接:https://www.aibase.com/zh/news/18359
优必选携手中国电信推出首款家庭桌面AI机器人,助力智能生活
优必选联合中国电信推出首款家庭桌面AI机器人,基于星辰大模型集成情感计算、环境感知及任务规划能力,支持拟人化陪伴、教育互动及智能家居控制。该机器人2024年7月启动研发,配备升级摄像头、14个伺服驱动器及LCD表情屏,支持视觉、动作及语音交互。中国电信陕西计划销售不低于10万台,结合云网融合技术实现智能推荐、设备联动等功能,推动家庭场景智能化升级。
原文链接:https://www.aibase.com/zh/news/18362
FinRobot发布:多智能体AI革新金融分析,预测、策略与报告一键搞定!
FinRobot开源AI金融工具通过多智能体协作系统和多模态数据处理,实现金融分析智能化。其Financial CoT技术将复杂问题分解为逻辑步骤,支持市场预测、投资组合优化及风险评估等场景,可整合新闻、财报等多源数据生成投资建议。工具支持GPT-4、FinGPT等模型定制,具备多语言处理能力,并通过自动化完成数据收集、报告生成等高重复性任务。开源特性降低使用门槛,已在GitHub开放代码,助力机构与个人高效参与AI金融创新。
原文链接:https://www.aibase.com/zh/news/18363
微软为画图、截图工具和记事本新增生成式 AI 功能
微软在Windows11中为画图、截图工具和记事本新增AI功能。画图应用支持通过Copilot生成自定义贴纸(如"穿西装的猴子"),并新增图层处理、背景移除等AI功能;截图工具可按住Ctrl键智能调整截图区域尺寸(需Copilot设备);记事本支持AI生成文本插入,通过右键菜单或快捷键输入提示生成内容(需Microsoft365或Copilot Pro订阅)。部分功能目前仅在Canary/Dev渠道测试,需特定硬件及订阅支持。
原文链接:https://www.aibase.com/zh/news/18365
华硕与Digiworld达成合作,共同推动越南AI生态系统发展
华硕与越南Digiworld公司签署合作备忘录,共同推进越南AI技术应用与生态建设。双方将整合AI服务器、工业级迷你电脑、智能办公设备及医疗、零售、制造等领域的软硬件解决方案,助力企业智能化转型。华硕凭借其AI服务器研发实力(如搭载NVIDIA平台的AI POD和XA NB3I-E12服务器)及超算中心建设经验,提供从硬件到开发工具的全链条支持。Digiworld作为越南ICT行业领军企业,依托三十年市场经验与可持续解决方案,推动技术落地与经济增长平衡发展。
原文链接:https://www.aibase.com/zh/news/18364
03
硬件&底层技术前沿
Hardware Technologies
星门计划震撼全球!美阿联酋联手打造5吉瓦AI超级枢纽,算力革命来了!
美国与阿联酋联合推进"星门计划",打造全球最大AI算力枢纽。该项目包含美国德克萨斯州1.2吉瓦和阿联酋5吉瓦超算中心,部署数十万颗Nvidia GB200/GB300芯片,总预算达5000亿美元。项目由OpenAI、Oracle、SoftBank及阿布扎比MGX基金共同推动,首期工程2026年投入运营,将为AI训练提供强大算力支持。该计划通过跨国合作重构全球AI基础设施格局,涉及核能混合供电方案应对能耗挑战,并规划向亚太和欧洲扩展布局。
原文链接:https://www.aibase.com/zh/news/18358
1亿人类细胞数据集,8亿参数单细胞基础模型,中山大学等推出CellFM
中山大学等团队整合1亿人类细胞的跨技术测序数据集,开发出8亿参数的单细胞基础模型CellFM。该模型基于MindSpore平台采用改进版RetNet架构,解决了单细胞RNA测序数据噪声、批次效应和稀疏性问题。实验显示,CellFM在基因功能预测(零样本准确率提升5.8%)、扰动响应预测(PCC提升4.75%)和细胞类型注释等任务中均优于现有模型,相关成果发表于《Nature Communications》。模型通过LoRA模块降低微调成本,支持药物研发和疾病机理研究。
原文链接:https://www.jiqizhixin.com/articles/2025-05-26-5
与Gemini Diffusion共振!首个扩散式「发散思维链」来了
西湖大学团队提出扩散式「发散思维链」推理范式,通过反向扩散过程的中间步骤模拟非线性思维生成,利用强化学习优化生成轨迹以提升答案正确率。该方法支持任意顺序生成,突破传统线性思维链限制,应用于SEDD和LLaDOU等扩散语言模型后,在数学推理和代码生成任务中性能超越现有模型。实验显示,仅用公开数据和16张H800显卡即可实现高效训练,生成过程首先生成关键数字和符号,再填充语法内容,验证了发散式推理的有效性。
原文链接:https://www.jiqizhixin.com/articles/2025-05-26-7
实测惊艳全球的Veo3!音画同步无敌,贵是有原因的
谷歌Veo3视频生成模型凭借音画同步技术实现视频与音频同步生成,支持对白口型匹配,实测在脱口秀、游戏直播等场景表现惊艳,生成效果逼真。然而,复杂动作场景(如体操、篮球)仍存在肢体扭曲、逻辑错误等问题,且生成效果依赖提示词质量,英文提示优于中文。用户通过免费会员体验发现,Veo3在单一场景中音画协调度高,但多场景转换能力有限。该技术为影视创作带来便利,但复杂内容生成仍待优化。
原文链接:https://www.jiqizhixin.com/articles/2025-05-26-8
《科学智能白皮书2025》发布:AI驱动科研范式变革,中国领跑应用创新
复旦大学联合上海科学智能研究院及施普林格·自然发布《科学智能白皮书2025》,基于2015-2024年全球数据,分析AI与科学研究的深度融合。报告覆盖7大科研领域、28个方向,指出AI通过模型驱动、自动化实验等革新科研范式,典型案例包括AlphaFold蛋白质预测及AI气象模型。数据显示中国AI出版物量全球占比达29%,引用量快速追赶美国,在工程、地球科学等领域领先,中美科研合作仍为全球核心。白皮书同时强调AI安全伦理及跨学科技术路径,推动科学智能可持续发展。
原文链接:https://www.jiqizhixin.com/articles/2025-05-26-6
04
上市公司动态
Listed Company Updates
新开普股价上涨2.40% 机构调研关注AI校园应用
新开普构建星普大模型和智能体创作平台,为高校提供AI服务,获泉果基金调研关注。
原文链接:http://m.toutiao.com/group/7508710341417697844/
正和生态2025年5月26日涨停分析
正和生态股价触及涨停,因公司战略转型布局生态水利基建和AI技术应用,新增AIAgent概念吸引市场关注,2024年归母净利润同比大幅增长61.16%。
原文链接:https://cj.sina.cn/article/norm_detail?url=http%3A%2F%2Ffinance.sina.cn%2F2025-05-26%2Fdetail-inexwafp0089709.d.html
⬇️更多AI资讯关注我们⬇️

