5月27日丨每日AI简讯- 大数跨境

首页

5月27日丨每日AI简讯

久新数智

2025-05-27

9agent.ai

点击蓝字关注我们

每日AI简讯

2025.05.27

大模型

LLM

ACL 2025 高分接收高感情语音技术：逻辑智能小语种TTS破局之道
北京深度逻辑智能科技与宁波东方理工团队提出低资源泰语TTS解决方案，构建覆盖语音、文本、音素的多维数据集（500+小时语音、百万级文本），开发声调感知模型与混合式预处理流程。该框架通过LLM增强的停顿预测、音调标注优化及GAN解码器，实现高保真合成与零样本声音克隆能力。实验显示其WER低至6.3%，自然度评分达4.4，超越Google/Microsoft商业方案，为小语种TTS提供了数据驱动的高效工程化路径，获ACL 2025高分收录。
原文链接：https://www.jiqizhixin.com/articles/20250526
微软副总裁X上「开课」连更RL知识，解析LLM强化学习核心方法论
微软副总裁Nando de Freitas在X平台开设强化学习（RL）系列课程，系统讲解单步/多步RL、策略梯度、PPO算法及其在大语言模型（LLM）中的应用。内容涵盖监督学习与RL差异、分布式系统设计、离线RL应用场景（如自动驾驶）等核心技术，并深度解析DeepSeekR1等案例的实现原理。课程强调RL在LLM训练中通过自我迭代提升模型性能的核心优势，同时指出基础设施成本与数据陈旧问题，为从业者提供兼顾理论与工程实践的指导。
原文链接：https://www.jiqizhixin.com/articles/202505262
昆仑万维发布天工超级智能体Skywork，颠覆Office办公场景
昆仑万维推出全球首款AI Agent架构的Office智能体应用——天工超级智能体（Skywork Super Agents），集成5个专家级AI Agent和1个通用Agent，支持文档、表格、PPT、播客、网页等内容的智能生成，并在GAIA、SimpleQA等基准测试中超越OpenAI等竞品。该产品通过开源框架和MCP接口赋能开发者，提供0.96元/任务的低成本服务，实现多模态内容生成、数据溯源及知识库管理，可直接生成可编辑的办公文档与可玩性网页游戏，推动办公场景智能化变革。
原文链接：https://www.jiqizhixin.com/articles/202505263
Claude 4登陆Amazon Bedrock：Agentic AI迈入企业级应用阶段
Anthropic推出的Claude 4系列模型（Opus 4与Sonnet 4）正式登陆Amazon Bedrock平台，标志着Agentic AI进入企业级应用。Opus 4作为全场景模型，具备领先的代码生成、复杂推理和长文本处理能力，适用于跨部门数据整合等高复杂度任务；Sonnet 4针对生产环境优化，支持高并发场景下的多任务处理。两款模型均支持200K token上下文窗口及动态切换响应模式，在工具使用、任务执行精度等测试中超越GPT4.1等竞品。开发者可通过Bedrock统一API快速构建应用，结合企业级安全防护，推动Agentic AI从实验走向工程化落地。
原文链接：https://www.jiqizhixin.com/articles/202505264
阿里妈妈在TongAI大会推出全新URM通用召回大模型，重塑购物体验
阿里妈妈在首届TongAI大会上发布URM通用召回大模型，该模型属于LMA2广告大模型系列，首次应用于生成式推荐领域。通过深度学习与大数据分析，URM能精准预测消费者潜在需求，实时解析用户行为数据，为商家提供智能广告投放策略，提升转化率及投资回报。同时，模型支持个性化推荐，优化消费者购物体验，帮助商家洞察市场趋势并调整产品布局，推动电商行业智能化升级，现已在阿里妈妈平台投入应用。
原文链接：https://www.aibase.com/zh/news/18360

产品应用

Product Application

Youware重磅更新:MCP加持一键生成复杂网页，AI建站进入新时代!
Youware通过集成Model Context Protocol(MCP)实现智能化建站升级，支持用户通过自然语言提示一键生成复杂网页。新功能可自动调用Figma设计稿、Hugeicons图标库和FLUX图片生成工具，解决素材整合难题。新增积分系统允许用户通过作品浏览量兑换奖励，并推出社区分类筛选与随机推荐功能，构建创作者生态。该工具目前免费开放，支持Google Maps等API接入，在复杂布局还原与动态组件处理上表现突出，推动AI建站向零门槛智能化发展。
原文链接：https://www.aibase.com/zh/news/18359
优必选携手中国电信推出首款家庭桌面AI机器人，助力智能生活
优必选联合中国电信推出首款家庭桌面AI机器人，基于星辰大模型集成情感计算、环境感知及任务规划能力，支持拟人化陪伴、教育互动及智能家居控制。该机器人2024年7月启动研发，配备升级摄像头、14个伺服驱动器及LCD表情屏，支持视觉、动作及语音交互。中国电信陕西计划销售不低于10万台，结合云网融合技术实现智能推荐、设备联动等功能，推动家庭场景智能化升级。
原文链接：https://www.aibase.com/zh/news/18362
FinRobot发布:多智能体AI革新金融分析，预测、策略与报告一键搞定!
FinRobot开源AI金融工具通过多智能体协作系统和多模态数据处理，实现金融分析智能化。其Financial CoT技术将复杂问题分解为逻辑步骤，支持市场预测、投资组合优化及风险评估等场景，可整合新闻、财报等多源数据生成投资建议。工具支持GPT-4、FinGPT等模型定制，具备多语言处理能力，并通过自动化完成数据收集、报告生成等高重复性任务。开源特性降低使用门槛，已在GitHub开放代码，助力机构与个人高效参与AI金融创新。
原文链接：https://www.aibase.com/zh/news/18363
微软为画图、截图工具和记事本新增生成式 AI 功能
微软在Windows11中为画图、截图工具和记事本新增AI功能。画图应用支持通过Copilot生成自定义贴纸（如"穿西装的猴子"），并新增图层处理、背景移除等AI功能；截图工具可按住Ctrl键智能调整截图区域尺寸（需Copilot设备）；记事本支持AI生成文本插入，通过右键菜单或快捷键输入提示生成内容（需Microsoft365或Copilot Pro订阅）。部分功能目前仅在Canary/Dev渠道测试，需特定硬件及订阅支持。
原文链接：https://www.aibase.com/zh/news/18365
华硕与Digiworld达成合作，共同推动越南AI生态系统发展
华硕与越南Digiworld公司签署合作备忘录，共同推进越南AI技术应用与生态建设。双方将整合AI服务器、工业级迷你电脑、智能办公设备及医疗、零售、制造等领域的软硬件解决方案，助力企业智能化转型。华硕凭借其AI服务器研发实力（如搭载NVIDIA平台的AI POD和XA NB3I-E12服务器）及超算中心建设经验，提供从硬件到开发工具的全链条支持。Digiworld作为越南ICT行业领军企业，依托三十年市场经验与可持续解决方案，推动技术落地与经济增长平衡发展。
原文链接：https://www.aibase.com/zh/news/18364

硬件&底层技术前沿

Hardware Technologies

星门计划震撼全球!美阿联酋联手打造5吉瓦AI超级枢纽，算力革命来了!
美国与阿联酋联合推进"星门计划"，打造全球最大AI算力枢纽。该项目包含美国德克萨斯州1.2吉瓦和阿联酋5吉瓦超算中心，部署数十万颗Nvidia GB200/GB300芯片，总预算达5000亿美元。项目由OpenAI、Oracle、SoftBank及阿布扎比MGX基金共同推动，首期工程2026年投入运营，将为AI训练提供强大算力支持。该计划通过跨国合作重构全球AI基础设施格局，涉及核能混合供电方案应对能耗挑战，并规划向亚太和欧洲扩展布局。
原文链接：https://www.aibase.com/zh/news/18358
1亿人类细胞数据集，8亿参数单细胞基础模型，中山大学等推出CellFM
中山大学等团队整合1亿人类细胞的跨技术测序数据集，开发出8亿参数的单细胞基础模型CellFM。该模型基于MindSpore平台采用改进版RetNet架构，解决了单细胞RNA测序数据噪声、批次效应和稀疏性问题。实验显示，CellFM在基因功能预测（零样本准确率提升5.8%）、扰动响应预测（PCC提升4.75%）和细胞类型注释等任务中均优于现有模型，相关成果发表于《Nature Communications》。模型通过LoRA模块降低微调成本，支持药物研发和疾病机理研究。
原文链接：https://www.jiqizhixin.com/articles/2025-05-26-5
与Gemini Diffusion共振!首个扩散式「发散思维链」来了
西湖大学团队提出扩散式「发散思维链」推理范式，通过反向扩散过程的中间步骤模拟非线性思维生成，利用强化学习优化生成轨迹以提升答案正确率。该方法支持任意顺序生成，突破传统线性思维链限制，应用于SEDD和LLaDOU等扩散语言模型后，在数学推理和代码生成任务中性能超越现有模型。实验显示，仅用公开数据和16张H800显卡即可实现高效训练，生成过程首先生成关键数字和符号，再填充语法内容，验证了发散式推理的有效性。
原文链接：https://www.jiqizhixin.com/articles/2025-05-26-7
实测惊艳全球的Veo3！音画同步无敌，贵是有原因的
谷歌Veo3视频生成模型凭借音画同步技术实现视频与音频同步生成，支持对白口型匹配，实测在脱口秀、游戏直播等场景表现惊艳，生成效果逼真。然而，复杂动作场景（如体操、篮球）仍存在肢体扭曲、逻辑错误等问题，且生成效果依赖提示词质量，英文提示优于中文。用户通过免费会员体验发现，Veo3在单一场景中音画协调度高，但多场景转换能力有限。该技术为影视创作带来便利，但复杂内容生成仍待优化。
原文链接：https://www.jiqizhixin.com/articles/2025-05-26-8
《科学智能白皮书2025》发布：AI驱动科研范式变革，中国领跑应用创新
复旦大学联合上海科学智能研究院及施普林格·自然发布《科学智能白皮书2025》，基于2015-2024年全球数据，分析AI与科学研究的深度融合。报告覆盖7大科研领域、28个方向，指出AI通过模型驱动、自动化实验等革新科研范式，典型案例包括AlphaFold蛋白质预测及AI气象模型。数据显示中国AI出版物量全球占比达29%，引用量快速追赶美国，在工程、地球科学等领域领先，中美科研合作仍为全球核心。白皮书同时强调AI安全伦理及跨学科技术路径，推动科学智能可持续发展。
原文链接：https://www.jiqizhixin.com/articles/2025-05-26-6

上市公司动态

Listed Company Updates

新开普股价上涨2.40% 机构调研关注AI校园应用
新开普构建星普大模型和智能体创作平台，为高校提供AI服务，获泉果基金调研关注。
原文链接：http://m.toutiao.com/group/7508710341417697844/
正和生态2025年5月26日涨停分析
正和生态股价触及涨停，因公司战略转型布局生态水利基建和AI技术应用，新增AIAgent概念吸引市场关注，2024年归母净利润同比大幅增长61.16%。
原文链接：https://cj.sina.cn/article/norm_detail?url=http%3A%2F%2Ffinance.sina.cn%2F2025-05-26%2Fdetail-inexwafp0089709.d.html

⬇️更多AI资讯关注我们⬇️

【声明】内容源于网络

久新数智

重塑生产力，开启人机协作新篇章！

内容 0

粉丝 0

久新数智重塑生产力，开启人机协作新篇章！

总阅读0

粉丝0

内容0