5月23日丨每日AI简讯- 大数跨境

首页

5月23日丨每日AI简讯

久新数智

2025-05-23

9agent.ai

点击蓝字关注我们

每日AI简讯

2025.05.23

大模型

LLM

帮大模型提速80%，华为拿出昇腾推理杀手锏FlashComm，三招搞定通算瓶颈
华为推出昇腾推理优化技术FlashComm系列，通过三招突破大模型通信瓶颈：FlashComm1采用通算重组技术，将AllReduce拆解为ReduceScatter+AllGather并引入量化降维，推理性能提升26%；FlashComm2重构计算流程并优化通信维度，通信量降低86%，推理速度提升33%；FlashComm3结合多流并行与流水线技术，实现MoE模型计算模块并行化，吞吐量提升30%。该系列技术针对千亿级MoE模型集群部署中的通信与计算协同难题，显著提升昇腾硬件资源利用率。
原文链接：https://www.jiqizhixin.com/articles/20250522
Nature | 微软发布包含13亿参数的地球系统基础模型
微软在《Nature》发布地球系统基础模型Aurora，该模型包含13亿参数，通过超百万小时地球物理数据预训练，大幅降低计算成本。Aurora采用3D Swin Transformer架构，在空气质量、海浪、热带气旋路径及高分辨率天气预报中均超越传统数值模型，如全球空气污染预测性能提升74%，热带气旋路径预测100%优于业务系统。模型支持快速微调（48周），未来可扩展至海洋环流、极端天气预警等领域，为低成本高效环境预测提供新方案。
原文链接：https://www.jiqizhixin.com/articles/202505223
Salesforce开源统一多模态模型BLIP3o：自回归+扩散实现图像理解与生成
Salesforce开源统一多模态模型BLIP3o，采用自回归+扩散混合架构，支持图像理解和生成。该模型通过自回归生成中间视觉特征，结合CLIP编码器与流匹配（Flow Matching）训练目标，在语义对齐和图像质量间取得平衡。实验显示CLIP+Flow Matching方案在生成多样性及视觉质量上表现最佳，同时采用顺序训练策略保留语言能力。模型包含4B/8B参数版本，基于25M开源图文数据预训练，并利用GPT4o生成60K指令微调数据提升性能。所有代码、模型及数据集均已开源。
原文链接：https://www.jiqizhixin.com/articles/202505225
字节跳动&清华大学开源多模态时序大模型ChatTS，可实现时序数据对话与推理
字节跳动与清华大学联合开源多模态时序大模型ChatTS，支持原生多变量时序数据的问答与推理。该模型采用合成数据驱动训练框架，通过属性池生成时序数据并匹配自然语言描述，结合Time Series EvolInstruct方法增强推理能力。其多模态输入结构整合时序patch编码与文本上下文，保留数值归一化参数以兼顾形态分析与绝对数值意义。在评估中，ChatTS在分类和推理任务上表现优于GPT4o等基线模型，分类F1提升46%75%，推理任务平均提升25.8%，相关成果已入选VLDB 2025会议，代码与数据集已开源。
原文链接：https://www.jiqizhixin.com/articles/202505227
Mistral开源Devstral模型：240亿参数性能超GPT4.1mini，支持本地部署
法国Mistral公司与All Hands AI合作推出240亿参数开源模型Devstral，采用Apache 2.0许可证允许免费商用。该模型专为实际编程场景设计，在SWEBench测试中以46.8%得分碾压GPT4.1mini（领先超20%），且在单块RTX 4090或32GB Mac即可运行，成为本地部署最优选。通过Mistral API使用时，定价为输入每百万token 0.1美元，输出0.3美元，性能表现超越DeepseekV3等更大规模模型。
原文链接：https://www.jiqizhixin.com/articles/202505228

产品应用

Product Application

京东Joy Inside首家合作！元萝卜AI下棋机器人五合一版重磅发布
商汤科技旗下元萝卜品牌联合京东推出首款Joy Inside定制产品——元萝卜AI下棋机器人五合一版，专为3~12岁儿童设计。该产品集成象棋、围棋等五种棋类启蒙功能，并搭载京东大模型驱动的智能对话系统，提供百科讲解、学科辅导及英语口语互动。新增国际跳棋和英语语伴功能，支持AI实时纠错。产品定价3299元，预售直降300元，京东独家发售。此次合作标志着AI与消费级机器人深度融合，未来将拓展更多家庭应用场景。
原文链接：https://www.jiqizhixin.com/articles/2025-05-22-4
2025全球人工智能终端展在深启幕深圳AI产业生态引领创新浪潮
2025年5月22日，全球人工智能终端展在深圳会展中心开幕，以"智联万物·端启未来"为主题，集中展示AI终端领域技术突破。华为、腾讯等龙头企业推出鸿蒙PC、昇腾AI一体机等产品，深业科技展出"语音智能下工单"系统，光峰科技研发可模拟人类微表情的仿生机器人。展区涵盖AI眼镜、教育拍学机、城市导览系统等民生应用，深圳同步发布50亿元产业基金支持AI终端发展。该展会凸显深圳"雁阵式"AI产业梯队优势，覆盖芯片、模型到应用全链条，推动建设全球人工智能先锋城市。
原文链接：http://m.toutiao.com/group/7507103887074148875/
2025全球人工智能终端展暨第六届深圳国际人工智能展举行
第六届深圳国际人工智能展以“智联万物·端启未来”为主题开幕，深圳市市长覃伟中致辞强调深圳将推动人工智能终端产业创新与生态建设。展会发布人工智能和具身机器人产业基金、成立AI眼镜产业联盟，华为、中兴等企业推出创新产品并签署合作协议。作为全球首个聚焦人工智能终端的专业展会，设置五大展区展示AI手机、PC等九大品类，吸引国内外展商参与，同期举办高端论坛及供需对接活动，助力产业资源整合与市场拓展。
原文链接：http://m.toutiao.com/group/7507217908804698659/
中科富创申请基于大模型的煤炭物流园区内容生成客服系统专利，显著提高了客服响应速度
中科富创（北京）智能系统技术有限公司于2025年2月申请了一项基于大模型的煤炭物流园区智能客服系统专利（公开号CN120012937A）。该系统通过数据采集模块、行业知识库、问题匹配度预估模块及问答生成大模型，实现用户问题的精准识别与高效响应。专利重点解决了煤炭物流场景下客服处理效率问题，支持多方式交互，可显著降低响应延迟并优化服务成本。目前该技术已进入公开阶段，公司累计拥有41项专利，业务覆盖智能系统研发与科技服务领域。
原文链接：http://m.toutiao.com/group/7507062097189012005/
商汤科技推出元萝卜 AI 下棋机器人五合一版，京东 Joy Inside 首度合作
商汤科技联合京东推出元萝卜AI下棋机器人五合一版，专为3-12岁儿童打造。该产品集成象棋、围棋、国际象棋等五种棋类教学，内置京东角色大模型实现智能对话互动，兼具全科辅导和英语语伴功能，可实时纠正语法错误。机器人通过专业课程启蒙棋类技能，并提供百科知识讲解，预售期间直降300元至2999元，成为京东Joy Inside系列首款消费类智能硬件，推动AI技术家庭场景应用创新。
原文链接：https://www.aibase.com/zh/news/18302

硬件&底层技术前沿

Hardware Technologies

OpenAI Responses API重磅更新，集成MCP、图像生成与代码解释器，AI智能体开发进入新纪元
OpenAI宣布Responses API重大升级，集成Model Context Protocol（MCP）、图像生成和代码解释器功能。新API支持单次调用实现多模态智能体开发，包括连接Shopify等外部工具、实时生成可编辑图像（每张0.011美元）及执行数据分析任务（每会话0.03美元）。新增后台模式支持异步处理，文件搜索成本为2.50美元/千次调用。该更新大幅降低开发门槛，适用于电商自动化、内容创作等场景，开发者社区反响热烈。OpenAI计划2026年淘汰旧API，全面转向统一智能体开发平台。
原文链接：https://www.aibase.com/zh/news/18272
xAI 推出网页搜索API:Live Search，赋能AI实时获取内容
xAI发布Live Search网页搜索API，为Grok模型提供实时网络数据接入能力，支持X平台、新闻及RSS等多元数据源。该API具备自主搜索决策功能，可根据上下文自动触发检索，开发者可灵活设置时间范围、结果数量及域名筛选等参数。现开放免费公测至2025年6月5日，每月提供25美元额度，兼容OpenAI和Anthropic的SDK，适用于聊天机器人、AI代理等实时场景，通过智能过滤机制确保搜索结果安全合规，助力开发者快速构建检索增强型AI应用。
原文链接：https://www.aibase.com/zh/news/18278
硅基流动升级DeepSeek-R1 等推理模型API ，支持 128K 上下文长度
硅基流动（SiliconCloud）升级DeepSeek-R1等推理模型API，将Qwen3、GLM-Z1等模型的上下文长度扩展至128K，DeepSeek-R1支持96K，强化复杂任务处理能力。新增独立控制"思维链"和"回复内容"长度的功能，开发者可分别设置thinking_budget（控制推理阶段Token用量）和max_tokens（限制最终输出长度），实现思考深度与响应效率的灵活平衡。当达到上下文长度或回复限制时，输出内容将被截断并标记终止原因，现可通过官方文档调用升级后的API服务。
原文链接：https://www.aibase.com/zh/news/18281
红帽发布全新 AI 推理服务器，推动混合云环境下智能化发展
红帽推出专为混合云设计的AI推理服务器，集成vLLM和Neural Magic技术，提供高性能推理服务。该方案通过智能LLM压缩工具缩减模型体积并保持精度，结合优化模型库实现推理效率提升2-4倍。支持容器化独立部署或与RHEL AI、OpenShift AI平台集成，可在多种操作系统及Kubernetes环境中灵活扩展。红帽提供企业级技术支持，帮助用户在生成式AI应用中实现快速响应与大规模推理部署，推动混合云智能化进程。
原文链接：https://www.aibase.com/zh/news/18292
华为FlashComm技术助力大模型推理提速80%
华为推出FlashComm技术，通过三项创新实现大模型推理速度最高提升80%。该技术优化了AllReduce通信操作，采用ReduceScatter与AllGather重组流程，通信量减少35%，关键计算量降至1/8；调整矩阵乘法并行维度并结合INT8量化技术，使数据传输量骤降86%；利用昇腾硬件多流引擎实现计算流并行处理，突破传统串行计算瓶颈。这些突破显著提升AI推理效率，为科研与工业应用创造新机遇。
原文链接：https://www.aibase.com/zh/news/18293

上市公司动态

Listed Company Updates

TCL 联手阿里云，打造半导体显示行业首个强推理大模型
TCL集团与阿里云达成全栈AI战略合作，将共同研发半导体显示行业首个强推理大模型"星智X-Intelligence"。该模型聚焦大模型推理、多模态理解和智能检索三大核心技术，基于阿里云通义千问迭代优化，计划于2024年9月底推出。通过融合海量行业知识，模型将助力TCL华星实现研发、制造、运营全链条智能化升级，推动半导体显示行业效率提升和流程优化。双方将构建"云计算+大模型+算力"体系，为高端制造业智能化转型提供标杆案例。
原文链接：https://www.aibase.com/zh/news/18275
腾讯全面展示AI大模型战略，推动企业智能化转型
腾讯在2025年AI产业应用峰会上首次全景展示其AI大模型战略，推出升级版大模型矩阵，包括全球评测前八的混元TurboS模型、新一代视觉语音模型及开源计划。CEO汤道生强调AI将驱动企业转型，腾讯云同步升级智能体开发平台和知识库工具，助力企业构建专属智能解决方案。通过技术赋能和开放生态，腾讯旨在加速行业智能化进程，支撑企业在数字化竞争中保持优势，未来将持续深化AI投入，推动全业务智能化发展。
原文链接：https://www.aibase.com/zh/news/18291
杭州市政府工作报告点名 DeepSeek，力挺算法模型企业发展
杭州市政府工作报告提及本土AI企业深度求索（DeepSeek）及其开源大模型，肯定其在低成本下实现技术突破并引发全球关注。作为"杭州六小龙"创新企业代表，DeepSeek专注大模型与具身智能领域，曾创单周用户破亿纪录。市政府推出"三个15%"政策，计划年均科技投入增长超15%，新增财力15%以上用于科技，统筹15%产业资金投向新质生产力，强化对算法模型等AI产业的资金和政策支持，巩固杭州人工智能领域领先地位。
原文链接：https://www.aibase.com/zh/news/18284
字节跳动海外版剪映 CapCut 推出 AI 营销平台 Pippit，并注册相关商标
字节跳动通过旗下剪映海外版CapCut推出AI营销平台Pippit，并同步启动商标布局。北京字跳网络技术有限公司已申请注册"PIPPIT"商标，涵盖教育娱乐、科学仪器、网站服务等10个国际分类，目前处于商标实质审查阶段。该平台于2024年4月正式上线，标志着字节跳动继短视频工具之后，开始向AI营销内容创作领域拓展商业版图，通过多品类商标注册为后续业务发展奠定法律基础。
原文链接：https://www.aibase.com/zh/news/18290
昆仑万维天工超级智能体发布!AI Office革命来袭，Deep Research碾压OpenAI，成本仅40%!
昆仑万维发布天工超级智能体，集成Deep Research技术，成本仅为OpenAI的40%。该系统包含5个专家智能体和1个通用智能体，支持文档、PPT、表格及多媒体内容生成，在GAIA基准以82.42分全球领先。其开源框架MCP允许开发者自由集成，单张A100 GPU即可运行复杂任务，适用于企业办公、内容创作等多场景。该产品通过多模态数据分析和高效模型优化，生成效率较传统工具提升80%，4K级视听内容达专业制作水准。
原文链接：https://mcp.so/server/skywork-super-agents/Skywork-ai

其他

Other

IBM翟峰:2025年是AI智能体规模应用的"拐点时刻"
分析AI智能体在企业级应用中的拐点趋势，涉及技术挑战与治理问题。
原文链接：https://cj.sina.cn/article/norm_detail?url=http%3A%2F%2Ffinance.sina.cn%2F2025-05-22%2Fdetail-inexmnme7058619.d.html
AI技术滥用的风险、治理面临的挑战与路径
探讨AI滥用风险及治理路径，属于政策与伦理范畴。
原文链接：http://m.toutiao.com/group/7507204495441510927/
谷歌推出新工具SynthID Detector ，助力识别AI生成内容
谷歌在Google I/O大会上发布SynthID Detector工具，通过检测SynthID水印识别AI生成内容。该工具支持图像、文本、音频和视频检测，可定位水印具体位置（如音频片段或图像区域），适用于Gemini、Imagen等模型生成的内容。目前处于早期测试阶段，正向注册候补用户逐步开放，旨在通过专业反馈优化工具性能，提升AI内容透明度。未来将扩大使用范围，帮助用户验证媒体内容的AI生成属性。
原文链接：https://www.aibase.com/zh/news/18277
谷歌NotebookLM用户量激增56%：AI笔记工具成黑马
谷歌旗下AI笔记工具NotebookLM半年内月访问量增长56%，凭借创新功能跃升为行业黑马。其核心功能"音频概览"可将文档、网页等转化为对话式播客内容，近期新增支持中文在内的50多种语言，打破使用壁垒。该工具广泛应用于学术研究（论文解析）、职场效率（文档摘要）及创意领域（历史播客制作），用户群体涵盖学生、研究者和内容创作者，成功案例包括用户通过维基内容制作Spotify热门播客，展现了工具在生产力与娱乐场景的双重价值。
原文链接：https://www.aibase.com/zh/news/18280
3DTown AI框架：单张俯视图生成高质量3D城市场景
普林斯顿大学、哥伦比亚大学与Cyberever AI联合推出3DTown框架，可通过单张俯视图生成逼真3D城市场景。该免训练框架将图像分解为重叠区域独立生成3D结构，再通过空间感知修复技术拼接整体，解决了传统方法设备昂贵、数据量大、几何不一致等痛点。实验显示其几何质量比主流模型高37%-55%，布局连贯性得分超40%，适用于游戏开发、影视制作及元宇宙构建，现已在GitHub开源。
原文链接：https://www.aibase.com/zh/news/18300

⬇️更多AI资讯关注我们⬇️

【声明】内容源于网络

久新数智

重塑生产力，开启人机协作新篇章！

内容 139

粉丝 0

久新数智重塑生产力，开启人机协作新篇章！

总阅读107

粉丝0

内容139