6月4日丨每日AI简讯- 大数跨境

首页

6月4日丨每日AI简讯

久新数智

2025-06-04

9agent.ai

点击蓝字关注我们

每日AI简讯

2025.06.04

大模型

LLM

ACL2025 | 传统符号语言传递知识太低效？探索 LLM 高效参数迁移可行性
中国科学院自动化研究所研究团队针对大语言模型（LLM）参数知识迁移提出新范式 PreAlign PKT，通过 LaTen 方法分阶段实现参数对齐与注入。实验发现跨规模模型参数结构相似性低导致迁移困难，表现为神经不兼容性。尽管尝试定位关键参数并设计超网络对齐，但跨规模模型间知识传递效果未达预期，表明现有参数迁移方法仍受限于模型规模差异与参数空间异构性。该研究为探索高效知识迁移路径提供了理论依据。
原文链接：https://www.jiqizhixin.com/articles/20250603
思维链也会「跳帧」？浙大团队提出 CoTBridge，显著提升数学推理性能
浙江大学团队针对大语言模型思维链（CoT）中存在的 “跳跃式推理” 问题，提出 CoTBridge 方法。该方法通过自动检测推理链中的逻辑跳跃并补全缺失步骤，修复了专家经验性省略导致的推理不连贯问题。实验表明，修复后的连贯推理数据使数学任务准确率最高提升 5.87%，并在知识蒸馏和强化学习中分别提升 3.02% 和 3.1% 的准确率。该技术还能增强模型逻辑推理泛化能力，降低无效输出比例，现已在 GitHub 开源。
原文链接：https://www.jiqizhixin.com/articles/202506036
视觉感知驱动的多模态推理，阿里通义提出 VRAG，定义下一代检索增强生成
阿里巴巴通义实验室推出 VRAGRL 框架，通过强化学习与视觉感知动作空间，提升视觉语言模型在检索、推理及理解视觉信息的能力。该框架采用多专家采样策略和细粒度奖励机制，支持多轮交互迭代优化，解决了传统 RAG 方法处理视觉丰富信息时推理不足的问题。实验显示其在多模态任务中性能显著优于现有方法，代码模型已开源。
原文链接：https://www.jiqizhixin.com/articles/202506038
集成 Evo2 与 Qwen3，多伦多大学、DeepMind 等开发 BioReason 使 AI 像生物学家一样推理
多伦多大学、DeepMind 等机构联合推出 BioReason 模型，通过集成 DNA 基础模型 Evo2 与语言模型 Qwen3，实现生物学多模态推理。该模型可处理基因组序列和文本查询，将 DNA 嵌入与用户指令结合，用于遗传变异致病性预测及疾病机制解析。在 KEGG 生物推理数据集测试中，其准确率达 97.24%，并在变异效应预测任务中显著优于基线模型。案例验证显示，BioReason 能生成 10 步机制解释基因突变与肌萎缩侧索硬化症的关联，推动可解释基因组分析发展。
原文链接：https://www.jiqizhixin.com/articles/202506034
经典 ReLU 回归！重大缺陷「死亡 ReLU 问题」已被解决
研究者提出 SUGAR 方法解决 ReLU 激活函数的死亡神经元问题，通过保留前向传播的标准 ReLU 特性，反向传播时采用非零替代梯度。该方法创新性地引入 BSiLU 和 NeLU 两种替代梯度函数，在 VGG16、ResNet18 等模型中实现显著性能提升，其中 VGG16 在 CIFAR100 数据集准确率提升 16 个百分点，ResNet18 在 CIFAR10 提升 9 个百分点。该方法无需修改模型架构或增加参数，已在 Swin Transformer 等现代架构验证有效性，保持 ReLU 稀疏性优势的同时解决梯度消失难题。
原文链接：https://www.jiqizhixin.com/articles/202506037

产品应用

Product Application

万帧？单卡！智源研究院开源轻量级超长视频理解模型 Video-XL-2
智源研究院联合上海交通大学发布开源长视频理解模型 Video-XL-2，支持单显卡处理万帧级视频。该模型采用 SigLIP-SO400M 视觉编码器和动态 Token 合成模块，通过四阶段渐进训练提升性能，在 MLVU、Video-MME 等评测中达到开源模型领先水平。引入分段预装填和双粒度 KV 解码策略，编码 2048 帧视频仅需 12 秒，显著优化显存与计算效率。模型已开源，适用于影视分析、监控异常检测等场景，单卡推理能力覆盖消费级至高性能显卡。
原文链接：https://www.jiqizhixin.com/articles/2025-06-03-2
微软推出 Bing Video Creator，免费助力用户轻松创作 AI 视频
微软基于 OpenAI 的 Sora 技术推出免费视频创作工具 Bing Video Creator，用户通过文字描述即可生成 5 秒短视频。该工具已在必应移动应用全球上线（除中俄地区），支持快速 / 标准两种生成模式，提供 10 次快速生成额度并奖励积分，生成视频可保存 90 天。视频现支持竖屏格式，未来将增加横屏格式，桌面版即将在 Copilot Search 推出。相较需订阅的 Sora，该工具显著降低创作门槛。
原文链接：https://www.aibase.com/zh/news/18550
谷歌 Gemini Live 功能正式登陆 iOS 平台，开启 AI 识别新体验
谷歌正式在 iOS/iPadOS 平台推出 Gemini Live 功能，目前仅限美国用户免费使用。该功能通过 Gemini App 调用设备后置摄像头实时识别物体并提供信息，支持屏幕内容共享交互。用户点击摄像头按钮即可启动 AI 识别，屏幕共享时需授权 "开始共享" 权限。其便捷的视觉交互设计展现了谷歌在 AI 应用场景的创新，但地区限制让海外用户暂无法体验。该功能无需订阅费用，标志着 AI 技术向消费级场景的进一步渗透。
原文链接：https://www.aibase.com/zh/news/18551
ElevenLabs 推全新语音交互平台 Conversational AI 2.0：AI 语音助手比真人还懂你
ElevenLabs 发布 Conversational AI 2.0 语音交互平台，通过先进轮流对话模型实现自然流畅对话，精准判断用户停顿并避免打断。平台支持 32 种语言无缝切换，集成检索增强生成技术实时调用企业知识库，确保专业回答，适用于医疗、客服等场景。新增批量通话功能支持大规模客户沟通，并符合 HIPAA 等企业级合规要求，提供多语言 SDK 便于集成。其低延迟响应和多模态交互特性（语音 / 文字自由切换）提升了客服、营销等场景的效率与灵活性，现已在官网开放使用。
原文链接：https://www.aibase.com/zh/news/18567
谷歌 "试穿" 实验上线美国：AI 虚拟试衣革新在线购物
谷歌推出 AI 驱动的 "试穿" 实验功能，用户上传全身照即可在 Google Shopping 平台实现虚拟试衣。该技术基于定制化图像生成模型，整合全球 500 亿商品数据，可真实呈现服装材质和贴合效果，支持裙装、裤装等品类试穿，并提供多条件搜索、比价分析和自动下单功能。隐私保护方面，用户照片仅用于即时生成效果图，数据处理符合合规标准。目前在美国开放测试，未来计划扩展至更多服装类型和地区，推动电商体验升级。
原文链接：https://www.aibase.com/zh/news/18576

硬件&底层技术前沿

Hardware Technologies

OpenAI 用 Rust 重新打造 Codex CLI，告别 Node.js
OpenAI 宣布将 AI 编程工具 Codex CLI 从 Node.js 迁移至 Rust 语言重写，旨在优化性能和安全性。新版支持零依赖安装，无需 Node.js 环境，并引入沙箱机制提升安全防护（如 macOS 的 Apple Seatbelt 和 Linux 的 Landlock）。Rust 的高效内存管理和无垃圾回收特性降低了资源消耗，同时兼容模型上下文协议（MCP），扩展了工具功能。尽管 Rust 学习曲线较陡，但其系统级优势促使 OpenAI 转型，原 TypeScript 版本仍将维护至 Rust 版功能完善。开发者对此表示期待，新版本已在 GitHub 开源，支持多平台运行。
原文链接：https://www.aibase.com/zh/news/18549
Cerebras 推理 API 全面开放，开发者每日获百万免费 Token
Cerebras Systems 宣布全面开放其推理 API，取消等待名单限制，开发者每日可免费使用 100 万 Token。该 API 支持 Llama4、Qwen3-32B 等主流开源模型，推理速度达 GPU 的 20 倍，并集成至 Hugging Face 等平台。Cerebras 通过北美和欧洲的六大新数据中心提供高性能服务，助力实时语音、代码生成等场景应用。其开放策略旨在降低开发者门槛，可能重塑 AI 推理市场竞争格局，凸显晶圆级引擎技术优势。
原文链接：https://www.aibase.com/zh/news/18569
软银与英特尔携手打造新型节能 AI 内存芯片，电力消耗或减半
软银与英特尔联合研发新型堆叠式 DRAM 芯片，通过创新布线设计将 AI 内存芯片的电力消耗降低约 50%。该项目由合资公司 Saimemory 负责设计，预计两年内完成原型开发，总投资额达 100 亿日元（软银注资 30 亿），目标 2020 年代实现商业化。该芯片旨在优化 AI 数据中心效能，支持低成本构建高性能计算基础设施，同时吸引日本政府及技术机构参与，推动节能技术在 AI 训练场景的规模化应用。
原文链接：https://www.aibase.com/zh/news/18573
谷歌推出 AI Edge Gallery 应用，实现离线智能手机 AI 处理
谷歌推出实验性 AI Edge Gallery 安卓应用，支持用户从 Hugging Face 平台下载 AI 模型并在本地离线运行，实现图像分析、文本生成及多轮对话等功能。该应用基于 LiteRT 平台开发，数据处理全程在设备端完成，有效保障医疗、金融等敏感行业的隐私安全。用户需通过 GitHub 手动安装 APK 文件，存在硬件性能差异影响体验的问题。谷歌通过开源 Apache2.0 协议推动边缘计算发展，旨在与苹果、高通竞争移动 AI 基础架构主导权。
原文链接：https://www.aibase.com/zh/news/18565
Google AI Edge Gallery 发布：Gemma 3n 加持，本地 AI 应用开发从未如此简单！
谷歌在 I/O 2025 大会上推出开源项目 Google AI Edge Gallery，基于 Gemma 3n 多模态模型，支持文本、图片、音频输入并实现完全本地化运行。该项目采用 Apache2.0 协议，代码已开源，支持 Android/iOS 设备离线推理，通过 int4 量化技术将模型体积缩小 2.5-4 倍，显著降低延迟和内存占用。开发者可自由集成 Hugging Face 模型，结合 RAG 技术打造医疗、工业等隐私敏感场景应用，无需依赖云端算力，在设备端完成数据隐私保护与实时交互。
原文链接：https://www.aibase.com/zh/news/18570

上市公司动态

Listed Company Updates

马斯克的 xAI 公司启动 3 亿美元股票出售计划，估值高达 1130 亿美元
马斯克旗下人工智能公司 xAI 启动 3 亿美元二级市场股票出售计划，公司估值达 1130 亿美元，允许员工向新投资者出售股份。此次融资旨在为后续更大规模融资铺路，此前 xAI 曾以 330 亿美元收购社交平台 X。面对特斯拉股价下跌、X 平台宕机及 Grok 模型升级延期等挑战，马斯克将重心转向企业运营。该计划有望为公司注入资金应对困境，并为未来发展提供支撑。
原文链接：https://www.aibase.com/zh/news/18548
云数据平台 Snowflake 宣布收购数据库初创公司 Crunchy Data
云数据平台 Snowflake 宣布以约 2.5 亿美元收购数据库公司 Crunchy Data，后者专注 PostgreSQL 开发，服务 UPS、美国国土安全部等客户。此次收购将推动 Snowflake 推出企业级 PostgreSQL 数据库，整合至其 AI 数据云，满足 AI 时代需求。Snowflake 高管称此举旨在巩固其作为企业数据与 AI 核心平台的地位，并拓展 3500 亿美元市场。此前 Snowflake 已收购 Datavolo 强化数据管理，此次战略收购进一步扩展其数据库业务，提升云平台竞争力。
原文链接：https://www.aibase.com/zh/news/18568
小米将多枚 “Kimi” 商标转让给月之暗面
小米科技将 2013 年起注册的多枚 “Kimi” 商标转让给北京月之暗面公司，后者系 2023 年成立的 AI 企业，已推出同名智能助手产品。此次转让或为小米聚焦核心业务的战略调整，通过优化非核心商标资源助力月之暗面完善品牌布局。月之暗面近期通过小红书推广和价格策略调整积极拓展市场，此次商标接收将强化其 AI 助手 Kimi 的市场竞争力，凸显双方在智能服务领域的协同发展。
原文链接：https://www.aibase.com/zh/news/18574
AI 招聘初创 Moonhub 关停：Salesforce 吸纳部分人才
AI 招聘初创公司 Moonhub 宣布关停，其部分团队成员将加入 Salesforce。Moonhub 由前 Meta 工程师 Nancy Xu 于 2022 年创立，专注开发 AI 招聘工具，通过 AI 筛选候选人、管理入职等流程，累计融资 1440 万美元，客户涵盖财富 500 强企业。Salesforce 澄清并非整体收购，仅接收部分人才以推进其 AI 战略。此次事件正值 Salesforce 加速布局 AI 领域，近期接连收购 Informatica 和 Convergence.ai。数据显示 93% 财富 500 强企业已应用 AI 优化人力资源流程。
原文链接：https://www.aibase.com/zh/news/18553
微软在瑞士投资 4 亿美元扩展云计算与人工智能基础设施
微软宣布向瑞士投资 4 亿美元用于扩建日内瓦和苏黎世数据中心，强化云计算与 AI 基础设施。该计划旨在满足当地市场对云服务及人工智能技术快速增长的需求，重点保障医疗、金融和政府领域的数据主权合规性。微软还将推出中小企业合作计划及 AI 培训项目，提升企业数字工具应用能力。副主席布拉德・史密斯强调瑞士创新生态优势，预计扩建将促进本地就业和经济发展，但具体新增岗位数量尚未披露。
原文链接：https://www.aibase.com/zh/news/18554

其他

Other

本周日不见不散！CVPR 2025 北京论文分享会最后报名了
机器之心将于 6 月 8 日在北京举办 CVPR 2025 论文分享会，聚焦多模态、视频生成等 AI 前沿技术。活动包含 Keynote 演讲、圆桌讨论及 Poster 交流环节，邀请中国科学院高林研究员、北航黄雷副教授等专家分享可视媒体合成、多模态大模型等主题。会议同时联动腾讯青云计划、京东 TGT 计划等合作伙伴，为产学研交流提供平台。报名截止至 6 月 7 日 12:00，支持线上线下参与。
原文链接：https://www.jiqizhixin.com/articles/2025-06-03-9
犹他州律师因引用 ChatGPT 生成虚假案例遭法庭处罚，AI 应用引发争议
美国犹他州律师理查德・贝德纳因在法庭文件中引用 ChatGPT 生成的虚假案例遭法院处罚。该律师提交的上诉申请中出现了法律数据库中不存在的虚构判例，后被证实由未取得执照的法律助理使用 AI 生成且未经审核。法院强调律师需对文件准确性负责，判定贝德纳需支付对方律师费用、退还客户款项并捐款 1000 美元。该事件引发法律界对 AI 工具使用风险的广泛讨论，警示从业者须严格审核 AI 生成内容。
原文链接：https://www.aibase.com/zh/news/18557
Getty Images CEO 谈 AI 版权诉讼：诉讼费用难以承受
Getty Images CEO 克雷格・彼得斯表示，公司因 AI 版权诉讼面临巨额费用，单案成本可达数百万美元。公司正起诉 Stability AI 未经授权使用其 1200 万张图片训练 AI，但无力追责所有侵权行为。Stability AI 辩称属合理使用，Getty 则指控其行为实质为盗窃。面对行业普遍存在的版权争议，Getty 除法律途径外，还通过政策倡导加强版权保护，呼吁美国政府维护创作者权益，认为现有法律已为 AI 发展提供合理框架。
原文链接：https://www.aibase.com/zh/news/18556
Character.AI 推出 AvatarFX 动画工具及社交功能，平台安全引关注
Character.AI 发布 AvatarFX 工具，用户可通过上传照片、选择声音和编写对话生成个性化动画视频，每日最多制作 5 个。新增 “场景” 和 “流” 功能支持用户分享角色互动视频至社交动态。此前平台因 AI 聊天机器人诱导未成年人自残等滥用事件被家长起诉。为防止滥用，平台限制上传真实人物照片并对视频添加水印，但名人艺术作品生成内容仍存深度伪造风险。该功能现已向所有用户开放，移动端及网页版同步更新。
原文链接：https://www.aibase.com/zh/news/18575
音乐巨头与 AI 初创公司 Udio 和 Suno 展开版权合作谈判
环球音乐、华纳音乐、索尼音乐正与 AI 音乐公司 Udio、Suno 进行版权许可谈判，旨在建立艺术家作品使用补偿机制。双方试图通过协议解决此前因 AI 生成音乐引发的版权诉讼，Udio 和 Suno 的技术可根据文字描述自动创作歌曲（如输入 "现代乡村情歌" 生成音频）。谈判将决定音乐公司与 AI 企业的合作模式，若达成协议既能保障艺术家权益，又能推动 AI 音乐创新，可能重塑行业创作生态。
原文链接：https://www.aibase.com/zh/news/18571

⬇️更多AI资讯关注我们⬇️

【声明】内容源于网络

久新数智

重塑生产力，开启人机协作新篇章！

内容 139

粉丝 0

久新数智重塑生产力，开启人机协作新篇章！

总阅读107

粉丝0

内容139