6月25日丨每日AI简讯- 大数跨境

首页

6月25日丨每日AI简讯

久新数智

2025-06-25

9agent.ai

点击蓝字关注我们

每日AI简讯

2025.06.25

大模型

LLM

3DVLA新范式!中科院&字节Seed提出BridgeVLA，斩获CVPR2025workshop冠军!
中科院自动化所与字节跳动Seed团队合作推出BridgeVLA模型，通过创新的Heatmap预测机制和对齐视觉语言模型的输入输出，显著提升了3D视觉语言操作任务的数据效率与性能。该模型在RLBench、COLOSSEUM等基准测试中刷新记录，并在真实机器人实验中展现强大泛化能力，荣获CVPR 2025 GRAIL workshop挑战赛冠军。其核心方法是将3D点云转换为多视角2D投影，通过预训练赋予模型目标检测能力，再结合关键帧预测实现高效动作解码，仅需少量训练数据即可完成复杂操作任务。
原文链接：https://www.jiqizhixin.com/articles/2025-06-24
立体几何难倒大模型!SolidGeo:首个多模态立体几何推理基准
中国科学院自动化研究所推出首个多模态立体几何推理基准SolidGeo，包含3113道涵盖三维结构理解和空间推理的立体几何题，分为8个子领域与3个难度等级。测试26个主流模型发现，最强模型OpenAI-o1准确率仅49.5%，远低于人类水平（77.5%），Gemini-2.5-pro在空间度量和三维坐标推理中超越人类，但在简单任务表现异常。开源模型整体落后，最佳Llama4准确率不足30%。研究揭示了AI在复杂空间推理上的瓶颈，为提升模型空间智能提供评测基准。
原文链接：https://www.jiqizhixin.com/articles/2025-06-24-3
强化学习新发现:无需数学样本，仅游戏训练AI推理大增
莱斯大学、约翰斯・霍普金斯大学和英伟达团队提出ViGaL方法，通过让多模态大语言模型玩贪吃蛇、旋转游戏等简单游戏进行强化学习，无需数学或多学科训练数据即可显著提升AI推理能力。该方法在MathVista数学推理基准平均提升2.9%，在MMMU多学科推理基准超越专业模型5.4%，且保持通用视觉能力。研究表明游戏训练可培养底层推理能力，为AI发展提供低成本、可扩展的新路径，突破传统依赖领域特定数据的训练模式。
原文链接：https://www.jiqizhixin.com/articles/2025-06-24-7
微软发布设备端小语言模型Mu：3.3亿参数专供Win11设置助手
微软推出3.3亿参数的设备端小语言模型Mu，专为Windows11设置应用的AI助手打造。该模型通过量化技术和参数共享实现本地高效运行，响应速度达每秒200次样本生成，首词延迟降低47%。支持AMD/英特尔/高通的NPU硬件，无需云端处理保障用户隐私。用户可通过自然语言指令直接操作数百项系统设置，未来将扩展至更多硬件平台。Mu的推出标志着操作系统与本地化AI深度融合，展现了小模型在边缘计算场景的应用潜力。
原文链接：https://www.aibase.com/zh/news/19197
DeepMind 推出 Gemini2.5Flash-Lite 模型实现实时交互界面生成
DeepMind发布Gemini2.5Flash-Lite模型，支持实时生成动态交互界面。该模型可根据用户当前操作内容和上下文，即时生成下一屏幕的UI代码及元素，实现"即点即得"体验。在编码、数学运算、科学推理等能力上显著优于前代，适用于教育、医疗等高互动场景。通过解析用户需求快速反馈，其交互流畅性提升了个性化体验，为智能化应用创新提供了技术基础。
原文链接：https://www.aibase.com/zh/news/19201

产品应用

Product Application

北大施柏鑫团队、贝式计算CVPR研究:视频里轻松换衣服、加柯基
北京大学施柏鑫团队与贝式计算合作推出突破性视频编辑技术，相关成果入选CVPR 2025。该技术通过AI算法实现视频中衣物实时替换与虚拟元素（如柯基犬）无缝植入，解决了传统视频难以修改的痛点。其核心为动态纹理迁移与时空一致性保持框架，可在保留人物动作自然性的同时，支持4K视频每秒30帧的高效处理。目前已在影视特效、虚拟试衣等场景验证，模型参数仅2.6亿但效果媲美商业级软件，代码即将开源。
原文链接：https://www.jiqizhixin.com/articles/2025-06-24-13
ACL 2025 | 让小说角色「活」起来!复旦BookWorld打造沉浸式小说世界模拟系统
复旦大学团队在ACL 2025发布BookWorld系统，该系统通过智能体技术将小说角色具象化，构建可自主互动的虚拟世界。系统从原著中提取角色特征、世界观设定等9142条数据，结合角色智能体与世界智能体双架构，支持自主模式生成故事线或用户干预引导剧情。创新性地引入地理空间建模限制角色活动范围，实验显示75.36%案例生成质量超越现有方法，在拟人化、故事连贯性等维度表现优异，未来或将成为新型互动创作平台。
原文链接：https://www.jiqizhixin.com/articles/2025-06-24-6
千里科技公布面向L3级、L4级别智驾方案全景路线图
千里科技发布L2+级智能辅助驾驶解决方案"千里智驾1.0"，包含基础版、专业版和旗舰版三大配置，最低标配100TOPS算力，旗舰版达700TOPS算力并已实现多车型搭载。公司宣布未来六个月将推出支持L3级自动驾驶的2.0方案，2026年下半年计划发布面向Robotaxi场景的L4级3.0方案，通过端到端技术整合打造全栈式智驾解决方案，与吉利等车企合作推动智能驾驶技术产业化落地。
原文链接：https://www.jiqizhixin.com/articles/2025-06-24-11
豆包推出可视化AI编程，拖拽即可创建网页应用
字节跳动旗下AI助手豆包发布"应用创造1.0"可视化编程功能，用户可通过拖拽操作直接修改网页应用文字、图片及局部元素，操作类似PPT编辑。该功能大幅降低编程门槛，支持零基础用户快速搭建完整网页应用，实现"所见即所得"体验。此前豆包AI编程已具备多文件上传、代码编辑器等专业功能，此次升级进一步推动AI编程工具普及，助力非技术人员使用AI辅助开发。
原文链接：https://www.aibase.com/zh/news/19198
法拉第未来重磅发布FF AI2.0:与OpenAI深度融合，支持50种语言智能交互
法拉第未来于2025年6月24日发布FF AI2.0智能座舱系统，深度融合OpenAI大语言模型，实现AI架构全面重构。该系统支持50余种语言实时切换，具备上下文记忆能力，可解析复杂指令并智能推荐解决方案（如替代空调的降温方式）。LLM技术深度整合至车控、导航等核心功能，通过OTA更新首推FF912.0车型并计划扩展至FX系列，标志着汽车AI技术迈入系统级整合新阶段，推动智能化车载体验革新。
原文链接：https://www.aibase.com/zh/news/19199

硬件&底层技术前沿

Hardware Technologies

外国小哥徒手改装消费级5090，一举击败巨无霸RTX Pro 6000
德国硬件改装专家Der8auer通过"Shunt Mod"技术对华硕ROG Astral LC RTX 5090显卡进行电路改装，通过在电源接口并联电阻器使系统误判功耗，成功将显卡功耗提升至790W，GPU频率达2950MHz。改装后在3DMark测试中帧数由146提升至152帧，略微超越售价1万美元的RTX Pro 6000专业显卡。该改装依赖液冷系统维持60℃的稳定温度，但导致功耗暴涨33%，存在硬件损坏风险，仅适用于高端液冷显卡。测试显示改装版虽性能突破，但能效比显著低于原厂方案。
原文链接：https://www.jiqizhixin.com/articles/2025-06-24-8

上市公司动态

Listed Company Updates

Harvey AI 融资再创新高，估值飙升至50亿美元
法律科技公司Harvey AI完成3亿美元E轮融资，估值达50亿美元，由Kleiner Perkins和Coatue领投，红杉资本等跟投。成立仅三年已拥有340名员工，计划扩员至两倍并扩展至税务会计领域。其AI方案可辅助律师审查文件、起草合同，服务337家法律客户，年化收入预计达7500万美元。此轮融资距D轮仅四个月，估值较前次提升超60%，在竞争激烈的法律科技领域以融资速度和业务增长凸显优势。
原文链接：https://www.aibase.com/zh/news/19206

其他

Other

AI识别引起复杂疾病的关键基因组合，有望带来治疗新途径
美国西北大学研发出生成式AI工具TWAVE，通过分析基因表达数据识别多基因组合引发的复杂疾病机制。该模型结合机器学习与优化算法，能在糖尿病、癌症等疾病中定位传统方法遗漏的致病基因群，并揭示不同患者可能由不同基因组合导致同种疾病的现象。研究突破单基因局限，整合环境因素影响，为个性化治疗提供新方向，相关成果已发表于《PNAS》。
原文链接：https://www.jiqizhixin.com/articles/2025-06-24-4
准确率72.46%!中南大学团队提出多源相似性融合模型MSSF，精准预测药物副作用频率
中南大学研究团队开发出多源相似性融合模型MSSF，通过将药物副作用频率预测重构为多分类问题，整合多模态数据与贝叶斯推理模块，在基准数据集上实现72.46%的准确率，较次优模型HMMF提升15.9%。模型引入自编码器和卷积网络融合多维特征，支持冷启动场景（新药预测准确率56.01%），并通过独立测试验证泛化能力。MSSF在减少相似性特征时仍保持高性能，现已开源供开发者使用。
原文链接：https://www.jiqizhixin.com/articles/2025-06-24-5

⬇️更多AI资讯关注我们⬇️

【声明】内容源于网络

久新数智

重塑生产力，开启人机协作新篇章！

内容 0

粉丝 0

久新数智重塑生产力，开启人机协作新篇章！

总阅读0

粉丝0

内容0