9agent.ai
点击蓝字 关注我们
每日AI简讯
2025.06.25
01
大模型
LLM
3DVLA新范式!中科院&字节Seed提出BridgeVLA,斩获CVPR2025workshop冠军!
中科院自动化所与字节跳动Seed团队合作推出BridgeVLA模型,通过创新的Heatmap预测机制和对齐视觉语言模型的输入输出,显著提升了3D视觉语言操作任务的数据效率与性能。该模型在RLBench、COLOSSEUM等基准测试中刷新记录,并在真实机器人实验中展现强大泛化能力,荣获CVPR 2025 GRAIL workshop挑战赛冠军。其核心方法是将3D点云转换为多视角2D投影,通过预训练赋予模型目标检测能力,再结合关键帧预测实现高效动作解码,仅需少量训练数据即可完成复杂操作任务。
原文链接:https://www.jiqizhixin.com/articles/2025-06-24
立体几何难倒大模型!SolidGeo:首个多模态立体几何推理基准
中国科学院自动化研究所推出首个多模态立体几何推理基准SolidGeo,包含3113道涵盖三维结构理解和空间推理的立体几何题,分为8个子领域与3个难度等级。测试26个主流模型发现,最强模型OpenAI-o1准确率仅49.5%,远低于人类水平(77.5%),Gemini-2.5-pro在空间度量和三维坐标推理中超越人类,但在简单任务表现异常。开源模型整体落后,最佳Llama4准确率不足30%。研究揭示了AI在复杂空间推理上的瓶颈,为提升模型空间智能提供评测基准。
原文链接:https://www.jiqizhixin.com/articles/2025-06-24-3
强化学习新发现:无需数学样本,仅游戏训练AI推理大增
莱斯大学、约翰斯・霍普金斯大学和英伟达团队提出ViGaL方法,通过让多模态大语言模型玩贪吃蛇、旋转游戏等简单游戏进行强化学习,无需数学或多学科训练数据即可显著提升AI推理能力。该方法在MathVista数学推理基准平均提升2.9%,在MMMU多学科推理基准超越专业模型5.4%,且保持通用视觉能力。研究表明游戏训练可培养底层推理能力,为AI发展提供低成本、可扩展的新路径,突破传统依赖领域特定数据的训练模式。
原文链接:https://www.jiqizhixin.com/articles/2025-06-24-7
微软发布设备端小语言模型Mu:3.3亿参数专供Win11设置助手
微软推出3.3亿参数的设备端小语言模型Mu,专为Windows11设置应用的AI助手打造。该模型通过量化技术和参数共享实现本地高效运行,响应速度达每秒200次样本生成,首词延迟降低47%。支持AMD/英特尔/高通的NPU硬件,无需云端处理保障用户隐私。用户可通过自然语言指令直接操作数百项系统设置,未来将扩展至更多硬件平台。Mu的推出标志着操作系统与本地化AI深度融合,展现了小模型在边缘计算场景的应用潜力。
原文链接:https://www.aibase.com/zh/news/19197
DeepMind 推出 Gemini2.5Flash-Lite 模型 实现实时交互界面生成
DeepMind发布Gemini2.5Flash-Lite模型,支持实时生成动态交互界面。该模型可根据用户当前操作内容和上下文,即时生成下一屏幕的UI代码及元素,实现"即点即得"体验。在编码、数学运算、科学推理等能力上显著优于前代,适用于教育、医疗等高互动场景。通过解析用户需求快速反馈,其交互流畅性提升了个性化体验,为智能化应用创新提供了技术基础。
原文链接:https://www.aibase.com/zh/news/19201
02
产品应用
Product Application
北大施柏鑫团队、贝式计算CVPR研究:视频里轻松换衣服、加柯基
北京大学施柏鑫团队与贝式计算合作推出突破性视频编辑技术,相关成果入选CVPR 2025。该技术通过AI算法实现视频中衣物实时替换与虚拟元素(如柯基犬)无缝植入,解决了传统视频难以修改的痛点。其核心为动态纹理迁移与时空一致性保持框架,可在保留人物动作自然性的同时,支持4K视频每秒30帧的高效处理。目前已在影视特效、虚拟试衣等场景验证,模型参数仅2.6亿但效果媲美商业级软件,代码即将开源。
原文链接:https://www.jiqizhixin.com/articles/2025-06-24-13
ACL 2025 | 让小说角色「活」起来!复旦BookWorld打造沉浸式小说世界模拟系统
复旦大学团队在ACL 2025发布BookWorld系统,该系统通过智能体技术将小说角色具象化,构建可自主互动的虚拟世界。系统从原著中提取角色特征、世界观设定等9142条数据,结合角色智能体与世界智能体双架构,支持自主模式生成故事线或用户干预引导剧情。创新性地引入地理空间建模限制角色活动范围,实验显示75.36%案例生成质量超越现有方法,在拟人化、故事连贯性等维度表现优异,未来或将成为新型互动创作平台。
原文链接:https://www.jiqizhixin.com/articles/2025-06-24-6
千里科技公布面向L3级、L4级别智驾方案全景路线图
千里科技发布L2+级智能辅助驾驶解决方案"千里智驾1.0",包含基础版、专业版和旗舰版三大配置,最低标配100TOPS算力,旗舰版达700TOPS算力并已实现多车型搭载。公司宣布未来六个月将推出支持L3级自动驾驶的2.0方案,2026年下半年计划发布面向Robotaxi场景的L4级3.0方案,通过端到端技术整合打造全栈式智驾解决方案,与吉利等车企合作推动智能驾驶技术产业化落地。
原文链接:https://www.jiqizhixin.com/articles/2025-06-24-11
豆包推出可视化AI编程,拖拽即可创建网页应用
字节跳动旗下AI助手豆包发布"应用创造1.0"可视化编程功能,用户可通过拖拽操作直接修改网页应用文字、图片及局部元素,操作类似PPT编辑。该功能大幅降低编程门槛,支持零基础用户快速搭建完整网页应用,实现"所见即所得"体验。此前豆包AI编程已具备多文件上传、代码编辑器等专业功能,此次升级进一步推动AI编程工具普及,助力非技术人员使用AI辅助开发。
原文链接:https://www.aibase.com/zh/news/19198
法拉第未来重磅发布FF AI2.0:与OpenAI深度融合,支持50种语言智能交互
法拉第未来于2025年6月24日发布FF AI2.0智能座舱系统,深度融合OpenAI大语言模型,实现AI架构全面重构。该系统支持50余种语言实时切换,具备上下文记忆能力,可解析复杂指令并智能推荐解决方案(如替代空调的降温方式)。LLM技术深度整合至车控、导航等核心功能,通过OTA更新首推FF912.0车型并计划扩展至FX系列,标志着汽车AI技术迈入系统级整合新阶段,推动智能化车载体验革新。
原文链接:https://www.aibase.com/zh/news/19199
03
硬件&底层技术前沿
Hardware Technologies
外国小哥徒手改装消费级5090,一举击败巨无霸RTX Pro 6000
德国硬件改装专家Der8auer通过"Shunt Mod"技术对华硕ROG Astral LC RTX 5090显卡进行电路改装,通过在电源接口并联电阻器使系统误判功耗,成功将显卡功耗提升至790W,GPU频率达2950MHz。改装后在3DMark测试中帧数由146提升至152帧,略微超越售价1万美元的RTX Pro 6000专业显卡。该改装依赖液冷系统维持60℃的稳定温度,但导致功耗暴涨33%,存在硬件损坏风险,仅适用于高端液冷显卡。测试显示改装版虽性能突破,但能效比显著低于原厂方案。
原文链接:https://www.jiqizhixin.com/articles/2025-06-24-8
04
上市公司动态
Listed Company Updates
Harvey AI 融资再创新高,估值飙升至50亿美元
法律科技公司Harvey AI完成3亿美元E轮融资,估值达50亿美元,由Kleiner Perkins和Coatue领投,红杉资本等跟投。成立仅三年已拥有340名员工,计划扩员至两倍并扩展至税务会计领域。其AI方案可辅助律师审查文件、起草合同,服务337家法律客户,年化收入预计达7500万美元。此轮融资距D轮仅四个月,估值较前次提升超60%,在竞争激烈的法律科技领域以融资速度和业务增长凸显优势。
原文链接:https://www.aibase.com/zh/news/19206
05
其他
Other
AI识别引起复杂疾病的关键基因组合,有望带来治疗新途径
美国西北大学研发出生成式AI工具TWAVE,通过分析基因表达数据识别多基因组合引发的复杂疾病机制。该模型结合机器学习与优化算法,能在糖尿病、癌症等疾病中定位传统方法遗漏的致病基因群,并揭示不同患者可能由不同基因组合导致同种疾病的现象。研究突破单基因局限,整合环境因素影响,为个性化治疗提供新方向,相关成果已发表于《PNAS》。
原文链接:https://www.jiqizhixin.com/articles/2025-06-24-4
准确率72.46%!中南大学团队提出多源相似性融合模型MSSF,精准预测药物副作用频率
中南大学研究团队开发出多源相似性融合模型MSSF,通过将药物副作用频率预测重构为多分类问题,整合多模态数据与贝叶斯推理模块,在基准数据集上实现72.46%的准确率,较次优模型HMMF提升15.9%。模型引入自编码器和卷积网络融合多维特征,支持冷启动场景(新药预测准确率56.01%),并通过独立测试验证泛化能力。MSSF在减少相似性特征时仍保持高性能,现已开源供开发者使用。
原文链接:https://www.jiqizhixin.com/articles/2025-06-24-5
⬇️更多AI资讯关注我们⬇️

