大数跨境

6月18日丨每日AI简讯

6月18日丨每日AI简讯 久新数智
2025-06-18
1



9agent.ai

点击蓝字 关注我们



每日AI简讯

2025.06.18


01

大模型

LLM

  • UIUC开源s3搜索智能体训练框架:仅需2.4k样本实现高效RAG优化

    UIUC联合亚马逊提出s3搜索智能体训练框架,通过GBR奖励函数精准衡量检索对生成效果的提升。该框架冻结生成器参数,专注于搜索器优化,采用语义评估标准GenAcc替代传统EM指标,使训练样本量降至2.4k且耗时仅114分钟。实验显示s3在通用QA和医学领域任务中,跨数据集表现优于Search-R1等基线模型,且具备更强的泛化能力。通过原始问题初始化检索起点和动态文档筛选机制,在保持响应效率的同时实现输入token减少2.6-4.2倍。

    原文链接:https://www.jiqizhixin.com/articles/2025-06-17

  • LMArena最新模型榜单发布,DeepSeek-R1网页编程能力超越Claude Opus 4

    DeepSeek-R1在LMArena最新榜单中表现亮眼,其升级版R1-0528在网页编程基准测试中与Gemini-2.5-Pro-Preview等闭源模型并列第一,分数超过Claude Opus 4。该模型在文本基准测试中整体排名第六,开放模型中位列第一,并在编程、数学等细分领域表现优异。尽管LMArena平台存在评测争议,但DeepSeek-R1基于MIT协议开源,为开发者提供了对标顶级闭源模型的选择,实际应用效果仍需验证。

    原文链接:https://www.jiqizhixin.com/articles/2025-06-17-2

  • CVPR 2025 | 零开销缓解物体幻觉:基于零空间投影的多模态大模型物体幻觉消除方法

    西安交通大学团队提出Nullu方法,通过识别大型视觉语言模型(LVLMs)中的"幻觉子空间",利用零空间投影技术消除物体幻觉。该方法通过分析真实与幻觉描述的特征差异定位关键子空间,通过正交化模型权重消除语言模型的偏好先验。无需训练即可部署,不增加推理开销,在CHAIR、POPE等基准测试中有效抑制幻觉生成,同时保持模型通用性能。相比解码阶段方法,该方法可在权重层面直接修改模型,实现零成本优化,相关成果已发表于CVPR 2025。

    原文链接:https://www.jiqizhixin.com/articles/2025-06-17-3

  • MiniMax-M1开源!1M超长上下文推理,AI新王者仅53万美元打造!

    中国AI公司MiniMax开源大型语言模型MiniMax-M1,具备100万token输入和8万token输出的超长上下文处理能力,可支持整本小说级信息解析。该模型采用混合专家架构,代理工具性能媲美OpenAI等商业模型,训练成本仅53万美元,性价比远超同类产品。通过Apache2.0协议开源并上架Hugging Face平台,MiniMax-M1在复杂任务处理效率、数学推理等基准测试中表现突出,为全球开发者提供了高效的长文本分析与生成工具。

    原文链接:https://www.aibase.com/zh/news/18961

  • Kimi-Dev-72B:开源编码LLM,赋能软件工程问题解决

    Kimi-Dev-72B是一款开源代码大模型,专注于解决软件工程问题。该模型在SWE-bench测试中展现顶尖性能,能自主修复Docker环境内的代码缺陷,并通过强化学习机制确保解决方案的正确性与鲁棒性。其采用两阶段框架,提供精准代码定位和编辑功能,支持测试编写与代码维护任务。项目已在Hugging Face和GitHub开源,开发者可自由部署,作为高效的问题排查与代码优化工具。

    原文链接:https://www.aibase.com/zh/news/18962


02

产品应用

Product Application

  • 从扭秧歌到跑半马:机器人离「iPhone时刻」还有多远?

    地瓜机器人推出RDK S100算控一体化开发者套件,采用CPU+BPU+MCU超级异构架构实现单芯片"算控一体",支持具身智能机器人分层模型架构。该平台通过共享内存核间通信机制简化开发,适配四足/人形机器人等应用场景,已在宇树G1机器人等20余客户中验证运动控制和AI推理性能。地瓜构建了算法仓、数据闭环工具链和地心引力计划生态支持,通过精准的80TOPS算力匹配未来三年量产场景需求,助力具身智能产业突破。

    原文链接:https://www.jiqizhixin.com/articles/2025-06-17-7

  • 1Password 与 AWS 携手打造 AI 与云环境安全新标准

    1Password 与 AWS 达成战略合作,聚焦 AI 和云原生环境安全需求,推动其从消费级密码管理工具转型为服务三分之一财富百强企业的安全平台。合作使 1Password 销售合同规模增至普通交易四倍,客户成功率超 50%。新平台对 AI 代理实施与人类身份同等级的安全标准,并整合 AWS Secrets Manager,实现云凭证管理自动化。此次合作预计提升 1Password 收入增速五至七倍,巩固其在企业访问管理市场的竞争力。

    原文链接:https://www.aibase.com/zh/news/18966

  • LinkedIn 全面升级AI求职搜索:自然语言匹配,告别关键词束缚

    LinkedIn推出AI驱动的新版求职搜索系统,通过微调语言模型实现自然语言智能匹配。该系统突破传统关键词限制,允许用户用口语化语句(如"查找硅谷近期软件工程岗")精准检索职位。采用两阶段数据蒸馏技术降低成本,将搜索流程从9阶段精简为查询理解、信息检索、精准排序三环节,显著提升职位匹配度。相较原有基于分类法的搜索方式,新版系统能更好理解用户意图,解决过往搜索结果不相关的问题,现已面向全平台用户开放。

    原文链接:https://www.aibase.com/zh/news/18972

  • 首个转型AI公司的新势力,在全球AI顶会展示下一代自动驾驶模型

    小鹏汽车在CVPR 2025顶会发布下一代自动驾驶基座模型,参数规模达720亿,训练超2000万条视频数据,具备视觉理解、推理及动作生成能力。其G7车型搭载2200TOPS算力的自研图灵芯片,首发VLA+VLM模型,支持复杂场景实时决策。通过云端模型蒸馏及强化学习,车端模型实现高效部署,并构建万卡智算集群验证自动驾驶的Scaling Laws。小鹏以“大算力+大模型+大数据”转型AI公司,推进L3级智能驾驶,未来技术将拓展至机器人及飞行汽车领域。

    原文链接:https://www.jiqizhixin.com/articles/2025-06-17-8


03

硬件&底层技术前沿

Hardware Technologies

  • 突破多智能体系统边界,开源方案OWL超越OpenAI Deep Research,获17k star

    港大、camel-ai等机构联合推出Workforce框架及OWL训练方法,通过解耦设计将系统分解为规划器、协调器和工作节点,解决多智能体跨领域迁移难题。其采用两阶段训练优化核心模块,在GAIA基准测试中取得69.70%准确率,超过OpenAI Deep Research等商业系统。该方案已开源并获17k星,为多领域协作AI建立新范式,但实际部署仍需应对真实场景差异挑战。

    原文链接:https://www.jiqizhixin.com/articles/2025-06-17-4

  • Groq携手Hugging Face挑战云服务巨头,AI 推理速度上新台阶

    Groq宣布与Hugging Face达成合作,成为其官方推理提供商,并提供对阿里巴巴Qwen332B语言模型的支持,实现131,000-token大上下文窗口处理能力。通过自研LPU架构,其推理速度达每秒535个token,突破传统云服务商在文本处理效率上的瓶颈。此次合作使开发者可直接在Hugging Face平台调用Groq服务,覆盖全球数百万开发者。Groq现已在美加及中东部署基础设施,计划继续扩展算力,但需面对AWS等巨头的竞争压力,其低价策略与长期盈利能力的平衡成为市场关注焦点。

    原文链接:https://www.aibase.com/zh/news/18967


04

上市公司动态

Listed Company Updates

  • 谷歌被曝暗中用 ChatGPT 训练 AI,Scale AI 急忙否认

    外媒曝光谷歌承包商利用ChatGPT生成回复对比优化Gemini(原Bard)性能,涉嫌借助竞争对手技术提升自身产品。Scale AI紧急澄清该操作仅属行业常规对比评估,未实际用于模型训练。同时谷歌与Scale AI的合作面临变数,因Meta计划143亿美元收购后者49%股权,或导致谷歌终止高达2亿美元的数据采购协议,暴露生成式AI领域激烈竞争与复杂商业博弈。

    原文链接:https://www.aibase.com/zh/news/18982

  • OpenAI 招聘主管:面对前所未有的增长压力,招聘至关重要

    OpenAI新任招聘主管华金・基尼奥内罗・坎德拉指出,公司因AI领域高速发展面临巨大增长压力,人才争夺战日趋激烈。他将公司比作进入“最大动压”阶段的火箭,需快速适应竞争环境。为扩充团队,OpenAI近期任命Instacart前CEO负责应用业务,收购苹果设计师创立的硬件初创公司,并聘请多位行业高管。过去两年半公司规模增长近十倍,需通过战略招聘保持与通用人工智能目标一致,同时应对Meta等对手的巨额投资和挖角压力。

    原文链接:https://www.aibase.com/zh/news/18963


05

其他

Other

  • 首个全面梳理语音大模型发展的权威综述入选ACL 2025主会

    香港中文大学团队发表首篇语音大模型综述,系统解析SpeechLM技术架构与训练方法。该模型通过语音分词器、语言模型及声码器实现端到端语音交互,突破传统流程信息丢失缺陷。论文详细阐述预训练、指令微调和后对齐三阶段训练策略,并梳理实时交互、多场景应用及安全性评估体系。研究覆盖语音对话、情感识别等应用方向,同时指出实时生成与多语言支持等技术挑战,为语音AI发展提供系统参考框架。

    原文链接:https://www.jiqizhixin.com/articles/2025-06-17-6



⬇️更多AI资讯关注我们⬇️



【声明】内容源于网络
0
0
久新数智
重塑生产力,开启人机协作新篇章!
内容 139
粉丝 0
久新数智 重塑生产力,开启人机协作新篇章!
总阅读107
粉丝0
内容139