9agent.ai
点击蓝字 关注我们
每日AI简讯
2025.06.06
01
大模型
LLM
ACL 2025 | 基于Token预算感知的大模型高效推理技术
南京大学等团队提出TALE框架,解决大语言模型推理中冗长Token导致的成本问题。该框架引入Token预算机制,包含两种实现方式:TALEEP通过提示工程动态控制Token生成,无需训练即节省60%开销;TALEPT通过微调或偏好优化内化预算感知,降低40%以上Token使用。实验显示两种方法在数学推理任务中保持准确率的同时显著提升效率,Qwen3和Claude 3.7等主流模型已采用类似技术优化推理效率。
原文链接:https://www.jiqizhixin.com/articles/20250605
华为盘古DeepDiver给出开域信息获取新解法
华为诺亚方舟实验室推出DeepDiver模型,通过Search Intensity Scaling技术实现动态调整搜索深度与频率,在真实互联网环境下提升信息检索能力。该模型基于强化学习与WebPuzzle数据集训练,7B参数规模下在复杂知识任务中表现接近671B参数的DeepSeekR1,跨域评测准确率最高提升9.47%。其创新训练流程包含冷启动SFT和Agentic RL两阶段,支持多轮搜索推理,有效解决信息冲突和噪声验证问题,现已在GitHub和arXiv公开技术细节。
原文链接:https://www.jiqizhixin.com/articles/202506058
10行代码,AIME24/25提高15%!揭秘大模型强化学习熵机制
清华大学、上海AI实验室等机构研究发现,大模型强化学习存在策略熵塌缩问题,导致模型探索能力骤降和性能瓶颈。通过分析发现熵变化与动作概率和优势度的协方差相关,进而提出ClipCov和KLCov两种方法(仅需10行代码修改),前者限制高协方差标记梯度更新,后者施加KL惩罚调控熵值。实验显示该方法在Qwen2.532B模型上提升6.4%性能,AIME24/25数据集表现提升达15%,有效突破熵瓶颈推动大模型持续优化。
原文链接:https://www.jiqizhixin.com/articles/202506059
日本AI逆袭全球!Shisa V2 405B开源发布,碾压GPT4的日语神器来了!
日本Shisa.AI发布基于Llama3.1的开源模型Shisa V2 405B,该模型在日语基准测试中超越GPT4及GPT4 Turbo,支持日英双语处理。通过优化微调技术和开源日英双语数据集ultraorcaborosenjav1,显著提升日语语法、翻译等任务性能。模型涵盖7B至405B参数规模,并融入少量韩语和繁体中文数据增强多语言能力。开源训练日志及基准测试工具,推动全球AI社区发展,助力日本在全球AI领域竞争力提升。
原文链接:https://www.aibase.com/zh/news/18643
工信部将推动大模型在制造业重点行业落地
工信部召开会议部署人工智能产业发展,计划推动大模型在制造业重点行业应用,通过强化算力供给、统筹布局行业专用大模型、建立高质量行业数据集等措施,加速制造业全流程智能化升级。会议提出培育人工智能专精特新企业,推进大模型在电子、原材料等领域的研发设计、生产制造等环节落地,并深化11个国家人工智能创新应用先导区建设。目前,我国已形成完整AI产业体系,算力规模全球领先,建成钢铁、煤炭等领域高质量数据集,培育超400家国家级专精特新企业。
原文链接:https://cj.sina.cn/article/norm_detail?url=http%3A%2F%2Ffinance.sina.cn%2F20250605%2Fdetailineyxyis3992867.d.html
02
产品应用
Product Application
钉钉更新7.7.0版本,多维表全面免费!
钉钉7.7.0版本宣布多维表功能全面免费,新增20余个AI字段模板,支持AI生成图片、解析文件及识别链接内容。多维表在电商、制造、餐饮等行业实现效率革新,如电商一键生成百件商品文案,制造业AI秒判设备异常,餐饮业通过剩餐分析优化菜品。钉钉闪记升级新增面试问答、客户拜访等场景的AI摘要模板,语音转文字自动生成结构化纪要,部分企业使用后效率提升50%。此外,版本针对用户体验完成近100项优化,命名为"地衣"强化服务理念。
原文链接:https://www.jiqizhixin.com/articles/2025-06-05-3
ICML 2025|趣丸研发新型人脸动画技术,声音+指令精准控制表情
趣丸科技团队在ICML 2025上提出Playmate框架,通过3D隐式空间引导的扩散模型实现高精度人脸动画生成。该技术结合音频输入与可选的指令控制,可独立调节表情、唇部动作及头部姿态,并引入情绪控制模块支持情感定制。实验显示,其在视频质量、唇同步准确性和表情控制灵活性上优于现有方法,适用于游戏、影视及虚拟社交场景。项目代码即将开源,为动态肖像生成提供了新的技术突破。
原文链接:https://www.jiqizhixin.com/articles/2025-06-05-6
ChatGPT 新功能上线,助力职场高效协作
OpenAI推出ChatGPT两项新功能“连接器”和“记录模式”,深度融入企业工作流。连接器功能支持跨平台整合GitHub、Google Drive等工具,用户可通过自然语言指令实现多系统数据查询与执行建议生成,如自动提取产品数据并生成规划文档。记录模式可在会议中自动录音转写,生成结构化纪要并支持关键词检索原始录音片段,减少人工记录负担。所有功能均遵循企业权限体系保障数据安全,并支持通过MCP协议连接私有数据库,提升协作效率及智能化体验。
原文链接:https://www.aibase.com/zh/news/18634
Cursor 1.0 正式发布:全新Bugbot功能,审查代码修复bug
AI代码编辑器Cursor正式推出1.0版本,核心更新包括BugBot自动化代码审查工具,可自动分析GitHub PR并实现一键修复;全面开放的Background Agent支持远程环境智能辅助开发;新增Jupyter Notebook编辑和Memories上下文记忆功能优化数据科学工作流;通过一键MCP安装简化环境配置,并对界面进行可视化升级。该版本基于VS Code深度整合AI能力,旨在提升开发效率和项目管理水平,现已在官网开放下载。
原文链接:https://www.aibase.com/zh/news/18635
法国AI巨头Mistral推出企业编码助手,正面挑战GitHub Copilot霸主地位
法国Mistral AI发布企业级编码助手Mistral Code,主打本地化部署与深度定制能力,专为注重数据安全的大型企业设计。该产品整合Codestral、Devstral等四大AI模型,支持80余种编程语言,通过私有服务器部署确保代码不外泄,并提供细粒度权限管理、审计日志等企业级功能。其核心技术团队包含Meta羊驼项目核心成员,开源模型Devstral在SWE-Bench测试中性能超越GPT-4.1-mini,以欧洲数据主权和Apache2.0开源协议形成差异化竞争力,直接挑战GitHub Copilot市场地位。
原文链接:https://www.aibase.com/zh/news/18636
03
硬件&底层技术前沿
Hardware Technologies
OpenAI久违发了篇「正经」论文:线性布局实现高效张量计算
OpenAI提出基于线性代数框架的“Linear Layouts”,通过𝔽₂数学构建张量布局的通用系统,解决深度学习编译器Triton中布局设计复杂、易出错的问题。该框架将张量映射与硬件资源结合,支持高效代码生成和布局转换,减少手动编码需求。测试显示,优化后的Triton-Linear在英伟达GPU上性能提升最高达1.57倍,AMD GPU提升约18%,显著提升矩阵运算效率,降低布局相关错误,适用于复杂硬件环境下的张量计算优化。
原文链接:https://www.jiqizhixin.com/articles/2025-06-05-2
英伟达发布Llama Nemotron Nano VL AI:登顶 OCRBench,高精度文档处理解决方案
英伟达推出Llama Nemotron Nano VL AI模型,基于Llama3.1架构与CRadioV2-H视觉编码器,参数规模8B,专攻文档智能处理。该模型在OCRBench v2基准测试中登顶,支持多模态输入处理复杂文档、表格及图表,具备16K令牌长文本解析能力。通过AWQ4bit量化技术,可在RTX GPU或边缘设备运行,显著降低部署成本,并在非英语文档、低质量扫描场景展现高鲁棒性。支持NVIDIA NeMo框架定制化开发,开源特性允许商业应用,适用于金融、医疗等领域的自动化文档问答与信息提取。
原文链接:https://huggingface.co/nvidia/Llama-3.1-Nemotron-Nano-VL-8B-V1
突破100元,300476历史新高!AI算力国产化率加速提升,多只龙头砸出“黄金坑”
胜宏科技股价于2025年6月5日突破百元创历史新高,受益于AI算力需求增长及国产化政策推动,公司2024年营收破百亿,2025年一季度净利润同比暴涨339%。工信部印发《算力互联互通行动计划》加速国产AI算力建设,带动生益电子、剑桥科技等概念股集体反弹。机构预测海光信息、中际旭创等31只算力股未来两年净利润增速超20%,当前板块市值较2023年底增长超万亿,部分个股回撤后现投资机会。
原文链接:http://m.toutiao.com/group/7512426941262086690
04
上市公司动态
Listed Company Updates
利欧股份(002131)AI赋能与全球化双轮驱动股价上涨,收涨1.66%
2025年6月5日,利欧股份股价收涨1.66%,受益于AI与全球化战略推进。公司自研的“LEO AIAD”平台与营销大模型效率提升9倍,并深化华为生态合作拓展流量;海外泵业基地产能释放,新能源产品在非洲订单增长120%。战略投资方面,持有理想汽车1000万股及新吉奥港股资产带来潜在收益。技术面显示股价站稳30日均线,量能温和放大,资金情绪回暖,当前估值处于行业低位,AI与海外业务增长驱动基本面改善。
原文链接:http://m.toutiao.com/group/7512358563340091916
Wordsmith AI 获 Index 领投2500万美元融资,重塑企业法务工作方式
苏格兰法律科技公司Wordsmith AI完成2500万美元A轮融资,由Index Ventures领投。其AI平台专为企业法务团队设计,通过Agentic AI和聊天机器人实现合同审查自动化,支持Microsoft Word等工具集成,可依据企业谈判策略自动标注文件偏差,覆盖保密协议等五大类法律文件。平台还提供多语言翻译、AI草拟通信等工具,已被Deliveroo等企业采用。融资将用于拓展欧美业务,并建立法律支持学院培养法律工程师,重新定义律师与AI协作的工作模式。
原文链接:https://www.aibase.com/zh/news/18648
海外科技巨头动向持续验证AI叙事,国内科网龙头优化AI战略布局
微软、谷歌、Meta、亚马逊、苹果等海外科技巨头2025Q1财报显示,北美云商资本开支保持强劲,验证AI领域持续投入。国内方面,腾讯计划2025年资本支出或达千亿元级别,阿里云宣布三年投入70亿元建设国际生态并增设海外服务中心。国内外科技企业同步强化AI布局,推动核心资产估值预期提升,恒生互联网ETF(513330)成为投资相关领域的重要工具。
原文链接:https://wap.eastmoney.com/a/202506053422787195.html
05
其他
Other
MOOSE-Chem3重塑科研范式:AI「动态引导」实验,实现科学发现的飞跃
中国科学技术大学等机构开发的MOOSE-Chem3框架,通过实验引导的假设排名范式革新科研流程。该框架利用领域知识模拟器CSX-smi动态优化实验策略,实现假设优先级实时调整。测试显示,其模拟器预测趋势与真实实验的Spearman相关系数达0.96,最优假设筛选实验次数从32次降至15次,并能在噪声干扰下保持鲁棒性。该技术大幅降低材料、药物研发成本,使AI成为科学家的智能实验助手,推动数据驱动型科研新范式发展。
原文链接:https://www.jiqizhixin.com/articles/2025-06-05-4
SAVANA:使用长读长测序对细胞畸变进行精准测量分析
欧洲分子生物学实验室开发的SAVANA算法突破传统短读测序局限,利用长读测序结合随机森林机器学习模型,实现癌症结构变异和拷贝数变异的高精度检测。该算法通过70余个特征分析数据,在临床样本中特异性达其他工具的388-547倍,并能解析单倍型特异性变异及肿瘤纯度、倍性。实验显示其在骨肉瘤、胶质母细胞瘤等样本中与传统技术高度兼容,召回率显著优于现有工具,已作为长读测序临床化突破被纳入英国基因组学战略,推动精准医疗发展。
原文链接:https://www.jiqizhixin.com/articles/2025-06-05-5
重磅!2025智源大会完整日程公布——全球AI先锋全阵容集结
2025年6月6日-7日,第七届北京智源大会将以线上线下联动形式召开,汇聚4位图灵奖得主、30余位AI企业创始人及100余位全球青年科学家,共举办180余场人工智能主题演讲。大会设置20场专题论坛,涵盖大模型产业、NeuroAI神经智能、自主智能体、AI+医疗、AI开源系统、类脑大模型等前沿议题,特设具身智能、多模态、AI安全等深度研讨场次。开幕式将发布智源研究院最新进展,产业论坛汇聚面壁智能、爱诗科技等企业领袖,同步举办PyTorch技术日、InnoVibe青年共创等特色活动,现官网已开放免费注册通道。
原文链接:https://www.jiqizhixin.com/articles/2025-06-05-7
当心“AI押题”陷阱
新华社调查发现,中高考冲刺阶段部分商家以“AI押题准确率超80%”为噱头,推出上百元的押题卷和提分课程,利用家长焦虑心理牟利。记者揭露这些高价产品存在虚假宣传嫌疑,质疑其本质是收割消费者钱包的营销手段,提醒考生及家长理性对待考试辅导产品。
原文链接:http://m.toutiao.com/group/7512360277376860698
互联网女皇AI趋势报告:AI模型训练成本超高,但推理成本断崖式下降
互联网女皇AI趋势报告指出,大型语言模型(LLM)训练成本持续攀升,单模型超1亿美元,2025年或现百亿美元级项目。与之形成对比的是AI推理成本骤降:英伟达Blackwell GPU较前代能耗降105000倍,斯坦福数据显示两年间每百万token推理价格暴跌99.7%。低成本推动AI应用爆发,Meta的Llama模型下载量激增3.4倍,顶级模型与小模型性能差距缩小,促使开发者可灵活选择模型架构,加速产品迭代并重塑行业商业模式。
原文链接:https://www.aibase.com/zh/news/18662
⬇️更多AI资讯关注我们⬇️

