大数跨境

6月13日丨每日AI简讯

6月13日丨每日AI简讯 久新数智
2025-06-13
2
导读:摘要信息



9agent.ai

点击蓝字 关注我们



每日AI简讯

2025.06.13


01

大模型

LLM

图片
  • CVPR 2025 多模态大一统:斯坦福 x 复旦提出符号主义建模生成式任务

    CVPR 2025论文提出多模态统一学习新范式,通过构建带有时空推理信息的AV-UIE数据集和Interaction-aware LoRA模型结构,解决多任务学习中的异质性干扰问题。该框架显式解耦任务能力,增强时序定位、空间定位等场景理解,实验显示其性能超越单一任务专有模型,支持像素级分割、视听问答等复杂任务。数据集、模型及代码已开源,为多模态统一感知和推理提供新思路。

    原文链接:https://www.jiqizhixin.com/articles/2025-06-12

  • 通义实验室最新成果WebDancer:开启自主智能Deep Research的新时代

    通义实验室推出自主智能Deep Research系统WebDancer,解决了高质量训练数据稀缺及开放环境训练复杂两大难题。通过CRAWLQA和E2HQA数据合成策略构建复杂问答数据集,并采用监督微调与强化学习两阶段训练,提升智能体多步推理及动态适应能力。实验表明,其在GAIA和WebWalkerQA基准测试中性能领先,未来计划集成更多工具并扩展至开放域长文本任务。该成果提供开源模型,为复现Deep Research类智能体提供了系统性训练范式。

    原文链接:https://www.jiqizhixin.com/articles/2025-06-12-8

  • 从高考到实战,豆包大模型交卷了

    火山引擎在Force 2025大会上发布豆包大模型1.6系列,包含标准版、深度思考版和极速版,支持256K上下文及多模态理解能力,高考数学单科成绩达144分。视频生成模型Seedance 1.0 Pro支持多镜头叙事和高速运动场景,性能超越Veo3等模型。同时推出实时语音模型及AI云原生基础设施套件,涵盖智能体开发、训练与部署优化,通过“AI云原生”架构降低延迟,提升算力效率,加速企业AI应用落地。

    原文链接:https://www.jiqizhixin.com/articles/2025-06-12-9

  • 夸克发布国内首个高考志愿大模型,整合专家经验实现智能填报

    夸克推出国内首个高考志愿大模型,融合数百名志愿专家经验,提供个性化填报服务。模型基于通义千问基座,通过多阶段训练构建专家级决策能力,整合全国2900多所高校实时数据及就业趋势信息,具备冲稳保策略生成、志愿表优化等核心功能。采用「模拟填报-专家反馈」强化学习机制优化决策逻辑,同时发起「暖芒公益」计划为偏远地区考生免费提供AI志愿报告,已服务超1.2亿用户。该模型支持复杂查询解析,可生成包含院校推荐、风险评估的完整志愿方案。

    原文链接:https://www.jiqizhixin.com/articles/2025-06-12-13

  • 百度智能云+澄海玩具!AI大模型开启千亿级智能玩具市场新蓝海

    百度智能云与汕头澄海区政府联合举办2025 AI玩具产业创新和发展会议,聚焦“AI+国潮”战略转型,推动传统玩具向智能教育、情感陪伴场景升级。百度依托大模型技术构建玩具“双智能中枢”,提供多模态交互与情感计算能力,并联合实丰文化推出AI魔法星等创新产品。澄海作为全球玩具供应链枢纽,通过云端技术降低接入门槛,加速打造千亿级智能玩具产业集群,预计2030年全球AI玩具市场规模将超360亿美元。

    原文链接:https://k.sina.com.cn/article_5787187353_158f1789902001wfqw.html


02

产品应用

Product Application

图片
  • 银河通用X清华大学发布业内首款开源人形机器人全身遥操系统OpenWBT,支持多机型、跨虚实,小时内可轻松部署

    清华大学与银河通用机器人联合推出开源人形机器人全身遥操系统OpenWBT,突破传统单一控制局限,支持多机型兼容及真实与仿真环境操作。该系统采用Real-world-Ready Skill Space技术框架,将机器人动作拆解为行走、姿态调整等原子技能,通过分层强化学习实现技能融合与稳定迁移。用户仅需VR设备和电脑即可快速部署,1小时内完成安装,兼容29自由度的Unitree G1和H1机型,适用于虚实场景下的高效数据采集与操作任务。开源代码已在GitHub、Gitee平台发布,未来将持续扩展功能与机型适配。

    原文链接:https://www.jiqizhixin.com/articles/2025-06-12-2

  • 字节自研AI IDE "TRAE",月活用户已超百万

    字节跳动在2025春季火山引擎大会上宣布,其自主研发的国内首款中文AI编程工具TRAE月活用户突破百万。该IDE集成智能代码补全、局部生成和自然语言编程功能,内部工程师使用率达80%,AI生成代码占比达85%。新发布的豆包1.6大模型已接入TRAE测试,并推出基于上下文理解的cue预测功能,可智能推荐代码修改方案。字节技术副总裁洪定坤表示,将继续优化人机协作模式,使AI既能理解自然语言也能感知编码场景,成为开发者的智能搭档。

    原文链接:https://www.jiqizhixin.com/articles/2025-06-12-10

  • 火山引擎发布智能解决方案平台PromptPilot 帮你优化每个指令

    火山引擎推出PromptPilot智能解决方案平台,专注解决大模型应用中Prompt编写难题。该平台提供从生成、调试到优化的一站式服务,通过自动化流程降低使用门槛,支持多轮对话优化、多模态任务拆解及工具调用优化等核心功能。其闭环优化体系可将用户问题案例转化为数据资产,持续迭代提升回答质量,并支持联网搜索与自定义知识库,助力企业高效应对复杂AI场景应用。

    原文链接:https://www.aibase.com/zh/news/18851

  • 字节Seedance 1.0 Pro发布:超越Veo 3,AI视频生成新王者诞生!

    字节跳动火山引擎发布AI视频生成模型Seedance 1.0 Pro,该模型在Artificial Analysis榜单中文生/图生视频任务中超越Google Veo3和可灵2.1。核心技术采用时间因果变分自编码器、解耦时空扩散变换器和多阶段蒸馏技术,实现1080p视频高精度生成与物理运动一致性。模型生成5秒高清视频仅需41秒,成本低至3.67元,覆盖内容创作、电商营销及影视制作场景。凭借生成效率与成本优势,目前已在火山引擎开放API接入,被业界视为AI视频领域新标杆。

    原文链接:https://www.aibase.com/zh/news/18863

  • 夸克推出高考志愿大模型,免费助力考生选择理想大学!

    阿里巴巴旗下夸克推出国内首个高考志愿大模型,整合“高考深度搜索”“志愿报告”“智能选志愿”三大功能。该系统基于自研高考知识库,可根据考生分数、性格、职业倾向生成个性化志愿方案,提供院校推荐和填报策略,覆盖全国2900多所高校的就业数据。今年算力投入扩大百倍,并坚持免费开放服务,配套名师直播和张雪峰独家专栏,助力考生高效完成志愿填报。该模型支持实时生成完整志愿报告,单次生成需5-10分钟算力支持。

    原文链接:https://www.aibase.com/zh/news/18852


03

硬件&底层技术前沿

Hardware Technologies

图片
  • Meta发布V-JEPA 2世界模型:视频训练实现环境理解与零样本规划

    Meta推出基于视频训练的世界模型V-JEPA 2,具备12亿参数,通过自监督学习实现环境理解和未来预测。该模型采用联合嵌入预测架构,分两阶段训练:百万小时视频预训练提升基础理解能力,62小时机器人数据微调强化动作规划。V-JEPA 2支持零样本任务执行,在未见过物体的新环境中完成抓取放置等任务,成功率高达80%。Meta同步发布IntPhys 2、MVPBench和CausalVQA三大物理推理基准测试,模型在HuggingFace物理推理榜单超越GPT-4o。LeCun强调世界模型是物理现实的数字孪生,可助力机器人、辅助技术及自动驾驶发展,现已在GitHub等平台开源。

    原文链接:https://www.jiqizhixin.com/articles/2025-06-12-3

  • 2D图像作中介,零训练实现3D场景生成SOTA:英伟达&康奈尔提出文本驱动新流程

    英伟达与康奈尔大学联合研发ArtiScene系统,通过2D图像中介实现文本驱动的3D场景生成。该系统结合文本生成图像与3D重建技术,采用五步流程:生成等轴测场景图、物体检测修复、3D定位、模块化模型生成及场景组装,无需额外训练即可构建风格统一的3D场景。实验显示,该方案在布局合理性(物体重叠率降低6-10倍)、风格一致性(CLIP分数提升10%)及生成效率上超越现有方案,支持物体编辑与人工设计图输入,适用于游戏开发、室内设计等场景。

    原文链接:https://www.jiqizhixin.com/articles/2025-06-12-4

  • 英伟达打造全球首个工业AI云,配万块GPU,物理AI机器人集群已启动

    英伟达宣布在德国构建全球首个工业AI云设施,配备万块DGX B200 GPU与RTX PRO服务器,联合宝马、奔驰等车企及Ansys等软件商推动AI驱动的制造业转型。该平台通过Omniverse数字孪生技术实现物理精确仿真,覆盖从产品设计到智慧城市管理的全周期。同时开源Isaac GR00T 1.5人形机器人模型,并联合欧洲机器人公司开发AI机器人群控系统,扩展Halos安全架构至机器人领域。该布局旨在加速欧洲工业智能化,预计两年内当地AI算力提升10倍。

    原文链接:https://www.jiqizhixin.com/articles/2025-06-12-11

  • 何恺明团队提出Dispersive Loss:简化生成模型表征学习框架

    何恺明与Runqian Wang提出Dispersive Loss,为扩散生成模型引入自监督正则化机制。该方法仅需在标准扩散损失中添加隐藏层表征分散项,通过鼓励批次内表征差异化提升性能,无需预训练模型、外部数据或额外参数。实验显示,在DiT/SiT等模型中应用后,FID指标提升最高达12.3%,且适用于一步式生成模型。相比谢赛宁的REPA方法,该方案将训练流程简化85%,在ImageNet 256×256生成任务中实现SOTA,相关代码已开源。

    原文链接:https://www.jiqizhixin.com/articles/2025-06-12-15

  • 英伟达 CEO 黄仁勋展望:欧洲 AI 算力将在两年内实现十倍增长

    英伟达CEO黄仁勋在VivaTech峰会上表示,欧洲AI算力预计两年内增长十倍,超20个在建AI超级工厂将配备超1吉瓦供电能力。欧盟设立200亿欧元基金支持5个配备10万处理器的AI工厂建设,单个工厂成本或达500亿美元。英伟达与法国Mistral合作搭建AI云平台,使用1.8万颗Grace Blackwell芯片,并推动各国建立自主AI体系。目前英伟达欧洲生态已吸引150万开发者及超万家企业的参与,正推进全球首个工业AI云项目。

    原文链接:https://www.aibase.com/zh/news/18862


04

上市公司动态

Listed Company Updates

图片
  • 智谱COO张帆即将离职,投身企业级生产力Agent创业

    智谱AI COO张帆离职创业开发企业级生产力Agent,智谱正筹备A股IPO冲刺“大模型第一股”。

    原文链接:https://wap.eastmoney.com/a/202506123428858625.html


05

其他

Other

图片
  • SIGGRAPH 2025奖项出炉:上科大、厦大最佳论文

    SIGGRAPH 2025公布技术论文奖项,上海科技大学与厦门大学等国内机构斩获多项殊荣。最佳论文奖得主包括提出CAST三维场景重建技术的团队,该技术通过GPT模型解析物体空间关系实现开放词汇重建;厦门大学团队首创动态IMU校准方法打破绝对静态限制。时间检验奖评选出Embree光线追踪框架等4篇经典论文,国内机构在图形学领域国际影响力显著提升。

    原文链接:https://www.jiqizhixin.com/articles/2025-06-12-5

  • 精度达原子级,基于深度学习的动态蛋白质设计,登Science

    加州大学研究团队开发出深度学习引导的动态蛋白质设计方法,实现了原子级精度的可控构象变化。该方法通过计算机模拟突变扫描确定关键残基,设计出能在预设状态间切换的蛋白质开关,并通过核磁共振验证结构精度。实验显示单个氨基酸改变即可调控构象平衡,并成功构建Ca2+浓度响应的变构调节系统。该方法突破了传统静态蛋白质设计的局限,为生物信号传导和合成生物学应用提供了新工具,相关成果已发表于《Science》。

    原文链接:https://www.jiqizhixin.com/articles/2025-06-12-12

  • 投资大佬Bill Gurley:AI浪潮打断本应发生的市场修正,中国的激烈竞争环境反而能塑造更强企业

    风投大佬Bill Gurley在访谈中指出,AI浪潮的爆发延迟了本该进行的市场修正,全球风险投资行业出现「超级基金崛起」和「僵尸独角兽」现象,零利率环境下企业估值虚高且IPO市场停滞。他特别强调中国AI市场的独特生态,指出阿里、百度等巨头开源大模型的竞争策略将推动技术迭代,形成多模型相互训练的开源生态,这种激烈竞争环境反而能催生更强企业。同时警示当前AI企业存在算力转售为主的营收结构,未来需解决单位经济效益问题。

    原文链接:http://m.toutiao.com/group/7514991251742114358/

  • ChatGPT 在国际象棋赛中被48年前的雅达利2600 “打败”!

    ChatGPT与雅达利2600游戏机内置的《Video Chess》对弈时表现欠佳,在90分钟比赛中多次出现低级失误,包括混淆棋子类型、错过关键战术布局等。实验者指出,虽然ChatGPT作为语言模型并非专为棋类设计,但其错误水平甚至低于人类三年级棋手。该测试凸显了AI在特定领域的局限性,同时启示与其利用通用模型进行博弈,不如专注其擅长的策略讨论领域。与1997年深蓝击败人类棋王的案例形成鲜明对比。

    原文链接:https://www.aibase.com/zh/news/18864

  • 微信 “问一问主持人” 功能上线,普通人也能抢占信息流C位

    微信推出"问一问主持人"功能,允许创作者通过公众号或视频号身份发起讨论,并带有专属主持人标识。该功能突破原有匿名提问模式,使内容创作者的提问可展示在主页、搜索页等信息流场景,提升互动曝光和私域流量转化。用户可通过搜一搜入口发起话题讨论,支持在公众号文章嵌入问答及社群运营,有效激活评论区和公私域流量衔接。早期用户反馈显示该功能强化了社群归属感,但曝光效率仍有优化空间,运营需配合精准提问策略和持续互动维护。

    原文链接:https://www.aibase.com/zh/news/18861



⬇️更多AI资讯关注我们⬇️



【声明】内容源于网络
0
0
久新数智
重塑生产力,开启人机协作新篇章!
内容 139
粉丝 0
久新数智 重塑生产力,开启人机协作新篇章!
总阅读107
粉丝0
内容139