6月13日丨每日AI简讯- 大数跨境

首页

6月13日丨每日AI简讯

久新数智

2025-06-13

导读：摘要信息

9agent.ai

点击蓝字关注我们

每日AI简讯

2025.06.13

大模型

LLM

CVPR 2025 多模态大一统:斯坦福 x 复旦提出符号主义建模生成式任务
CVPR 2025论文提出多模态统一学习新范式，通过构建带有时空推理信息的AV-UIE数据集和Interaction-aware LoRA模型结构，解决多任务学习中的异质性干扰问题。该框架显式解耦任务能力，增强时序定位、空间定位等场景理解，实验显示其性能超越单一任务专有模型，支持像素级分割、视听问答等复杂任务。数据集、模型及代码已开源，为多模态统一感知和推理提供新思路。
原文链接：https://www.jiqizhixin.com/articles/2025-06-12
通义实验室最新成果WebDancer:开启自主智能Deep Research的新时代
通义实验室推出自主智能Deep Research系统WebDancer，解决了高质量训练数据稀缺及开放环境训练复杂两大难题。通过CRAWLQA和E2HQA数据合成策略构建复杂问答数据集，并采用监督微调与强化学习两阶段训练，提升智能体多步推理及动态适应能力。实验表明，其在GAIA和WebWalkerQA基准测试中性能领先，未来计划集成更多工具并扩展至开放域长文本任务。该成果提供开源模型，为复现Deep Research类智能体提供了系统性训练范式。
原文链接：https://www.jiqizhixin.com/articles/2025-06-12-8
从高考到实战，豆包大模型交卷了
火山引擎在Force 2025大会上发布豆包大模型1.6系列，包含标准版、深度思考版和极速版，支持256K上下文及多模态理解能力，高考数学单科成绩达144分。视频生成模型Seedance 1.0 Pro支持多镜头叙事和高速运动场景，性能超越Veo3等模型。同时推出实时语音模型及AI云原生基础设施套件，涵盖智能体开发、训练与部署优化，通过“AI云原生”架构降低延迟，提升算力效率，加速企业AI应用落地。
原文链接：https://www.jiqizhixin.com/articles/2025-06-12-9
夸克发布国内首个高考志愿大模型，整合专家经验实现智能填报
夸克推出国内首个高考志愿大模型，融合数百名志愿专家经验，提供个性化填报服务。模型基于通义千问基座，通过多阶段训练构建专家级决策能力，整合全国2900多所高校实时数据及就业趋势信息，具备冲稳保策略生成、志愿表优化等核心功能。采用「模拟填报-专家反馈」强化学习机制优化决策逻辑，同时发起「暖芒公益」计划为偏远地区考生免费提供AI志愿报告，已服务超1.2亿用户。该模型支持复杂查询解析，可生成包含院校推荐、风险评估的完整志愿方案。
原文链接：https://www.jiqizhixin.com/articles/2025-06-12-13
百度智能云+澄海玩具!AI大模型开启千亿级智能玩具市场新蓝海
百度智能云与汕头澄海区政府联合举办2025 AI玩具产业创新和发展会议，聚焦“AI+国潮”战略转型，推动传统玩具向智能教育、情感陪伴场景升级。百度依托大模型技术构建玩具“双智能中枢”，提供多模态交互与情感计算能力，并联合实丰文化推出AI魔法星等创新产品。澄海作为全球玩具供应链枢纽，通过云端技术降低接入门槛，加速打造千亿级智能玩具产业集群，预计2030年全球AI玩具市场规模将超360亿美元。
原文链接：https://k.sina.com.cn/article_5787187353_158f1789902001wfqw.html

产品应用

Product Application

银河通用X清华大学发布业内首款开源人形机器人全身遥操系统OpenWBT，支持多机型、跨虚实，小时内可轻松部署
清华大学与银河通用机器人联合推出开源人形机器人全身遥操系统OpenWBT，突破传统单一控制局限，支持多机型兼容及真实与仿真环境操作。该系统采用Real-world-Ready Skill Space技术框架，将机器人动作拆解为行走、姿态调整等原子技能，通过分层强化学习实现技能融合与稳定迁移。用户仅需VR设备和电脑即可快速部署，1小时内完成安装，兼容29自由度的Unitree G1和H1机型，适用于虚实场景下的高效数据采集与操作任务。开源代码已在GitHub、Gitee平台发布，未来将持续扩展功能与机型适配。
原文链接：https://www.jiqizhixin.com/articles/2025-06-12-2
字节自研AI IDE "TRAE"，月活用户已超百万
字节跳动在2025春季火山引擎大会上宣布，其自主研发的国内首款中文AI编程工具TRAE月活用户突破百万。该IDE集成智能代码补全、局部生成和自然语言编程功能，内部工程师使用率达80%，AI生成代码占比达85%。新发布的豆包1.6大模型已接入TRAE测试，并推出基于上下文理解的cue预测功能，可智能推荐代码修改方案。字节技术副总裁洪定坤表示，将继续优化人机协作模式，使AI既能理解自然语言也能感知编码场景，成为开发者的智能搭档。
原文链接：https://www.jiqizhixin.com/articles/2025-06-12-10
火山引擎发布智能解决方案平台PromptPilot 帮你优化每个指令
火山引擎推出PromptPilot智能解决方案平台，专注解决大模型应用中Prompt编写难题。该平台提供从生成、调试到优化的一站式服务，通过自动化流程降低使用门槛，支持多轮对话优化、多模态任务拆解及工具调用优化等核心功能。其闭环优化体系可将用户问题案例转化为数据资产，持续迭代提升回答质量，并支持联网搜索与自定义知识库，助力企业高效应对复杂AI场景应用。
原文链接：https://www.aibase.com/zh/news/18851
字节Seedance 1.0 Pro发布:超越Veo 3，AI视频生成新王者诞生!
字节跳动火山引擎发布AI视频生成模型Seedance 1.0 Pro，该模型在Artificial Analysis榜单中文生/图生视频任务中超越Google Veo3和可灵2.1。核心技术采用时间因果变分自编码器、解耦时空扩散变换器和多阶段蒸馏技术，实现1080p视频高精度生成与物理运动一致性。模型生成5秒高清视频仅需41秒，成本低至3.67元，覆盖内容创作、电商营销及影视制作场景。凭借生成效率与成本优势，目前已在火山引擎开放API接入，被业界视为AI视频领域新标杆。
原文链接：https://www.aibase.com/zh/news/18863
夸克推出高考志愿大模型，免费助力考生选择理想大学!
阿里巴巴旗下夸克推出国内首个高考志愿大模型，整合“高考深度搜索”“志愿报告”“智能选志愿”三大功能。该系统基于自研高考知识库，可根据考生分数、性格、职业倾向生成个性化志愿方案，提供院校推荐和填报策略，覆盖全国2900多所高校的就业数据。今年算力投入扩大百倍，并坚持免费开放服务，配套名师直播和张雪峰独家专栏，助力考生高效完成志愿填报。该模型支持实时生成完整志愿报告，单次生成需5-10分钟算力支持。
原文链接：https://www.aibase.com/zh/news/18852

硬件&底层技术前沿

Hardware Technologies

Meta发布V-JEPA 2世界模型：视频训练实现环境理解与零样本规划
Meta推出基于视频训练的世界模型V-JEPA 2，具备12亿参数，通过自监督学习实现环境理解和未来预测。该模型采用联合嵌入预测架构，分两阶段训练：百万小时视频预训练提升基础理解能力，62小时机器人数据微调强化动作规划。V-JEPA 2支持零样本任务执行，在未见过物体的新环境中完成抓取放置等任务，成功率高达80%。Meta同步发布IntPhys 2、MVPBench和CausalVQA三大物理推理基准测试，模型在HuggingFace物理推理榜单超越GPT-4o。LeCun强调世界模型是物理现实的数字孪生，可助力机器人、辅助技术及自动驾驶发展，现已在GitHub等平台开源。
原文链接：https://www.jiqizhixin.com/articles/2025-06-12-3
2D图像作中介，零训练实现3D场景生成SOTA:英伟达&康奈尔提出文本驱动新流程
英伟达与康奈尔大学联合研发ArtiScene系统，通过2D图像中介实现文本驱动的3D场景生成。该系统结合文本生成图像与3D重建技术，采用五步流程：生成等轴测场景图、物体检测修复、3D定位、模块化模型生成及场景组装，无需额外训练即可构建风格统一的3D场景。实验显示，该方案在布局合理性（物体重叠率降低6-10倍）、风格一致性（CLIP分数提升10%）及生成效率上超越现有方案，支持物体编辑与人工设计图输入，适用于游戏开发、室内设计等场景。
原文链接：https://www.jiqizhixin.com/articles/2025-06-12-4
英伟达打造全球首个工业AI云，配万块GPU，物理AI机器人集群已启动
英伟达宣布在德国构建全球首个工业AI云设施，配备万块DGX B200 GPU与RTX PRO服务器，联合宝马、奔驰等车企及Ansys等软件商推动AI驱动的制造业转型。该平台通过Omniverse数字孪生技术实现物理精确仿真，覆盖从产品设计到智慧城市管理的全周期。同时开源Isaac GR00T 1.5人形机器人模型，并联合欧洲机器人公司开发AI机器人群控系统，扩展Halos安全架构至机器人领域。该布局旨在加速欧洲工业智能化，预计两年内当地AI算力提升10倍。
原文链接：https://www.jiqizhixin.com/articles/2025-06-12-11
何恺明团队提出Dispersive Loss：简化生成模型表征学习框架
何恺明与Runqian Wang提出Dispersive Loss，为扩散生成模型引入自监督正则化机制。该方法仅需在标准扩散损失中添加隐藏层表征分散项，通过鼓励批次内表征差异化提升性能，无需预训练模型、外部数据或额外参数。实验显示，在DiT/SiT等模型中应用后，FID指标提升最高达12.3%，且适用于一步式生成模型。相比谢赛宁的REPA方法，该方案将训练流程简化85%，在ImageNet 256×256生成任务中实现SOTA，相关代码已开源。
原文链接：https://www.jiqizhixin.com/articles/2025-06-12-15
英伟达 CEO 黄仁勋展望:欧洲 AI 算力将在两年内实现十倍增长
英伟达CEO黄仁勋在VivaTech峰会上表示，欧洲AI算力预计两年内增长十倍，超20个在建AI超级工厂将配备超1吉瓦供电能力。欧盟设立200亿欧元基金支持5个配备10万处理器的AI工厂建设，单个工厂成本或达500亿美元。英伟达与法国Mistral合作搭建AI云平台，使用1.8万颗Grace Blackwell芯片，并推动各国建立自主AI体系。目前英伟达欧洲生态已吸引150万开发者及超万家企业的参与，正推进全球首个工业AI云项目。
原文链接：https://www.aibase.com/zh/news/18862

上市公司动态

Listed Company Updates

智谱COO张帆即将离职，投身企业级生产力Agent创业
智谱AI COO张帆离职创业开发企业级生产力Agent，智谱正筹备A股IPO冲刺“大模型第一股”。
原文链接：https://wap.eastmoney.com/a/202506123428858625.html

其他

Other

SIGGRAPH 2025奖项出炉：上科大、厦大最佳论文
SIGGRAPH 2025公布技术论文奖项，上海科技大学与厦门大学等国内机构斩获多项殊荣。最佳论文奖得主包括提出CAST三维场景重建技术的团队，该技术通过GPT模型解析物体空间关系实现开放词汇重建；厦门大学团队首创动态IMU校准方法打破绝对静态限制。时间检验奖评选出Embree光线追踪框架等4篇经典论文，国内机构在图形学领域国际影响力显著提升。
原文链接：https://www.jiqizhixin.com/articles/2025-06-12-5
精度达原子级，基于深度学习的动态蛋白质设计，登Science
加州大学研究团队开发出深度学习引导的动态蛋白质设计方法，实现了原子级精度的可控构象变化。该方法通过计算机模拟突变扫描确定关键残基，设计出能在预设状态间切换的蛋白质开关，并通过核磁共振验证结构精度。实验显示单个氨基酸改变即可调控构象平衡，并成功构建Ca2+浓度响应的变构调节系统。该方法突破了传统静态蛋白质设计的局限，为生物信号传导和合成生物学应用提供了新工具，相关成果已发表于《Science》。
原文链接：https://www.jiqizhixin.com/articles/2025-06-12-12
投资大佬Bill Gurley:AI浪潮打断本应发生的市场修正，中国的激烈竞争环境反而能塑造更强企业
风投大佬Bill Gurley在访谈中指出，AI浪潮的爆发延迟了本该进行的市场修正，全球风险投资行业出现「超级基金崛起」和「僵尸独角兽」现象，零利率环境下企业估值虚高且IPO市场停滞。他特别强调中国AI市场的独特生态，指出阿里、百度等巨头开源大模型的竞争策略将推动技术迭代，形成多模型相互训练的开源生态，这种激烈竞争环境反而能催生更强企业。同时警示当前AI企业存在算力转售为主的营收结构，未来需解决单位经济效益问题。
原文链接：http://m.toutiao.com/group/7514991251742114358/
ChatGPT 在国际象棋赛中被48年前的雅达利2600 “打败”!
ChatGPT与雅达利2600游戏机内置的《Video Chess》对弈时表现欠佳，在90分钟比赛中多次出现低级失误，包括混淆棋子类型、错过关键战术布局等。实验者指出，虽然ChatGPT作为语言模型并非专为棋类设计，但其错误水平甚至低于人类三年级棋手。该测试凸显了AI在特定领域的局限性，同时启示与其利用通用模型进行博弈，不如专注其擅长的策略讨论领域。与1997年深蓝击败人类棋王的案例形成鲜明对比。
原文链接：https://www.aibase.com/zh/news/18864
微信 “问一问主持人” 功能上线，普通人也能抢占信息流C位
微信推出"问一问主持人"功能，允许创作者通过公众号或视频号身份发起讨论，并带有专属主持人标识。该功能突破原有匿名提问模式，使内容创作者的提问可展示在主页、搜索页等信息流场景，提升互动曝光和私域流量转化。用户可通过搜一搜入口发起话题讨论，支持在公众号文章嵌入问答及社群运营，有效激活评论区和公私域流量衔接。早期用户反馈显示该功能强化了社群归属感，但曝光效率仍有优化空间，运营需配合精准提问策略和持续互动维护。
原文链接：https://www.aibase.com/zh/news/18861

⬇️更多AI资讯关注我们⬇️

【声明】内容源于网络

久新数智

重塑生产力，开启人机协作新篇章！

内容 139

粉丝 0

久新数智重塑生产力，开启人机协作新篇章！

总阅读107

粉丝0

内容139