大数跨境
0
0

元以AI早报-2025年11月15日

元以AI早报-2025年11月15日 元以科技集团
2025-11-15
1
导读:元以AI早报-2025年11月15日

1.小米发布 Xiaomi Miloco,用大模型重新定义全屋智能
2.ChatGPT上线群聊功能,AI助手也能看气氛说话了!
3.VLA-R1:为机器人注入‘思维链’,真实场景执行成功率75%

元以AI早报


01
小米发布 Xiaomi Miloco,用大模型重新定义全屋智能


🚀小米发布智能家居方案Miloco,融入大模型推动行业向‘理解驱动’转型🤖搭载端侧视觉语言大模型,支持自然语言表达意图实现场景化智能联动🔓构建四层架构,开放接入第三方IoT平台并已在GitHub开源
11月14日,小米正式发布智能家居未来探索方案 Xiaomi Miloco,率先将大模型技术深度融入全屋智能场景,推动行业从‘规则驱动’迈向‘理解驱动’。与传统智能家居需手动设置繁琐自动化规则不同,Miloco 搭载自研的 Xiaomi MiMo-VL-Miloco-7B 端侧视觉语言大模型,赋予家庭设备‘看懂画面、理解需求’的能力。用户只需用自然语言表达意图,如‘当我读书时开台灯’或‘看看小孩有没有在玩手机’,系统便能结合米家摄像头的视觉识别与多模态理解能力,自动触发复杂联动,实现真正意义上的场景化智能。Miloco 构建了涵盖用户层、应用层、能力平台层和硬件层的四层架构体系,支持米家生态与 Home Assistant 无缝打通,并通过标准化 MCP 协议开放接入第三方 IoT 平台,打破生态壁垒。所有数据处理均在本地完成,保障用户隐私安全。尤为关键的是,Miloco 已全面开源,项目已在 GitHub 上线(https://github.com/XiaoMi/xiaomi-miloco),开发者可自由部署、体验并参与技术共建,共同探索大模型驱动下的全屋智能未来。
信息来源:https://mp.weixin.qq.com/s/lBGWgAFOK9AIA1YT1aQBng

02
ChatGPT上线群聊功能,AI助手也能看气氛说话了!


🚀 OpenAI推出ChatGPT群聊功能,在日本等4地区试点支持20人同时互动🤖 群聊中AI仅被@回应,能用表情包,根据头像指代成员🔒 对话不调用私人记忆库,设青少年保护机制,群主有踢人权限
OpenAI正式推出ChatGPT群聊功能,标志着AI助手迈入社交协作新阶段。这项功能目前在日本、新西兰、韩国和中国台湾地区率先试点,支持最多20人同时在一个对话中与AI互动。创建群聊极为便捷,只需点击人物图标生成专属链接,分享后无论免费还是付费用户都能一键加入。更聪明的是,ChatGPT now学会了‘察言观色’——它不会随意插话,只有被@时才会回应,还能用表情包表达情绪,甚至根据头像指代具体成员,仿佛真的融入了人类社交圈。每个群组可自定义AI行为指令,家庭群可以轻松搞笑,工作群则专业严谨。群主拥有踢人权限,成员也可修改群名或屏蔽通知,管理灵活。隐私方面,OpenAI强调对话不调用私人记忆库,也不存入长期记忆,且设有青少年保护机制:一旦检测到未成年用户,系统自动开启内容过滤,家长还可通过亲子监管关闭入口。背后由GPT-5.1模型驱动,回复质量因账户类型略有差异。相比Meta等对手,ChatGPT在精细化控制上更胜一筹,未来或将广泛应用于小组会议、家庭沟通等场景,让AI真正成为懂分寸的‘群成员’。
信息来源:https://mp.weixin.qq.com/s/NR21WSySdRDc-31TvFom0Q

03
VLA-R1:为机器人注入‘思维链’,真实场景执行成功率75%


🤖 VLA-R1是推理增强型VLA模型,实现‘先思考、后行动’📊 构建1.3万条标注的VLA-CoT-13K数据集,对齐推理链与标注📈 实验显示可供性IoU 36.51(+17.78%),轨迹误差降17.25%,真实平台成功率62.5%/75%
在具身智能领域,视觉-语言-动作(VLA)模型正成为机器人理解与交互的核心。然而,传统模型缺乏逐步推理能力,常在复杂场景中‘想当然’地出错。为此,GigaAI、CASIA与清华大学联合推出VLA-R1——一个真正会‘先思考、后行动’的推理增强型VLA模型。其核心创新在于构建了包含1.3万条标注数据的VLA-CoT-13K‘思维教科书’数据集,首次系统性实现了推理链与可供性、轨迹标注的严格对齐。在此基础上,团队引入基于可验证奖励的强化学习,设计区域对齐、轨迹一致性和输出格式三大奖励信号,如同三位严师协同指导,显著提升模型鲁棒性。实验结果显示,VLA-R1在域内测试中,可供性感知IoU达36.51,较最强基线提升17.78%;轨迹预测综合误差降低17.25%。在真实机器人平台上,面对颜色混淆、物体遮挡等挑战,其可供性识别平均成功率达62.5%,轨迹执行成功率高达75%,充分验证了‘思维链’带来的实际优势。
信息来源:https://mp.weixin.qq.com/s/UtExXbxYQAmma84jPoeGWw

04
中国AI的效率突围:低投入高产出的歧异发展之路


📊中美AI资本支出中国仅为美18%,顶尖模型性能达90%🚀中国转向效率核心,通过架构创新等提升资源利用率🔧中国芯片产能预测修正,总算力供应反超推理需求119%
杰富瑞最新报告揭示,2023至2025年中美AI资本支出分别为1240亿与6940亿美元,中国仅为美国的18%,但其顶尖模型MiniMax M2性能却达到GPT-5 Codex high的90%,差距仅约10%。这一反差背后,是中国主动转向以效率为核心的发展路径。面对先进芯片进口受限,中国通过模型架构创新(如MoE)、开源生态建设及极低API定价(如DeepSeek每百万token仅0.32美元),大幅提升资源利用率。更关键的是,报告修正了对中国芯片产能的预测:7纳米良率预期从2030年20%上调至35%,本土GPU产量预计达410万片,总算力供应将达11081 EFLOPS,而2030年推理需求为5071 EFLOPS,供应反超119%。这意味着中国正构建“设计-制造-应用”闭环的内循环体系,华为等企业通过缺陷容忍设计激活国产工艺潜力,结合软件栈优化,有望在2030年前化解芯片短缺风险。中国的AI战略不再盲目追随美国的规模竞赛,而是走出一条低成本、高效率、强落地的可持续发展新路。
信息来源:https://mp.weixin.qq.com/s/eloG8KrVy6FI7sz-W3ZShA

05
打通大模型落地‘最后一公里’,让智能体开发如‘拼积木’般便利


🚀大模型发展加速,合合信息与火山引擎推出“大模型加速器”升级版以打通落地最后一公里📊平台超高精度文档解析稳定率99.99%,转化非结构化数据为结构化🛠️共建“AI创新应用平台”,分Hi Agent与Coze服务分层,多部署覆盖多场景
当前,大模型发展正加速进入“强应用”阶段。中国信通院7月数据显示,国内已发布大模型超过1500个,技术从“实验室”走向“生产线”的需求愈发迫切。在此背景下,合合信息TextIn与火山引擎联合推出“大模型加速器”升级版,旨在打通大模型落地的“最后一公里”。该平台依托多模态文本智能处理技术,提供超高精度文档解析能力,可应对上千种非标准化文档中的无线表格、合并单元格、跨页段落、手写字符等复杂难题,解析稳定率高达99.99%。尤其在专业图表解析方面,能精准处理研报、论文、财报中的十余种图表类型,将非结构化文档转化为机器可理解的结构化数据,为大模型提供高质量语料支持。同时,双方在火山引擎Hi Agent和Coze平台上共建“AI创新应用平台”,针对大型企业与中小开发者推出分层服务:Hi Agent支持低代码与高代码混合开发,助力企业打造定制化“数字员工”;Coze则让智能体搭建像“拼乐高”一样简单,大幅降低开发门槛。平台还支持公有云、私有化部署、开源等多种模式,实现按需选用、无缝集成,全面覆盖医疗、金融、制造、教育、物流等应用场景,推动AI技术真正实现“智能触手可及”。
信息来源:https://mp.weixin.qq.com/s/ziBxLq372rsByISaf4d7mg

06
全球最大开源具身大模型!中国机器人跑完马拉松后开始学思考


🤖北京人形机器人创新中心发布全球最大开源具身智能大模型Pelican-VL,7B/72B参数支持🚀标志中国机器人从‘能跑’迈向‘会想’新阶段👆实现类人级灵巧抓取,支持多步骤任务与多场景应用
北京人形机器人创新中心发布了全球最大的开源具身智能大模型Pelican-VL,支持7B和72B两种参数规模,标志着中国机器人从‘能跑’迈向‘会想’的新阶段。该模型深度融合视觉、语言与动作,构建了主动预测、触觉适应与记忆更新三大核心环节,实现类人级别的灵巧抓取——不仅能通过视觉预判物体属性,还能在接触瞬间动态调整力度,并将每次操作经验存入物理记忆图谱,越用越聪明。在实际应用中,Pelican-VL可驱动机器人完成‘把鞋子放鞋架、扔垃圾、洗衣’等多步骤家庭任务,也能在商超、工厂中担任收银员或质检员,展现出强大的长时序规划与多机器人协作能力。更关键的是,它以函数调用形式将‘思考’转化为‘执行’,让复杂指令变得可控透明。依托已开源的代码与模型,开发者可快速定制各类场景应用,大幅降低研发门槛。随着‘千台机器人真实场景数据采集计划’推进,Pelican-VL正加速向制造业、物流、家居等领域的规模化落地,推动人形机器人进入低成本、高泛化的智能新时代。
信息来源:https://mp.weixin.qq.com/s/XiqjS0s7vekjnPJ_6HjFmw

07
Science:AI大模型解码药物扰动转录图谱,精确制导细胞命运调控


🔬Cellarity等团队提出DrugReflector框架,利用转录组数据高效预测化合物表型活性📈该模型在CMap测试中平均召回率提升15倍以上,血液疾病模型命中率显著提高📊DRUG-seq2技术每周上万样本高通量低成本产出,支撑AI模型数据需求
2025年10月23日,Cellarity公司、亥姆霍兹联合会与麻省理工学院团队在《Science》发表重磅成果,提出名为DrugReflector的闭环主动强化学习框架,利用转录组数据预测化合物表型活性,实现高效药物筛选。该模型基于CMap等数据库超百万级药物扰动转录数据训练,覆盖近万种化合物和50种细胞系,在CMap Touchstone基准测试中,平均召回率较传统算法Dr.Insight提升15倍以上;在血液疾病模型中,巨核细胞分化命中率提升17倍,红细胞祖细胞分化命中率提高13倍,结合闭环学习后命中率再翻倍。其成功核心在于高质量、大规模转录组数据支撑。南京昕瑞再生自主研发的DRUG-seq2技术,可实现每周上万样本的高通量、低成本数据产出,单次实验稳定检测超1万基因表达变化,为AI模型提供精准‘燃料’。在免疫性血小板减少症研究中,该组合将活性化合物命中率从传统筛选的1.1%提升至19.6%,效率提高17倍;在脊髓损伤修复药物筛选中,也能快速锁定具有‘胚胎样再生转录组特征’的候选分子。这一‘数据生成+智能预测’新模式正重塑药物研发逻辑,为难治性疾病带来新希望。
信息来源:https://mp.weixin.qq.com/s/Z6rLV630rvPOyzKiD1Qsqg

08
医学大模型RAG系统真的靠谱吗?耶鲁最新研究打了谁的脸?


📊研究:医学RAG检索仅22%相关,准确性完整性降6%🔍RAG问题:检索不准、证据用不上、输出反退步🚀简单策略提升性能,需科学评估与系统优化
最近,耶鲁大学等顶尖机构的一项重磅研究给火热的医学AI泼了一盆冷水。研究发现,当前广泛使用的检索增强生成(RAG)系统在医学场景中表现堪忧:仅22%的检索内容真正相关,更离谱的是,启用RAG后,模型的事实准确性和完整性反而下降了6%!这项研究堪称迄今最全面的医学RAG专家评估,汇聚18位医学专家贡献的80,502个标注,覆盖GPT-4o和Llama-3.1-8B两大主流模型。数据显示,即便检索到有用信息,模型也常常“视而不见”——GPT-4o引用相关证据的精度仅41%、召回率49%,Llama-3.1更惨,召回率低至28%。问题出在哪?研究一针见血:检索不准、证据用不上、输出反退步。但好消息是,通过简单的证据过滤和查询重构策略,性能在高难度任务上显著提升。这提醒我们:RAG不是万能药,盲目套用不如精心设计。医学AI要走得稳,还得靠科学评估与系统优化。
信息来源:https://mp.weixin.qq.com/s/AWLzX2VLhY36xXd7My850A

09
老挝国家大模型上线,广西打造东盟人工智能合作新标杆


🚀老挝国家大模型完成训练并正式部署上线🌐东盟首个非通用语种国家大模型,中老英三语翻译能力卓越👥累计培养近百人专业人才,增强广西AI自主能力
近日,由自治区数据局牵头,联合国内顶尖研究机构和企业共同研发的老挝国家大模型已完成训练并正式部署上线。作为东盟首个非通用语种国家大模型,该模型在中、老、英三语翻译与互译能力上表现卓越,尤其在老挝语理解、内容生成、文化适配及本地化应用等方面展现出显著优势。面对老挝语电子语料稀缺、数字基础设施薄弱等挑战,项目团队创新构建了低成本、可复制的基础模型技术框架,不仅成功攻克研发难题,还为越南、泰国、马来西亚等其他东盟国家的模型建设提供了可借鉴路径。此次项目累计培养出覆盖数据采集、清洗、模型训练与微调等环节的近百人专业人才队伍,显著增强了广西在人工智能领域的自主能力和产业支撑力。下一步,广西将以老挝国家大模型为起点,体系化推进中国—东盟人工智能合作,聚焦农业、医疗、旅游、教育、金融、物流等重点行业,加快垂直领域大模型的研发与落地,推动区域数字化转型与智能升级。
信息来源:https://mp.weixin.qq.com/s/Jw8jObbPr83J2A8brDjrBg

10
华为混合云2025运维现代化沙龙:四大体系护航政企数智转型


📊华为提出覆盖四大领域的混合云运维现代化顶层设计🔧推出ManageOne AI Insight平台实现资源可视与故障定界⚡大模型应用使告警根因识别速度提升至分钟级,缩短超50%
在“华为混合云2025年运维现代化沙龙”上,华为基于十余年政企混合云运维经验,提出覆盖运维体系、平台、应用与安全四大领域的现代化顶层设计。该架构助力企业从传统运维向智能化云化运维转型,尤其针对AI大模型兴起带来的算力调度难、故障定位复杂等挑战,推出ManageOne AI Insight平台,实现全栈资源360度可视与非确定性故障快速定界。同时,华为将大模型技术深度应用于运维本身,结合运维知识图谱与增强推理模型,打造智能问答、数据检索与故障诊断助手,使告警根因识别速度从小时级提升至分钟级,平均故障处理时间缩短超50%。依托服务5000多家政企客户积累的丰富数据与专家经验,华为正推动混合云运维全面迈向智能化,为政企数智化转型提供坚实支撑。
信息来源:https://mp.weixin.qq.com/s/2ib9QayLsz7ppcayjH5t7A


早报内容及素材均来自网络公开渠道,版权归原作者所有,仅作信息分享使用。


—— END ——



【声明】内容源于网络
0
0
元以科技集团
1234
内容 118
粉丝 0
元以科技集团 1234
总阅读1.3k
粉丝0
内容118