

AI一周资讯速递（9.8-9.12）

上海蓝玥信息科技有限公司

2025-09-12

一、 Anthropic禁止中国控股公司使用Claude，公司在哪都不行

1. Anthropic发布最新政策限制，停止向多数股权由中国资本持有的集团或子公司提供Claude服务，无论其运营地点在哪里；

2. 该限制适用于直接或间接被中国公司持股超过50%的实体，官方声明这是出于法律、监管和安全风险考虑；

3. 政策同样适用于俄罗斯、伊朗、朝鲜等"对手国家"实体，高管称此举预计会对Anthropic全球收入造成"数亿美元"范围的影响。

https://mp.weixin.qq.com/s/TsErlyz7xnm_iHhP1CGc8Q

二、一个能让 iPhone 用上 AI 的配件，千万人围观但或大可不必

1. AI Key作为一款定价89美元的iPhone外接AI助手硬件，上线7小时内几乎售罄，可通过USB接口连接后实现语音控制手机应用功能；

2. 当今iPhone已自带强大芯片能访问各类AI模型，AI Key等外接硬件本质是给已足够智能的设备增加冗余功能；

3. AI硬件创业潮(如Humane Ai Pin和Rabbit R1)多数是短期热度，未来真正有价值的是将AI作为系统"属性"而非"功能"，嵌入所有智能设备中。

https://mp.weixin.qq.com/s/5ncWQpkSCjQo1eVONZXf3g

三、腾讯混元游戏视觉生成平台「混元游戏」发布全新2.0版本

1. 混元游戏2.0正式发布并全面开放使用，新增游戏图生视频、自定义模型训练、角色一键精修等能力；

2. 新推出的AI动画/CG能力支持角色360度旋转等游戏演示，用户只需上传游戏图片并输入动态描述即可生成高质量动态视频；

3. 自定义模型训练功能大幅降低生图模型精调门槛，用户只需上传数十张相同风格或角色图片并设置触发词，系统自动打标训练专属LoRA模型。

https://mp.weixin.qq.com/s/nh8zID_oCDI9mbawej52Tg

四、阿里Qwen3-Max-Preview（Instruct）官宣上线，万亿参数

1. 阿里发布Qwen3-Max-Preview超万亿参数模型，在全球主流权威基准测试中碾压Claude-Opus 4、Kimi-K2和DeepSeek-V3.1；

2. 新模型在知识推理、数学推理、竞争性编程等多项评测中表现优异，证明Scaling仍然有效，参数越大模型性能越强；

3. 模型已正式上线阿里云百炼平台和Qwen Chat，支持100+语言，最大支持256k上下文，按token数阶梯计费。

https://mp.weixin.qq.com/s/5cyPaUENhU6C2ZGavtRx9A

五、字节Seed推出Robix：让机器人学会思考、规划与灵活互动

1. 字节跳动Seed团队发布机器人研究成果Robix，一种将推理、任务规划与人机交互无缝整合的统一"机器人大脑"；

2. Robix采用层次化架构将"大脑"与"小脑"解耦，高阶认知层负责复杂任务决策，低阶控制层执行具体动作，实现"宏观思考，微观执行"；

3. 团队通过三阶段训练（打好物理世界基础、模拟社交情境、纠正思想与行动偏差）构建了Robix，使机器人能理解模糊指令、处理实时反馈、进行动态推理决策。

https://mp.weixin.qq.com/s/S2TY124YgC7sx1VkVZviXg

六、 5天爆卖40000台，做AR+AI眼镜的"小而美"，Rokid交卷

1. Rokid Glasses开售5天全渠道已售40000台，9月产能已排满，其AR+AI眼镜以49g轻量化设计和精细产品体验赢得市场认可；

2. 产品核心优势在于细节打磨，包括可拆卸鼻托适配各种鼻型、三种音频模式、三种拾音模式，显示位置无级调节，89种语言实时翻译等；

3. Rokid昨日开放SDK，首次提供面向AI智能眼镜的完整开发工具链，降低应用开发门槛，目前产品已布局全球80多个国家和地区。

https://mp.weixin.qq.com/s/M3SZrkXFTbTxmEAfvPA2Eg

七、马斯克谈AI5 和 AI6 芯片的最新进展，称其为史诗般的芯片

1. 马斯克在X平台透露特斯拉AI5芯片设计团队完成评审，称其将是"史诗级"芯片，下一代AI6有望成为"迄今为止最好的AI芯片"；

2. 特斯拉决定从两种芯片架构切换到一种，所有芯片人才将专注于同一目标，马斯克形容为"理所当然的选择"；

3. AI5预计2025年下半年推出，初期代工会在中国台湾，到后期会在美国，算力将是前代的10倍；AI6芯片或将由三星在美国工厂生产。

https://mp.weixin.qq.com/s/XivsL8vf15x5BrcUx_yTQA

八、 Meta超级智能实验室的首篇论文来了，重新定义了RAG

1. Meta超级智能实验室推出REFRAG框架，提出重新定义RAG技术，最高将首字生成延迟(TTFT)加速30倍，突破长上下文计算冗余瓶颈；

2. REFRAG通过"压缩、感知、扩展"三步流程，使用轻量级编码器将长文本压缩为紧凑表征，再智能判断关键内容，最终结合压缩表示和原始文本形成混合序列；

3. 该技术不仅保持性能无损，还能使上下文窗口等效扩大16倍，适用于RAG、多轮对话、长文档摘要等多种长上下文应用场景。

https://mp.weixin.qq.com/s/ftP3-qoUcO5hNEdmwjFZVw

九、光刻机巨头ASML杀入AI！豪掷15亿押注「欧版OpenAI」

1. 光刻机巨头ASML斥资15亿美元领投Mistral AI，成为这家成立仅两年的法国AI初创公司最大股东，此轮融资总额约20亿美元；

2. 融资完成后Mistral AI估值达140亿美元，将成为欧洲最有价值的AI公司，ASML还将获得其董事会席位；

3. Mistral AI秉承开源理念，由Meta和DeepMind前员工创立，曾发布多款开源模型，并推出聊天助手Le Chat、AI音频模型Voxtral和编码模型Devstral等产品。

https://mp.weixin.qq.com/s/ay0nTvxTWqevXBxLczyLYA

十、微软开源3大突破AI Agent模型，140亿参数超越DS-R1？

1. 微软研究院开源推理模型rStar2-Agent，仅有140亿参数却在多项基准测试中超越拥有6710亿参数的DeepSeek-R1；

2. 该模型通过三大技术突破：隔离式高吞吐代码执行基础设施、动态负载均衡调度器，以及融合Resample-on-Correct的GRPO-RoC算法；

3. 模型采用"非推理微调+多阶段强化学习"的高效训练流程，只需64台MI300X GPU，一周内完成510步强化学习迭代即达到性能峰值，大大降低了算力成本。

https://mp.weixin.qq.com/s/Lu_k1UnLo-tcrVH67-15wA

十一、刚刚结束的OpenAI黑客松上，全球共有六支团队冲进榜单

1. OpenAI在旧金山举办GPT-5黑客马拉松，邀请500多位开发者挑战GPT-5极限，韩国AI初创公司Gentoo团队获得冠军；

2. 获奖项目包括：营销活动模拟系统、AI时尚搭配、Excel电子表格智能辅助、知识视频生成工具、AI电脑使用智能体、AI电网优化系统；

3. 参赛团队利用GPT-5强大的思考能力和工具调用功能，开发出多种实用场景应用，展示了AI在各行业落地的创新可能性。

https://mp.weixin.qq.com/s/whBNr0pTomNAKhIrfkUYYQ

十二、 OpenAI 首部 AI 电影曝光！GPT-5 加持，明年戛纳首映？

1. OpenAI正为动画长片《Critterz》提供工具和算力支持，预计明年5月在戛纳电影节首映；

2. 该片由伦敦Vertigo Films与专注AI与传统影像融合的Native Foreign工作室合作制作，预算控制在3000万美元以内；

3. 制作团队将邀请真人演员配音，由艺术家绘制概念草图，再用OpenAI的GPT-5等工具进行AI处理，制作周期仅9个月，远低于传统动画电影的3年制作周期。

https://mp.weixin.qq.com/s/HRdHTl1PBw_Mqmsacz2uTg

十三、港科大发布3D 场景表征与大规模重建新方法 SAIL-Recon

1. 香港科技大学谭平团队与地平线联合发布SAIL-Recon，通过锚点图建立构建场景全局隐式表征，突破现有模型对大规模视觉定位与3D重建的处理瓶颈；

2. 该技术采用全局隐式场景表征、统一Transformer架构和渐进式2D-3D编码等创新方法，实现万帧级场景重建；

3. 在TUM-RGBD、CO3Dv2和Tanks & Temples等权威基准数据集上，SAIL-Recon在相机位姿估计与新视角合成精度均显著超越现有方法。

https://mp.weixin.qq.com/s/5CZFIhy-mAia8gIw0SsDug

十四、 Altman亲自发博客点赞，OpenAI这两大杰出人才究竟是谁？

1. OpenAI CEO Sam Altman在博客中特别介绍了两位幕后核心研究员Jakub Pachocki和Szymon Sidor，称他们是"完美互补的传奇搭档"；

2. Pachocki作为首席科学家负责制定公司宏观研究路线图，曾领导GPT-4预训练工作，并入选今年《时代》杂志百大AI人物；

3. 两人在2023年OpenAI"宫斗"事件中发挥关键作用，他们的辞职威胁成为员工大规模抗议的导火索，最终促使董事会妥协迎回Altman。

https://mp.weixin.qq.com/s/zV3CYpWMY_8ZUfcv8VVyKA

十五、 Vidu Q1上线「参考生图」功能，人物、背景、道具随意组合

1. 国产AI工具Vidu Q1推出"参考生图"功能，能同时处理7张参考图，在一致性、真实性、美学等方面超越Flux Kontext，媲美谷歌Nano Banana；

2. Vidu Q1在主体一致性方面表现出色，能精准还原人物特征、细节和服饰，同时支持换装、换背景、换道具等多种创意应用，满足电商、广告等行业需求；

3. Vidu专注"一致性"赛道，从"参考生视频"到"参考生图"，实现了多模态可控，将AI从娱乐工具转变为规模化落地的生产力工具，效率提升90%。

https://mp.weixin.qq.com/s/Blyk_UT5jLueRmvg3KsH9A

十六、阿里发布最新语音识别模型Qwen3-ASR-Flash，能识别rap

1. 阿里发布语音识别模型Qwen3-ASR-Flash，支持11种语言和多种口音，能自动分辨语种、过滤噪声，并通过添加上下文信息定制识别结果；

2. 在各项基准测试中，该模型识别错误率明显低于谷歌Gemini-2.5-Pro、OpenAI GPT-4o-Transcribe等竞品，尤其在方言、多语种、关键信息和歌词识别方面表现突出；

3. 实测表明，即使在连续多种噪音、电竞解说、英文说唱、方言混杂等复杂场景中，模型仍能精准识别，歌词识别错误率低于8%。

https://mp.weixin.qq.com/s/9Dv1mkJrlSAc7yxBSTA7VA

十七、百度发布深度思考模型文心大模型X1.1，迭代式混合强化框架

1. 百度在Wave Summit大会上发布文心大模型X1.1深度思考模型，相比X1版本事实性能力提升34.8%，指令遵循能力提升12.5%，智能体能力提升9.6%；

2. 该模型在多项基准测试中超越DeepSeek-R1-0528，效果与GPT-5和Gemini 2.5 Pro基本持平，主要采用迭代式混合强化学习框架提升效果；

3. 基于文心X1.1技术，百度推出剧本驱动多模协同数字人，同时发布飞桨3.2版本及文心快码3.5S，目前百度45%新增代码由AI生成。

https://mp.weixin.qq.com/s/hPUkm3oe2dRptFpmc4xc8Q

十八、豆包·图像创作模型 Seedream 4.0 上线，支持 4K 多模态生图

1. 豆包·图像创作模型Seedream 4.0上线，支持4K高清多模态生图、多图融合、参考生图等功能，对标谷歌Nano Banana；

2. Seedream 4.0在主体一致性方面表现突出，支持多种创意玩法：火柴人姿势转专业摄影、多人物合影、场景拼装、产品展示，尤其在亚洲人脸识别和中文文字呈现方面更有优势；

3. 该模型采用"生成和编辑任务统一"的工作方式，通过联合训练和多模态感知，实现秒级4K出图，能自动补充知识和背景逻辑。

https://mp.weixin.qq.com/s/LKUIrgQcX63Tggb3GzU4Jw

十九、 AI编程赛道整合加速，全球首家破百亿美金AI编程企业诞生

1. AI编程独角兽Cognition获超4亿美元融资，投后估值达102亿美元，超越Anysphere成为全球AI编程赛道估值最高企业；

2. 该公司由华裔工程师Scott Wu、Steven Hao和Walden Yan共同创立，创始人均为国际信息学奥林匹克金牌得主，融资由Peter Thiel旗下基金领投；

3. Cognition在收购Windsurf后，年化收入从7300万美元翻倍增长，同时获得高盛、花旗等大客户，但也因要求"996"级工作强度引发争议。

https://mp.weixin.qq.com/s/kw7YExlD_92_w91s6_4aZQ

二十、英伟达下一代GPU登场，Rubin CPX一次推理数百万Token

1. 英伟达推出专为长上下文推理设计的Rubin CPX GPU，能一次性在数百万token范围内推理，支持软件开发、视频生成等长上下文任务；

2. 该GPU将与NVIDIA Vera CPU和Rubin GPU搭配组成Vera Rubin NVL144 CPX平台，单机架提供8 exaflops AI算力，是GB300 NVL72系统的7.5倍；

3. 系统配备100TB高速内存和1.7 PB/s内存带宽，预计2026年底上市，将为长上下文任务带来前所未有的性能与效率提升。

https://mp.weixin.qq.com/s/f0p0o5Vvq0v4TpV14vZZyA

二十一、 Claude 发布更新，可以直接生成EXCEL、PPT和PDF等文件

1. Claude推出重磅更新，可直接创建和编辑Excel表格、Word文档、PPT幻灯片和PDF文件，并输出真正可用的文件格式；

2. 系统为Claude配备私有计算环境，能写代码运行程序生成各类文档，支持高级数据分析、图像视频处理、各类文件操作和跨格式转换；

3. 该功能已向Max、Team和Enterprise用户开放，Pro用户需等待几周，功能开启后可上传文件或描述需求，Claude在后台完成操作并支持导出或保存到Google Drive。

https://mp.weixin.qq.com/s/D4crDBYWl27D0SwHO9sHnw

二十二、腾讯版「Claude Code」来了！AI编程的L4时代is coming

1. 腾讯发布AI CLI工具CodeBuddy Code并开放CodeBuddy IDE公测，国内版支持无限制使用DeepSeek模型，开创全面支持插件、IDE和CLI三种形态的AI编程工具矩阵；

2. 系统定位专业工程师用CLI Agent，通过自然语言驱动整个开发运维生命周期，支持多智能体协作、长期记忆与上下文压缩，与Git/CI/CD深度集成；

3. AI编程正向L4级AI软件工程师演进，CLI成为下一代AI编程底层基础设施，内部使用显示编码时间缩短40%以上，AI代码评审贡献从12%增至35%。

https://mp.weixin.qq.com/s/ZdR3ovHHsQKhowJyqdeRwQ

二十三、快手AI超级员工上线！一句话短视频，从文案到发布一条龙

1. 快手推出AIGC超级员工Kwali，能通过一句话生成完整短视频，自动完成脚本、拍摄、剪辑到发布全流程，目前正在内测；

2. 系统由多Agent框架驱动，包括意图解析、脚本生成、镜头匹配和剪辑合成四大Agent，并接入千寻素材库与数字人模特库，支持私有素材拖入；

3. Kwali将所有元素拆成可独立操控节点挂在时间轴上，支持实时预览和单独操作，使原本需要多团队分工完成的视频制作变为几分钟内可完成的简易任务。

https://mp.weixin.qq.com/s/4lAwQ5kEGdT9nFEXlrEJLg

二十四、 Fellou实现交互/任务/记忆三连通，重新定义AI时代生产力

1. Fellou CE创建了"无割裂的连续体体验"，实现交互连续(人类与AI与浏览器间自然交互)、任务连续(自动分解大目标为子任务)和记忆连续(统一记忆层关联交互历史);

2. 系统支持跨应用自主执行、多模态转换和动态工作流编排，成功应用于旅行规划、内容创作和投资报告等场景，在Halluminate's Web Bench benchmark测试中取得72%成功率；

3. Fellou CE推出"深度搜索"与"可视化报告生成"核心功能免费开放，同时引入任务可定时、任务可干预和知识可编辑特性，全面提升用户掌控感和生产力体验。

https://mp.weixin.qq.com/s/-HwepuB9gcx9QO9O7SCXrw

二十五、腾讯混元生图模型升级2.1版本开源，支持写字、2k分辨率

1. 腾讯发布开源文生图模型"混元图像2.1"，支持原生2K生图，在复杂语义理解、跨领域泛化和文字生成方面达到业界领先水平；

2. 模型支持最长1000个tokens的提示词，能精准生成场景细节、人物表情和动作，实现多物体分别描述与文字精细控制，支持真人、漫画与搪胶手办等丰富风格；

3. 混元图像2.1采用32倍超高压缩倍率VAE，配备MLLM模块和ByT5模型双文本编码器，解决平均流模型训练稳定性问题，将推理步数由100步蒸馏至8步。

https://mp.weixin.qq.com/s/y42JArSGf-9amxShrpTKGA

二十六、估值120亿美元的Thinking Machines，发布首篇研究博客

1. Thinking Machines发布首篇研究博客，解决LLM推理中的非确定性问题，核心是批次不变性；

2. 研究团队通过改进RMSNorm、矩阵乘法和注意力机制，实现完全可复现的推理结果，性能损失可接受；

3. 公司估值达120亿美元，创始团队多来自OpenAI，首款产品命名为Connection Machine。

https://mp.weixin.qq.com/s/2m_8ZPYBBIs3SuKoEJWiIw

二十七、 ChatGPT终于支持MCP了，一句Prompt即可全自动化

1. OpenAI宣布ChatGPT正式支持MCP(模型上下文协议)，Plus和Pro用户可一键Prompt实现自动化操作；

2. MCP实现了AI模型、工具和数据源的标准化交互，使不同模型能共享上下文，支持即插即用；

3. 用户可通过开启开发人员模式连接第三方服务(如Stripe)，完成复杂任务，但目前无法与其他ChatGPT功能同时使用。

https://mp.weixin.qq.com/s/09par8_260tRn10VEEg4fA

二十八、微信官方公众号「智能回复」功能上线，混元大模型支持

1. 微信公众号推出由腾讯混元大模型支持的"智能回复"功能，解决运营者无法及时回复读者问题的困扰；

2. 该功能可自动学习公众号历史文章和回复风格，回复内容会标注"该消息为智能回复"，并可引用相关历史文章；

3. 腾讯混元还将上线Roleplay模型和AI分身应用，提供沉浸式对话体验，个人创作者可在公众号PC端后台开启。

https://mp.weixin.qq.com/s/sd5KRKgsSnmEiuGv8wBD5A

二十九、一个中间件，能让Kimi K2的万亿模型参数进入秒更时代

1. Kimi开源新中间件checkpoint-engine，能在20秒内完成万亿参数模型在数千GPU上的更新，显著提升强化学习效率；

2. 该技术采用混合共置架构，通过分布式检查点引擎管理参数状态，实现参数广播和重载并行处理；

3. 系统设计支持训练和推理引擎完全解耦，采用参数逐条更新的流水线方式，可抵御单点故障提高稳定性。

https://mp.weixin.qq.com/s/eDg0lpYaxD6mWBXT91J-sA

三十、英伟达发布了用于 3D 模型生成的 AI Blueprint，文本驱动

1. NVIDIA发布新AI Blueprint，通过生成式AI技术让3D艺术家能快速创建场景原型，只需文本提示即可生成多达20个3D模型；

2. 集成Microsoft TRELLIS NVIDIA NIM微服务，比原生应用快20%，支持所有配备16GB以上显存的RTX 50和40系列GPU；

3. 工作流程自动化了从创意到3D模型的转换，生成的模型可导出至Blender等平台进一步优化，大幅节省艺术家原型设计时间。

https://mp.weixin.qq.com/s/T9AnbRcGYpvK9hSxx-pjZA

三十一、百度学术宣布进行AI重构，打造行业一站式AI学术平台

1. 百度学术完成AI重构，推出AI学术搜索、AI文献总结、AI阅读、论文图谱等功能，打造行业首个一站式AI学术平台；

2. 全面覆盖"搜、读、创、编"学术全链路，提供文献总结、全文翻译、选题推荐和专业排版等功能，大幅提升学术研究效率；

3. 平台已收录6.9亿文献资源，覆盖104万学术站点，建立420万学者主页，未来将构建学术身份系统并提供百度全域流量支持。

https://mp.weixin.qq.com/s/Z6qyMVqcTknl7NnPkVEYOw

三十二、 AI托管上线腾讯会议！让元宝替你听会，实现永远「在场」

1. 腾讯会议联合元宝推出AI托管功能，能替用户提前听会并实时记录，解决迟到、多会议撞车和中途离场等问题；

2. 用户只需在会议页面或列表点击"AI托管"，元宝将自动接入会议，生成智能AI纪要，保证会议内容不遗漏；

3. 会后可直接向元宝提问会议内容，辅助决策推进，实现会议成果沉淀转化，让关键会议永远"在场"。

https://mp.weixin.qq.com/s/cobZ01s7siWYi3I0QHX29A

【声明】内容源于网络

上海蓝玥信息科技有限公司

1234

内容 108

粉丝 0

上海蓝玥信息科技有限公司 1234

总阅读371

粉丝0

内容108