

AI一周资讯速递（9.1-9.5）

上海蓝玥信息科技有限公司

2025-09-05

一、马斯克画饼兑现，xAI正式上线编码模型Grok Code Fast 1

1. Grok Code Fast 1从零打造，速度比GPT-5快五倍，性价比高，性能冲进全球编码模型前五；

2. 模型架构与训练数据聚焦真实编程任务，支持多语言，全栈开发与bug修复能力突出；

3. 研发团队以华人学者为主，xAI通过用户反馈迭代优化，并公布多模态与视频生成等后续路线图。

https://mp.weixin.qq.com/s/tw0_UEs4T_Gf-W0UwiMvVA

二、 Meta正寻求与OpenAI或谷歌合作，为旗下应用注入AI

1. Meta在AI领域面临瓶颈，内部旗舰模型进展缓慢，Llama 5尚未成型；

2. 扎克伯格为提升竞争力，正寻求引入OpenAI或谷歌模型，并已在内部工具接入外部模型；

3. 外部合作策略体现Meta在AI赛道的焦虑与被动，既要自研突破，也需借力外部技术维持产品竞争力。

https://mp.weixin.qq.com/s/w8uw4PHEiq1A-tj4f6iYFQ

三、 OpenAI通过技术直播发布了语音模型GPT-realtime

1. OpenAI发布GPT-realtime，具备超自然语音生成、情感语调模仿与多模态理解，准确率与推理能力显著提升；

2. 模型在指令遵循、函数调用、异步对话与图像输入等方面大幅优化，支持更灵活的Agent应用场景；

3. Realtime API同步上线，扩展SIP等连接、复用提示、内置安全防护，并以更低价格开放，推动语音AI智能体落地。

https://mp.weixin.qq.com/s/2C1o50LncfsAtfYUqhU91A

四、 Claude开始收用户数据训模型，不同意30天就删记录

1. Claude更新隐私政策，默认允许收集用户对话与编程数据用于模型训练，不同意则仅保留30天；

2. 此举涵盖免费及付费用户，违背其早期“安全不收集”的承诺，被批评为价值观转向；

3. 用户可在设置中手动关闭，但默认开关已打开，反映出AI公司在隐私与安全上普遍趋向数据依赖。

https://mp.weixin.qq.com/s/yMN1y3_fUHiZeftdiqjYkA

五、美团开源龙猫大模型LongCat-Flash，5600亿参数MOE

1. 美团开源龙猫大模型LongCat-Flash，采用5600亿参数MoE架构，创新引入“零计算专家”和ScMoE，大幅提升效率与速度；

2. 模型在MMLU、ArenaHard、CEval等基准中表现接近甚至超越DeepSeek V3.1与Qwen3，尤其在指令遵循与Agent任务上排名领先；

3. 支持128k上下文、推理速度超100TPS、成本仅0.7美元/百万词元，已在Hugging Face和GitHub开源，MIT协议开放使用。

https://mp.weixin.qq.com/s/rDzzODj80YVMPTDCXOMQMw

六、 AI版「狼人杀」七大LLM狂飙演技，GPT-5冷酷操盘

1. 全球七大LLM参加狼人杀210场对战，GPT-5以96.7%胜率遥遥领先，展现出超强社交推理与操纵能力；

2. 作为狼人，GPT-5以逻辑框架与心理战精准瓦解对手；作为村民，则靠司法化调查体系抵抗操纵，零误伤关键角色；

3. 新“狼人杀基准”揭示AI在博弈、说服、抗操控上的差异，GPT-5成为最具统治力的“社交智能体”，远超其他模型。

https://mp.weixin.qq.com/s/o-GJXrctcWseFgbRWCK4fg

七、 xAI创始老哥叛逃OpenAI，马斯克：他上传了整个代码库

1. xAI创始工程师李雪辰在套现约700万美元股票后，被指窃取并上传了Grok核心代码库，随后叛逃至OpenAI；

2. xAI已在加州联邦法院提起诉讼，指控其盗取数十亿美元级别商业机密，并要求设备交出、数据删除、竞业禁止及巨额赔偿；

3. 事件加剧了马斯克与OpenAI的对立，也引发业界对AI人才流动、知识产权保护与行业规则的高度关注。

https://mp.weixin.qq.com/s/b3ualFfQr35OaD6kROiD6A

八、 Meta和Scale AI刚合作就闹翻！砸143亿买的高管跑路

1. Meta和Scale AI合作出现裂痕，仅两个月后随Scale AI前CEO进入Meta的高管Ruben Mayer已离职；

2. Meta内部研究人员抱怨Scale AI数据质量太低，Meta转向与Scale AI竞争对手Mercor和Surge合作；

3. Meta这一波天价挖人后已多次重组AI部门，而Scale AI失去Meta支持后也丢失OpenAI和谷歌等大客户，经历大规模裁员。

https://mp.weixin.qq.com/s/-1wg9-_Vv165qaa_vidonw

九、 Claude Opus 4.1白天退化，Anthropic承认并回滚更新

1. 多位用户反馈Claude Opus 4.1在上午10-11点期间性能显著下降，处理文稿任务频繁出错，且只在白天出现；

2. 分析认为可能是Anthropic在白天采用1.58位量化（仅用-1、0、1三个值表示参数）导致模型丢失关键信息；

3. Anthropic官方承认是推理堆栈出问题，本意是提升模型效率却影响了响应质量，已将Claude Opus 4.1和4.0版本回滚。

https://mp.weixin.qq.com/s/IRD_K4OAuivBVsh59GfUQg

十、拿下30个第1名的翻译模型腾讯Hunyuan-MT-7B开源

1. 腾讯混元开源7B参数翻译模型Hunyuan-MT-7B，支持33个语种和5种民汉语言/方言互译，在WMT2025比赛31个语种中拿下30个第一；

2. 同步开源业界首个翻译集成模型Hunyuan-MT-Chimera-7B，能根据原文和多个翻译模型的结果生成更优翻译；

3. 模型采用AngelSlim压缩工具进行FP8量化，推理性能提升30%，已接入腾讯会议、企业微信、QQ浏览器等多个腾讯业务。

https://mp.weixin.qq.com/s/rKcf7jXAYlCKcwan0o756Q

十一、阶跃星辰发布开源端到端语音大模型Step-Audio 2 mini

1. 阶跃星辰发布端到端语音大模型Step-Audio 2 mini，统一建模语音理解、音频推理与生成，并支持语音原生Tool Calling能力；

2. 模型在多个基准测试中表现突出，MMAU得分73.2位列开源端到端语音模型榜首，中英互译和语音识别任务大幅领先其他模型；

3. 采用真端到端多模态架构，引入链式思维推理与强化学习联合优化，可精细理解情绪、语调、音乐等副语言和非语音信号。

https://mp.weixin.qq.com/s/aiJe0286r-oN2AFeXmcRLQ

十二、书生·万象3.5发布，通用、推理能力与部署效率升级

1. 上海AI实验室开源发布书生·万象InternVL3.5系列模型，包含10亿至2410亿参数九种尺寸，通用能力、推理能力和部署效率全面升级；

2. 旗舰模型InternVL3.5-241B-A28B在多项基准上超越GPT-5，MMMU获77.7分（开源最高），通过级联式强化学习将推理性能较上代提升16.0分；

3. 创新引入动态视觉分辨率路由与解耦部署框架，单次推理延迟由369ms缩短至91ms（提升约4倍），并增强GUI智能体、具身空间推理等智能体核心能力。

https://mp.weixin.qq.com/s/28l0HdFv7baHk2UfReUHtg

十三、韩国给数万名独居老人发AI玩偶，24h陪伴+健康监测

1. 韩国政府向数万名独居老人分发由初创公司Hyodol开发的AI玩偶，该玩偶不仅能陪伴聊天，还能提醒吃饭服药并监测健康状况；

2. 玩偶内置基于ChatGPT的对话系统，颈部红外传感器可检测动作，胸部麦克风会记录老人对日常问题的回答，并可在紧急情况下通知护工；

3. 已有1.2万多台Hyodol玩偶在韩国独居老人家中提供服务，每台售价约8160人民币，远低于护理人员成本，有效缓解韩国养老护理人员缺口问题。

https://mp.weixin.qq.com/s/uC5zLM_khbxe8HceXywFJg

十四、今起实施！AI生成内容必须带"身份证"，多平台已公告

1. 9月1日起，《人工智能生成合成内容标识办法》正式实施，AI生成的视频、语音、文字、图片必须添加"身份标签"；

2. 生成合成服务提供者(如大模型企业)需添加显式和隐式标识，传播服务提供者(如内容平台)需核验元数据并加注提示；

3. 腾讯、抖音、快手、B站、DeepSeek等平台已发布细化规则和公告，并为AI内容添加明显标识，提供标识功能，且禁止用户删除或篡改标识。

https://mp.weixin.qq.com/s/UzEUDAxeW8EqjD1iO98UQg

十五、这次真不一样，谷歌Gemini解锁「详解网页」新技能

1. 谷歌Gemini API全面上线"URL Context"功能，使模型能深度访问并处理来自URL的内容，包括网页、PDF和图像等；

2. 该功能采用两步检索流程，可深度解析PDF中的表格、文本结构、脚注等，处理容量上限达34MB，单次请求最多处理20个URL；

3. URL Context被评价为"RAG的又一颗棺材钉"，无需提取、分块、矢量化和存储等繁琐流程，直接解析特斯拉50页PDF并精准提取数据。

https://mp.weixin.qq.com/s/alV-czwScS_CSsdP3nWZHQ

十六、混元世界模型上新，综合能力问鼎WorldScore排行榜

1. 腾讯发布混元3D世界模型系列最新成员HunyuanWorld-Voyager，业界首个支持原生3D重建的超长漫游世界模型；

2. 混元Voyager突破传统视频生成限制，能生成长距离、世界一致的漫游场景，支持将视频直接导出为3D格式，且与混元世界模型1.0高度适配；

3. 该模型在斯坦福大学李飞飞团队发布的WorldScore基准测试中位居综合能力首位，支持视频场景重建、3D物体纹理生成等多种应用。

https://mp.weixin.qq.com/s/vCkFWwV5vUQhjMRfMQB2XA

十七、 Runway跨界机器人领域，世界模型成模拟训练新引擎

1. 视觉生成AI公司Runway获英伟达、谷歌和General Atlantic等投资者超5亿美元融资，估值达30亿美元，正式跨界机器人领域；

2. Runway的AI世界模型可为机器人和自动驾驶汽车公司提供训练模拟，实现高效、低成本的虚拟测试环境；

3. 相比真实场景训练，Runway的模型能让用户更精细地控制特定变量测试，尤其适合评估不同操作在相同环境下的表现。

https://mp.weixin.qq.com/s/VrJOttdmvr-EgD5b_PC6-A

十八、腾讯优图开源智能体框架Youtu-Agent，开箱即用！

1. 腾讯优图实验室开源Youtu-Agent智能体框架，具备开源友好、成本低、灵活架构和自动智能体生成等特点；

2. 该框架在WebWalkerQA基准上使用DeepSeek-V3.1达到71.47%准确率刷新开源效果SOTA，在GAIA文本子集达到72.8%，无需充值闭源模型；

3. 框架采用DITA原则，提供四个典型应用案例：本地文件管理、数据分析、论文分析和广域综述，支持一键生成配置和启动测试。

https://mp.weixin.qq.com/s/ODLHcZnEqAwxJ0fB0K_pjQ

十九、 flowith 团队发布了一款全新平行世界小游戏 flolife.me

1. flowith团队发布基于多模态画布和Nano Banana技术的AI人生模拟器flolife.me，玩家可捏造角色后由AI接管整个人生模拟；

2. 游戏流程简单：玩家输入角色名字、性别、出生地并分配属性，再设置人格描述，系统便自动生成完整人生线和分支选项；

3. flolife会为用户生成各种人生关键节点的不同可能性，展现离奇故事，还能从中挑选四个高光瞬间制作分享海报。

https://mp.weixin.qq.com/s/r5YPiYvUcViA8qkr_SSzpA

二十、 Aivilization 深度体验： AI 社畜不睡觉不恋爱卷生卷死

1. 来自香港科技大学的Aivilization小镇项目可让用户创建自定义AI人物，设置MBTI性格与目标，再看它们在虚拟小镇生活成长；

2. 游戏评价体系单一，以金钱排名为唯一衡量标准，导致玩家优化策略趋向"剥夺人性"——不睡觉不休息只赚钱，打造冷血工具人；

3. 顶尖玩家发现，通过挖矿积累初始资金、升级房子后制造芯片，可实现每天67680金币的被动收入，远超读书、休闲等生活方式的收益。

https://mp.weixin.qq.com/s/OVzHdohWLFt2NnmplxYvLw

二十一、 GLM-4.5工具调用超越Claude Opus 4.1，成本仅1.4%

1. 智谱开源的GLM-4.5在伯克利工具调用排行榜上超越Claude Opus 4.1，运行相同任务的成本仅为对手的1.4%；

2. 该模型使用MoE架构，在涵盖六大开发领域、52个实际编程任务的CC-Bench评测体系中表现强劲，尤其在任务完成效果和工具调用可靠性方面；

3. GLM-4.5不仅推理速度比Opus 4.1快3倍、比GPT-5快5倍，已接入Claude Code、Cline、Gemini CLI等多款主流编程工具，价格仅为Claude的1/7。

https://mp.weixin.qq.com/s/ykuuGhq0vqdOhcRDtsDzPQ

二十二、 OpenAI斥资11亿美金，收购软件开发平台公司Statsig

1. OpenAI以11亿美元收购软件实验和分析平台Statsig，并任命创始人Vijaye Raji为OpenAI应用部门新CTO；

2. Statsig帮助软件团队判断代码是否该上线及效果评估，这次收购显示OpenAI战略重心从纯底层模型研发转向打造数据驱动的终端用户产品；

3. Vijaye Raji曾在微软工作十年，后在Meta担任高管十年，2021年创立Statsig，期间表现出卓越的编程能力和领导才能，将直接向OpenAI应用CEO Fidji Simo汇报。

https://mp.weixin.qq.com/s/_eGHvABP5GK2FfCEl1jlfw

二十三、又一万亿AI独角兽诞生，Anthropic完成130亿美元融资

1. Anthropic宣布完成130亿美元F轮融资，投后估值达1830亿美元，成为仅次于OpenAI、字节跳动的全球第三大AI独角兽；

2. 公司年化收入从年初10亿美元飙升至50亿美元，服务超30万企业客户，增长的主要动力是AI编程神器Claude Code三个月使用量增长10倍；

3. Anthropic已完成9轮融资总额达300亿美元，本轮由ICONIQ、Fidelity和Lightspeed领投，新资金将用于扩大企业采用规模和国际扩张。

https://mp.weixin.qq.com/s/qLbioi8xkW6T-Kd3sl16Bg

二十四、 nano banana爆火！谷歌官方最强Prompt模板终于来了

1. 谷歌发布nano banana(Gemini 2.5 Flash Image)官方Prompt模板，覆盖写实摄影、贴纸、文本渲染、商业摄影、留白设计和漫画六大场景；

2. 模板强调像讲故事一样描述场景，详细指定摄影参数、配色方案、风格特点和构图细节，生成高质量图像；

3. 用户可直接套用模板，通过Python代码调用API生成图像，解决了生成图片风格不统一、品质不佳等问题。

https://mp.weixin.qq.com/s/Ov1Y6PJicJkdgsyhrDQTHQ

二十五、 CPO宣布「OpenAI for Science」计划：打造下一代科学工具

1. OpenAI首席产品官Kevin Weil正式宣布启动"OpenAI for Science"计划，将组建由顶尖学者组成的小型团队，打造AI驱动的科学发现平台；

2. 该团队成员需满足三个条件：研究领域达世界级水准、深度认同AI理念、具备卓越科学传播能力；

3. Weil列举GPT-5在科学领域的四个案例，包括17分钟优化凸优化边界值、推导量子场论证明过程、优化诺贝尔奖级蛋白质设计等。

https://mp.weixin.qq.com/s/lAz_hpFlhnp9SyuaGEVaYw

二十六、 Midoo.AI 发布，AI Agent 能否破解千亿美金的教育行业

1. Midoo.AI发布全球首个语言学习Agent，致力解决教育行业"学习效果"交付成本高、千人千面难规模化的核心困境；

2. 平台通过动态个性化内容、沉浸式场景和学习伙伴系统，建立由"事"(剧情主线)、"物"(可互动物品)、"人"(符合人设的NPC)组成的MultiAgent+Workflow系统；

3. 创始团队由TalkAI创始人Mark和前Fellou.ai联合创始人Leo组成，定位语言学习赛道，将先聚焦日韩和北美市场再逐步拓展全球。

https://mp.weixin.qq.com/s/lTWectcA5Ovw_g3fleLFgw

二十七、 UCSD首个智能体浏览器发布！多页面设计，颠覆传统交互

1. 加州大学圣地亚哥分校推出Orca浏览器，将传统标签页转变为可随意拖拽、并排比较的无限空间化画布，用户可同时操作多个网页；

2. Orca支持大规模查看、管理、导航和提取功能，用户可部署调度不同智能体完成情境任务，每个智能体通过不同颜色的虚拟光标方便追踪；

3. 用户实验表明，Orca显著降低管理多页面的成本，激发更强探索欲望，用户对信息来源有更强控制力，因此更信任结果。

https://mp.weixin.qq.com/s/149KsdD3NJ7eb5Gvxh56yQ

二十八、 00后打造最强苹果开发Agent！刚刚，OpenAI打包收编

1. Xcode最流行的超强编程Copilot插件Alex团队被OpenAI收编，创始人Daniel Edrisian及全体成员加入OpenAI的Codex团队；

2. Alex作为深度集成Xcode的侧边栏插件，不仅提供代码自动补全和对话功能，还能直接在Xcode中操作修改代码，实现开发任务自动化；

3. 这次收购显示OpenAI意图进入Xcode生态系统，扩大在苹果App开发领域的影响力，Alex团队能带来苹果生态开发AI自动化的专业经验。

https://mp.weixin.qq.com/s/dkJXma-8iF_r7pIi0ijXGw

二十九、 AI搜索引擎，苹果两个动作：WKA、与谷歌合作支持Siri

1. 苹果计划2026年春季推出代号为"世界知识问答"(World Knowledge Answers)的AI搜索引擎，将与ChatGPT和Perplexity直接竞争；

2. 同时苹果倾向于与谷歌合作，利用谷歌模型为Siri的部分功能提供技术支持，两公司已于本周达成正式协议；

3. 苹果正面临AI人才流失危机，已在数周内失去10名AI研究员，其中包括基础模型团队负责人庞若鸣在内的多位核心人员，大多加入了Meta。

https://mp.weixin.qq.com/s/SG38lbfHbE6xn75AwufdoQ

三十、月之暗面上新，Kimi K2-0905登场，更强编程、创意写作

1. 月之暗面发布新版本Kimi K2-0905模型，增强了编程能力，支持256K超长上下文(K2-0711仅支持128K)；

2. 新版本在创意写作领域仍保持SOTA水平，同时改善了Claude Code兼容性，提升了网页和图表生成的美观度；

3. 模型暂未开源，目前处于开放Beta测试阶段，API就绪后将为测试者提供一些免费token。

https://mp.weixin.qq.com/s/V8U6TrvQvdlsXwNQWwQHiA

三十一、 AI边刷视频边思考！快手最新多模态大模型开源，推理超快

1. 快手开源80亿参数多模态大模型Keye-VL-1.5，支持128k tokens扩展上下文，在同等规模模型中于多项视频理解基准测试取得SOTA；

2. 该模型能捕捉视频细节与时间逻辑，在10秒内完成数分钟视频内容的处理，能自动识别AI生成内容，但暂不支持音频理解和图像/视频创作；

3. Keye-VL-1.5引入了三项关键创新：慢-快视频编码策略、渐进式预训练策略和全面的训练后方法，适用于视频推荐、创作和内容审核等场景。

https://mp.weixin.qq.com/s/gGbujt11fpFG-5_iJjRrjQ

三十二、 OpenAI宣布向免费版ChatGPT开放Projects项目功能

1. OpenAI向免费版ChatGPT开放Projects功能，支持用户上传最多5个文件，管理项目颜色与图标，并提供专属项目记忆控制选项；

2. Projects功能允许集中管理相关内容，上传文档、代码、图片等文件，添加自定义指令，大幅提升ChatGPT的使用效率；

3. 该功能已在网页版和安卓端开放，iOS版将在未来几天内上线，用户可创建专项项目如婚礼筹备、研究分析等，使ChatGPT成为个性化的协作工具。

https://mp.weixin.qq.com/s/hPuh7WW54NtUZ_jSqWB1Dw

三十三、裁员4000人！Salesforce CEO：有AI不再需要那么多人

1. Salesforce裁撤约4000个客户支持岗位(从9000人减至5000人)，CEO Marc Benioff直言"因为有了AI不再需要那么多人"；

2. 裁员归因于公司推出的客服AI系统Agentforce大幅提升工作效率，降低了支持工单数量，Benioff称AI已承担公司内部高达50%的工作量；

3. 尽管裁减支持岗位，Salesforce仍计划增招1000-2000名销售人员来向客户解释AI价值，Benioff认为围绕Agentforce的战略是公司当前头等大事。

https://mp.weixin.qq.com/s/3xkwetI9yxecLlDwPfHMPg

【声明】内容源于网络

上海蓝玥信息科技有限公司

1234

内容 108

粉丝 0

上海蓝玥信息科技有限公司 1234

总阅读363

粉丝0

内容108