

AI一周资讯速递（10.27-10.31）

上海蓝玥信息科技有限公司

2025-10-31

一、ChatGPT 企业版新增：公司知识，连公司各种内部工具

1. ChatGPT企业版新增"公司知识"功能，可连接Slack、Google Drive、GitHub、SharePoint等内部工具进行多源检索并综合答案；

2. 该功能仅向Business、Enterprise、Edu版开放，使用特调的GPT-5专精于跨多个数据源检索和综合，支持多次搜索和时间筛选；

3. 企业管理员可控制应用连接权限，ChatGPT只能访问用户本身有权限的内容，OpenAI不会用数据训练模型，支持SSO、SCIM等安全措施。

https://mp.weixin.qq.com/s/ckM7X8NqH7eG3ypOBrPLGg

二、OpenAI被曝瞄准AI音乐赛道商业化，已跟艺术学院合作

1. OpenAI已与茱莉亚学院合作标注海量乐谱用作音乐模型训练数据，积极探索AI音乐To B市场特别是广告行业；

2. Suno凭借订阅模式今年ARR达1.5亿美元毛利率超60%，音频模型天生更轻更省钱，OpenAI看中这块肥肉准备入局；

3. OpenAI早在2019年推出MuseNet、2020年推出Jukebox，此次重拾音乐梦是在Scaling Law撞墙后寻求能落地赚钱的新产品方向。

https://mp.weixin.qq.com/s/66mh1F-WG06b8qafvg7Rkg

三、ima 2.0升级：任务模式上线，一键激活2亿知识文件

1. 腾讯正式发布ima 2.0，推出"任务模式"成为业界首个融合Agent能力的个人知识库，可理解复杂任务并自主拆解步骤调用工具完成流程；

2. 新版新增AI要点自动生成结构化摘要、支持多任务并行和协作共享，已服务20多个行业累计沉淀2亿份知识库文件；

3. 支持播客内容智能生成、自定义角色和音色，适用于教育、营销、个人创作等多元场景，计划10月27日正式上线。

https://mp.weixin.qq.com/s/KbEqOqEtIFU2g6BZifIy3A

四、阿里首款自研AI眼镜，夸克AI眼镜在天猫旗舰店开售

1. 阿里首款自研AI眼镜夸克AI眼镜正式开售，88VIP会员最低到手价3329元，上线半日冲上天猫智能眼镜实时榜Top 1；

2. 搭载高通AR1芯片与恒玄BES2800协处理器，整合通义千问、夸克AI、高德导航等阿里生态，采用双电池+换电仓设计支持24小时续航；

3. 配备双光机双目显示和一体贴合定制光波导镜片，实现"处方一体化+光波导显示"方案，镜腿宽度与镜框厚度比主流产品薄40%。

https://mp.weixin.qq.com/s/7VLTWQXe3esg0nS6e36dVA

五、OpenAI收购macOS供应商SAI，剑指GPT操作系统？

1. OpenAI收购了曾为Mac开发自然语言交互界面Sky的公司SAI，将把Sky技术整合进ChatGPT并吸纳约12人团队；

2. SAI三位联合创始人全部出身苹果，CEO曾创立被苹果收购的Workflow演化为Shortcuts，Sky能"看懂"屏幕内容并代表用户完成操作；

3. 此举被认为OpenAI不仅看中Sky技术更是为ChatGPT入局操作系统铺路，微软作为大股东对此感到不安，同日发布新版Copilot推出12项新功能反击。

https://mp.weixin.qq.com/s/ytYLk41hGpA6IwcHP3Q9mg

六、深度学习「三巨头」之一，成为全球首个百万引用科学家

1. 计算机科学家Yoshua Bengio成为Google Scholar上首个引用量超过100万的科学家，与Hinton、LeCun并称深度学习"三巨头"；

2. 他的代表作包括与Goodfellow共同提出的GAN论文获超10万引用，与Hinton、LeCun合著的《Deep learning》获超8.6万引用；

3. 现年61岁的Bengio依然以第一作者身份发表论文，从纯粹科学家转变为积极的伦理倡导者，领导撰写AI安全报告并创办非营利组织LawZero。

https://mp.weixin.qq.com/s/QjU426CzWCXtUBJY5uaA0A

七、特斯拉「世界模拟器」首曝，1天蒸馏人类500年驾驶经验

1. 特斯拉正式公开神经网络「世界模拟器」，可直接模拟合成自动驾驶孪生世界，一个神经网络每天狂吞500年人类驾驶经验并在虚拟世界中自我进化；

2. 该模拟器采用端到端神经网络架构，能生成8个摄像头、24帧/秒的连续画面，一次直出长达6分钟逼真驾驶体验，同款AI大脑可供擎天柱机器人共用；

3. 特斯拉通过「端到端」技术路线，实现从原始像素输入直接输出方向盘角度和油门/刹车力度，消除模块间信息损失，能学习人类价值观处理复杂路况决策。

https://mp.weixin.qq.com/s/vJqksNRnMnl2STjJCnacLA

八、美团LongCat-Video 视频模型发布，开启世界模型的探索

1. 美团正式发布LongCat-Video视频生成模型，基于DiT架构的统一视频基座，通过"条件帧数量"区分任务，原生支持文生、图生、视频续写三大核心任务；

2. 该模型可稳定输出5分钟级别的长视频且无质量损失，720P的5秒视频仅需10秒完成，采用二阶段粗到精生成、块稀疏注意力和模型蒸馏三重优化，推理速度提升10.1倍；

3. LongCat-Video在文生、图生视频任务中综合性能达开源SOTA级别，特别在长视频生成领域具备显著优势，适配数字人、具身智能等需要长时序动态模拟场景。

https://mp.weixin.qq.com/s/iWxKChMbPULHww8ooq3tHw

九、MiniMax悄悄发布M2模型，8%价格打出Claude级性能

1. MiniMax发布M2模型并正式开源，在Artificial Analysis智能指数排名第五，价格仅为Claude 4.5的1/12、GPT-5的1/7，是前五中唯一国产模型；

2. M2在SWE-bench Verified得分69.4分，在τ²-Bench、GAIA、BrowseComp等多项测试中表现优异，FinSearchComp-global金融搜索基准65.5分全球登顶；

3. M2支持接入Claude Code、Cursor等主流开发工具，API和Agent全面限免14天，打破"智能水平、速度、价格"不可能三角，性价比具压倒性优势。

https://mp.weixin.qq.com/s/XTd_WgOCTClQ2c_snMfmoQ

十、豆包视频模型1.0 pro fast发布，提速3倍，价格降72%

1. 火山引擎上线豆包视频生成模型Seedance 1.0 pro fast，生成速度最高提升约3倍，720P的5秒视频仅需10秒，价格直降72%；

2. 生成一条5秒1080P视频成本仅1.03元，以1万元成本可制作9709条视频，对比pro版效能提升3.56倍；

3. 模型强化了指令遵循、无缝多镜头叙事、细节表现力等核心能力，在图生视频方向相较Veo 3.0 Fast等全球主流模型有显著效果优势。

https://mp.weixin.qq.com/s/jB4Sg7eCSflmoKd2ZaEUGg

十一、Skywork AI网页复刻能力正式上线，建站效率提升10倍

1. 昆仑万维Skywork AI推出网页复刻(Web Clone)功能，用户只需提供网页链接、上传文件或输入文字描述，AI即可在数分钟内生成功能完备的网页原型；

2. 系统通过算法深度解析网页DOM层级结构、视觉分区和语义关系，可实现较高网页还原度，涵盖布局、文字、图片、配色等多维度要素；

3. 支持三种创建方式：上传文件自动生成官网、提供网址一键复刻、纯文字描述智能生成，生成的网页可持续编辑和实时微调，显著降低建站技术门槛。

https://mp.weixin.qq.com/s/VYG1U43RlXlltDCZ3dbO5Q

十二、xAI公司再推AI虚拟女友「Mika」，瞄准千亿"孤独生意"

1. 马斯克旗下xAI为Grok推出AI虚拟伴侣功能Grok Companions，首个角色Mika是深绿色头发的二次元酷姐型角色，会用调情语气回答问题、开玩笑、卖萌；

2. Mika定位为情感产品而非工具，某些模式下能解锁"成人语气"引发家长和媒体关注，在"儿童模式"下也可能被误触；

3. 目前Grok已有五个AI伴侣包括Mika、Ani、Valentine、Good Rudi和Bad Rudi，马斯克试探AI不只是工具也可以是情感产品的市场可能性。

https://mp.weixin.qq.com/s/H35ckRyW1vNw5_HFYdIDyg

十三、高通发2款新芯片，面向下一代AI推理优化解决方案

1. 高通发布AI200和AI250数据中心AI推理解决方案，AI200每张加速卡支持768GB LPDDR内存，AI250引入近存计算架构实现超10倍有效内存带宽提升；

2. 两款解决方案均支持直接液冷散热、PCIe纵向扩展与以太网横向扩展，整机架功耗160千瓦，AI200预计2026年商用，AI250预计2027年商用；

3. 配备丰富软件栈与主流AI框架无缝兼容，支持一键模型部署，高通将按年度迭代节奏持续推进数据中心产品技术路线图。

https://mp.weixin.qq.com/s/PPsfdFHSzle2d2jLhBGJJg

十四、OpenAI重组，OpenAI Foundation继续掌控营利实体

1. OpenAI宣布完成资本结构重组，非营利主体改名为OpenAI Foundation持有营利实体26%股份，当前估值约1300亿美元；

2. 微软将在营利实体中持有32.5%股份，员工和投资者持有47%股份，OpenAI已同意额外购买2500万美元微软Azure云服务；

3. OpenAI Foundation承诺在健康治愈疾病和AI弹性技术解决方案两大领域投入250亿美元，软银225亿美元投资将顺利到账。

https://mp.weixin.qq.com/s/Vj5xcNqAlFwBPF-mp15jQA

十五、MiniMax Hailuo 2.3 视频复杂表现新高度 & Media Agent

1. MiniMax发布Hailuo 2.3视频模型，在肢体动作呈现、风格化和人物微表情方面实现显著提升，保持Hailuo 02既有价格实现"加量不加价"；

2. Hailuo 2.3 Fast模型生成速度更快定价更低，最高可为批量创作降低50%成本，对运动指令响应更优化；

3. Hailuo Video Agent升级为支持全模态全能创作的Media Agent，可实现"一键成片"功能并支持自然语言与AI交互共创。

https://mp.weixin.qq.com/s/qnnTeGwGRgotm8taqBijfw

十六、马斯克亲手放出「开源版」维基百科，Grokipedia V0.1

1. 马斯克正式发布Grokipedia V0.1，收录超88万篇文章，每次查询Grok都会核验事实，支持在线交互和申报错误；

2. Grokipedia对比维基百科在内容详细度和参考资料数量上均有优势，但被指部分内容直接从维基百科照搬复制；

3. 维基百科页面浏览量同比减少8%，创始人认为AI无法取代维基百科准确性，正成立工作组应对AI搜索时代挑战。

https://mp.weixin.qq.com/s/7uIYFP4p4Re8g3VRZtcvDw

十七、Claude直接以插件形态接入Excel！面向金融任务优化

1. Anthropic推出Claude for Excel插件以研究预览形式发布测试版，仅Max、Teams或企业版前1000名用户可体验；

2. 插件可在Excel侧边栏直接使用，支持实时分析数据、自动跳转对应单元格、跟踪并解释修改理由，讨论电子表格工作原理；

3. Claude新增6项金融领域技能包括可比公司分析、折现现金流模型、尽职调查数据包等，已被领先银行和金融科技公司广泛使用。

https://mp.weixin.qq.com/s/oRfIxnewTuv-6s7cYso9zw

十八、Thinking Machines 今天新公布了又一项重磅研究成果

1. OpenAI前CTO Mira Murati的Thinking Machines Lab公布同策略蒸馏研究，以1/10成本达到强化学习同等效果；

2. 在数学推理任务上，同策略蒸馏用1800 GPU小时达到传统强化学习需17920 GPU小时的性能，成本直降90%；

3. 该方法通过反向KL散度和零折扣因子实现高效训练，无需等待完整轨迹，教师查询仅需一次前向传播，不需要单独奖励模型。

https://mp.weixin.qq.com/s/KViRRWh8tdrMZ745qRJfOw

十九、英伟达开源OmniVinci全模态理解模型，1/6训练数据

1. 英伟达发布OmniVinci全模态理解模型，仅用0.2万亿Token训练数据（Qwen2.5-Omni为1.2万亿），数据效率提升6倍；

2. 在Dailyomni基准测试上比Qwen2.5-Omni高出19.05分，在音频理解MMAR测试上高出1.7分，在视频理解Video-MME测试上高出3.9分；

3. 创新架构包括OmniAlignNet、时间嵌入分组(TEG)和约束旋转时间嵌入(CRTE)三大技术，实现视觉、音频和文本的统一全模态理解。

https://mp.weixin.qq.com/s/cZo3NT6K4I50oSxree1vWQ

二十、英伟达GTC深夜爆拉市值，Vera Rubin芯片首露面

1. 英伟达在GTC华盛顿大会上首次展示Vera Rubin超级芯片，搭载88核Vera CPU和两颗Rubin GPU，预计2026年第三或第四季度量产；

2. 黄仁勋发布会后英伟达股价上涨4.98%，市值增加2300多亿美元达到4.89万亿美元，成为首家市值冲刺5万亿美元的公司；

3. 大会重点包括量子互联技术NVQLink、与美国能源部合作建造7台新超级计算机、宣布与Uber合作部署约10万辆自动驾驶汽车等。

https://mp.weixin.qq.com/s/iMoJ2fuVG23PINixFRSO9w

二十一、Soul AI Lab开源播客语音合成模型SoulX-Podcast

1. Soul App AI团队正式开源播客语音合成模型SoulX-Podcast，支持中英川粤等多语种方言，能稳定输出超60分钟多轮语音对话；

2. 该模型支持零样本克隆的多轮对话能力，可实现跨方言音色克隆，仅用普通话参考语音即可生成带方言特征的自然语音；

3. 模型基于Qwen3-1.7B作为基座，采用LLM + Flow Matching语音生成范式，在播客场景下语音可懂度与音色相似度均取得最佳结果。

https://mp.weixin.qq.com/s/bbn1c-e9IUI9mr4h9GL3qw

二十二、Adobe Firefly Image 5更新，400万像素、AI图层编辑

1. Adobe在MAX大会推出Firefly图像模型5，擅长生成照片级逼真细节，可原生生成4MP分辨率图像且无需升级；

2. Adobe CC 2026全家桶正式发布Windows版本，包括Photoshop 2026 27.0、Illustrator 2026 30.0等多款软件全面更新；

3. 新版本支持仅通过输入提示即可编辑图像，能根据需要进行精确修改同时保持其他像素不变，且具有商业安全性。

https://mp.weixin.qq.com/s/hgg30DE3MFr3dCZSyUi2kA

二十三、混元推出国内首个交互式AI播客，听众可以"举手"提问

1. 腾讯混元推出国内首个交互式AI播客，用户可在收听过程中随时打断主持人和嘉宾发言，通过语音或打字方式提问；

2. 基于大模型意图识别、长上下文理解和多轮对话能力，系统能结合上下文及背景信息准确给出答案，改变传统播客单向收听模式；

3. 混元AI播客现已支持默认模式、深度探索、思辨讨论三种模式，提供8种不同音色，支持单人和双人播客形式。

https://mp.weixin.qq.com/s/RKjyNAN-qJoiC5W2rSVnFw

二十四、PayPal宣布已与OpenAI达成合作，嵌入其数字钱包

1. PayPal宣布与OpenAI签署合作协议，其数字钱包将嵌入ChatGPT，让用户能直接在聊天机器人中完成购物支付；

2. 从明年起PayPal生态的消费者与商户都可接入ChatGPT，用户可在平台上购买商品，商户商品库存也能上架销售；

3. 受此消息推动PayPal盘前一度大涨超15%，同时公司上调全年业绩预期并宣布成立27年来首次发放股息。

https://mp.weixin.qq.com/s/pagG97f9KUYw8zqnLR7m0A

二十五、Windsurf等美国公司们，接入Made in China大模型

1. 美国AI编程产品Windsurf被网友发现其神秘新模型来自中国智谱GLM，Cerebras也上架GLM-4.6推理服务；

2. 多家美国AI公司选择部署中国大模型的核心原因是性价比，OpenAI和Anthropic模型虽好但太贵，而中国模型性能够打且价格实惠；

3. Together AI、Vercel等美国平台也已部署GLM-4.6等国产模型，中国大模型的Made in China含金量持续上升。

https://mp.weixin.qq.com/s/Ky8YUjD8cjkROmgnE3aWmQ

二十六、OpenAI 刚刚开源了两个专门用于安全分类的推理模型

1. OpenAI开源gpt-oss-safeguard安全分类模型(120b和20b版本),采用Apache 2.0许可证,能直接理解策略文档进行内容分类无需重新训练；

2. 该模型在多个基准测试中表现超越GPT-5-thinking,在内容审核评估集和ToxicChat数据集上达到行业最佳性价比；

3. OpenAI内部已使用该技术(Safety Reasoner原型)处理图像生成和Sora 2等产品,安全推理算力占比高达16%。

https://mp.weixin.qq.com/s/_dmZj9IwtbRLpvXHulQ_8g

二十七、Cursor 2.0更新,自研模型Composer,多agent并行

1. Cursor发布2.0版本,推出首个自研编码模型Composer,生成速度达每秒250个token,是同类前沿系统的4倍,标志从"AI外壳"向"AI原生平台"转型；

2. Composer采用混合专家(MoE)架构,通过强化学习针对软件工程优化,在Cursor Bench评测中达到前沿水平,已被团队日常开发使用；

3. 新版界面支持多智能体并行协作,基于git worktree或远程机器实现不同模型同时处理同一任务,并增加原生浏览器工具用于测试迭代。

https://mp.weixin.qq.com/s/3wkFC_UCkyRRJm2zR72yFQ

二十八、Sora连更三大新功能!一键打造IP形象,限时免注册

1. Sora推出角色客串(Character Cameo)功能,支持保持非人类客串角色一致性,可从生成视频中提取虚拟角色实现自循环；

2. 新增视频拼接功能和社区排行榜,分为被使用最多的客串角色、被二创最多的视频等分类；

3. Sora在美国、加拿大、日本和韩国四国限时取消邀请码限制直接开放注册,正值Android版本上线节点抢占安卓市场。

https://mp.weixin.qq.com/s/KEQ0OzpbLtHHPv4GhGcUUQ

二十九、MiniMax Speech 2.6更新,最强 Voice Agent 来袭?

1. MiniMax Speech 2.6端到端延迟低于250毫秒达行业顶尖水平,已成为LiveKit、Pipecat、Vapi等全球语音平台的底层技术引擎；

2. 新版本支持多语言的网址、邮箱、电话、日期及金额等非标准文本格式直接转换,无需繁琐文本预处理实现信息传递更流畅；

3. 提供Fluent LoRA功能,即使是带口音或不流利的非母语录音也可在音色复刻时生成流利自然语音,支持40+语种。

https://mp.weixin.qq.com/s/RWXK8FYJVS4LhtocKeIxJw

三十、刚刚,智源悟界·Emu3.5登场,原生具备世界建模能力

1. 北京智源发布悟界·Emu3.5多模态世界大模型,基于34B稠密Transformer在超10万亿Token(约790年视频)上预训练,首次揭示"多模态Scaling范式"；

2. 采用"下一状态预测"目标实现视觉叙事和视觉指导能力,在图像编辑任务上达到与Gemini-2.5-Flash-Image相当性能；

3. 提出离散扩散自适应(DiDA)技术将图像推理速度提升近20倍,成为首个在速度和质量上媲美顶级闭源扩散模型的自回归模型。

https://mp.weixin.qq.com/s/wXNDkNzKDG3rx9qZ9GkqgQ

三十一、OpenAI明年上市,万亿美元估值将成史上最大IPO

1. OpenAI计划最早2026年下半年提交上市申请2027年挂牌,拟通过IPO募集至少600亿美元,估值或高达1万亿美元成全球最大规模IPO；

2. 完成架构重组后非营利组织持有新组建OpenAI集团26%股权,微软放弃独享云服务优先权但获得额外2500亿美元Azure采购合同；

3. 双方新协议明确AGI实现需经独立专家验证,微软对OpenAI技术使用权延长至2032年,同时获准自主开展AGI研究或与第三方合作。

https://mp.weixin.qq.com/s/x86jSJx9FXLFD4Kea-EAIA

【声明】内容源于网络

上海蓝玥信息科技有限公司

1234

内容 108

粉丝 0

上海蓝玥信息科技有限公司 1234

总阅读363

粉丝0

内容108