

AI一周资讯速递（10.13-10.17）

上海蓝玥信息科技有限公司

2025-10-17

一、硅谷百亿大佬Chamath弃用美国AI，带头"倒戈"中国模型

1. 硅谷顶级投资人Chamath Palihapitiya公开表示其公司已将大量工作负载转向中国Kimi K2模型，因性能足够强且比OpenAI和Anthropic便宜太多；

2. Vercel、Cursor、Perplexity等美国开发者生态重要平台已集成Kimi K2，开发者用代码进行"投票"成为市场证明；

3. State of AI Report 2025也首次将中国AI从"追赶者"提升为"平行竞争者"。

https://mp.weixin.qq.com/s/BPMY6wxX7ZL9f_bVNrHNLg

二、濒死3次，宾大教授奇迹自救，誓用AI攻克14000种绝症

1. 宾大医学院教授David Fajgenbaum三次濒临死亡后通过血样分析发现mTOR通路过度活跃，用西罗莫司成功自救并缓解疾病11年半；

2. Fajgenbaum创立非营利组织Every Cure打造AI系统MATRIX，在7500万种药物与疾病组合中寻找治疗方案，已帮助多位罕见病患者；

3. MATRIX利用生物医学知识图谱为每个药物-疾病组合打分，优先攻克"最糟糕的病"，生成7500万个分数时间从100天缩短至17小时。

https://mp.weixin.qq.com/s/auZkYzOuQLB4KSAiKZHgOA

三、超级天才重返Meta，Thinking Machines Lab痛失联创

1. 曾拒绝Meta超10亿美元报价的Andrew Tulloch最终还是离开Thinking Machines Lab重返Meta担任重要职位；

2. Andrew Tulloch是AI领域传奇人物，在Meta工作11年6个月后加入OpenAI深度参与GPT-4o和GPT-4.5研发，2025年与前OpenAI CTO Mira Murati共同创立Thinking Machines；

3. Thinking Machines Lab于今年7月完成20亿美元种子轮融资，由a16z领投，英伟达、AMD等参与投资，Andrew的离开原因为"个人原因"。

https://mp.weixin.qq.com/s/dTP8hBgMORbJF5RSUq2izQ

四、刚刚，OpenAI官宣自研AI芯片！博通股价飙涨10%

1. OpenAI与博通达成战略合作，将部署100亿瓦OpenAI设计的定制AI芯片，博通计划2026年下半年开始部署并于2029年底完成；

2. 这是OpenAI一个月内与第三家芯片巨头的重磅交易，此前已宣布英伟达1000亿美元投资和AMD 60亿瓦GPU部署协议；

3. Sam Altman透露双方过去18个月一直在设计新芯片，使用OpenAI自己的模型参与设计，消息公布后博通股价一度涨超10%。

https://mp.weixin.qq.com/s/1VqWsC2R2dpIwYVxyF3Jlg

五、谷歌Gemini 3.0「全家桶」更新预告，前端不再需要人类

1. 谷歌Gemini 3.0预计10月22日发布，内测人士放出惊艳demo显示其前端开发能力强大，可一键直出网页、游戏、原创音乐等；

2. Gemini 3.0采用MoE架构超万亿参数每次查询激活150-200亿参数，上下文从100万跃升至数百万token，可处理整本书和代码库；

3. 内测显示Gemini 3.0在"骑自行车的鹈鹕"等前端测试中表现断档领先，甚至可生成3D版本像素艺术，2025年9月Gemini环比增长率达46.24%。

https://mp.weixin.qq.com/s/ALfH3BKf0HCXFQ66mT0EDw

六、LiblibAI 2.0升级，定位打造创作者的 AI 专业创作工作室

1. LiblibAI（哩布哩布）2.0升级接入海螺、通义万相、可灵、Pixverse、vidu等10+个热门视频模型和大量生图模型，站内完成所有AI创作；

2. 新增视频特效一键同款功能，接入Midjourney V7、Qwen-image、Seedream 4.0等常用生图模型，支持图生视频无缝切换；

3. 增加资产管理菜单和AI工具箱入口，集合高清放大、抠图、产品精修等大量模型工作流，为新老用户提供一站式AI体验。

https://mp.weixin.qq.com/s/CzMtMYyCEdqoRU2lTsCJ0g

七、Mamba的最新进化版本Mamba-3来了，ICLR 2026

1. Transformer最有力继任者Mamba的第三代版本Mamba-3已进入ICLR 2026盲审，采用梯形规则离散化、复数状态空间、多输入多输出设计三大创新；

2. Mamba-3通过引入复数隐状态实现"钟摆"记忆能够处理周期模式和奇偶校验，MIMO设计显著提高算术强度使GPU满负荷运行；

3. 在超长上下文信息检索测试NIAH中表现优异，推理延迟大幅降低，适合长文本处理、实时交互和边缘计算等应用场景。

https://mp.weixin.qq.com/s/XpdIgXyMSTWF_MERFEdJtQ

八、SAM 3分割一切的下一步：理解「概念」，ICLR 2026

1. 疑似Meta推出的SAM 3论文登陆ICLR 2026，实现可提示概念分割（PCS），用户通过简单名词短语或图像范例即可分割所有匹配实例；

2. SAM 3在SA-Co基准上性能比之前系统提升至少2倍，在LVIS数据集零样本掩码平均精度达47.0超越之前38.5纪录；

3. 采用双编码器-解码器Transformer架构，构建包含400万独特短语和5200万掩码的高质量训练数据，单H200 GPU处理100+物体图像仅需30毫秒。

https://mp.weixin.qq.com/s/7uDHXQd1ES2mV4dZFB7VMw

九、谷歌的ReasoningBank记忆框架，扩展AI自我进化范式

1. 谷歌提出ReasoningBank创新记忆框架，从智能体成功和失败经验中提炼记忆项形成闭环自我进化系统，无需真实标签即可学习；

2. 引入记忆感知的测试时扩展（MaTTS）通过并行和顺序设置生成多样探索，使ReasoningBank合成更具普遍性的记忆实现协同效应；

3. 在WebArena、Mind2Web和SWE-Bench-Verified基准测试中，ReasoningBank有效性相对提高达34.2%，交互步骤减少16.0%。

十、大模型追逐星辰大海，GPT和Gemini国际天文奥赛夺金

1. 最新研究显示GPT-5和Gemini 2.5 Pro在国际天文学和天体物理学奥林匹克竞赛(IOAA)中均获金牌成绩，GPT-5在理论考试平均得分84.2%；

2. 两大模型在理论考试表现优于当届最佳学生，但在几何/空间问题上准确率(49-78%)明显低于物理/数学问题(67-91%)；

3. 这标志着AI不仅在数学领域具有强推理能力，也在天文、天体物理等多科学领域展现出接近顶尖人类水平的综合能力。

https://mp.weixin.qq.com/s/rZFnDrbIrEnZ4_FqjXzbnw

十一、英伟达AI超算3999美元，可部署99%大参数开源模型！

1. 英伟达正式发布DGX Spark个人AI超级计算机，售价3999美元，搭载Grace Blackwell GB10超级芯片，提供1 Petaflop AI计算性能和128GB统一内存；

2. 该设备采用NVLink-C2C技术实现CPU与GPU无缝连接，带宽是PCIe 5代的5倍，可在本地运行2000亿参数大模型，两台联机可处理4000亿参数模型；

3. 预装完整NVIDIA AI软件栈包括CUDA、TensorRT等，10月15日起通过英伟达官网及全球合作伙伴正式发售。

https://mp.weixin.qq.com/s/cMrowGjQ6o15_-knsdt-HA

十二、Karpathy新开源项目nanochat，100美元手搓ChatGPT

1. AI大神Andrej Karpathy发布开源项目nanochat，8000行代码实现从零训练ChatGPT克隆版全流程，发布12小时内获得近5000颗GitHub星标；

2. 项目覆盖分词器训练、预训练、微调、强化学习和推理引擎全部功能，仅需100美元成本（8×H100训练4小时）即可训练出能聊天的迷你模型；

3. Karpathy强调该项目更适合学习研究而非个性化应用，要实现个性化需要复杂的合成数据生成和大量预训练数据混合。

https://mp.weixin.qq.com/s/AfVRL9Vo3fqBeEYjxIUPxQ

十三、微软发布首个自主研发的文本生成图像模型，MAI-Image-1

1. 微软AI推出首款完全自研文生图模型MAI-Image-1，首次亮相即以1096分排在LMArena文生图榜单第9名；

2. 该模型在光影效果、自然景观等超写实图像生成上表现突出，研究团队特别注重避免输出内容重复与同质化问题；

3. MAI-Image-1将集成至Copilot和Bing Image Creator等微软核心产品，这是微软AI在语音、对话、图像领域打造多模态自主技术矩阵的重要一步。

https://mp.weixin.qq.com/s/qPuk_Wp5ofXkOW4Z_r5-ng

十四、Youtu-Embedding 正式开源，优图实验室加速企业级RAG

1. 腾讯优图实验室正式开源通用文本表示模型Youtu-Embedding，可同时胜任文本检索、意图理解、相似度判断等六大主流任务，破解"负迁移"困境；

2. 模型从零开始训练使用3万亿Token中英文语料，采用创新"协同-判别式微调框架"，在CMTEB中文语义评测基准上以77.46分登顶；

3. 支持集成至LangChain、LlamaIndex等主流框架开箱即用，降低开发门槛，特别适用于构建企业级RAG检索增强生成系统。

https://mp.weixin.qq.com/s/QaaSp8mvXVVQznZBD1Rmfw

十五、不用跟AI客气了！新研究：语气越粗鲁回答正确率越高

1. 宾夕法尼亚州立大学研究显示，对LLM使用粗鲁语气提问时，GPT-4o正确率达84.8%，而特别客气时正确率仅80.8%；

2. 研究人员解释粗鲁表达更直接能让AI精准抓住核心任务，而礼貌表达中的"多余"话语反而增加了干扰；

3. 值得注意的是GPT-3.5和Llama2-70B等老模型则不喜欢粗鲁语气，新模型在训练时可能接触了更复杂的语气相关数据。

https://mp.weixin.qq.com/s/RYO6pAHO5qt4atXN3VeUeQ

十六、QQ浏览器AI升级，「较真AI」「AI视频助理」同步登场

1. QQ浏览器电脑端v19.7.5新增"较真AI"功能，基于腾讯新闻较真平台10年查证经验及百万级辟谣数据库，可快速辨别信息真伪并输出可信度评分；

2. "AI视频助理"支持智能总结、16种语言识别翻译和一键导出带字幕视频，依托腾讯混元翻译模型解决外语视频理解难题；

3. 两大功能均已在QQ浏览器Agent中心上线，用户可免费使用，分别解决信息真伪辨别和视频内容高效获取两大痛点。

https://mp.weixin.qq.com/s/_Se0LbBXFJOaK7Tvw1x9sA

十七、新凯来发布全球领先90GHz超高速实时示波器，万里眼

1. 万里眼发布90GHz超高速实时示波器，带宽位列全球第二，采样率200GSa/s，存储深度4Gpts（业界2倍），将国产示波器性能提升至原有水平的500%；

2. 该设备搭载T级实时数据采集平台、超强算力平台（32核处理器+300TFLOPS AI算力）和智能数据平台，全球首创智能参数寻优功能，10分钟遍历万种配置；

3. 采用全面屏设计与航空级全铝合金架构，支持自然交互系统，已获华为和上海交大客户认可，打破西方技术封锁。

https://mp.weixin.qq.com/s/PbPi-u0HMDslF61gr7uDNA

十八、苹果M5芯片10核CPU、10核GPU，AI性能飙到3.5倍

1. 苹果发布M5芯片，采用第三代3nm工艺，最高10核CPU、10核GPU、16核神经引擎，每个GPU核心增加神经网络加速器；

2. 统一内存带宽153GB/s，比M4提升近30%，最高可选配32GB内存，能在设备端运行更大规模AI模型，搭载M5的设备AI性能是M4版的3.5倍；

3. 将于10月17日上午9点接受预购，10月22日发售，搭载机型包括14英寸MacBook Pro、iPad Pro和Apple Vision Pro，售价12999元起。

https://mp.weixin.qq.com/s/BmTilPXhswpbCWSuuInVHA

十九、Gemini 3.0 Pro单HTML文件复刻macOS等操作系统

1. 谷歌未发布的Gemini 3.0 Pro在A/B测试中展现强大能力，仅通过几行提示词One Shot生成完整HTML版WebOS，2分钟内复刻macOS、Windows、Linux等操作系统；

2. 生成的系统具备流畅动画、窗口管理、文本编辑器、浏览器、画图、终端等基础应用，Claude 4.5 Sonnet相同测试下生成内容不可用；

3. 模型能理解抽象哲学风格描述并转化为前端设计，但生成内容仅为功能演示而非真正操作系统，目前代码已在CodePen开源。

https://mp.weixin.qq.com/s/s0bT4aB8-PhaG-3_fDRAbQ

二十、千问开源视觉语言模型系列Qwen3-VL的4B与8B版本

1. 阿里开源Qwen3-VL的4B与8B版本（含Instruct与Thinking版本），在几十项权威基准测评中超越Gemini 2.5 Flash Lite、GPT-5 Nano等同级模型；

2. 模型尺寸缩减显著降低VRAM占用，Qwen3-VL-8B Instruct在MIABench、OCRBench等30项基准中取得SOTA成绩，4B版本同样展现"以小敌大"能力；

3. 该模型在Vision Arena排名第二、Text Arena开源第一，成为首个同时揽获纯文本和视觉两大领域开源大模型。

https://mp.weixin.qq.com/s/teLFWA3jw14EhR-eR-OG5A

二十一、科大讯飞同传大模型再升级，讯飞AI翻译耳机新品发布

1. 科大讯飞同传大模型第三次重大升级，中英同传主观体验提升至4.6分（满分5分），首字响应时间低至2秒，专业词库扩充至10万+，新增声音复刻功能；

2. IDC最新报告显示，科大讯飞在AI翻译速度、效果、专业度等8大核心维度排名第一，其中6项满分，商业化规模和研发投入领跑行业；

3. 讯飞AI翻译耳机支持60种语言同传互译，采用骨导+气导开放式设计，单次12小时、总42小时续航，覆盖通话、面对面、线上同传、旁听同传四大场景。

https://mp.weixin.qq.com/s/Gv3qtqgYZUzQm9JebBYZug

二十二、OPPO发布新一代操作系统ColorOS 16，AI战略公开

1. OPPO发布ColorOS 16，搭载极光引擎、潮汐引擎、繁星编译器三大系统架构，首创芯片级动态追踪技术，高温环境下性能异常闪退为零，温度升高仅4.1°C；

2. AI能力方面，推出一键闪记、AI取餐码、AI随口记、AI实景对话等功能，小布助手新增指物识别能力，可穿越屏幕识别实景物体并提供讲解；

3. AI战略围绕On-Device Compute（300 TOPS/s峰值推理）、PersonaX记忆共生引擎、Agent Matrix智能体生态三大底座重构，首次实现与Apple Watch互通。

https://mp.weixin.qq.com/s/lJKr0mhkZBQpbliEB9MSrg

二十三、谷歌深夜上新Veo 3.1对标Sora 2，网友狂刷2.75亿条

1. 谷歌发布视频生成模型Veo 3.1，主打更强叙事与音频控制、首尾帧与多图参考等精控功能，接入Gemini API与Vertex AI，Flow与Gemini可用；

2. 模型支持720p或1080p分辨率24fps视频，原生时长4-8秒，使用Extend功能最长可扩展至148秒，可合成多人物场景并实现音画同步；

3. 用户已在Flow中生成超过2.75亿个视频，但成片质感较Veo 3进步有限，基础物理表现有所改善但人物表演与复杂调度仍存在问题。

https://mp.weixin.qq.com/s/2qlH4dnTviiWV5XuEUyANA

二十四、Anthropic 推轻量模型 Claude Haiku 4.5，便宜、快速

1. Anthropic发布轻量级模型Claude Haiku 4.5，编码性能可与Claude Sonnet 4相媲美，成本仅为其三分之一（每百万输入token 1美元，输出5美元），推理速度提升一倍多；

2. 在计算机使用基准OSWorld上得分50.7%超越Sonnet 4的42.2%，数学推理测试中借助Python工具成绩高达96.3%远超Sonnet 4的70.5%；

3. 模型主打实时低延迟任务场景如聊天助手、客服、协同编程，通过严格安全性评估，偏差行为发生率显著低于其他Claude模型。

https://mp.weixin.qq.com/s/EsiE4RhNhgMrFXul8OO0aA

二十五、千问上线Qwen Chat Memory功能，让AI拥有记忆

1. 阿里通义千问正式上线Qwen Chat Memory功能，让AI能够记录并理解用户在过去对话中的重要信息，包括个人偏好、兴趣方向或特定任务背景；

2. 该功能可跨越多轮甚至多天对话保留个性化认知，与仅依靠上下文窗口的短期记忆不同；记忆是AI助手向长期陪伴型智能体迈出关键一步；

3. 所有记忆内容可由用户查看、管理和删除，用户拥有完整控制权，首先在网页版Qwen Chat上线，未来推广至更多终端。

https://mp.weixin.qq.com/s/65iKWpzNW3XsjP_yAtjKUA

二十六、字节更新语音模型，豆包·语音合成2.0与声音复刻2.0

1. 火山引擎升级豆包语音合成模型2.0和声音复刻模型2.0，通过Query-Response能力实现情境理解与语气把控，可通过细节描述精准生成对应情感；

2. 语音合成2.0提供默认模式、语音指令和引入上文三种模式，可控制整段情绪基调、方言类型、语速音调等，模型能自动理解上下文情绪连贯生成；

3. 声音复刻2.0可精准复现米老鼠、小沈阳等动漫人物和真人音色语速情绪，对公式朗读测试准确率接近90%，在教育场景专项优化。

https://mp.weixin.qq.com/s/_TJXhIp79xeZ5-HoEPX18Q

【声明】内容源于网络

上海蓝玥信息科技有限公司

1234

内容 108

粉丝 0

上海蓝玥信息科技有限公司 1234

总阅读371

粉丝0

内容108