一、 硅谷百亿大佬Chamath弃用美国AI,带头"倒戈"中国模型
1. 硅谷顶级投资人Chamath Palihapitiya公开表示其公司已将大量工作负载转向中国Kimi K2模型,因性能足够强且比OpenAI和Anthropic便宜太多;
2. Vercel、Cursor、Perplexity等美国开发者生态重要平台已集成Kimi K2,开发者用代码进行"投票"成为市场证明;
3. State of AI Report 2025也首次将中国AI从"追赶者"提升为"平行竞争者"。
https://mp.weixin.qq.com/s/BPMY6wxX7ZL9f_bVNrHNLg
二、 濒死3次,宾大教授奇迹自救,誓用AI攻克14000种绝症
1. 宾大医学院教授David Fajgenbaum三次濒临死亡后通过血样分析发现mTOR通路过度活跃,用西罗莫司成功自救并缓解疾病11年半;
2. Fajgenbaum创立非营利组织Every Cure打造AI系统MATRIX,在7500万种药物与疾病组合中寻找治疗方案,已帮助多位罕见病患者;
3. MATRIX利用生物医学知识图谱为每个药物-疾病组合打分,优先攻克"最糟糕的病",生成7500万个分数时间从100天缩短至17小时。
https://mp.weixin.qq.com/s/auZkYzOuQLB4KSAiKZHgOA
三、 超级天才重返Meta,Thinking Machines Lab痛失联创
1. 曾拒绝Meta超10亿美元报价的Andrew Tulloch最终还是离开Thinking Machines Lab重返Meta担任重要职位;
2. Andrew Tulloch是AI领域传奇人物,在Meta工作11年6个月后加入OpenAI深度参与GPT-4o和GPT-4.5研发,2025年与前OpenAI CTO Mira Murati共同创立Thinking Machines;
3. Thinking Machines Lab于今年7月完成20亿美元种子轮融资,由a16z领投,英伟达、AMD等参与投资,Andrew的离开原因为"个人原因"。
https://mp.weixin.qq.com/s/dTP8hBgMORbJF5RSUq2izQ
四、刚刚,OpenAI官宣自研AI芯片!博通股价飙涨10%
1. OpenAI与博通达成战略合作,将部署100亿瓦OpenAI设计的定制AI芯片,博通计划2026年下半年开始部署并于2029年底完成;
2. 这是OpenAI一个月内与第三家芯片巨头的重磅交易,此前已宣布英伟达1000亿美元投资和AMD 60亿瓦GPU部署协议;
3. Sam Altman透露双方过去18个月一直在设计新芯片,使用OpenAI自己的模型参与设计,消息公布后博通股价一度涨超10%。
https://mp.weixin.qq.com/s/1VqWsC2R2dpIwYVxyF3Jlg
五、谷歌Gemini 3.0「全家桶」更新预告,前端不再需要人类
1. 谷歌Gemini 3.0预计10月22日发布,内测人士放出惊艳demo显示其前端开发能力强大,可一键直出网页、游戏、原创音乐等;
2. Gemini 3.0采用MoE架构超万亿参数每次查询激活150-200亿参数,上下文从100万跃升至数百万token,可处理整本书和代码库;
3. 内测显示Gemini 3.0在"骑自行车的鹈鹕"等前端测试中表现断档领先,甚至可生成3D版本像素艺术,2025年9月Gemini环比增长率达46.24%。
https://mp.weixin.qq.com/s/ALfH3BKf0HCXFQ66mT0EDw
六、LiblibAI 2.0升级,定位打造创作者的 AI 专业创作工作室
1. LiblibAI(哩布哩布)2.0升级接入海螺、通义万相、可灵、Pixverse、vidu等10+个热门视频模型和大量生图模型,站内完成所有AI创作;
2. 新增视频特效一键同款功能,接入Midjourney V7、Qwen-image、Seedream 4.0等常用生图模型,支持图生视频无缝切换;
3. 增加资产管理菜单和AI工具箱入口,集合高清放大、抠图、产品精修等大量模型工作流,为新老用户提供一站式AI体验。
https://mp.weixin.qq.com/s/CzMtMYyCEdqoRU2lTsCJ0g
七、Mamba的最新进化版本Mamba-3来了,ICLR 2026
1. Transformer最有力继任者Mamba的第三代版本Mamba-3已进入ICLR 2026盲审,采用梯形规则离散化、复数状态空间、多输入多输出设计三大创新;
2. Mamba-3通过引入复数隐状态实现"钟摆"记忆能够处理周期模式和奇偶校验,MIMO设计显著提高算术强度使GPU满负荷运行;
3. 在超长上下文信息检索测试NIAH中表现优异,推理延迟大幅降低,适合长文本处理、实时交互和边缘计算等应用场景。
https://mp.weixin.qq.com/s/XpdIgXyMSTWF_MERFEdJtQ
八、SAM 3分割一切的下一步:理解「概念」,ICLR 2026
1. 疑似Meta推出的SAM 3论文登陆ICLR 2026,实现可提示概念分割(PCS),用户通过简单名词短语或图像范例即可分割所有匹配实例;
2. SAM 3在SA-Co基准上性能比之前系统提升至少2倍,在LVIS数据集零样本掩码平均精度达47.0超越之前38.5纪录;
3. 采用双编码器-解码器Transformer架构,构建包含400万独特短语和5200万掩码的高质量训练数据,单H200 GPU处理100+物体图像仅需30毫秒。
https://mp.weixin.qq.com/s/7uDHXQd1ES2mV4dZFB7VMw
九、谷歌的ReasoningBank记忆框架,扩展AI自我进化范式
1. 谷歌提出ReasoningBank创新记忆框架,从智能体成功和失败经验中提炼记忆项形成闭环自我进化系统,无需真实标签即可学习;
2. 引入记忆感知的测试时扩展(MaTTS)通过并行和顺序设置生成多样探索,使ReasoningBank合成更具普遍性的记忆实现协同效应;
3. 在WebArena、Mind2Web和SWE-Bench-Verified基准测试中,ReasoningBank有效性相对提高达34.2%,交互步骤减少16.0%。
十、大模型追逐星辰大海,GPT和Gemini国际天文奥赛夺金
1. 最新研究显示GPT-5和Gemini 2.5 Pro在国际天文学和天体物理学奥林匹克竞赛(IOAA)中均获金牌成绩,GPT-5在理论考试平均得分84.2%;
2. 两大模型在理论考试表现优于当届最佳学生,但在几何/空间问题上准确率(49-78%)明显低于物理/数学问题(67-91%);
3. 这标志着AI不仅在数学领域具有强推理能力,也在天文、天体物理等多科学领域展现出接近顶尖人类水平的综合能力。
https://mp.weixin.qq.com/s/rZFnDrbIrEnZ4_FqjXzbnw
十一、英伟达AI超算3999美元,可部署99%大参数开源模型!
1. 英伟达正式发布DGX Spark个人AI超级计算机,售价3999美元,搭载Grace Blackwell GB10超级芯片,提供1 Petaflop AI计算性能和128GB统一内存;
2. 该设备采用NVLink-C2C技术实现CPU与GPU无缝连接,带宽是PCIe 5代的5倍,可在本地运行2000亿参数大模型,两台联机可处理4000亿参数模型;
3. 预装完整NVIDIA AI软件栈包括CUDA、TensorRT等,10月15日起通过英伟达官网及全球合作伙伴正式发售。
https://mp.weixin.qq.com/s/cMrowGjQ6o15_-knsdt-HA
十二、Karpathy新开源项目nanochat,100美元手搓ChatGPT
1. AI大神Andrej Karpathy发布开源项目nanochat,8000行代码实现从零训练ChatGPT克隆版全流程,发布12小时内获得近5000颗GitHub星标;
2. 项目覆盖分词器训练、预训练、微调、强化学习和推理引擎全部功能,仅需100美元成本(8×H100训练4小时)即可训练出能聊天的迷你模型;
3. Karpathy强调该项目更适合学习研究而非个性化应用,要实现个性化需要复杂的合成数据生成和大量预训练数据混合。
https://mp.weixin.qq.com/s/AfVRL9Vo3fqBeEYjxIUPxQ
十三、微软发布首个自主研发的文本生成图像模型,MAI-Image-1
1. 微软AI推出首款完全自研文生图模型MAI-Image-1,首次亮相即以1096分排在LMArena文生图榜单第9名;
2. 该模型在光影效果、自然景观等超写实图像生成上表现突出,研究团队特别注重避免输出内容重复与同质化问题;
3. MAI-Image-1将集成至Copilot和Bing Image Creator等微软核心产品,这是微软AI在语音、对话、图像领域打造多模态自主技术矩阵的重要一步。
https://mp.weixin.qq.com/s/qPuk_Wp5ofXkOW4Z_r5-ng
十四、Youtu-Embedding 正式开源,优图实验室加速企业级RAG
1. 腾讯优图实验室正式开源通用文本表示模型Youtu-Embedding,可同时胜任文本检索、意图理解、相似度判断等六大主流任务,破解"负迁移"困境;
2. 模型从零开始训练使用3万亿Token中英文语料,采用创新"协同-判别式微调框架",在CMTEB中文语义评测基准上以77.46分登顶;
3. 支持集成至LangChain、LlamaIndex等主流框架开箱即用,降低开发门槛,特别适用于构建企业级RAG检索增强生成系统。
https://mp.weixin.qq.com/s/QaaSp8mvXVVQznZBD1Rmfw
十五、不用跟AI客气了!新研究:语气越粗鲁回答正确率越高
1. 宾夕法尼亚州立大学研究显示,对LLM使用粗鲁语气提问时,GPT-4o正确率达84.8%,而特别客气时正确率仅80.8%;
2. 研究人员解释粗鲁表达更直接能让AI精准抓住核心任务,而礼貌表达中的"多余"话语反而增加了干扰;
3. 值得注意的是GPT-3.5和Llama2-70B等老模型则不喜欢粗鲁语气,新模型在训练时可能接触了更复杂的语气相关数据。
https://mp.weixin.qq.com/s/RYO6pAHO5qt4atXN3VeUeQ
十六、QQ浏览器AI升级,「较真AI」「AI视频助理」同步登场
1. QQ浏览器电脑端v19.7.5新增"较真AI"功能,基于腾讯新闻较真平台10年查证经验及百万级辟谣数据库,可快速辨别信息真伪并输出可信度评分;
2. "AI视频助理"支持智能总结、16种语言识别翻译和一键导出带字幕视频,依托腾讯混元翻译模型解决外语视频理解难题;
3. 两大功能均已在QQ浏览器Agent中心上线,用户可免费使用,分别解决信息真伪辨别和视频内容高效获取两大痛点。
https://mp.weixin.qq.com/s/_Se0LbBXFJOaK7Tvw1x9sA
十七、新凯来发布全球领先90GHz超高速实时示波器,万里眼
1. 万里眼发布90GHz超高速实时示波器,带宽位列全球第二,采样率200GSa/s,存储深度4Gpts(业界2倍),将国产示波器性能提升至原有水平的500%;
2. 该设备搭载T级实时数据采集平台、超强算力平台(32核处理器+300TFLOPS AI算力)和智能数据平台,全球首创智能参数寻优功能,10分钟遍历万种配置;
3. 采用全面屏设计与航空级全铝合金架构,支持自然交互系统,已获华为和上海交大客户认可,打破西方技术封锁。
https://mp.weixin.qq.com/s/PbPi-u0HMDslF61gr7uDNA
十八、苹果M5芯片10核CPU、10核GPU,AI性能飙到3.5倍
1. 苹果发布M5芯片,采用第三代3nm工艺,最高10核CPU、10核GPU、16核神经引擎,每个GPU核心增加神经网络加速器;
2. 统一内存带宽153GB/s,比M4提升近30%,最高可选配32GB内存,能在设备端运行更大规模AI模型,搭载M5的设备AI性能是M4版的3.5倍;
3. 将于10月17日上午9点接受预购,10月22日发售,搭载机型包括14英寸MacBook Pro、iPad Pro和Apple Vision Pro,售价12999元起。
https://mp.weixin.qq.com/s/BmTilPXhswpbCWSuuInVHA
十九、Gemini 3.0 Pro单HTML文件复刻macOS等操作系统
1. 谷歌未发布的Gemini 3.0 Pro在A/B测试中展现强大能力,仅通过几行提示词One Shot生成完整HTML版WebOS,2分钟内复刻macOS、Windows、Linux等操作系统;
2. 生成的系统具备流畅动画、窗口管理、文本编辑器、浏览器、画图、终端等基础应用,Claude 4.5 Sonnet相同测试下生成内容不可用;
3. 模型能理解抽象哲学风格描述并转化为前端设计,但生成内容仅为功能演示而非真正操作系统,目前代码已在CodePen开源。
https://mp.weixin.qq.com/s/s0bT4aB8-PhaG-3_fDRAbQ
二十、千问开源视觉语言模型系列Qwen3-VL的4B与8B版本
1. 阿里开源Qwen3-VL的4B与8B版本(含Instruct与Thinking版本),在几十项权威基准测评中超越Gemini 2.5 Flash Lite、GPT-5 Nano等同级模型;
2. 模型尺寸缩减显著降低VRAM占用,Qwen3-VL-8B Instruct在MIABench、OCRBench等30项基准中取得SOTA成绩,4B版本同样展现"以小敌大"能力;
3. 该模型在Vision Arena排名第二、Text Arena开源第一,成为首个同时揽获纯文本和视觉两大领域开源大模型。
https://mp.weixin.qq.com/s/teLFWA3jw14EhR-eR-OG5A
二十一、科大讯飞同传大模型再升级,讯飞AI翻译耳机新品发布
1. 科大讯飞同传大模型第三次重大升级,中英同传主观体验提升至4.6分(满分5分),首字响应时间低至2秒,专业词库扩充至10万+,新增声音复刻功能;
2. IDC最新报告显示,科大讯飞在AI翻译速度、效果、专业度等8大核心维度排名第一,其中6项满分,商业化规模和研发投入领跑行业;
3. 讯飞AI翻译耳机支持60种语言同传互译,采用骨导+气导开放式设计,单次12小时、总42小时续航,覆盖通话、面对面、线上同传、旁听同传四大场景。
https://mp.weixin.qq.com/s/Gv3qtqgYZUzQm9JebBYZug
二十二、OPPO发布新一代操作系统ColorOS 16,AI战略公开
1. OPPO发布ColorOS 16,搭载极光引擎、潮汐引擎、繁星编译器三大系统架构,首创芯片级动态追踪技术,高温环境下性能异常闪退为零,温度升高仅4.1°C;
2. AI能力方面,推出一键闪记、AI取餐码、AI随口记、AI实景对话等功能,小布助手新增指物识别能力,可穿越屏幕识别实景物体并提供讲解;
3. AI战略围绕On-Device Compute(300 TOPS/s峰值推理)、PersonaX记忆共生引擎、Agent Matrix智能体生态三大底座重构,首次实现与Apple Watch互通。
https://mp.weixin.qq.com/s/lJKr0mhkZBQpbliEB9MSrg
二十三、谷歌深夜上新Veo 3.1对标Sora 2,网友狂刷2.75亿条
1. 谷歌发布视频生成模型Veo 3.1,主打更强叙事与音频控制、首尾帧与多图参考等精控功能,接入Gemini API与Vertex AI,Flow与Gemini可用;
2. 模型支持720p或1080p分辨率24fps视频,原生时长4-8秒,使用Extend功能最长可扩展至148秒,可合成多人物场景并实现音画同步;
3. 用户已在Flow中生成超过2.75亿个视频,但成片质感较Veo 3进步有限,基础物理表现有所改善但人物表演与复杂调度仍存在问题。
https://mp.weixin.qq.com/s/2qlH4dnTviiWV5XuEUyANA
二十四、Anthropic 推轻量模型 Claude Haiku 4.5,便宜、快速
1. Anthropic发布轻量级模型Claude Haiku 4.5,编码性能可与Claude Sonnet 4相媲美,成本仅为其三分之一(每百万输入token 1美元,输出5美元),推理速度提升一倍多;
2. 在计算机使用基准OSWorld上得分50.7%超越Sonnet 4的42.2%,数学推理测试中借助Python工具成绩高达96.3%远超Sonnet 4的70.5%;
3. 模型主打实时低延迟任务场景如聊天助手、客服、协同编程,通过严格安全性评估,偏差行为发生率显著低于其他Claude模型。
https://mp.weixin.qq.com/s/EsiE4RhNhgMrFXul8OO0aA
二十五、千问上线Qwen Chat Memory功能,让AI拥有记忆
1. 阿里通义千问正式上线Qwen Chat Memory功能,让AI能够记录并理解用户在过去对话中的重要信息,包括个人偏好、兴趣方向或特定任务背景;
2. 该功能可跨越多轮甚至多天对话保留个性化认知,与仅依靠上下文窗口的短期记忆不同; 记忆是AI助手向长期陪伴型智能体迈出关键一步;
3. 所有记忆内容可由用户查看、管理和删除,用户拥有完整控制权,首先在网页版Qwen Chat上线,未来推广至更多终端。
https://mp.weixin.qq.com/s/65iKWpzNW3XsjP_yAtjKUA
二十六、字节更新语音模型,豆包·语音合成2.0与声音复刻2.0
1. 火山引擎升级豆包语音合成模型2.0和声音复刻模型2.0,通过Query-Response能力实现情境理解与语气把控,可通过细节描述精准生成对应情感;
2. 语音合成2.0提供默认模式、语音指令和引入上文三种模式,可控制整段情绪基调、方言类型、语速音调等,模型能自动理解上下文情绪连贯生成;
3. 声音复刻2.0可精准复现米老鼠、小沈阳等动漫人物和真人音色语速情绪,对公式朗读测试准确率接近90%,在教育场景专项优化。
https://mp.weixin.qq.com/s/_TJXhIp79xeZ5-HoEPX18Q



