多模态检索再破局!Qwen3-VL 双子星开源,支持 30+ 语言
2026 年 1 月 8 日,阿里通义千问正式开源 Qwen3-VL-Embedding 和 Qwen3-VL-Reranker 两款模型。二者基于 Qwen3-VL 构建,统一支持文本、图像、视频等多模态内容理解,采用“快速召回 + 精准重排”两阶段架构,在多项权威评测中达业界领先水平,覆盖 30 余种语言,具备轻量部署与灵活适配能力。
微软推 Copilot Checkout 与品牌智能体,升级 AI 购物体验
2026 年 1 月 9 日,微软在 Copilot 平台上线 Copilot Checkout 功能及 “Brand Agents” 品牌智能体,率先在美国落地。用户可在聊天界面直接完成商品搜索、比价、下单与支付;品牌智能体提供个性化推荐与实时咨询,已接入 PayPal、Shopify 等生态伙伴,实测显著提升购物转化率。
Gmail 接入 Gemini 新功能:邮件摘要与实时校对默认启用
2026 年 1 月 8 日,谷歌为 Gmail 全面升级 Gemini AI 能力,新增长邮件线程要点摘要、收件箱 AI 概览、实时语法校对等功能。其中邮件摘要已向美国所有用户开放;校对等高级功能限美国付费订阅用户;部分测试用户还可体验关键信息自动高亮。此次更新强化谷歌在生成式 AI 邮件场景的竞争力。
OpenAI 开年首笔人才收购:Convogo 团队加盟云业务
2026 年初,OpenAI 完成年内首起收购——以全股票交易方式引入企业领导力发展软件公司 Convogo 的三位联合创始人。本次不涉及知识产权交割,Convogo 现有产品将终止运营,核心团队将聚焦 OpenAI 人工智能云服务与企业级产品建设。此为 OpenAI 过去一年第九次并购。
小鹏第二代 VLA 物理世界大模型量产,开启无导航智驾新时代
2026 年 1 月 8 日,小鹏于全球新品发布会正式量产第二代 VLA(Visual-Language-Action)物理世界大模型。该模型突破传统语言中转逻辑,实现视觉信号到动作指令的端到端直出,面向 L4 级智驾,无需高精地图支撑。预计 3 月推送至相关车型,搭配自研图灵芯片,加速高阶智驾普及。
Rokid Style 无屏 AI 眼镜 CES2026 亮相,38.5g 轻量化对标 Meta Ray-Ban
2026 年 CES 展上,Rokid 发布无屏 AI 眼镜 Style,整机仅重 38.5g,支持全天佩戴与多种矫正镜片适配。产品定价 299 美元,搭载双芯片方案,续航达 12 小时,兼容 ChatGPT 等主流 AI 生态,支持 4K 视频录制。将于 1 月 19 日全球发售,视障用户可享专项补贴。
MiniMax 港股上市募资 41.89 亿港元,认购超 1800 倍
1 月 8 日,国产大模型企业 MiniMax 港股暗盘交易大涨逾 24%;1 月 9 日正式登陆港交所。公司以 165 港元/股发行 2538.92 万股,合计募资 41.89 亿港元,获 14 家头部机构作为基石投资者,公开发售超额认购达 1800 倍以上,成为港股开年最受关注的 AI 上市项目之一。
多国启动调查:Grok 图像生成涉未成年人色情内容
2026 年初,xAI 旗下 Grok 图像生成功能被曝大量生成含女性及未成年人的露骨色情图像,单小时新增违规图片数千张,并在 X 平台广泛传播。欧盟、英国、印度等多国监管机构已启动正式调查,欧盟要求 X 平台留存相关数据至 2026 年底。xAI 已致歉并紧急下线问题模块,但安全机制缺失仍引发广泛质疑。
蚂蚁、美团联合入股光智时空,加码 AGI 硬件入口布局
2026 年初,深圳光智时空完成超 2000 万美元 A 轮融资,由蚂蚁集团领投、美团龙珠跟投。工商变更后公司注册资本增至 210.62 万元。该公司成立于 2024 年,主推多模态 AI 穿戴设备 Looki L1,本轮融资凸显巨头对 AGI 时代人机交互新入口的战略卡位。
微信、抖音等平台开展“AI 魔改”专项治理,首周清理违规内容超 5000 条
国家广播电视总局近日启动为期一个月的“AI 魔改”视频专项治理行动,重点整治《四大名著》《三国演义》等经典作品及历史题材的恶意篡改、低俗恶搞内容。微信、抖音、快手等平台迅速响应,首周累计下架违规视频超 5000 条,部分平台同步处置关联账号,切实维护文化价值与清朗网络空间。

