AI硬件战火升级，飞书推出“AI录音豆”；OpenAI之后，又一家2万亿AI独角兽即将诞生

首页

AI硬件战火升级，飞书推出“AI录音豆”；OpenAI之后，又一家2万亿AI独角兽即将诞生 | AI一周看点

AI新榜

2026-01-19

导读：AI前沿资讯，及时拿捏！

又是新的一周，适合回顾知新！这里是“AI新榜”的周更栏目“AI一周看点”，带你高效盘点过去一周的AI大事件、工具更新与行业动态。

本周速览：

🚀 飞书联合安克创新发布“AI录音豆”；字节扣子全球首发AI技能商店；腾讯混元3D Studio 1.2开放公测，引入笔刷交互与八视图生成。

💰 快手可灵AI月收入突破2000万美元；Anthropic获250亿美元融资，估值达3500亿美元；OpenAI确认ChatGPT将引入广告；科技巨头围绕AI购物入口的争夺战再次升级。

🌍 爱诗科技发布实时世界模型PixVerse R1；谷歌Veo 3.1原生支持竖屏4K视频；Anthropic发布AI Agent协作工具Claude Cowork；Replit推出自然语言生成iOS应用功能。

国内资讯

1. 飞书首度跨界硬件，联手安克创新发布“AI录音豆”

1月19日，飞书与安克创新联合发布智能录音硬件“AI录音豆”。该设备重仅10克，呈豆状设计，搭载双MEMS麦克风阵列，整机含充电舱约48克，支持蓝牙与Wi-Fi双模传输，主打无感佩戴与随时录音。

产品核心能力为实时语音转结构化纪要，并自动同步至飞书知识库。用户可通过AI助手对历史内容进行对话式检索、提问与二次创作。目前已上线主流电商平台。

2. 美团发布全球首个开源“重思考”模型，工具调用能力登顶开源SOTA

1月16日，美团LongCat团队正式开源LongCat-Flash-Thinking-2601模型。作为前代升级版，其在智能体搜索、工具调用与工具交互推理等关键评测中均达开源模型SOTA水平。

该模型已在GitHub、Hugging Face平台开源，用户可访问longcat.ai网站免费体验（深度思考模式需主动启用）。

GitHub：
https://github.com/meituan-longcat/LongCat-Flash-Thinking-2601

Hugging Face：
https://huggingface.co/meituan-longcat/LongCat-Flash-Thinking-2601

3. 千问App上线400多项新功能，AI从聊天迈入“办事时代”

1月15日，千问App全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态服务，首次实现点外卖、购物、订机票等真实生活场景的AI闭环操作，并向全体用户开放测试。本次升级上线超400项AI办事功能，推动AI助手向复杂任务执行演进。

4. 爱诗科技发布通用实时世界模型PixVerse R1

1月14日，爱诗科技发布全球首个支持最高1080P分辨率的通用实时世界模型PixVerse R1。实时世界模型可对画面、声音等内容进行实时生成与交互建模，支持数字场景持续演化及即时响应用户操作，典型应用场景为实时互动视频生成。

5. 可灵AI月收入突破2000万美元

1月13日，快手科技宣布可灵AI于2025年12月单月收入突破2000万美元，年化收入（ARR）达2.4亿美元。此前其在2025年3月（上线第10个月）已实现ARR破1亿美元。

6. 阶跃星辰开源语音模型登顶全球评测榜首

1月15日，阶跃星辰原生语音推理模型Step-Audio-R1.1在全球权威评测Artificial Analysis Speech Reasoning中以96.4%准确率位列第一，超越Grok、Gemini等主流模型，刷新历史纪录。

该评测聚焦模型直接处理音频并完成复杂逻辑推理的能力，核心指标包括准确率与首包延迟。模型权重已开源至Hugging Face与GitHub，用户可通过阶跃星辰开放平台体验中心试用。

HuggingFace：
https://huggingface.co/stepfun-ai/Step-Audio-R1.1

GitHub：
https://github.com/stepfun-ai/Step-Audio-R1

7. 百川开源医疗大模型M3，全面超越GPT-5.2

1月13日，百川智能开源新一代医疗大模型Baichuan-M3。其在权威医疗AI评测HealthBench中以65.1分综合成绩全球第一，首次在医疗领域全面超越GPT-5.2。

M3具备原生“端到端”严肃问诊能力，可主动追问关键病史与风险信号，并基于完整信息进行深度医学推理，问诊能力显著高于真人医生平均水平。

Hugging Face：
https://huggingface.co/baichuan-inc/Baichuan-M3-235B

GitHub：
https://github.com/baichuan-inc/Baichuan-M3-235B

8. DeepSeek团队发布梁文锋署名新论文

1月12日晚，DeepSeek联合北京大学发布新论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》，作者署名含DeepSeek创始人梁文锋。同日开源配套记忆模块Engram。

论文地址：
https://github.com/deepseek-ai/Engram/blob/main/Engram_paper.pdf

9. 智谱联合华为开源基于国产芯片训练的多模态SOTA模型

1月14日，智谱AI与华为联合开源图像生成模型GLM-Image。该模型基于昇腾Atlas 800T A2设备与昇思MindSpore框架完成全流程训练，是首个在国产芯片上训练并达SOTA水平的多模态开源模型。

GLM-Image采用“自回归+扩散解码器”混合架构，实现图像生成与语言模型协同，面向“认知型生成”技术范式探索。代码已上线GitHub、Hugging Face与魔搭社区。

GitHub：
https://github.com/zai-org/GLM-Image

Hugging Face：
https://huggingface.co/zai-org/GLM-Image

10. 腾讯混元3D Studio 1.2开放公测，引入笔刷交互与八视图生成

1月16日，腾讯混元3D Studio 1.2版本全面开放公测。

升级亮点包括： - 组件能力升级至PartGen 1.5，拆分精度提升至1536³，支持笔刷细粒度控制，增强专业可控性； - 基模升级至混元3D 3.1，几何细节与纹理还原度大幅提升，支持八视角图像输入生成3D模型。

体验链接：
https://3d.hunyuan.tencent.com/studio

11. AI初创公司Humanify获数千万元融资，专注打造“类人认知”AI OS

AI初创公司Humanify（人格智能）近日完成数千万元种子轮融资，由五源资本领投、奇绩创坛跟投。资金将用于模型与操作系统研发、团队扩张及真实场景落地。

公司成立于2024年，核心团队来自浙江大学、清华大学等高校及头部企业，覆盖AI模型算法、系统工程与产品设计全链条。

12. 字节旗下扣子全球首发AI技能商店

1月19日，字节跳动旗下Coze平台全球首发AI技能商店，扣子空间同步升级为扣子2.0，增强Agent Skills、Agent Plan、Agent Coding与Agent Office等能力。技能商店旨在将个人经验封装为可交易、可复用的AI技能包。

用户可通过PC端访问coze.cn或下载扣子App体验。

海外资讯

1. 消息称红杉资本等参与Anthropic新一轮250亿美元融资，估值达3500亿美元

1月18日，Anthropic正推进总额超250亿美元的新一轮融资，估值预计达3500亿美元，较2025年9月翻倍，成为继OpenAI之后第二家估值突破2万亿元人民币的AI独角兽。

2. OpenAI确认ChatGPT将引入广告，为AGI愿景筹资

1月17日，OpenAI确认将在未来几周内于ChatGPT免费版与GO版（月费8美元）中投放广告，为通用人工智能（AGI）目标筹集资金。

广告将以独立模块形式呈现于AI回答底部，并明确标注；系统将自动识别健康、心理、政治等敏感语境并强制屏蔽广告；用户对话数据不向广告商出售，且可随时清除定向数据。付费订阅用户不受影响。

3. 谷歌联手沃尔玛推出AI购物功能

1月11日，谷歌与沃尔玛宣布合作，将后者商品整合进Gemini AI助手，并发布通用商业协议（UCP），支持用户在Gemini对话中直接浏览与下单。此举标志着科技巨头围绕AI购物入口的竞争全面升级。

此前，OpenAI已于2025年9月在ChatGPT上线“即时结账”功能，联合Shopify打通购物闭环；亚马逊则通过技术手段限制AI抓取数据，并加速自有AI购物工具研发。

4. Anthropic发布AI Agent协作工具Claude Cowork

1月13日，Anthropic发布Claude Cowork，定位为其编程助手Claude Code的“平民版”，支持普通用户通过自然语言指挥AI完成任务。当前以研究预览版形式开放，限macOS系统Claude Max订阅用户使用。

5. 谷歌视频生成模型Veo 3.1升级，原生支持竖屏4K视频

1月14日，谷歌Veo 3.1更新，首次原生支持9:16竖屏格式及4K分辨率，标志其正式进军AI短视频领域。

普通用户可通过YouTube Shorts、YouTube Create及Gemini App体验；企业与开发者可通过Gemini API、Vertex AI集成使用。

6. 谷歌发布TranslateGemma开放翻译模型，手机端也能运行

1月16日，谷歌发布基于Gemma 3架构的TranslateGemma系列开放翻译模型（4B/12B/27B），支持55种核心语言及多模态图像翻译，已在Kaggle与Hugging Face开放下载。

Hugging Face：
https://huggingface.co/collections/google/translategemma

Kaggle：
https://www.kaggle.com/models/google/translategemma/

7. Replit推出“Mobile Apps on Replit”功能

1月15日，Replit上线“Mobile Apps on Replit”功能，用户仅需自然语言描述需求，即可几分钟内生成可运行iOS应用，并数日内提交App Store；同时支持接入Stripe实现变现。消息称公司正接近完成新一轮融资，估值或达90亿美元。

8. Higgsfield宣布完成8000万美元A轮追加融资

AI视频生成公司Higgsfield近日完成8000万美元A轮追加融资，投资方包括Accel、AI Capital Partners与Menlo Ventures，A轮总融资超1.3亿美元，估值超13亿美元。公司成立不足9个月已实现2亿美元ARR，累计吸引超1500万用户，日均生成视频450万条。新资金将用于企业服务、国际扩张、模型研发及API自动化建设。

【声明】内容源于网络

AI新榜

做内容从业者关心的AI研究，发布AI产品榜.

内容 1256

粉丝 0

AI新榜做内容从业者关心的AI研究，发布AI产品榜.

总阅读34.1k

粉丝0

内容1.3k