大数跨境
0
0

AI硬件战火升级,飞书推出“AI录音豆”;OpenAI之后,又一家2万亿AI独角兽即将诞生 | AI一周看点

AI硬件战火升级,飞书推出“AI录音豆”;OpenAI之后,又一家2万亿AI独角兽即将诞生 | AI一周看点 AI新榜
2026-01-19
8
导读:AI前沿资讯,及时拿捏!

又是新的一周,适合回顾知新!这里是“AI新榜”的周更栏目“AI一周看点”,带你高效盘点过去一周的AI大事件、工具更新与行业动态。

本周速览:

🚀 飞书联合安克创新发布“AI录音豆”;字节扣子全球首发AI技能商店;腾讯混元3D Studio 1.2开放公测,引入笔刷交互与八视图生成。

💰 快手可灵AI月收入突破2000万美元;Anthropic获250亿美元融资,估值达3500亿美元;OpenAI确认ChatGPT将引入广告;科技巨头围绕AI购物入口的争夺战再次升级。

🌍 爱诗科技发布实时世界模型PixVerse R1;谷歌Veo 3.1原生支持竖屏4K视频;Anthropic发布AI Agent协作工具Claude Cowork;Replit推出自然语言生成iOS应用功能。

国内资讯

1. 飞书首度跨界硬件,联手安克创新发布“AI录音豆”

1月19日,飞书与安克创新联合发布智能录音硬件“AI录音豆”。该设备重仅10克,呈豆状设计,搭载双MEMS麦克风阵列,整机含充电舱约48克,支持蓝牙与Wi-Fi双模传输,主打无感佩戴与随时录音。

产品核心能力为实时语音转结构化纪要,并自动同步至飞书知识库。用户可通过AI助手对历史内容进行对话式检索、提问与二次创作。目前已上线主流电商平台。

2. 美团发布全球首个开源“重思考”模型,工具调用能力登顶开源SOTA

1月16日,美团LongCat团队正式开源LongCat-Flash-Thinking-2601模型。作为前代升级版,其在智能体搜索、工具调用与工具交互推理等关键评测中均达开源模型SOTA水平。

该模型已在GitHub、Hugging Face平台开源,用户可访问longcat.ai网站免费体验(深度思考模式需主动启用)。

GitHub:
https://github.com/meituan-longcat/LongCat-Flash-Thinking-2601

Hugging Face:
https://huggingface.co/meituan-longcat/LongCat-Flash-Thinking-2601

3. 千问App上线400多项新功能,AI从聊天迈入“办事时代”

1月15日,千问App全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态服务,首次实现点外卖、购物、订机票等真实生活场景的AI闭环操作,并向全体用户开放测试。本次升级上线超400项AI办事功能,推动AI助手向复杂任务执行演进。

4. 爱诗科技发布通用实时世界模型PixVerse R1

1月14日,爱诗科技发布全球首个支持最高1080P分辨率的通用实时世界模型PixVerse R1。实时世界模型可对画面、声音等内容进行实时生成与交互建模,支持数字场景持续演化及即时响应用户操作,典型应用场景为实时互动视频生成。

5. 可灵AI月收入突破2000万美元

1月13日,快手科技宣布可灵AI于2025年12月单月收入突破2000万美元,年化收入(ARR)达2.4亿美元。此前其在2025年3月(上线第10个月)已实现ARR破1亿美元。

6. 阶跃星辰开源语音模型登顶全球评测榜首

1月15日,阶跃星辰原生语音推理模型Step-Audio-R1.1在全球权威评测Artificial Analysis Speech Reasoning中以96.4%准确率位列第一,超越Grok、Gemini等主流模型,刷新历史纪录。

该评测聚焦模型直接处理音频并完成复杂逻辑推理的能力,核心指标包括准确率与首包延迟。模型权重已开源至Hugging Face与GitHub,用户可通过阶跃星辰开放平台体验中心试用。

HuggingFace:
https://huggingface.co/stepfun-ai/Step-Audio-R1.1

GitHub:
https://github.com/stepfun-ai/Step-Audio-R1

7. 百川开源医疗大模型M3,全面超越GPT-5.2

1月13日,百川智能开源新一代医疗大模型Baichuan-M3。其在权威医疗AI评测HealthBench中以65.1分综合成绩全球第一,首次在医疗领域全面超越GPT-5.2。

M3具备原生“端到端”严肃问诊能力,可主动追问关键病史与风险信号,并基于完整信息进行深度医学推理,问诊能力显著高于真人医生平均水平。

Hugging Face:
https://huggingface.co/baichuan-inc/Baichuan-M3-235B

GitHub:
https://github.com/baichuan-inc/Baichuan-M3-235B

8. DeepSeek团队发布梁文锋署名新论文

1月12日晚,DeepSeek联合北京大学发布新论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》,作者署名含DeepSeek创始人梁文锋。同日开源配套记忆模块Engram。

论文地址:
https://github.com/deepseek-ai/Engram/blob/main/Engram_paper.pdf

9. 智谱联合华为开源基于国产芯片训练的多模态SOTA模型

1月14日,智谱AI与华为联合开源图像生成模型GLM-Image。该模型基于昇腾Atlas 800T A2设备与昇思MindSpore框架完成全流程训练,是首个在国产芯片上训练并达SOTA水平的多模态开源模型。

GLM-Image采用“自回归+扩散解码器”混合架构,实现图像生成与语言模型协同,面向“认知型生成”技术范式探索。代码已上线GitHub、Hugging Face与魔搭社区。

GitHub:
https://github.com/zai-org/GLM-Image

Hugging Face:
https://huggingface.co/zai-org/GLM-Image

10. 腾讯混元3D Studio 1.2开放公测,引入笔刷交互与八视图生成

1月16日,腾讯混元3D Studio 1.2版本全面开放公测。

升级亮点包括: - 组件能力升级至PartGen 1.5,拆分精度提升至1536³,支持笔刷细粒度控制,增强专业可控性; - 基模升级至混元3D 3.1,几何细节与纹理还原度大幅提升,支持八视角图像输入生成3D模型。

体验链接:
https://3d.hunyuan.tencent.com/studio

11. AI初创公司Humanify获数千万元融资,专注打造“类人认知”AI OS

AI初创公司Humanify(人格智能)近日完成数千万元种子轮融资,由五源资本领投、奇绩创坛跟投。资金将用于模型与操作系统研发、团队扩张及真实场景落地。

公司成立于2024年,核心团队来自浙江大学、清华大学等高校及头部企业,覆盖AI模型算法、系统工程与产品设计全链条。

12. 字节旗下扣子全球首发AI技能商店

1月19日,字节跳动旗下Coze平台全球首发AI技能商店,扣子空间同步升级为扣子2.0,增强Agent Skills、Agent Plan、Agent Coding与Agent Office等能力。技能商店旨在将个人经验封装为可交易、可复用的AI技能包。

用户可通过PC端访问coze.cn或下载扣子App体验。

海外资讯

1. 消息称红杉资本等参与Anthropic新一轮250亿美元融资,估值达3500亿美元

1月18日,Anthropic正推进总额超250亿美元的新一轮融资,估值预计达3500亿美元,较2025年9月翻倍,成为继OpenAI之后第二家估值突破2万亿元人民币的AI独角兽。

2. OpenAI确认ChatGPT将引入广告,为AGI愿景筹资

1月17日,OpenAI确认将在未来几周内于ChatGPT免费版与GO版(月费8美元)中投放广告,为通用人工智能(AGI)目标筹集资金。

广告将以独立模块形式呈现于AI回答底部,并明确标注;系统将自动识别健康、心理、政治等敏感语境并强制屏蔽广告;用户对话数据不向广告商出售,且可随时清除定向数据。付费订阅用户不受影响。

3. 谷歌联手沃尔玛推出AI购物功能

1月11日,谷歌与沃尔玛宣布合作,将后者商品整合进Gemini AI助手,并发布通用商业协议(UCP),支持用户在Gemini对话中直接浏览与下单。此举标志着科技巨头围绕AI购物入口的竞争全面升级。

此前,OpenAI已于2025年9月在ChatGPT上线“即时结账”功能,联合Shopify打通购物闭环;亚马逊则通过技术手段限制AI抓取数据,并加速自有AI购物工具研发。

4. Anthropic发布AI Agent协作工具Claude Cowork

1月13日,Anthropic发布Claude Cowork,定位为其编程助手Claude Code的“平民版”,支持普通用户通过自然语言指挥AI完成任务。当前以研究预览版形式开放,限macOS系统Claude Max订阅用户使用。

5. 谷歌视频生成模型Veo 3.1升级,原生支持竖屏4K视频

1月14日,谷歌Veo 3.1更新,首次原生支持9:16竖屏格式及4K分辨率,标志其正式进军AI短视频领域。

普通用户可通过YouTube Shorts、YouTube Create及Gemini App体验;企业与开发者可通过Gemini API、Vertex AI集成使用。

6. 谷歌发布TranslateGemma开放翻译模型,手机端也能运行

1月16日,谷歌发布基于Gemma 3架构的TranslateGemma系列开放翻译模型(4B/12B/27B),支持55种核心语言及多模态图像翻译,已在Kaggle与Hugging Face开放下载。

Hugging Face:
https://huggingface.co/collections/google/translategemma

Kaggle:
https://www.kaggle.com/models/google/translategemma/

7. Replit推出“Mobile Apps on Replit”功能

1月15日,Replit上线“Mobile Apps on Replit”功能,用户仅需自然语言描述需求,即可几分钟内生成可运行iOS应用,并数日内提交App Store;同时支持接入Stripe实现变现。消息称公司正接近完成新一轮融资,估值或达90亿美元。

8. Higgsfield宣布完成8000万美元A轮追加融资

AI视频生成公司Higgsfield近日完成8000万美元A轮追加融资,投资方包括Accel、AI Capital Partners与Menlo Ventures,A轮总融资超1.3亿美元,估值超13亿美元。公司成立不足9个月已实现2亿美元ARR,累计吸引超1500万用户,日均生成视频450万条。新资金将用于企业服务、国际扩张、模型研发及API自动化建设。

【声明】内容源于网络
0
0
AI新榜
做内容从业者关心的AI研究,发布AI产品榜.
内容 1256
粉丝 0
AI新榜 做内容从业者关心的AI研究,发布AI产品榜.
总阅读34.1k
粉丝0
内容1.3k