点击关注
已关注公众号
4月10日,AI赛道再掷重磅 —— 生数科技宣布完成近20亿元人民币B轮融资。阿里云领投,中网投、好未来、光合创投等战略加持,百度风投等老股东悉数加码。在大模型赛道趋于冷静的当下,这笔大额融资,直接把通用世界模型推到了行业聚光灯下。
不同于扎堆语言模型的路线,生数科技从一开始就锚定物理世界与数字世界的融合,用一套统一的世界模型,重新定义下一代AI生产力底座。这不是简单的技术跟风,而是一条通往通用人工智能的全新路径。
过去几年,大语言模型改变了文本交互,但始终有一道难以跨越的壁垒:无法真正理解物理世界。它擅长处理文字符号,却缺少视觉、时空、动作、因果这些真实世界的核心信息,更难以完成模拟、预测与行动。
生数科技给出的答案,是通用世界模型。它以统一架构承载多模态信息,完整还原人类认知、模拟、交互物理世界的过程。简单说,大语言模型让AI“会说话”,而世界模型让AI“懂世界、能行动”。
作为全球率先打通数字与物理世界的通用世界模型公司,生数以基座世界模型为底层,分化出两条核心路线:面向数字内容的世界生成模型,面向物理场景的世界行动模型。这不是技术堆砌,而是一套从理解、生成到行动的完整闭环。
Vidu凭什么拿下全球第一?
在数字世界一侧,生数的 Vidu 模型已经用实力证明领先性。在国际权威 AI 基准测试机构Artificial Analysis榜单中,Vidu Q3位居全球第一。它最核心的突破,是解决了商业化视频生成最痛的问题 —— 长时长、高一致性、声画同步。
全球首创的参考生视频技术,让多主体、连续镜头的商业创作不再出现画面崩坏;16秒声画同出、多镜头运镜控制、背景音乐与音效自动生成、多语种对话支持,把电影级视频生成推向产业可用。
更关键的是性价比。依托自研训练与推理架构,Vidu实现高效率、低成本生成,通过MaaS、SaaS及阿里云百炼平台开放服务,覆盖广告、影视、教育、文旅等行业,大幅降低专业内容生产门槛。
Motus模型如何让机器人拥有真正的通用大脑?
如果说Vidu重塑数字内容,Motus则在改写物理世界的AI规则。2025年12月,生数开源了基于视频大模型的统一架构世界行动模型Motus。它第一次在全球验证了具身基础模型的Scaling law,被业内视作具身智能的 “GPT-2时刻”。
传统机器人依赖模块化设计,链路割裂、数据稀缺、泛化能力差,只能完成固定动作。Motus用UniDiffuser统一框架,把语言、视频、动作整合表达,让机器人从 “执行指令” 升级为 “自主理解与决策”。
实测数据更有说服力:在多任务场景中,Motus成功率比国际主流VLA模型Pi0.5提升约40%。这意味着,机器人将更快走进工业生产、商业服务、家庭生活,实现规模化落地。
近20亿融资不是偶然,而是行业对下一代技术方向的共识。中网投看重生数在关键核心技术的自主创新能力,以及数字与物理世界融合的战略布局;光合创投认为,世界模型是继大语言模型后,通往AGI的核心路径;百度风投从首轮支持到B轮追加,笃定团队技术与赛道前景。
生数科技创始人朱军直言,视频承载着时空、动作、因果关系,是构建世界模型的关键载体。团队的目标,是用统一架构打通感知到行动的全链路,让世界模型真正成为连接数字与物理世界的桥梁。
与此同时,生数正加速全球化人才布局,用顶尖团队支撑前沿模型与全球业务,为通用世界模型走向AGI筑牢根基。
从文本大模型到世界模型,AI正在完成一次本质跃迁。不再局限于理解语言,而是理解整个世界;不再只是生成内容,而是生成场景、自主行动。
生数科技以Vidu与Motus双轮驱动,一边释放数字生产力,一边推进物理世界落地,走出了一条完整的通用智能路线。
20亿资金加持、生态协同推进、技术持续突破,通用世界模型不再是实验室概念,而是正在到来的产业现实。当AI真正读懂世界、融入世界、改造世界,下一代数字与物理世界的生产力底座,已经由生数科技率先搭建。
往期推荐
雷军、刘强东联手投了一家仿生机器人企业数亿元!
仅一季度,中国诞生了一批具身智能百亿独角兽!
点赞鼓励一下

