点击关注
已关注公众号
当下AIGC视频赛道入局者扎堆,行业竞争日趋激烈。华为“天才少年”王裕鑫正式创办形界智能,这家新成立的企业仅用一个月,就拿下数千万级首轮融资,资本的快速加持,印证了市场对其技术路线与团队实力的高度认可。
和市面上主流的文生视频、图生视频工具不同,形界智能锚定流式视频生成这一前沿方向,试图打破AI视频离线制作、单向输出的传统模式,探索实时交互、连续生成的全新发展路径。
为何放弃主流赛道,专攻流式视频生成?
目前市面上绝大多数AI视频产品,都属于离线生成工具。用户输入指令后,平台后台完成全流程运算,最终输出一段固定视频,不仅存在明显延迟,成品也无法根据用户操作实时调整,本质只是传统视频制作的数字化升级,赛道早已陷入同质化内卷。
王裕鑫带领团队跳出存量竞争,将核心方向锁定流式视频生成。这项技术的核心特点,是让视频如同数据流一般持续产出,用户全程的操作与互动都能被系统即时响应,视频内容也会随之动态续写、实时变化。这条路线并非临时决策,而是王裕鑫多年技术积累的必然选择。
作为元石科技007号早期员工,他是国内MoE架构大模型预训练的早期核心参与者,也是公司大模型体系搭建的关键推动者。在职期间,他主导完成200B + 超大规模大模型训练,牵头落地问小白o4、问小白5等核心模型项目,把并行思考、超大规模训练等前沿技术落地到实际产品中。
此外,他还曾担任Muset视频Agent技术负责人,参与多款海外AI陪伴产品的技术落地,在实时视频模型领域深耕已久。
2025年,其所在团队入选业内知名人士评选的中国TOP6大模型团队,与国内一众头部AI团队并列。同年年底,团队发布全球首个开源并行思考模型XBai o4,该模型仅32B 参数量,就在权威测评中超越多款国际主流大模型。
从超大模型训练,到视频智能体研发,再到实时视频技术落地,连贯的技术沉淀,让形界智能从起步阶段就拥有扎实的技术壁垒。
技术融合之下,形界智能瞄准哪些新场景?
依托过往技术优势,形界智能确定了清晰的研发路径:将大模型推理、视频生成、AI Agent三大技术深度融合,直击AI视频从离线短片制作迈向实时交互生成的行业拐点。
传统AI视频比拼画质、生成效果等静态指标,主要服务内容创作者,市场空间趋于饱和。而流式视频生成主打强交互属性,瞄准的是行业增量市场。
在AI陪伴场景中,实时生成的虚拟形象可以跟随用户对话、情绪调整状态,带来更自然的陪伴体验;在互动娱乐与虚拟角色领域,虚拟主播、互动短剧、沉浸式游戏能够摆脱固定脚本,内容随用户行为实时变化;在视频Agent方向,实时视频能力也能让AI智能体在可视化场景中完成连续交互任务,进一步拓宽应用边界。
可以看出,形界智能并未切入红海般的视频创作工具市场,而是聚焦交互类视频新场景,依靠差异化定位避开正面竞争,精准踩中行业发展趋势。
全新技术方向,将给AI视频产业带来哪些改变?
形界智能入局流式视频赛道,不只是一次创业事件,更会对整个AI视频产业带来深远影响,推动行业进入全新发展阶段。
首先,行业竞争重心全面转移。过去业内比拼离线视频的生成质量、产出效率,未来实时响应速度、交互稳定性、长时序生成连贯性,会成为评判视频模型实力的核心标准,倒逼各大厂商调整研发方向,转向实时交互技术攻关。
其次,产品形态与商业模式迎来革新。传统AI视频工具依靠按次生成、会员订阅盈利,服务群体单一。流式视频技术成熟后,会催生出实时虚拟直播、互动娱乐、AI陪伴等新产品,行业商业模式也会向场景运营、定制服务延伸,打开全新盈利空间。
再者,加速多模态技术融合落地。流式视频离不开大模型的语义理解、AI Agent的交互调度能力。形界智能的技术路线,为行业提供了可参考的融合范式,推动企业打破技术孤岛,打造一体化多模态体系,助力整个AI技术生态迭代。
最后,拓宽AI视频的应用边界。以往AI视频多应用于内容创作、广告制作等场景,而实时交互视频可覆盖数字人、在线教育、互动文旅等多个领域,让视频从单纯的内容工具,转变为人机交互的核心载体。
现阶段,流式视频生成仍处在早期阶段,画面稳定性、算力消耗、复杂指令响应等难题仍待攻克。但资本与优质技术团队的入局,会持续加快技术迭代。随着相关技术不断成熟,实时交互有望成为AI视频的标配,一个全新的互动视频时代正在加速到来。
往期推荐
融资10亿!上海国资重仓AMD前员工
吴夏青是谁?为什么离职英伟达创业?
点赞鼓励一下
图片来源:网络
本文不作为投资建议

