随着AGI从数字世界走向物理世界,耀途早期投资组合灵宇宙创始人顾嘉唯凭借对人机交互的长期深耕与前瞻洞察,继现象级累计售出近千万台的产品Luka卢卡之后,再次推出全新AI硬件终端“小方机”,并迅速登上京东618热销榜单。
作为深耕AI领域十余年的连续创业者,他追求的不仅只是一个爆款AI产品,更是一个能承载未来的智能人机交互底座。
在近期网易科技1.7万字的专访中,顾嘉唯复盘了过去十余年从业、创业的起落,畅想了AGI蓝图以及实现路径。以下为原文:
出品 | 网易科技《态度AGI》
作者 | 袁宁
编辑 | 丁广胜
618期间,一款刚推出不到两周的儿童AI硬件登顶了京东婴幼童玩具618累计竞速榜首。同样在榜的,是频繁刷屏的 Haivivi ,以及朱啸虎投的Fuzozo。
这款卖爆了的产品叫“小方机”,是顾嘉唯最新的AI硬件终端,刚刚在六一儿童节期间推出。产品开售前一天,我和他的一位同事聊天,她告诉我,今天太忙了,首发全售罄,忙着备货,每天被骂。
这并不是顾嘉唯的第一个爆品。在圈内,他职业生涯最早的标签是 “技术天才”。
微软研究院、百度人工智能研究院,28岁入选百度“少帅计划”,深度参与 Windows8、Xbox Kinect 、百度无人车、图像搜索等重大创新项目,主导过BaiduEye 智能眼镜、DuBike 智能单车、DuLight、FaceU 脸优等前沿产品研发。
2016年,他离开百度,带着一款“会读绘本的猫头鹰”阅读机器人 Luka 卢卡,用深度学习打造的无屏触控技术,在桌面上构建起孩子与图书知识之间的互动。
在“大模型”这个词还没有火的时候,打开了 AI 走入儿童家庭教育的可能性。目前,Luka 卢卡已卖出近千万台,遍布18个国家。
2023年,顾嘉唯重新创业,创办灵宇宙,并快速完成三轮融资。
“小方机”,依旧面向孩子,也依旧不靠屏幕。用顾嘉唯的话来说——这是一款 AI Native, Voice First 的智能终端。
他认为,这一轮 AI 涌现出主动意识、拟人感和长短期记忆的智能体之后,就不再需要人去适应技术,不再以设备为中心,转而以世界为中心。随即将 AI 从“屏幕后的服务”,变成了“现实世界的共生体”。一句话概括:AGI 正在从数字世界通往物理世界。
如果说,过去他所打造的Luka卢卡是陪众多家庭的孩子“读万卷书”,那Ling灵宇宙的”小方机“则是带更多孩子“行万里路”。
左边为 Luka 卢卡,右边为 Ling 灵宇宙 AI 小方机
从产品形态上看,“小方机”尺寸不大,挂在脖子上,拥有达尔文、爱因斯坦、马斯克、苏东坡、曹文教授、狮子老爸等众多角色,成为孩子身边的“超级学伴”。
核心亮点是其facetime功能:AI学伴可以实时接收视频流,像打视频电话一样”看见“现实世界,随时回答孩子们“这是什么”、“为什么是这样”。
但并非爽文。从微软、百度到灵宇宙,这并不是顾嘉唯故事的全部。
微软研究院时期,顾嘉唯的研究领域叫做 Tangbile & Embodied Interaction “可触摸实体和具身交互”,为的是打通虚实世界做可触摸有实体的人机交互,包括 Haptics 触觉、手势体感等。
但那时他所做的大多技术原型都比时代早了好几步,也因此在当时多半没能走入主流市场。
二次创业创办灵宇宙前,他又经历了背后上市公司出事,背上几亿连带债务,房子抵押,MBO管理层回购自救。那时候他们的办公室现在是泡泡玛特总部,当时光办公室装修就花了2000万。
但在他眼中,这些都是宝贵的“认知财富”。
他挺过来了,也变了。
而从“读万卷书”的Luka卢卡到“行万里路”的小方机,看似产品延续路径背后,也实则是一套思维模型的逐步落地。
顾嘉唯认为,硬件不是目的,技术也不是卖点,人工智能真正稀缺的是交互方式和数据闭环,是“世界模型的入口”。
他并不想造一个“更好用的早教机或是学习机”,而是要成为“孩子们的第一个AI伙伴”,打造“面向下一代的AI终端”,“一个类似电影《Her》中展示的产品”。而这条路,他从十多年前在百度尝试 BaiduEye 这个项目就已经开始。
因此,与其说他在做儿童产品,不如说他在以孩子为起点,去试图定义下一代的交互范式。
他说,产品不是终点,终端才是。Luka 卢卡、小方机,对他来说,都是这个终端生态的一部分,是他构建“物理世界 AI-OS 智能操作系统”的起点。
他提供了一个简单的比喻:想象一下,如果每个人都拥有一台能说会道的超级 AI 智能终端——一台比每个人类知道得更多、计算得更快、无所不知、无所不能、无所不在的新型 AI 计算机,在身边作为“第二大脑”,我们的生活和工作会是什么样子?
顾嘉唯清楚地知道:他要的不只是一个爆款产品,而是一个能承载未来的智能人机交互底座。
和顾嘉唯见面时,已经是晚上8点。谈话开始前,他刚结束和一个客户的视频会议,手里还拿着一台用来演示的小方机。
顾嘉唯正在演示灵宇宙 AI 小方机
他说,“你真上手体验后,就会显而易见地发现 ta 和别的不一样。”
谈话后半段,临近9点,他才吃上晚饭,一边吃,一边讲着他的逻辑。
他投入,或许不是因为对风口的迫切,而是他知道,这次,他离想要的答案,还差一点。他必须再试一次。
以下为网易科技《态度AGI》栏目与顾嘉唯的交流,经不改变原意的编辑。
网易科技:我看你们以前叫“物灵科技”,现在叫“灵宇宙”,是改名了吗?
顾嘉唯:不是改名,是进入重新创业的新阶段。十年前我们最初的理念是“万物有灵,人机共生”,你们看到柜上的那行书法字,还是当年一位我很尊敬的长者写的。
这块牌子曾经就挂在我们在浦项中心顶楼的办公室里,那里曾有望京最高的“万物有灵”咖啡厅在我们的“共生广场”,如今那个地儿变成了泡泡玛特的全球总部。
过去几年波折,我们也换过好几个地儿,今天你看到它在这儿静静地杵着,就像一个信物,默默见证了我们涅槃重生的全过程。
我们从做Luka 卢卡开始,一路走来,已经实现了千万台设备,进入了大约400多万个家庭。
你也看到办公室放着各式各样的家庭机器人的探索,我们是家庭陪伴机器人真正从早期就定义品类的玩家。
在 Luka 卢卡出来之前,都是语音交互的屏幕和娃娃身子的产品。现在市面上的产品,带摄像头扫描桌面可以搜题可以查词的各类学习机早教机,其实都在跟进我们的思路,是我们所定义产品,被拆解、复制的组合体。
我一直强调,我们做的是定义下一代 AI 终端的工作,从不做追随者。无论是在微软还是百度,我一直在做的是面向未来五到十五年的事。创业后,我任务就是带着“望远镜”的远景和“显微镜”的执行。
网易科技:“小方机”这个产品是从什么时候开始做的?
顾嘉唯:从“Luka 卢卡”之后我们就开始做了,其实已经做了好几年。这期间背后上市公司出现问题,也对我们有比较大的影响。
但今天的产品定义,跟当年早期版本比还是有挺大的变化,毕竟今天 AI native 智能原生的底层大模型时代是最大的新契机。
当年 Luka 卢卡得益于 AI 计算机视觉的技术红利,从一众语音对话机器人之列脱颖而出,今天各式各样的陪伴机器人都是让手办潮玩、毛绒玩具开口说话,其实马上这个市场就会经历一个恶性竞争阶段和残酷的洗牌过程。
而我认为,所有模态都会达到类似的“低垂果实”程度,之后就进步缓慢,逐步拉齐,目前视频追上了文字,后续具身智能机器人也会追上。
所以我的思路是,在技术逐步收敛期,要做长在技术延长线上的容器属性的智能终端,而不是一个一个容易被技术迭代淹没的产品。
网易科技:背后上市公司出现问题,当时是什么情况?
顾嘉唯:说白了就是我们背后的上市公司资金杠杆出问题了,老板进去了,我自己都有几个亿的无限连带。
那段时间我把房子抵押出去,团队能一起扛过来,是最大的福分,用朋友的钱一起做 MBO,就是为了救出公司。还好当时还有“Luka 卢卡”这个产品在撑,保证了公司基本盘运转。
那几年我算是“消失”了,其实都在救公司、做重组。如果当时公司没出事,我可能早就把上面说的事做起来了。
但也不是坏事。今天到了更好的 timing。况且,年轻时候踩坑,总比晚踩强。
网易科技:当时16年你从百度出来创业没有从一级市场拿钱吗?
顾嘉唯:对,第一次创业没拿一级市场的钱,我们是直接跟上市公司一起起盘的。
为了创办物灵科技这家机器人 OS 公司, 2016年那时候我们从二级市场定增中拿出3个多亿投美国机器人本体公司,为了做机器人操作系统。
LingOS驱动的产品
因为当时国内没有好的机器人本体,我跑去大洋彼岸看遍了当年北美高校各家 DARPA 资助的人形机器人16家研究机构,最后投了包括现代机器人之父 Rodney Brooks 的公司 Rethink Robotics 在内的三家机器人本体, 4个多亿投入做人工智能深度学习和机器人相关的研发投入。
我们那时候的办公室现在是泡泡玛特总部,当时光办公室装修就花了2000万。
但这也是为什么我现在做事谨慎务实,因为我经历过资本膨胀的年代,也经历过暴雷、兜底、重启的一整个周期。
网易科技:为什么重新创业会选择做“小方机”?是因为有大模型的出现吗?
顾嘉唯:首先我一直在坚持这个方向,大模型的成熟只是让这件事变得有更高的天花板了。
其次我们的产品不仅是做给小孩或者年轻人的,我们原来也做过针对各种人群的家庭陪伴机器人。初心从我创办物灵科技开始就没变过, 只是选择了一条“南坡”路径,跟大多数直接干人形机器人的公司,长得很不一样。
这次我们做“小方机”,核心是为了打造一个家庭机器人所必须的家庭场景和人机活动场景的数据闭环,通过第一视角的智能体,把用户在真实场景下操作动作的过程记录下来。
因为当前我们真正缺的,不只是末梢抓取和运控的通用泛化能力,更重要的是人类在现实情境中如何行动,空间、物体、动作、行为的数据。
特别是类似大语言文本模型中“predict next token”,接下去在真实世界中如何推理“下一步”行为任务的通用能力的数据还远远不够。
网易科技:收集数据?这是一个怎样的逻辑?
顾嘉唯:这个逻辑其实就像特斯拉造车一样,造电动车只是中间过程,打造 FSD 终极目标是自动驾驶。
而小孩就是唯一真正会在物理世界中自由探索的个体,他们不只会和各种人发生互动,智能体可以引导孩子同世界持续交互。
有篇论文尝试让小孩头上戴一个GoPro头盔去记录3到8岁的所有行为过程,让这些数据涌现智能,出现了出奇的效果。
但这样的实验环境很难搭建,现实中你不可能让孩子一直戴着GoPro。所以我们需要一个真正能让孩子愿意使用的产品。
我一直在做的就是这件事。十年前在百度的时候就已经在做相关工作了。这只是一个用来收集数据的价值终端,我们一直没有偏离这个方向。
网易科技:那为什么不做AI眼镜呢?如果要采集数据的话,眼镜不是一个很好的终端吗?
顾嘉唯:从微软研究院到百度研究院,智能眼镜我也做过挺多代,无论是带光机显示的 AR 眼镜 HoloLens,还是只有摄像头的 AI 眼睛 BaiduEye,而在大模型时代它其实作为主要载体,数据的价值刚刚开始,也是为了采集人在物理世界里是怎么操作事物完成空间的过程。
“具身智能大脑”真正缺的是这种数据,不是别的。你靠互联网视教远程操控或者仿真模拟,是无法获取到真实有效的数据的。
关于家庭机器人的技术发展,我们其实是在沿着两条主线持续推进:
第一条主线,“第一视角人生数据闭环”的采集路径。这条路径我从过去做到现在从未变过。
以前Luka卢卡收集的是桌面上的交互数据,现在我们收的是整个真实世界(物理场景)中,孩子和环境空间交互的数据——孩子每天怎么跟世界交互、在什么情境下产生了什么行为,我们都能收集。
你可以理解为我们在构建一种全场景、全交互的“世界输入层”。未来世界的交互入口,不再是APP,而是你和世界本身的连接方式,我们就是在定义这个连接。
第二条主线,“第三视角数据”的采集路径。比如现在的 Luka卢卡,它不仅能跟用户进行 桌面级的互动,还可以加装手脚、轮足、机械臂,实现写字、画画、抓取道具等能力。用户可以与之进行更深度的物理互动。
小方机也在做这件事,它是以AI角色的方式陪伴孩子,用具备“主动意识”和“长短期记忆”的“拟人化”角色,作为观察者,在一天的日常生活 lifelogging持续采集孩子的行为轨迹和成长过程。
首先,下一个 AI 终端一定是新的交互形式。
因为人机交互的发展路径已经很清晰——从客厅里的大屏幕,到桌面屏幕,再到口袋里的手机屏幕,最终一定走向“invisible 无形”。
当屏幕消失之后,下一代计算终端只有两条路:一是比特交互为主的极致随身化、小型化个人计算设备;二是原子交互为主的具身智能,能操纵真实世界的机器人。
所以你要么走可穿戴终端的方向,把 AI 能力越来越贴近人;要么直接走到“机器人”的路径,让机器替人去物理世界。这两个方向,也是我始终围绕在做的核心。
网易科技:为什么要沿着这两条路径走?底层逻辑是什么?
顾嘉唯:其实这两条路径的目的,都是为了解决当下最大的问题:物理世界里的空间交互数据非常稀缺。
现在,文本、图像类数据,其实已经相对完善了,但物理世界里的行为数据还没有被系统性地采集,这正是通向 Physical AI 具身智能大脑最大的不确定性所在。
人类也好,人形机器人也罢,要实现通用泛化的动作、习惯、任务的调度与预判,全靠这些空间交互行为数据。
没数据就没智能。所以我们这两个路径,本质上都是在为AI构建下一代的行为世界模型——你怎么行动、接下来会怎么行动,这些都是靠真实设备在最有价值的场景中收上来的。
这两种维度的数据,一个是观察人怎么操作物理世界,一个是作为“人”的延伸去感知世界。它们是建立世界模型最需要的数据,最重要的是,这里需要的数据量级。现在没有哪家公司能像我们这样,通过大规模实打实铺设备、收数据的方式,走出闭环路径。
我认为,当下我们的思路是在构建具身大脑路径中拿入场券、拿门票。因为具身项目目前都需要一步步的迭代且落地周期都相当长,短期要找场景能闭环商业化的“家庭陪伴”是一条路径,有机会从产品失效成本低的简单场景搜集数据,逐步迭代到复杂场景。
当时我们物灵科技做各类服务机器人,有商业用途的也有家用的,除了桌面机器人,还有能在屋子里跑,也能在室外活动,是为了补全视角与交互的类型——但那时候技术条件还不到。现在不同了,时代到了。
外界总以为我在做的是“Luka卢卡”那类C端产品,实际上,C端只是落地的形态,背后的目标一直是数据,构建世界模型的终极数据闭环。
网易科技:你刚提到,要做定义下一代的产品,“小方机”如何定义下一代?从 Luka卢卡到小方机,这其中的思路是什么?
顾嘉唯:其实从桌面交互延伸出来的路径,我们做了很多年,也经历了不少波折。
现在我们重新定义好 AI 终端,服务好这个我们熟悉的人群和产品形态,我们的优势在于交互和软件操作系统,我们其实并不是一个设备公司,软件交互定义硬件设备,这是我们在这个 AI 时代的定义。因为我一直相信我在做的业务,硬件只是手段,软件才是目的。通过硬件守住用户场景,软件积累价值数据。
硬件形态上,你看过电影《Her》吗?我们的理念就是那个形态,核心不是耳机,而是一个具备实时互动能力的智能体。
下一代的手机形态,可以手持,也可以在胸前摄像头看得见眼前的实时场景,这是2013年电影设定的2025年人类跟 AI 操作系统 OS1如何共生的剧情。
就像你刚才看到的 demo,我在物理世界中向你展示的那些互动场景,那就是我们所定义的随身角色,一个在你身边、实时与你交互的智能助手。
网易科技:所以这也是我们挂脖设计的出发点吗?第一视角的交互方式,就像《Her》里的体验一样。
顾嘉唯:对,这就是我常说的,AI 发展的路径里,只有在目前从智能体 Agentic AI 往物理世界 Physical AI进化的结构性节点上,才有可能诞生“原生设备( AI native device)”的新机会。
以前我们只是把AI叠加在手机、电脑等已有设备上,做一些效率提升的事情。但只有当AI成为一个独立的交互介质,才能诞生新的品类。
现在去正面跟手机、眼镜竞争其实很难短期成就独立计算终端,比如电池续航、场景限制等问题。而我想要做的就是下一代 AI 独立计算终端,可以插 SIM 卡,可以独立运行,那我就要找对细分市场,垂直人群的应用场景。
我的观点是,手机为中心的个人计算范式还会有一长段时间,眼镜耳机这些品类本质上属于手机应该去做的配件,一旦你证明有PMF(Product-Market Fit,产品市场匹配),大厂自然会快速跟进。
但正因为如此,这块领域不是一个对创业公司友好的地带,门槛高、窗口期短,很难有持续优势。所以这条路我们没有选择。
更大的背景是,这一轮的大模型智能体就是“人”,传统由人来做的事,被“人”替代了——也就是由Agent来替代真人服务。
这使得重运营成本的服务转变成产品解决方案,毛利结构也迅速变化。
以前的服务构建需要大量人力,成本高,毛利低。而Agent的加入,让成本下降,毛利提升,同时商业模式也发生了进化。现在越来越多的人是买产品来获得服务,而不是单独为服务付费,最典型的例子还有疫情双减后的教培行业跟学习机的关系。
网易科技:这就涉及一个“卖给谁”的问题。“小方机”的用户人群是怎么样的?
顾嘉唯:是的。我们这代人小时候是穿鞋套进机房的,我们当时用的 IT 产品,是微软这些老品牌服务我们的产物。
可今天主流的应用,已经不是我们用的那些东西了。你看看00后,甚至10后、20后在用的产品,你可能一个都没听过。
而现在,我们的用户人群结构已经变了,事实上每一代信息产品到智能产品,回顾 snapchat、insgram、tikok 等,都是从更年轻的人群开始渗透,且年龄越来越低。
因为“交互方式的变革”只能从新一代开始。 新的交互方式,比如像Her(电影《她》)里的那种与AI情感交互,必须从智能时代的原住民那里开始。所以我们选择儿童,是因为他们才是真正会使用、习惯并期待新交互方式的一代。
人口学中把00-10后称为“阿尔法世代”(“Generation Alpha”)。
所谓“阿尔法世代”用户,指的就是智能时代的原住民,我们的产品就是为这拨人设计的。另外像95后这代年轻家长,他们作为客户,天然接受新形态产品, 期待孩子有个哆啦 A 梦陪伴成长。
我们会持续深耕这一人群,先从0-15岁儿童到青少年阶段入手,这部分我们已经建立了一个足够大的用户基本盘——接近千万的设备,积累了大量的用户数据。
此外,我们发现,美国60岁以上的老人也在玩我们的产品,所以用户的年龄结构其实也会不断拓展。 “交互方式的变革”只能从新一代开始,小方机是孩子的第一个AI朋友。
向上的话,我们将从儿童成长延伸到15-30岁的年轻人、宠物经济,以及30-50岁父母的育儿家庭带娃场景。再往下我们会覆盖到老年用户的养老场景。
另外,从数据的角度来看,如果你没法伴随一个人的成长,那就不可能数据化这个人。而新一代的 AI-OS 原生的消费科技公司肯定是完全长在人类的全生命周期的数据之上的。
当年是像LG这样的财阀型公司,它们能做一整条产业链,从一个纸杯到一艘航母,产品覆盖全年龄段全产业链。
但今天的智能时代不是这样。今天能不能占住用户的心智、能不能获取跨代际人群的数据,要靠你从“第一天”开始就拥有数据闭环的能力。
这是我给今天的AI时代公司下的定义:拥有数据起点,才能构建真正的用户价值。
网易科技:聊回“小方机”本身,它的市场定位是早教机这样的产品吗?
顾嘉唯:传统上最大的两个品类,一个是早教机,主要面向学龄前的小朋友,另一个是学习机,偏向6岁以上孩子的刷题和考试准备。
我们现在的小方机,其实是一个全新物种,它的定位是“孩子的 AI 手机”——每个孩子都应该有一个属于自己的“ AI 手机”,只是过去没有合适的设备来承担这个角色。
要知道今天的孩子身边一堆设备,桌上的学习机、故事机,口袋里的听力机、单词机,手腕上的电话手表,孩子太累了,今天是最好的时间可以实现 all-in-one 集合了多种功能于一体的 iphone moment 出现了。
儿童手表也可以算是上一个周期的“孩子手机”,它的底层逻辑是通信,是家长“找孩子”。定位、电话、短信这些功能是刚需,后来才长出了孩子之间的社交网络。
但那是通信时代的产物,而不是智能时代的。而在今天,智能时代的终端应该有新的形态,小方机就是为这个时代设计的。
“小方机”的产品介绍
网易科技:那小方机起的作用是“陪伴”还是“教育”呢?

