钱雨:技术终将趋同,难的是理解人
引子:三个标签
2026年6月3日,方寸一间。
钱雨坐在镜头前,被要求用三个标签做自我介绍。他愣了几秒钟——这个问题没有提前准备过。他想了想,给出了三个词:AI、研究、跨界。
AI,是因为他做AI投资将近11年,最近一两年还自己做了一个AI项目。
研究,是因为他无论是做投资还是做AI项目,所有事情都围绕研究展开——他更关注事情本身,而不是单纯看人。
跨界,是因为他学了多年的工科,又做了多年的VC,学了很多金融投资相关的知识。
三个词轻描淡写,但背后的轨迹并不简单:北邮博士(电子工程→信号信息处理)→清华-港中大FMBA→VR/AR投资人→中关村智用人工智能研究院首席产业研究员→清研载物AI基金合伙人→现在自己做AI创业。
这条路径,几乎是中国过去十年科技投资赛道变迁的一个缩影。
PART.1
VR为什么失败了:一个老炮的复盘
钱雨接触VR的时间很早。
2014年、2015年,VR被公认为下一个大趋势。资本市场热捧,创业者蜂拥而入,所有人都在说VR会改变世界。
钱雨也是这么想的。他当时在VR/AR领域投了不少项目。
但后来,VR没有真正起来。
为什么?
“元宇宙就是各种失败技术的结合体。”
“凡是不挣钱的技术,最后都被打包成了元宇宙,变成了一个新的概念。”
这句话说出来很刻薄,但事实确实如此。到今天,元宇宙也没有找到真正挣钱的场景。
钱雨认为,VR失败的核心原因是硬件制约。
“VR眼镜要做得特别轻薄,才能让人戴一整天。但从2014年到2020年,这个目标始终没有实现——眼镜太重了,B端用一用可以,C端没有人会日常佩戴。”
后来Facebook出了雷朋眼镜,那款产品其实已经不是真正的AR眼镜了——它降级了,变成了一款带AI能力和蓝牙功能的时尚眼镜。但卖得还不错,因为它解决的不再是AR问题,而是时尚和轻度AI功能的问题。
VR大空间项目也是同样的逻辑。钱雨举了一个例子:
浪浪山小妖怪是一部很好的IP电影,同步做了一套VR大空间体验,内容和互动都做得很好。但问题在于,VR大空间需要400到500平米的场地,在北京这样的城市,租金极高,还需要2到3个现场服务人员。最终一个月能带来的收入只有几十万,而场地的坪效太低,根本覆盖不了成本。
“VR最后都是在拼坪效和翻台率。它没有成为一个刚需,它解决的只是某种猎奇需求。”
现在百镜大战兴起,各种厂商都在出带光波导的眼镜或者蓝牙耳机型的眼镜。钱雨的判断是:目前最实用的还是“耳机+AI”的组合,但如果光学模组能做得更轻薄,市场就会爆发——但这需要基础物理学和光学等一系列基础学科都发展到那个阶段才能实现。
现在还没有到那一步。
PART:2
AI为什么比VR还难投
从VR转向AI,钱雨发现了一件让人困惑的事:AI比VR还难投。
为什么?
钱雨说,VC投资的本质是靠行业的快速爆发力和想象力来支撑的。移动互联网时代,项目可以一年做两三轮融资,烧钱做增长,烧到IPO,前期投资人的钱就有机会退出。那个时代,互联网公司的估值逻辑和美股资本市场的退出通道完美匹配,所以VC好做。
但AI不一样。
第一,AI的基础投资金额要求比移动互联网高很多个层级。“如果你要做基础模型,全中国只有几家能烧得起钱,全世界也就那几家。”
第二,AI和实体经济结合之后,它的增长速度是依赖于实体经济的,不能快速爆发。“你要做AI,一定和实体经济结合以后,它就变成了实体经济,它其实是一个实体经济基础上的导数。所以它没有办法快速爆发,也就没法快速退出。”
钱雨打了个比方:“投AI应用和投工业很像。以前有一帮投工业的投资人,他们得出的结论是,你要投工业,就要做好投9年以上才能退出的准备。AI的大多数行业应用,都有这个特点。”
那AI VC是不是没法做了?也不尽然。钱雨说他投了一家企业,从Pre-A开始投,不到5年,现在马上要IPO了,每年的营收都在增长,去年已经快5个亿,今年比去年还能翻不少。但这是少数案例。
“我的结论是,AI其实很难投。投下去以后,你要做好一个很长跑的准备。但大多数投资人其实并没有做好长跑的心态。”
PART:3
大模型中美差距还有多远
关于大模型,钱雨有一个相对客观的判断。
他目前用的主要工具是Claude Code,里面跑的模型是智谱的GLM 5.1。效果很好,做基本所有的工作,都比用普通模型好。
但他也坦承:国内最好的编程模型和Claude比起来,差距还挺大。
“我们自己的项目,第一版核心架构设计,因为我不确定智谱能不能跑好,所以我不完全敢用智谱。用Claude出来的方案会好很多。但是Claude出来的方案也会有问题,拿回来再让智谱去挑毛病,智谱也能挑出一堆毛病。整体来说,Claude的架构能力比智谱强一些。大概有半年以上的差距。”
半年差距意味着什么?意味着智谱现在的模型,大概相当于Claude去年秋天的水平。
但差距在快速缩小。“原来我们以为要5年才能追上,其实花了两三年就追到了。可能大家现在差不到一年了。”
差距缩小的速度在加快,但还有一些客观限制:
芯片限制——高端芯片被卡脖子,数量不够。
数据限制——中文互联网最好的数据都在各自封闭的APP里,不在公共网络上,不像英文互联网有大量可用的网页。
钱雨还提到了DeepSeek,认为DeepSeek V4.0没有上多模态,主要还在长文本上发力。他自己没有特别高频使用DeepSeek。
PART:4
AI应用为什么没有爆款
2022年到2023年,大家玩的是大模型和提示词。那时候出现了一个职业叫“提示词工程师”,年薪很高,有人用整整一两页纸写提示词,写得跟编程代码一样。
为什么?因为当时大模型能力很弱,用人话和它说,它听不懂。
但现在不一样了。你可以用很自然的方式和大模型对话,甚至你没说到的东西,它都能替你想到。这背后的原因是:基础模型能力增强了,但更多还是因为Agent(智能体)的出现。
钱雨梳理了从大模型到Agent的演进路径:
第一阶段:大模型。你问一句话,它答一句话,不会考虑太多问题。
第二阶段:工作流(2024年流行)。像编程一样写一个工作流程,每一步需要大模型干什么都规划好,最后固定流程出来一个结果。好处是结果很好,但坏处是没有弹性——一个工作流只能干一个事儿,没法应对C端太多变的需求。所以工作流只适合B端。
第三阶段:Agent。不再是固定流程,而是一个灵活的调度系统。你把需求给它,它能相对灵活地调度大模型,用软的逻辑来帮你解决问题。
多Agent系统(Multi-Agent)更进一步:模拟一个真实组织的运作方式。钱雨举了一个奥迪4S店的例子——里面模拟了店长、销售、售后、财务等多个角色,每个角色有各自的知识和思维方式。客户的问题进来之后,大家从各自的角度拿出方案,共同讨论,最后由店长决策。这就比直接问一个大模型“我该买什么车”靠谱多了。
“Agent里面真正有价值的全是人类的经验。Agent本身没什么,Agent里面内化了多少人类经验,它就能帮你解决多少问题。”
那为什么现在AI应用还没有真正的爆款?钱雨说,阿里做战略投资的人看了很久,结论是:没有发现AI爆款应用。唯一半个爆款是"妙鸭相机"——但很快就没了,因为效果不够好,做出来的人总和人有点不一样。
“现在AI的问题在于,它的效果不够好,就会变成伪流量。人的需求是有的,但流量是假的,因为它接不住。”
PART:5
谁将被AI替代
AI对哪些行业的冲击最大?
钱雨认为,冲击最大的是两类人:办公室文员和程序员。
文员:现在写各种文档都可以用Claude Code这类工具帮忙写,效率极高。秘书的价值在发生变化——原来需要文笔好,现在更重要的是“会领导AI干活”的能力。知道怎么用AI,怎么描述需求,怎么审核AI给的方案,怎么测试结果。这些能力比文笔更重要。
程序员:钱雨自己从去年到现在用AI写了5万多行代码。他不是程序员出身,但有了AI,不需要写代码的人,只需要知道要什么,精准描述,让AI实现,然后审核方案、想测试方法。
但有一个问题:用AI编程的头两个月,他每天比之前多睡两个小时。因为AI干活速度太快,大脑信息密度太高,需要持续高强度思考,比传统编程更累。
更深的变革在于:初级程序员可能要失业了。
“过去为什么程序员要招年轻人?因为干的活大多是编码的活,是体力活。但现在AI编程时代,人干的活是思考的活、宏观的活、经验的活。35岁以上的程序员反而开始被抢着要,因为经验越丰富,越知道怎么和AI配合。”
钱雨还提到,他看到有公司在招程序员时,只招35岁以上的人。因为这个阶段的人,经验足够丰富,知道怎么带AI干活,怎么识别AI方案里的问题。
AI对影视行业的冲击也是实实在在的。钱雨参观过一个字节跳动的AI短剧合作公司,发现现在手机上的AI短剧已经和大片没什么太大区别了——从服化道到场面的视觉效果都很好,成本却很低廉,一分钟最贵也就一两百块钱。
但在大屏上还不行的,清晰度和AI穿帮的问题依然存在。
还有一个有意思的案例:OPC公司(一人或多人的微型公司)。钱雨说,现在真正能做起来的OPC,就是做AI短剧的——一个人能干活,能以个体接活,需要一个公司来结算和税务处理。但OPC本质上不适用于所有行业,它更挑具体的落地情况。
PART:6
一个AI老炮在做什么AI项目
钱雨现在自己做的AI项目,是一个基于人格识别的AI系统。
这个项目的来源,是他做VC投资时一直在用的方法——用AI识别创始人的人格特质,帮助判断创始人是否值得投资。
“我们早期其实都是投事,后来变成投人。但人怎么投?就是靠怎么去看人。”
他们发现,用这套技术来判断创始人的个人风格,和最后公司的发展轨迹高度吻合。这让他们意识到这个技术的价值。
这个AI系统怎么工作?
它可以通过多种维度识别一个人的人格特质:
第一,面相。不同类型的人,从面相上有一定的区分。
第二,微表情和眼神。人的眼神、表情、说话的语气语调节奏,都是特定的。
第三,语言结构。有很多人的说话结构是相似的,可以归类。
第四,行为模式。这些行为模式是由大脑神经结构决定的,有特定的脑神经回路,就有特定的行为,反过来也成立。
这个系统的核心价值是什么?
钱雨说,他发现人和人的冲突,表面上看是因为人品或者能力问题,但真正的问题其实大多是由性格因素导致的。不同性格的人,语言系统不一样,对方说的话可能深深刺痛你,但你可能自己都体会不到。
“我认识了我的性格,我选择不按我性格的默认套路出牌的时候,才叫有自主性。”
这个AI系统有多个版本:手机APP和小程序(内测中)、桌面机器人版本(陪伴用,因为机器人能看着你,沉浸感更强)、规划中的AI眼镜版本(沟通过程中实时给出沟通建议)。
它的应用场景包括:夫妻沟通(了解对方性格,减少冲突)、招聘(AI测试候选人人格特质)、智能客服(按客户性格调整沟通方式)、亲子教育(识别家长和孩子的性格冲突)、相亲市场(快速了解对方性格,判断是否匹配)。
钱雨举了一个典型的例子:有一个家庭,四口人里有三口人是同一种性格,另外一个孩子是另一种性格。这个孩子到哪去都随心所欲,玩到现场才找酒店,找酒店要花两小时。另外三口人就觉得这个孩子特别不靠谱。但实际上这只是两种不同性格的表现,并不是不靠谱或者没活力。
PART:7
为什么AI理解人这么难
钱雨做的这个项目,背后的理论依据是什么?
他提到了几条线:
第一条是乔姆斯基——美国现代心理学奠基人之一,他奠定了相关理论基础。
第二条是RST理论(脑神经科学)——你的大脑神经结构如何决定你的各种行为。
第三条是计算机科学里的人格计算——2008年以后,随着计算机能力增强,科学家发现人的性格是可以用计算机计算出来的。
钱雨说,真正做这些研究的是计算机科学和脑神经科学的交叉领域,而不是传统心理学科班出身的人。
这也解释了为什么AI理解人这么难。
钱雨举了一个咖啡机器人的例子:机器人要识别顾客买咖啡的意图。一个年轻女孩说来一杯温咖啡,表面上是买一杯咖啡,但实际上背后可能有很多考量因素——今天的天气、她是不是这两天身体不舒服在生理期、她为什么要买温的……如果能识别这些,机器人就能建立更深度的联系。但这个识别能力,目前的大模型本身是做不到的。
“大模型打死也不会给你讲这些事情。你要给AI建立一套复杂的知识图谱系统,才能让它有这些判断能力。”
所以钱雨给自己的项目的定位是:在人格和性格冲突这个特定领域内,做理解人的意图的基础设施。
“你现在买AI工具,其实就好比你用斧头砍树。但如果你有Claude Code加上GLM 5.1,那就不是斧头了,是电锯。”
PART:8
AI投资的真正机会在哪里
钱雨在六年前有一篇著名的文章《三个最具投资价值的AI创业模式》,里面提到了"故事与数字"的核心理论——任何一个企业的估值都由两个东西决定:商业模式(故事)和财务数字。
三个模式分别是:
模式一:高举高打型。一个伟大的故事+暂且无法匹配的业绩数字。这类项目创始人背景极其强悍,理想极其远大,但风险也极大——历史上最先出场的往往不是最后的赢家。
模式二:高举落地型。一个伟大的故事+技术逐步落地带来的实在市场业绩。这类项目核心是具有通用性的产品/服务,诞生于实际市场需求,但面临中国特殊营商环境的挑战——B端客户通常第一年小规模试验,第二年才可能签大单。
模式三:低举落地快速壮大型。一个当下看似平庸、未来可能升级的故事+优异的市场业绩数字。这类项目初期不性感,但能解决具体问题,而且具备跃迁复制性——用一个技术解决一个问题,然后复制到多个垂直领域。
钱雨认为,现在AI VC最大的问题是:大家都在扎堆底层技术(芯片、具身机器人),但这些领域的投资逻辑其实不在于有没有想象力,而在于能不能做出来。
“真正到了顶层应用,很多人其实看不太懂。”
具身机器人,钱雨认为是个大泡沫。“大家都在融资,融完钱以后不花,囤着现金。因为具身机器人在未来几年内很难创造出足够的实用价值。你一个企业砸了几十亿进去,但你的产品卖不出几十亿的价值,你干什么?”
真正有价值的,是那些既有技术深度,又能跨越多个行业的团队。钱雨投的一家AI企业,每年开辟新赛道,每条赛道都带来新的营收,就是因为有多条线平推的能力。
“AI不是一个垂类行业,它是一个平行的行业。你进入任何一个新的领域,都会遇到知识、经验、门槛和资源关系的门槛。”
PART.9
AI时代,我们需要什么样的能力
访谈的最后,钱雨给出了一个让很多人意外的建议。
他说,现在最重要的能力,是把自己变成一个"AI翻译官"。
什么是AI翻译官?
就是既特别懂自己传统企业的业务,又特别懂AI,知道怎么用AI把自己的业务表达出来、表现出来、实现出来。做到这一点的人,未来一定时间内会很稀缺。
关键在于,要对AI最新的工具有热情,愿意去试。钱雨的建议是:每半年更新一轮工具认知就够了,因为AI工具不会那么频繁地爆发。
关于孩子的教育,钱雨说自己两个二年级的孩子也在用AI:问豆包单词什么意思,让AI帮忙出题、分析错题原因、用AI编一个背单词的小游戏……
但他一般不让孩子直接用AI出答案。
“他们现在还比较淳朴,没想过可以用AI直接搞定作业。”
钱雨认为,未来最重要的能力还是那些基础能力:美感、逻辑思维能力……但有一个东西AI目前还很难提供——情绪价值。
“人提供情绪价值还挺重要的。AI能不能提供情绪价值,还很难讲。”
对于年轻人在AI时代的定位,钱雨说,最麻烦的不是失业,而是没有经验的年轻人如何找到自己在AI时代的价值。
“这个问题目前没有答案,因为还没有到各行各业都接受AI的地步。”
尾声
访谈结束了。钱雨站起来,说还要去茶室聊一些事情。
他这一年都在做自己的AI项目——那个基于人格识别的系统。投资人的身份暂时退居幕后,创业者的身份走到前台。
这是他过去十年路径的延续:从技术出发,经历过移动互联网的喧嚣,经历过VR的泡沫,经历过AI的火热与迷茫,现在在AI应用层找到了一个具体的切入点。
他说,AI和人性的关系,是他看到的最有价值也最难解决的问题。
技术终将趋同——半年差距,一年差距,慢慢会弥合。但理解人这件事,可能永远是AI最难跨越的那道坎。
因为人本身,也还没有被完全理解。
金句合集
“VR就是各种失败技术的结合体。凡是不挣钱的技术,最后都被打包成了元宇宙,变成了一个新的概念。”
“AI其实很难投。投下去以后,你要做好一个很长跑的准备。但大多数投资人其实并没有做好长跑的心态。”
“国内最好的编程模型和Claude比起来,大概有半年以上的差距。但差距在快速缩小。”
“Agent里面真正有价值的全是人类的经验。Agent本身没什么,Agent里面内化了多少人类经验,它就能帮你解决多少问题。”
“现在AI的问题在于,它的效果不够好,就会变成伪流量。人的需求是有的,但流量是假的,因为它接不住。”
“初级程序员可能要失业了。35岁以上的程序员反而开始被抢着要,因为经验越丰富,越知道怎么和AI配合。”
“你认识了我的性格,我选择不按我性格的默认套路出牌的时候,才叫有自主性。”
“大模型打死也不会给你讲这些事情。你要给AI建立一套复杂的知识图谱系统,才能让它有这些判断能力。”
“现在最重要的能力,是把自己变成一个AI翻译官——既懂传统业务,又懂AI,能把两者连接起来。”
“人提供情绪价值还挺重要的。AI能不能提供情绪价值,还很难讲。”
“技术终将趋同,但理解人这件事,可能永远是AI最难跨越的那道坎。”

