大数跨境
0
0

2024 到 2025,《晚点》与闫俊杰的两次访谈,记录一条纯草根 AI 创业之路

2024 到 2025,《晚点》与闫俊杰的两次访谈,记录一条纯草根 AI 创业之路 晚点LatePost
2026-01-09
9
导读:来找找相同和不同吧。

来找找相同和不同吧。

本文首发于 2024 年 04 月 17 日,2025 年 01 月 17 日。

文丨程曼祺

编辑丨宋玮

在今天(1 月 9 日)早上前往港交所敲钟前,MiniMax 创始人闫俊杰对《晚点 LatePost》分享了他此刻的想法:

希望我们后续能有机会对整个行业智能水平的提升做出更大的贡献。我们初步探索了一条纯草根 AI 创业的路径,尽管后面还是非常挑战,如果能对 AI 创新创业生态的发展有启发我们会感到很光荣。

2024 年和 2025 年,《晚点 LatePost》发表了两篇对 MiniMax 创始人兼 CEO 闫俊杰的访谈。第一篇访谈发生在 2023 年年底和 2024 年 3 月,第二次访谈发生在 2025 年 1 月。

两次访谈间隔不到 1 年,行业和 MiniMax 自身都有很大变化。2024 年初,闫俊杰给团队定下的目标是“技术上如何达到 GPT-4,产品上如何把用户规模翻十倍,单个产品能突破千万 DAU”。2025 年春节 DeepSeek-R1 震撼全球后,“DAU” 在 MiniMax 内部被视为“虚荣指标”。

这在那个春节前的访谈中已有信号:闫俊杰指出,做大模型的一大误区是套用移动互联网的逻辑——更多用户和反馈虽能反哺推荐算法,却不能直接让大模型更聪明;现阶段提升大模型性能的核心路径仍是训练与迭代新模型。

不变的是,MiniMax 一直坚持“Intelligence with everyone”,服务普通人。例如,首次访谈中提及的 MoE(混合专家系统)和线性注意力机制,已在 2025 年 1 月发布的 M1 千亿参数大模型中落地;而关于“信息获取”的 Agent 构想,目前尚未推出公开产品。

两次访谈的异同,记录了这家公司与整个行业的演进轨迹。

2024 年的访谈:AGI 不是大杀器,是普通人每天用的产品

“每件事都是做到极致才会好”

晚点:一位 OpenAI 的工程师告诉我们,判断一位人工智能创业者是否真正信仰 AGI,就看他是在 ChatGPT 发布之前还是之后创业。

闫俊杰:MiniMax 成立于 2021 年底,当时 AGI 在中国还是巨大非共识。我们算过,把 GPT-3 扩大 100 倍需要数十亿美元,而当时我们并不认为中国会支持一家创业公司投入如此巨资。

晚点:有人认为你们最开始做元宇宙,大模型火了才转向 AGI。出发时到底有多相信 AGI?

闫俊杰:我们在 ChatGPT 出现前成立,大部分公司是其后入局——这是核心区别。当时没有参考,只能边试边走,但技术进步是内核,产品方向则尚不清晰。

我们最初想象的 AI 产品是一个具备声音、形象和文字能力的智能体;曾做过带 3D 形象的原型,但其语言与语音能力仍由大模型驱动。

晚点:你认为 AGI 是什么?如何确认它已到来?

闫俊杰:我们的定义至今未变——当大家不再觉得它是“AI”,那一天就到了。就像今天没人说抖音是“基于推荐系统的内容分发软件”,只说“抖音就是抖音”。

晚点:MiniMax 是国内首个明确主攻 AI 2C 的公司,为什么?

闫俊杰:电动车、移动互联网的成功,本质是服务普通人。而服务普通人的前提是商品化、产品化,而非项目制。当时整个行业陷入困境,而成功行业都靠产品化驱动,结论几乎唯一:必须做出能服务大众的人工智能技术和产品。

所以我从不认为 AGI 是原子弹式的大杀器,它就是普通人每天使用的服务——这也是我们最坚持的。而且 AGI 不应由一家公司独自完成,而需与用户共同迭代。

晚点:今年 1 月你们是国内首个发布 MoE 大模型的公司,其他厂商主要在迭代 dense 模型。做 MoE 是一场豪赌吗?

闫俊杰:一开始我也认为是赌,那几个月别人都走在更稳的路上,而我们押注一个更难的方向。

当时我们将 80% 以上的算力和研发资源投向 MoE,且没有 Plan B。

晚点:MoE 是 2023 年夏启动研发的,为何必须选它?

闫俊杰:一是基于我们有限的数据和算力资源,MoE 是唯一能完整训练出来的模型架构;二是已有大量 2B/2C 产品日均处理海量 token,dense 模型的生成成本与延迟已无法承受,系统面临崩溃风险。

如今这已是行业共识:若要构建万亿参数级模型,dense 架构已不可行。

晚点:最后是如何攻克的?

闫俊杰:过程很痛苦,失败两次。比如模型训练半个月后发现关键指标持续偏离预期,如同火箭偏航——需重新排查各环节。每次失败都耗费大量资金和时间,但积累的经验最终汇聚为下一次成功的基础。

后来我发现,挑战并非源于 MoE 本身,而是底层实验方法、网络结构和数据组织等基础能力的不足;问题的解决,本质是团队整体研发效率与科学性的跃升。

晚点:一位接触过你的人评价你很有工程化思维,追求在约束条件下实现最优解。

闫俊杰:其实都是算出来的。我们大部分决策基于目标优化,本质是在解方程。

晚点:当前资源约束快速变化,你倾向保守还是冒险?

闫俊杰:基本选择最冒险的路径——因为“每件事都是做到极致才会好”。我选的技术路线是上限最高、几乎无退路的;算力方式也极为激进。

晚点:听说你们不买 GPU,只租卡?

闫俊杰:我们没有一块 GPU,但可能是中国实际使用 GPU 数量最多的 AI 创业公司。

持有资产会使动作变形。若拥有大量 GPU,商业上最优解或许是对外出租;而我们只想让公司更简单。

晚点:去年 10 月遭遇算力紧缺,如何规避类似风险?

闫俊杰:成为市场上最大的客户。

对中国创业公司来说,更好的方式是同时思考技术和产品

晚点:李彦宏称创业公司“双轮驱动”不是好模式,但你们第一天就要做产品,决策依据是什么?

闫俊杰:创业初期既没技术、也没产品和用户。前六七个月只是做出最原始模型,才有后续产品基础。

假设所有资源免费、组织无限强大,技术优先当然合理;但对创业公司而言,若缺乏足够强的产品能力承接,即便技术领先,成果也无法转化。独立发展的创业公司必须同步考量技术与产品。

晚点:OpenAI 也是在推出 GPT-3.5 后才做出 ChatGPT 这一杀手级应用,此前并不重视产品。

闫俊杰:那是因为 OpenAI 在技术、人才和数据积累上具有数量级领先,享有长达一年的独特创业窗口期——这不会再现。没有公司能短期拿出“优于全球十倍”的方案,因此对中国创业公司而言,技术与产品并重才是更现实路径。

晚点:有投资人认为你们现在做产品太早,“在黑莓手机上做不出抖音”。

闫俊杰:按此逻辑,现在也不该做技术——今天的模型也不是五年后的模型。但共识是:唯有通过构建当下技术,才能深入理解它,并推动未来三年至五年的突破。

晚点:技术发展是渐进式的,产品也是吗?

闫俊杰:是的。中国成功的公司如米哈游、美团、字节、理想,几乎没有靠第一个产品取胜的,多是第二个乃至更后的产品达成突破——这是业内总结的共性规律。

晚点:既然有开源大模型,为何不干脆专注做产品?

闫俊杰:核心在于——对模型的理解即是对产品的理解。产品越往下深挖,对模型的要求就越深。此外,成本控制与响应延迟也高度依赖模型掌控力。很多问题如“什么可解、什么不可解、如何迭代”,都要求扎实的技术底座。

现实是:去年不少产品基于 GPT-4 构建,却始终未能复现 ChatGPT 的体验。

晚点:同样做产品,你们却同时运营 Glow、星野、海螺 AI 等多个项目,而非聚焦一两款,原因何在?

闫俊杰:OpenAI 在 ChatGPT 后的产品也未达预期,说明当前技术能力与产品形态之间存在显著 Gap。即使采用顶尖技术,也未必匹配最佳产品。若承认这一 Gap,客观规律就是:必须多尝试、多失败,以找到真正可行的路径。

晚点:感觉有点像字节跳动的产品方法论。

闫俊杰:我们尚不具备按字节方式运作的资格。每个公司应选择适配自身现状的形态:字节优势在于技术资源富余、产品供给充足,尝试越多收益越大;而我们资源有限,产品投入占比远低于模型研发,经测算,这种策略成功率更高。

晚点:技术重要,产品也重要,你们纠结过哪个更重要吗?

闫俊杰:曾纠结,但现已不纠结。

2022 年底 Glow 发版因新冠感染导致一个小算法 bug,致使对话体验下降 15%,元旦三天 DAU 下跌 40%。修复后用户迅速回流。这让我们深刻认识到:现阶段产品价值的核心,依然是模型性能与算法能力。几乎所有重大体验提升,均源于模型本身的进步。

晚点:同时做大模型与多款产品,最大挑战是什么?

闫俊杰:技术不够好——这是本质。我们的技术迭代速度已很快,但仍与全球顶尖模型存在差距。

十倍的 Scaling Laws

晚点欧洲头部公司 Mistral 已开源 MoE 模型,业界普遍认为 GPT-4 亦属 MoE,MoE 会是今年大模型的关键赛点吗?

闫俊杰:MoE 只是其中一个环节。凡能写入论文的技术,基本难以构成绝对壁垒。

晚点:在这场技术竞赛中,MiniMax 有何非共识判断?

闫俊杰:行业非共识往往 6–9 个月内即转为共识。当前有三点共识已明晰:一是 Scaling Laws(规模定律);二是同等精度模型所需算力与资金投入正逐年大幅下降,算法公开与自由探索加速了这一进程;三是提升数据质量的性价比极高。

由此可自然推导出我们的多数关键决策。

晚点:你怎么理解 Scaling Laws?它揭示了哪些可能性?

闫俊杰:Scaling Laws 是一条曲线。你可以信仰原始版本,也可以信仰十倍甚至百倍加速版本。

2020 年提出大模型 Scaling Laws 的经典论文《Scaling Laws for Neural Language Models》指出,影响模型性能的核心变量是算力(C)、数据量(D)和参数量(N),关系为 C≈6ND;模型结构与层数等因素影响较小。

其价值在于提供方法论:可通过小规模实验预测大规模结果;并助力行业对齐目标——因 Scaling Laws 要求数据、算力、芯片、算法、产品等多环节协同,统一预期至关重要。

至于论文中具体公式及结论,部分已显滞后。例如,其低估了网络结构的重要性,而实践证明,结构设计实为关键变量之一。

晚点:哪些变量可能实现十倍或百倍的 Scaling Laws 加速?

闫俊杰:网络结构本身即是一例。我们初研 MoE 时,以为其结构与 dense 模型类似,后证实不然——MoE 自身即可加速 Scaling Laws。此外,数据质量提升、算力分配优化(如将算力用于数据预处理而非仅训练)亦具显著加速度。

晚点:Scaling Laws 的力量源于简洁性,引入过多变量是否破坏其本质?

闫俊杰:提升数据质量、优化算法与训练方法永无止境,持续做就会持续受益。

真正的权衡在于:不同变量在不同阶段对 Scaling Laws 效率的提升速度各异。而小规模实验恰可帮助我们识别:哪些变量在哪个周期更具杠杆效应——这正是 Scaling Laws 方法论的延续。

为何中国必须追求几倍于原始的 Scaling Laws?当算力充足时,可优化原始曲线;当算力受限,则必须通过优化几倍曲线来达成相近效果——这完全可行。Anthropic 已用更短周期推出类 GPT-4 的 Claude-3,印证了放大 Scaling Laws 的可行性。

晚点:长文本(Long Context)会成为大模型差异化竞争的关键路线吗?

闫俊杰:优质大模型本应默认支持长文本。我们一直具备该能力,但未在产品中强调,主因是计算成本高。

晚点:实现长文本处理的技术路径是什么?

闫俊杰:标准 Transformer 使用非线性 attention,计算复杂度为 O(n²);过去一年,线性 attention 成为主流研究方向,使长文本计算复杂度降至 O(n),大幅降低资源消耗。

但实际差异在 token 达到 80 万至 100 万量级时才显著显现:此前如 20 万或 30 万,二次函数近似线性,性能差别不大;而 Gemini 1.5 是首个接近线性 attention 的模型,在 100 万 token 场景下响应仅比 50 万慢 1 倍,而非 4 倍。

因此,长文本解决的并非 20–30 万字需求,而是百万字及以上量级的真实场景。

晚点:100 万 token 相当于 100 万汉字,多少人有此需求?

闫俊杰:用户需求与技术能力相互塑造。远超预期的能力上线后,自然催生新需求。ChatGPT 上线语音功能前,无人明确提出语音通话诉求;上线后用户广泛使用。海螺 AI 的语音通话功能同样受欢迎——我 80 岁的祖父首次使用便与 AI 讨论四五十分钟历史人物,远超我最初的设想。

晚点:你们在产品中率先强调语音等多模态能力,而非长文本。如何判断技术优化的优先级?

闫俊杰:“Intelligence with everyone” 是我们最核心的信仰——我们并非技术的 Owner。

当前全球仅有 1–2 亿人用过 AI 产品,重度用户仅数千万。因其提问门槛高,真正愿意打字的群体极为有限;而语音与图片天然覆盖老人、儿童等更广人群。加入多模态后,用户上手门槛与平台渗透率均有明显改善。这正如今日头条到抖音的演进路径,在移动互联网领域已被验证一次。

越到后期,用户的价值越高

晚点:Glow 是你们首个产品,主打用户与定制 AI 角色互动,类似乙女游戏,在二次元圈层流行。为何选定该方向?

闫俊杰:早期冷启动阶段,我们精准触达 AI 爱好者、二次元青年等年轻群体,依其反馈快速迭代前几版产品。起量后,每日追踪社媒真实用法,通过观察+数据验证持续优化,而非依赖 AB Test。

晚点:产品踩过哪些坑?

闫俊杰:最初设想的智能体需同时具备声音、形象与文字能力,因此公司成立之初即启动语言、语音、视觉三大模型研发。

很快我们放弃 3D 形象——因其无法规模化(仅游戏与电影行业有成熟实践,研发周期以年计);也意识到深度学习做 3D 并非正确路径。在手机载体上,一个始终凝视用户的 3D 形象本就违和,绝大多数交互无需实体形象。

晚点:是上线后通过数据发现的吗?

闫俊杰:不是数据。首版 3D 形象制作时,我们请两位模特拍摄,当把模型放入手机屏幕那一瞬,就立刻意识到方向错误。

晚点:首个模型尚未产出,就招募产品经理。你如何向他描述想要的产品?

闫俊杰:当时并不清晰,因无任何参照。我们只模糊想象:存在一个可与用户自由、长时间对话的智能体,本质是信息交换与处理。

我们唯一确定的是:模型必须服务大众,这就决定了它必须是产品——因此最早便招来产品经理。

晚点:面对众多用户需求,如何取舍?

闫俊杰:后期取舍变得简单:是否符合技术发展趋势?能否为特定用户带来 10 倍以上体验提升?

晚点:产品审美上,你认为怎样的产品才算好?当前玩法较多,是否过于复杂?

闫俊杰:坦白说,我们尚未做出公认的好产品,故尚无答案。

当被问“复杂好还是简单好”,多数人答“简单”。但我对此存疑——尤其在行业发展前期。QQ 曾极其复杂,却为微信诞生奠定基础;ChatGPT 当前约 3000 万 DAU,似乎已达增长瓶颈。可见,偏简单的 AGI 产品在现阶段或存天花板,但最终一定会有极简交互满足更广泛人群。

晚点Sora 的出现对你有何启发?

闫俊杰:若 Sora 响应速度大幅提升——生成 1 分钟视频不再耗时 20 分钟,而是实时输出——将引发质变。

它会是更优的视频生成工具,还是更优的视频生成社区?再进一步,是否演进为超级内容平台?取决于两点:是否确信空间足够大,以及是否确信响应速度可足够低。

晚点:你认为未来用户量最大的 AI 产品可能是什么?

闫俊杰:我们目前仅实现百万 DAU,尚未突破千万或十亿级,故不敢断言。但信息交换与处理的价值毋庸置疑。

晚点:MiniMax 产品日活已接近 Character.AI,使用时长甚至更长。但有人质疑其数据表现好并非技术强,而是因软色情内容。

闫俊杰:分析表明,真正留住用户的是正向体验。如星野,其核心是为用户提供发挥创造力与想象力的平台。我们持续投入提升内容安全能力,确保平台正向生态。

晚点:技术提升对产品效果有多大影响?星野上线 MiniMax 自研 MoE 模型后效果如何?

闫俊杰:消息量当日增长 40%;平均响应从 4 秒缩短至 1 秒——这不仅是 MoE 功效,也得益于推理系统整体优化。

晚点:技术提升速度与用户规模之间是因果关系吗?

闫俊杰:这非常微妙。若你是行业第一(如 OpenAI),大致成立;若非第一,则未必。

过去一年,许多中国大模型公司用户有限,技术仍在提升——因可学习第一名。但长期看,若模型能力逼近顶尖水平,用户权重与价值将愈发凸显。

这如同算力:更多算力是否必然产出更好模型?不一定,提升数据质量 ROI 或更高;但长期看,算力充裕确为必要前提。

晚点:AI 原生超级产品与移动互联网时代的超级产品,根本差异在哪?

闫俊杰:移动互联网极度关注“用户痛点”,但去年 DAU 百万以上的六七个 AI 原生产品,均非针对痛点设计,而是释放突破性技术后自然演变为产品。反倒是后期针对性添加的功能(如 ChatGPT Plugins、GPT-S)收效甚微。一旦技术进步放缓,产品驱动或将回归主流。

当前仍是技术驱动(technology-driven),而非产品驱动(product-driven)。

晚点:海螺 AI 频繁推送消息吸引用户点击,说明做了较多产品优化?

闫俊杰:最近我们也反思:功能点过全,或反成负向信号——说明核心功能尚未倾注最多精力。

晚点:2025 年团队目标是什么?

闫俊杰:技术上达到 GPT-4 水平,产品上用户规模翻十倍,单产品突破千万 DAU。

晚点:10 倍增长,幅度很大。

闫俊杰:并不算大,移动互联网产品本就是亿级 DAU 起步。

融资打不死别人

晚点:以当前中国市场资源总量,能支撑几家 AGI 创业公司?

闫俊杰:不止一家,总资源足够。

晚点:如今许多投资人已不再关注大模型,认为创业公司难有机会。

闫俊杰:我经历过上一轮靠融资堆砌的 AI 发展阶段。若公司需靠持续融资续命,其核心优化方向易异化为“如何说服投资人给更多钱”。

我的路径是:通过服务用户,逐步探索合理商业化。尽管研发投入巨大,短期难见效,但这条路必须探索。

晚点:当市场资源有限时,第一名是否应全力融资,挤压对手生存空间?上一轮移动互联网竞争常如此操作。

闫俊杰:疯狂融资以扼杀对手——我认为这是错误的。靠融资无法真正击倒他人。

当前中国头部创业公司,无一家资源比对手高出一个量级。真正的拐点只可能来自技术、产品或商业化效率的领先。

晚点:算力稀缺,如何解决?

闫俊杰:中国算力供给已较此前充裕。回到 Scaling Laws 本质:当算力不足时,必须寻找方法优化几倍 Scaling Laws,以达相似效果。

晚点:如何评判 MiniMax 与 OpenAI 的差距?

闫俊杰:我们内部设有“开箱可用率”指标——即客户或开发者接入 API 后,能否快速完成复杂任务。

从开放平台看,GPT-4 几乎可跑通全部需求。例如去年一项需求:用户提交小说,模型生成分角色、带语气的有声剧。GPT-4 经精细调用可实现,而我们当时模型尚不能,但现已达标。

晚点:与国内同行相比呢?

闫俊杰:未全面测评。因测与不测,都不改变我们前进的方向。

晚点:2024 年,中国大模型行业将发生什么?

闫俊杰:中国公司将推出类 GPT-4 模型,且不止一家。但更关键的问题是:之后该如何走?

把公司当函数

晚点:你说写在论文里的技术都不是壁垒,那么真正壁垒是什么?

闫俊杰:拼多多前身是拼好货,美团始于团购,字节起步于今日头条——都不是最终大成的产品。

大小成之别在于:大成公司均完成了组织创新,从而可持续产出更强成果。

晚点:壁垒难道不是顶尖论文作者吗?

闫俊杰:一个严峻现实是:对大模型领域贡献排前 20 甚至前 50 的人,可能无一人供职于中国公司。

依赖天才路径已不可行。当前唯一路径是:聚集基本素质优秀的团队,打造成长型组织,持续突破挑战,加速集体进化。希望三年后,领域前 20、前 50 的贡献者能出自中国公司。

晚点:如何打造该组织?

闫俊杰:本质上是优化一个无解析解的函数,寻找梯度下降最快的方向。

晚点:举例说明?

闫俊杰:例如提升技术进步速度,我们学习 OpenAI——因其路径最确定。非指模仿其参数,而是学习更科学的实验方法、更快试错迭代机制、更清晰简洁的问题定义能力。

晚点:追求梯度下降可能陷入局部最优,如何避免脱靶长期目标?

闫俊杰:我们自身进化路径是:从模糊看数据,到深入看数据,再到意识到光看数据不够,需叠加高质量洞见(insight)。

许多洞见源于长期思考。例如,仅盯短期产品数据,便不会意识到需研发新一代多模态模型。

晚点:优化函数的方法能解决人性问题吗?如技术与产品团队间的拉扯。

闫俊杰:我们通过更细颗粒度的数据埋点,尽可能用数据归因真实问题,而非依赖主观判断。

我们信任数据科学——这并非原创,中国互联网公司早已将其应用至极致。

晚点:你曾称希望组织更轻,但团队已达 300 人,其中大半为去年入职。如何平衡?

闫俊杰:组织结构仅三层:我、我的 -1、我 -1 的 -1。

目前只有三个部门:技术部(我负责)、产品部(含 C 端与开放平台)、运营与增长部(涵盖产品增长、公司增长及 HR)。

晚点:智谱约 1000 人,月之暗面约 200 人,你们 300 人,人数差异背后逻辑是什么?

闫俊杰:取决于信念。我们不需向外界证明什么,只需做自己认定之事。非必要岗位,我们不设。需要做什么事,就招匹配之人。

我们需做一定规模的前端产品,因此除算法与应用数据人才外,还需推理系统、线上服务、开发及产品运营等复合型人才。

晚点:现阶段最缺哪类人才?

闫俊杰:更多算法人才。我们已掌握实验方法,资源也可支撑大量实验,但实验执行者不足。

视频生成模型正趋实用化。按过往规律,首个落地产品更易胜出,多家公司正全力争夺这一窗口期。

晚点:如何识别合适人才?

闫俊杰:关键是其加入能否提升团队整体产出。有些极强个体未必融入,而看似平凡者反而能带动集体升级。

面试中,我重点关注其在重大项目中与 mentor、上下游协作的真实表现。

晚点:你在商汤曾管理大型技术团队,有哪些心得?

闫俊杰:若初心是“做管理”,可能已偏航。

核心是驱动团队做出超出用户与自我期待的成果。AI 虽处风口,本质仍是科学——需高水准人才 + 类似数据科学的方法论,快速识别有效路径。二者融合,即是正道。

晚点:如何吸引更强人才加入?

闫俊杰:归根结底是组织强,能持续做成好事。这是我们唯一能选的路径。

晚点:希望形成怎样的公司文化?

闫俊杰:第一,不走捷径——多次尝试皆遭重挫;第二,User-in-the-Loop;第三,技术驱动。

三者均源于切身教训与经验沉淀。

自己好像慢慢变成了一组基函数

晚点:商汤是你首份工作,它给你留下什么烙印?

闫俊杰:主要是对“集中力量干大事”技术路线的自信。

另一刻骨铭心的反馈是:组织内若觉某事不对,却避而不言,对所有人都是巨大伤害——因此我希望 MiniMax 组织足够简单透明。

晚点:2020 年 AGI 尚属非共识,你如何提前洞察这一方向?

闫俊杰:源自偶然思考。2020 年我在商汤带队时,突然发现每天 AI 论文已看不完——这对我触动极大。

作为技术从业者,当时进展已远超个人理解范围。人类进化缓慢,唯一出路是借助更强 AI 加速技术发展,或提升人类研究效率。

另有一观察:2020 年前的 AI 应用(如商汤业务)对社会直接价值有限,与长期承诺存在矛盾。若非投入不足,唯一解释便是技术路线或问题选择有误。

晚点:上一代 AI 从业者大多意识到了矛盾,却苦无出路。

闫俊杰:2021 年初 OpenAI 发布 CLIP 对我至关重要。它揭示自然语言与计算机视觉本质一致,同属统一机器学习系统——我由此看到通用人工智能的技术可能性。

若真信 AI,就该行动。

晚点:你如何学习?

闫俊杰:结识比自己更强的人——这是创业给予的少数短期满足。我有幸遇到多位顶级人物,他们赋予我更高视角。站得更高,问题反而更易解。其次,我会大量阅读论文。

晚点:你说应避免产品“全面优秀”,那你本人是全面优秀吗?你在商汤晋升极快,从研发做到集团副总裁,似能胜任多种职能。

闫俊杰:我不认为自己全面优秀。成长于河南小县城,无人教导,只能靠自学领悟——这是被迫形成的底层认知能力。它至今仍有用:面对陌生事务,我能快速抓住底层逻辑。

晚点:短板是什么?

闫俊杰:我不是顶尖研究者,或仅属二流。

【声明】内容源于网络
0
0
晚点LatePost
各类跨境出海行业相关资讯
内容 2285
粉丝 0
晚点LatePost 各类跨境出海行业相关资讯
总阅读11.7k
粉丝0
内容2.3k