大数跨境
0
0

快手这次的突破,挺震撼的

快手这次的突破,挺震撼的 AI产品阿颖
2025-09-20
36

快手的技术实力不容小觑。

近日,快手发布了行业首个实现工业级部署的电商搜索端到端生成式框架——OneSearch。这一技术突破标志着电商搜索正式迈入大模型驱动的新阶段。

令人意外的是,引领这一变革的并非阿里、京东或拼多多等传统电商巨头,而是以短视频起家的快手。此前,快手已推出基于大模型的推荐系统,如今又将AI能力延伸至搜索领域,展现出其在技术路径上的前瞻布局与激进探索。

更关键的是,OneSearch并非实验室原型,而是已在生产环境中大规模部署,真正服务于亿级用户流量。这意味着,延续十余年的传统电商搜索架构,终于迎来颠覆性重构。

搜索技术的演进

回顾电商搜索发展史,其技术迭代大致经历了三个阶段:关键词匹配、机器学习排序与深度学习语义理解。

早期电商搜索本质是“翻字典”式匹配——用户输入关键词,系统从商品标题中查找对应词汇并返回结果。这种模式完全忽视用户意图和场景差异,导致结果相关性差、转化率低。

2010年前后,机器学习开始应用于搜索排序。系统通过CTR、CVR模型预估点击与转化概率,并结合LTR(Learning to Rank)进行排序优化。此时搜索具备初步个性化能力,例如根据用户历史行为偏好推荐高性价比或潮流款式。

然而,该阶段依赖大量人工特征工程,如价格、销量、品牌等需手动提取并输入模型,如同在调音台上逐一调节旋钮。同时,系统采用多阶段流水线架构(召回→粗排→精排),各环节独立运行,信息割裂,难以协同优化。

随着移动互联网兴起,用户行为数据爆发式增长,传统方法逐渐乏力。GPU算力提升与深度学习框架成熟推动搜索进入第三代——深度学习时代。DNN模型可自动学习用户意图与商品语义,通过向量表示实现语义层面的匹配,支持多模态输入(文本、图像、语音)与千人千面推荐。

尽管如此,其底层仍沿用多阶段流水线结构,存在算力浪费、冷启动难、长尾覆盖不足等问题。各类优化本质上仍是“打补丁”,未能改变架构局限。

近年来,大模型技术为搜索带来新思路:能否让一个统一模型直接理解用户需求与商品内容,端到端生成最终结果?这正是OneSearch的核心理念。

快手 OneSearch 的设计

OneSearch摒弃传统多阶段流水线,采用端到端大模型架构,将用户理解、商品建模、结果生成一体化完成,实现从“接力跑”到“一气呵成”的转变。

其技术创新主要体现在三个方面:

1. 商品语义深层建模:层次量化编码(KHQE)

传统搜索依赖商品标题中的关键词,但商家常堆砌热词以提升曝光,造成语义混乱。例如一条裙子可能包含“通勤、约会、显瘦、法式、初恋风”等多个标签,模型难以识别真实属性。

OneSearch提出KHQE(Knowledge-aware Hierarchical Quantization Encoding)方法,为每件商品构建五层语义档案:

  • 前三层按语义层级归类(如服饰→女装→连衣裙);
  • 后两层刻画细节差异(如颜色、材质、版型)。

最终生成紧凑语义向量,使模型能精准区分同类商品的细微差别,有效降低标题堆词带来的噪声干扰,提升推荐准确性。

2. 用户画像全程融合:短期行为+长期偏好联合建模

传统系统通常在精排阶段才引入个性化特征,且多为离散统计指标(如近7天点击类目)。而OneSearch从推理起点即融入用户行为序列。

系统捕捉用户近期搜索、浏览、加购等动态行为,并赋予更高权重,实时感知兴趣变化。同时,为避免被短期热点误导(如节假日集中查看行李箱),还引入长期稳定偏好建模。

不同于直接输入冗长历史记录,OneSearch先将长期行为压缩为若干紧凑向量,再与短期行为共同输入模型,兼顾语义完整性与推理效率。

由此形成的用户画像不再是零散标签集合,而是具有语义连贯性的动态表达,显著增强搜索结果的相关性与个性化程度。

3. 排序机制革新:偏好感知奖励系统(PARS)

传统排序中,相关性与个性化往往分离处理——先保证语义匹配,再通过特征调整偏好。OneSearch则通过PARS(Preference-Aware Reward System)实现二者深度融合。

模型训练分为两个阶段:

  1. 监督微调:依次学习query-商品语义匹配、共现规律及个性化偏好;
  2. 强化学习:利用真实用户行为(点击、加购、下单、停留时长)作为分层奖励信号,持续优化排序策略。

该机制使模型在生成结果时同步考虑“是否相关”与“是否喜欢”,实现真正意义上的偏好驱动排序。

新搜索框架的效果

OneSearch不仅提升了智能化水平,也在系统效率上实现重大突破。

传统多阶段架构需重复计算特征与embedding,大量算力消耗于中间传递过程,模型推理资源利用率极低。OneSearch通过端到端整合,消除冗余环节,仅保留单一主干模型完成全部推理任务。

据快手团队披露数据:

  • 模型算力利用率(MFU)从3.26%提升至27.32%;
  • 推理成本(OPEX)降至原有四分之一;
  • 线上A/B测试显示,单品CTR提升1.67%,页面CTR提升3.14%,CVR提升1.78%,买家数增长2.4%,订单量上涨3.2%。

尤其在中长尾查询与冷启动商品推荐场景下,性能提升更为显著。即使缺乏历史交互数据的新品,也能被准确匹配至潜在目标用户。

这一成果并非依赖参数规模扩张或硬件堆砌,而是源于对搜索范式的根本重构——用端到端生成替代多阶段流水线。

写在最后

快手OneSearch的落地,标志着电商搜索进入全新发展阶段。

长期以来,行业普遍在既有架构上做局部优化。而OneSearch首次验证了大模型驱动的生成式搜索在工业级场景的可行性,为下一代搜索系统提供了清晰蓝图。

这不是一次简单的技术升级,而是一次架构级跃迁。它预示着,未来的搜索将不再局限于“找到相关商品”,而是“理解需求并生成最优解”。

【声明】内容源于网络
0
0
AI产品阿颖
1234
内容 2089
粉丝 0
AI产品阿颖 1234
总阅读7.7k
粉丝0
内容2.1k