大数跨境
0
0

CV双任务破局:Cradle2Cane人脸识别×跨年龄人脸老化识别新框架,一举击穿Age-ID权衡

CV双任务破局:Cradle2Cane人脸识别×跨年龄人脸老化识别新框架,一举击穿Age-ID权衡 极市平台
2025-11-21
1
↑ 点击蓝字 关注极市平台
作者丨Tao Liu, Dafeng Zhang等 
来源丨AI生成未来
编辑丨极市平台

极市导读

 

Cradle2Cane 两阶段人脸老化:先用 AdaNI 动态噪声“精准变老”,再用 SVR-ArcFace + Rotate-CLIP 找回身份,0.56 s 生成全年龄段,CelebA-HQ HCS 指标刷新 SOTA,支持同步属性编辑,代码已开源。>>加入极市CV技术交流群,走在计算机视觉的最前沿

论文链接: https://arxiv.org/abs/2506.20977

代码链接: https://github.com/byliutao/Cradle2Cane

亮点直击

  • 直击痛点,提出“Age-ID Trade-off”: 深入分析了人脸老化任务中“年龄准确性”与“身份保持”之间的内在矛盾。现有方法往往顾此失彼,而本文提出的框架旨在打破这一零和博弈 。
  • 首创两阶段(Two-Pass)解耦架构: 提出 Cradle2Cane 框架。第一阶段利用自适应噪声注入(AdaNI)专注于“变老”,第二阶段利用身份感知Embedding(IDEmb)专注于“找回身份”。这种分而治之的策略实现了1+1>2的效果 。
  • 巧妙的特征解耦设计: 引入了 SVR-ArcFace 和 Rotate-CLIP 模块。通过奇异值重加权(SVR)剔除ArcFace特征中的年龄干扰,利用球面线性插值(Slerp)在CLIP空间平滑迁移年龄属性,实现了身份与年龄特征的精准剥离与控制 。
  • 基于SDXL-Turbo的高效推理:利用少步(Few-step)扩散模型的优势,仅需0.56秒即可生成高质量图像,在保持极高保真度的同时,完美支持从“幼年到老年(Cradle to Cane)”的全年龄段平滑变换 。

01 解决的问题

长期以来,人脸老化(Face Aging)任务都面临一个核心挑战:如何在大幅度改变年龄特征的同时,完美保留原本的身份信息? 作者将这一挑战定义为 “Age-ID Trade-off”(年龄-身份权衡)。

  • 传统GAN方法(如Lifespan, CUSP):在身份保持上表现尚可,但在处理大跨度年龄变化(如从幼年到老年)时,往往生成模糊,且难以模拟真实的皮肤纹理和骨骼变化 。
  • 现有Diffusion方法(如FADING):虽然生成画质高,但往往伴随着严重的身份漂移(Identity Drift),生成的“老年版”看起来像是另一个人 。 如图1所示,现有方法的性能曲线往往呈现“trade-off”的趋势——年龄迁移准确性越高,身份相似度就越低。反之,身份相似度越高,年龄迁移准确性就越低。如何打破这一现状,实现全生命周期的高保真老化,是本文解决的核心问题。

02 提出的方案

本文提出了一种基于 SDXL-Turbo 的两阶段(Two-Pass)扩散框架 —— Cradle2Cane。该方案的核心思想是“解耦”:将年龄变换和身份保持拆解为两个独立的子任务进行优化。

第一阶段(1st Pass):自适应噪声注入 (AdaNI)

这一阶段的目标是“精准变老”。 作者发现,年龄跨度越大,所需的图像结构变化越剧烈。因此,AdaNI 机制会根据目标年龄与源年龄的差距,动态调整注入潜空间(Latent Space)的噪声水平 。

  • 小跨度: 注入低噪声,微调纹理。
  • 大跨度: 注入高噪声,允许模型对脸型、皱纹、发际线进行大刀阔斧的修改。 虽然这一步会牺牲部分身份信息,但它为生成逼真的老化特征奠定了基础。

第二阶段(2nd Pass):身份感知Embedding (IDEmb)

这一阶段的目标是“找回身份”。 在第一阶段生成的图像基础上,模型通过引入 IDEmb 进行去噪引导。IDEmb 由两个创新模块组成:

  • SVR-ArcFace: 传统ArcFace特征中混杂了年龄信息。作者利用奇异值重加权(Singular Value Reweighting, SVR)技术,抑制特征中随年龄变化的成分,提取出更纯粹的“身份核心” 。
  • Rotate-CLIP: 既然CLIP文本特征具有方向性,作者提出在CLIP空间中进行“旋转”(Rotate)。通过球面插值(Slerp)而非简单的向量相减,平滑地将特征导向目标年龄,同时保留语义一致性 。

03 达到的效果

3.1 平衡的性能

在 CelebA-HQ 和 CelebA-HQ (in-the-wild) 数据集上的实验表明,Cradle2Cane 在 Face++ 和 Qwen-VL 多模态大模型两种评估协议下,均取得了 SOTA 的成绩。 特别是在 HCS (Harmonic Consistency Score) 这一综合指标上,本文方法大幅领先于 SAM, CUSP, FADING 等基线模型 。

3.2 自然的视觉效果

无论是皱纹的加深、皮肤的松弛,还是发色的改变(如变白),Cradle2Cane 都能生成极其自然的细节。 更重要的是,即使是处理 In-the-wild 的图片,在面对遮挡、侧脸、复杂光照时,该模型仍旧能够展现不错的效果。

3.3 灵活的应用扩展

得益于两阶段编辑的灵活性,除了单独改变年龄,该方法还能同步进行人脸属性编辑。比如该方法可以无缝地应用各种属性,例如,戴眼镜、绿色的头发、戴帽子,同时持续地进行年龄增长,显著提高了生成图像的多样性和可控性。

3.4 更多结果

04 总结

Cradle2Cane 的成功证明了在生成式AI时代,针对特定任务的结构化解耦设计依然具有巨大的潜力。通过放弃“一步到位”的传统思路,采用由粗到精、先年龄迁移再ID增强的策略,南开大学与三星的研究团队为基于Diffusion的人脸年龄编辑任务提供了一个新的框架,来解决长久存在的“Age-ID trade-off“问题。 这不仅是一次算法的创新,更让我们看到了AI在数字娱乐、影视特效甚至寻找走失人口等社会公益领域的广阔应用前景。

参考文献

[1] From Cradle to Cane: A Two-Pass Framework for High-Fidelity Lifespan Face Aging


公众号后台回复“数据集”获取100+深度学习各方向资源整理


极市干货

技术专栏:多模态大模型超详细解读专栏搞懂Tranformer系列大视觉模型 (LVM) 解读扩散模型系列极市直播
技术综述:小目标检测那点事大模型面试八股含答案万字长文!人体姿态估计(HPE)入门教程

点击阅读原文进入CV社区

收获更多技术干货

【声明】内容源于网络
0
0
极市平台
为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
内容 8155
粉丝 0
极市平台 为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
总阅读3.2k
粉丝0
内容8.2k