极市导读
Cradle2Cane 两阶段人脸老化:先用 AdaNI 动态噪声“精准变老”,再用 SVR-ArcFace + Rotate-CLIP 找回身份,0.56 s 生成全年龄段,CelebA-HQ HCS 指标刷新 SOTA,支持同步属性编辑,代码已开源。>>加入极市CV技术交流群,走在计算机视觉的最前沿
论文链接: https://arxiv.org/abs/2506.20977
代码链接: https://github.com/byliutao/Cradle2Cane
亮点直击
-
直击痛点,提出“Age-ID Trade-off”: 深入分析了人脸老化任务中“年龄准确性”与“身份保持”之间的内在矛盾。现有方法往往顾此失彼,而本文提出的框架旨在打破这一零和博弈 。 -
首创两阶段(Two-Pass)解耦架构: 提出 Cradle2Cane 框架。第一阶段利用自适应噪声注入(AdaNI)专注于“变老”,第二阶段利用身份感知Embedding(IDEmb)专注于“找回身份”。这种分而治之的策略实现了1+1>2的效果 。 -
巧妙的特征解耦设计: 引入了 SVR-ArcFace 和 Rotate-CLIP 模块。通过奇异值重加权(SVR)剔除ArcFace特征中的年龄干扰,利用球面线性插值(Slerp)在CLIP空间平滑迁移年龄属性,实现了身份与年龄特征的精准剥离与控制 。 -
基于SDXL-Turbo的高效推理:利用少步(Few-step)扩散模型的优势,仅需0.56秒即可生成高质量图像,在保持极高保真度的同时,完美支持从“幼年到老年(Cradle to Cane)”的全年龄段平滑变换 。
01 解决的问题
长期以来,人脸老化(Face Aging)任务都面临一个核心挑战:如何在大幅度改变年龄特征的同时,完美保留原本的身份信息? 作者将这一挑战定义为 “Age-ID Trade-off”(年龄-身份权衡)。
-
传统GAN方法(如Lifespan, CUSP):在身份保持上表现尚可,但在处理大跨度年龄变化(如从幼年到老年)时,往往生成模糊,且难以模拟真实的皮肤纹理和骨骼变化 。 -
现有Diffusion方法(如FADING):虽然生成画质高,但往往伴随着严重的身份漂移(Identity Drift),生成的“老年版”看起来像是另一个人 。 如图1所示,现有方法的性能曲线往往呈现“trade-off”的趋势——年龄迁移准确性越高,身份相似度就越低。反之,身份相似度越高,年龄迁移准确性就越低。如何打破这一现状,实现全生命周期的高保真老化,是本文解决的核心问题。
02 提出的方案
本文提出了一种基于 SDXL-Turbo 的两阶段(Two-Pass)扩散框架 —— Cradle2Cane。该方案的核心思想是“解耦”:将年龄变换和身份保持拆解为两个独立的子任务进行优化。
第一阶段(1st Pass):自适应噪声注入 (AdaNI)
这一阶段的目标是“精准变老”。 作者发现,年龄跨度越大,所需的图像结构变化越剧烈。因此,AdaNI 机制会根据目标年龄与源年龄的差距,动态调整注入潜空间(Latent Space)的噪声水平 。
-
小跨度: 注入低噪声,微调纹理。 -
大跨度: 注入高噪声,允许模型对脸型、皱纹、发际线进行大刀阔斧的修改。 虽然这一步会牺牲部分身份信息,但它为生成逼真的老化特征奠定了基础。
第二阶段(2nd Pass):身份感知Embedding (IDEmb)
这一阶段的目标是“找回身份”。 在第一阶段生成的图像基础上,模型通过引入 IDEmb 进行去噪引导。IDEmb 由两个创新模块组成:
-
SVR-ArcFace: 传统ArcFace特征中混杂了年龄信息。作者利用奇异值重加权(Singular Value Reweighting, SVR)技术,抑制特征中随年龄变化的成分,提取出更纯粹的“身份核心” 。 -
Rotate-CLIP: 既然CLIP文本特征具有方向性,作者提出在CLIP空间中进行“旋转”(Rotate)。通过球面插值(Slerp)而非简单的向量相减,平滑地将特征导向目标年龄,同时保留语义一致性 。
03 达到的效果
3.1 平衡的性能
在 CelebA-HQ 和 CelebA-HQ (in-the-wild) 数据集上的实验表明,Cradle2Cane 在 Face++ 和 Qwen-VL 多模态大模型两种评估协议下,均取得了 SOTA 的成绩。 特别是在 HCS (Harmonic Consistency Score) 这一综合指标上,本文方法大幅领先于 SAM, CUSP, FADING 等基线模型 。
3.2 自然的视觉效果
无论是皱纹的加深、皮肤的松弛,还是发色的改变(如变白),Cradle2Cane 都能生成极其自然的细节。 更重要的是,即使是处理 In-the-wild 的图片,在面对遮挡、侧脸、复杂光照时,该模型仍旧能够展现不错的效果。
3.3 灵活的应用扩展
得益于两阶段编辑的灵活性,除了单独改变年龄,该方法还能同步进行人脸属性编辑。比如该方法可以无缝地应用各种属性,例如,戴眼镜、绿色的头发、戴帽子,同时持续地进行年龄增长,显著提高了生成图像的多样性和可控性。
3.4 更多结果
04 总结
Cradle2Cane 的成功证明了在生成式AI时代,针对特定任务的结构化解耦设计依然具有巨大的潜力。通过放弃“一步到位”的传统思路,采用由粗到精、先年龄迁移再ID增强的策略,南开大学与三星的研究团队为基于Diffusion的人脸年龄编辑任务提供了一个新的框架,来解决长久存在的“Age-ID trade-off“问题。 这不仅是一次算法的创新,更让我们看到了AI在数字娱乐、影视特效甚至寻找走失人口等社会公益领域的广阔应用前景。
参考文献
[1] From Cradle to Cane: A Two-Pass Framework for High-Fidelity Lifespan Face Aging
公众号后台回复“数据集”获取100+深度学习各方向资源整理
极市干货

点击阅读原文进入CV社区
收获更多技术干货

