CV双任务破局：Cradle2Cane人脸识别×跨年龄人脸老化识别新框架，一举击穿Age-ID权衡

极市平台

2025-11-21

↑ 点击蓝字关注极市平台

作者丨Tao Liu, Dafeng Zhang等

来源丨AI生成未来

编辑丨极市平台

极市导读

Cradle2Cane 两阶段人脸老化：先用 AdaNI 动态噪声“精准变老”，再用 SVR-ArcFace + Rotate-CLIP 找回身份，0.56 s 生成全年龄段，CelebA-HQ HCS 指标刷新 SOTA，支持同步属性编辑，代码已开源。>>加入极市CV技术交流群，走在计算机视觉的最前沿

论文链接： https://arxiv.org/abs/2506.20977

代码链接： https://github.com/byliutao/Cradle2Cane

亮点直击

直击痛点，提出“Age-ID Trade-off”：深入分析了人脸老化任务中“年龄准确性”与“身份保持”之间的内在矛盾。现有方法往往顾此失彼，而本文提出的框架旨在打破这一零和博弈。
首创两阶段（Two-Pass）解耦架构：提出 Cradle2Cane 框架。第一阶段利用自适应噪声注入（AdaNI）专注于“变老”，第二阶段利用身份感知Embedding（IDEmb）专注于“找回身份”。这种分而治之的策略实现了1+1>2的效果。
巧妙的特征解耦设计：引入了 SVR-ArcFace 和 Rotate-CLIP 模块。通过奇异值重加权（SVR）剔除ArcFace特征中的年龄干扰，利用球面线性插值（Slerp）在CLIP空间平滑迁移年龄属性，实现了身份与年龄特征的精准剥离与控制。
基于SDXL-Turbo的高效推理：利用少步（Few-step）扩散模型的优势，仅需0.56秒即可生成高质量图像，在保持极高保真度的同时，完美支持从“幼年到老年（Cradle to Cane）”的全年龄段平滑变换。

01 解决的问题

长期以来，人脸老化（Face Aging）任务都面临一个核心挑战：如何在大幅度改变年龄特征的同时，完美保留原本的身份信息？作者将这一挑战定义为 “Age-ID Trade-off”（年龄-身份权衡）。

传统GAN方法（如Lifespan, CUSP）：在身份保持上表现尚可，但在处理大跨度年龄变化（如从幼年到老年）时，往往生成模糊，且难以模拟真实的皮肤纹理和骨骼变化。
现有Diffusion方法（如FADING）：虽然生成画质高，但往往伴随着严重的身份漂移（Identity Drift），生成的“老年版”看起来像是另一个人。如图1所示，现有方法的性能曲线往往呈现“trade-off”的趋势——年龄迁移准确性越高，身份相似度就越低。反之，身份相似度越高，年龄迁移准确性就越低。如何打破这一现状，实现全生命周期的高保真老化，是本文解决的核心问题。

02 提出的方案

本文提出了一种基于 SDXL-Turbo 的两阶段（Two-Pass）扩散框架 —— Cradle2Cane。该方案的核心思想是“解耦”：将年龄变换和身份保持拆解为两个独立的子任务进行优化。

第一阶段（1st Pass）：自适应噪声注入 (AdaNI)

这一阶段的目标是“精准变老”。作者发现，年龄跨度越大，所需的图像结构变化越剧烈。因此，AdaNI 机制会根据目标年龄与源年龄的差距，动态调整注入潜空间（Latent Space）的噪声水平。

小跨度：注入低噪声，微调纹理。
大跨度：注入高噪声，允许模型对脸型、皱纹、发际线进行大刀阔斧的修改。虽然这一步会牺牲部分身份信息，但它为生成逼真的老化特征奠定了基础。

第二阶段（2nd Pass）：身份感知Embedding (IDEmb)

这一阶段的目标是“找回身份”。在第一阶段生成的图像基础上，模型通过引入 IDEmb 进行去噪引导。IDEmb 由两个创新模块组成：

SVR-ArcFace：传统ArcFace特征中混杂了年龄信息。作者利用奇异值重加权（Singular Value Reweighting, SVR）技术，抑制特征中随年龄变化的成分，提取出更纯粹的“身份核心” 。
Rotate-CLIP：既然CLIP文本特征具有方向性，作者提出在CLIP空间中进行“旋转”（Rotate）。通过球面插值（Slerp）而非简单的向量相减，平滑地将特征导向目标年龄，同时保留语义一致性。

03 达到的效果

3.1 平衡的性能

在 CelebA-HQ 和 CelebA-HQ (in-the-wild) 数据集上的实验表明，Cradle2Cane 在 Face++ 和 Qwen-VL 多模态大模型两种评估协议下，均取得了 SOTA 的成绩。特别是在 HCS (Harmonic Consistency Score) 这一综合指标上，本文方法大幅领先于 SAM, CUSP, FADING 等基线模型。

3.2 自然的视觉效果

无论是皱纹的加深、皮肤的松弛，还是发色的改变（如变白），Cradle2Cane 都能生成极其自然的细节。更重要的是，即使是处理 In-the-wild 的图片，在面对遮挡、侧脸、复杂光照时，该模型仍旧能够展现不错的效果。

3.3 灵活的应用扩展

得益于两阶段编辑的灵活性，除了单独改变年龄，该方法还能同步进行人脸属性编辑。比如该方法可以无缝地应用各种属性，例如，戴眼镜、绿色的头发、戴帽子，同时持续地进行年龄增长，显著提高了生成图像的多样性和可控性。

3.4 更多结果

04 总结

Cradle2Cane 的成功证明了在生成式AI时代，针对特定任务的结构化解耦设计依然具有巨大的潜力。通过放弃“一步到位”的传统思路，采用由粗到精、先年龄迁移再ID增强的策略，南开大学与三星的研究团队为基于Diffusion的人脸年龄编辑任务提供了一个新的框架，来解决长久存在的“Age-ID trade-off“问题。这不仅是一次算法的创新，更让我们看到了AI在数字娱乐、影视特效甚至寻找走失人口等社会公益领域的广阔应用前景。