大模型来了,虹膜识别的底层逻辑要变了
虹膜识别技术前沿
虹识微刊 · 第23期 · 2026年3月19日
这期微刊,我们聊一件让虹膜识别工程师既兴奋又有点慌的事:大模型(Foundation Model)正在闯入生物识别领域。
不是那种"我们用了AI"的营销话术——而是在顶级学术会议上,有人拿通用视觉语言大模型跑虹膜识别,不做任何微调,直接拿到了97.55%的识别率。这意味着什么?工程师该怎么接招?我们今天好好拆一拆。
· · ·
论文速读
论文一:基础模型做生物识别,零样本能到什么水平?
论文:Benchmarking Foundation Models for Zero-Shot Biometric Tasks
机构:美国密歇根州立大学(MSU)
发表:arXiv 2505.24214,2025年5月
密歇根州立大学的研究团队一口气跑了 41个视觉语言大模型(VLM),评估它们在六项生物识别任务上的零样本表现。虹膜识别的结果让人眼前一亮:
在 IITD-R-Full 数据集上,不做任何微调的情况下,TMR@1%FMR 达到 97.55%。
大模型为什么能做到这一点?核心在于特征表征的泛化能力。VLM 在训练时接触了数十亿张图像-文本对,学到的特征具有强大的语义结构——哪怕没有专门见过虹膜图像,它也能捕捉到纹理、结构、局部细节等区分性特征。
更有意思的是:在这些嵌入向量上加一个简单的分类器头,就可以同时检测虹膜呈现攻击(PAD)、提取软生物特征、检测深度伪造——一个模型撑起多个下游任务。
🔹 对工程师的启示
① 特征提取可以外包给大模型——直接用 CLIP、DINOv2、SigLIP 提取特征,训练轻量任务头
② 数据瓶颈被部分解除——小样本甚至零样本场景下就能跑通
③ 注意场景边界——97.55% 是标准数据集结果,实际部署还需考虑噪声、光照、模糊等问题
▲ Foundation Model在多项生物识别任务上的零样本性能对比
论文二:DINOv2 + VisualOpenCLIP 做虹膜活体检测
论文:Towards Iris Presentation Attack Detection with Foundation Models
机构:德国达姆施塔特大学(h_da)生物识别与网络安全研究组
发表:arXiv 2501.06312,2025年1月
这篇论文专注于 近红外虹膜呈现攻击检测(NIR Iris PAD)——行业公认的难题:数据集小、真实样本和攻击样本不同源、跨数据集泛化差。
研究者的方案:用 DINOv2(Meta自监督视觉基础模型)和 VisualOpenCLIP 提取特征,在上面接一个小型神经网络作为分类头进行微调——结果超过了此前基于深度学习的 state-of-the-art 方法。
DINOv2 用 1.4亿张图像进行自监督预训练,生成的特征具有极强的泛化性。大模型的通用特征表征,在小数据集的下游任务上,比从头训练的专用模型还好用。
注意:当真实样本和攻击样本都充足时,从头训练的专用模型仍然更优。大模型的优势主要体现在数据受限场景。
论文三:手机可见光虹膜识别,能做到 96.57% 了
论文:Smartphone-based Iris Recognition through High-Quality Visible Spectrum Iris Capture
机构:Clarkson 大学(纽约)
发表:arXiv 2412.13063,2024年12月
用普通智能手机的摄像头,能做虹膜识别吗?答案是:可以,而且效果不差。
Clarkson 大学团队的完整 Android 方案:YOLOv3-tiny 做实时检测 + G-ATTU-Net 做分割 + 自动对焦变焦优化 + ISO/IEC 29794-6 质量评估。
🔹 测试结果(47名受试者)
可见光(VIS)图像 TAR:96.57%
近红外(NIR)图像 TAR:97.95%
跨光谱匹配(手机VIS与NIR底库)也能跑通
虹膜识别的采集门槛正在降低。
不再必须用专用NIR摄像头,主流智能手机也可以作为采集终端。
这对虹识技术来说,既是机会,也是挑战。
▲ 智能手机可见光虹膜识别方案架构示意
· · ·
行业雷达
一、基础模型 + 生物识别,正在成为一条新的技术路线
三篇论文都在传递同一个信号:专用小模型的时代在松动,大模型特征提取 + 轻量任务头,正在成为主流范式。这不是说传统虹膜识别算法(如 Phaselirs™)要被淘汰——在嵌入式端、FPGA/ASIC 场景下,轻量专用算法依然是王道。但在服务器端、云端,大模型路线值得认真评估。
二、数据闭环越来越重要
零样本/少样本能力很好,但要在特定场景做到产品级精度,高质量领域数据仍然是核心壁垒。谁有数据,谁就有护城河。
三、手机虹膜正在走向主流
可见光智能手机虹膜识别,TAR 已经跨过 96% 的门槛。消费电子巨头一旦跟进,这个场景可能迎来爆发式增长。
· · ·
大模型进入虹膜识别领域,不是来抢饭碗的,是来改变工具箱的。
工程师应该问的不是"大模型会不会取代我们",而是"大模型能让我们的系统更好用在哪里"。特征提取、攻击检测、跨光谱匹配——这些过去需要反复调参的模块,现在可能只需要换一个更好的特征提取器,加一个轻量头,就能大幅提升性能。
把精力省出来,专注在大模型搞不定的地方:极端光照、长距离采集、芯片端实时性。那才是真正的硬核阵地。
论文来源:arXiv | 数据整理:龙山技术研究所

