大数跨境

大模型来了,虹膜识别的底层逻辑要变了

大模型来了,虹膜识别的底层逻辑要变了 虹识微刊
2026-03-19
1
导读:41个VLM零样本达97.55%,DINOv2超越传统PAD,手机虹膜TAR达96.57%。大模型正在重写生物识别的工具箱。

 大模型来了,虹膜识别的底层逻辑要变了

虹膜识别技术前沿

 虹识微刊 · 第23期 · 2026年3月19日


 这期微刊,我们聊一件让虹膜识别工程师既兴奋又有点慌的事:大模型(Foundation Model)正在闯入生物识别领域

 不是那种"我们用了AI"的营销话术——而是在顶级学术会议上,有人拿通用视觉语言大模型跑虹膜识别,不做任何微调,直接拿到了97.55%的识别率。这意味着什么?工程师该怎么接招?我们今天好好拆一拆。

· · ·

 论文速读

论文一:基础模型做生物识别,零样本能到什么水平?

 

论文:Benchmarking Foundation Models for Zero-Shot Biometric Tasks

 

机构:美国密歇根州立大学(MSU)

 

发表:arXiv 2505.24214,2025年5月

 密歇根州立大学的研究团队一口气跑了 41个视觉语言大模型(VLM),评估它们在六项生物识别任务上的零样本表现。虹膜识别的结果让人眼前一亮:

 

   在 IITD-R-Full 数据集上,不做任何微调的情况下,TMR@1%FMR 达到 97.55%。  

 大模型为什么能做到这一点?核心在于特征表征的泛化能力。VLM 在训练时接触了数十亿张图像-文本对,学到的特征具有强大的语义结构——哪怕没有专门见过虹膜图像,它也能捕捉到纹理、结构、局部细节等区分性特征。

 更有意思的是:在这些嵌入向量上加一个简单的分类器头,就可以同时检测虹膜呈现攻击(PAD)、提取软生物特征、检测深度伪造——一个模型撑起多个下游任务。

 

🔹 对工程师的启示

 

① 特征提取可以外包给大模型——直接用 CLIP、DINOv2、SigLIP 提取特征,训练轻量任务头

 

② 数据瓶颈被部分解除——小样本甚至零样本场景下就能跑通

 

③ 注意场景边界——97.55% 是标准数据集结果,实际部署还需考虑噪声、光照、模糊等问题

▲ Foundation Model在多项生物识别任务上的零样本性能对比

论文二:DINOv2 + VisualOpenCLIP 做虹膜活体检测

 

论文:Towards Iris Presentation Attack Detection with Foundation Models

 

机构:德国达姆施塔特大学(h_da)生物识别与网络安全研究组

 

发表:arXiv 2501.06312,2025年1月

 这篇论文专注于 近红外虹膜呈现攻击检测(NIR Iris PAD)——行业公认的难题:数据集小、真实样本和攻击样本不同源、跨数据集泛化差。

 研究者的方案:用 DINOv2(Meta自监督视觉基础模型)和 VisualOpenCLIP 提取特征,在上面接一个小型神经网络作为分类头进行微调——结果超过了此前基于深度学习的 state-of-the-art 方法

 

   DINOv2 用 1.4亿张图像进行自监督预训练,生成的特征具有极强的泛化性。大模型的通用特征表征,在小数据集的下游任务上,比从头训练的专用模型还好用。  

 注意:当真实样本和攻击样本都充足时,从头训练的专用模型仍然更优。大模型的优势主要体现在数据受限场景

论文三:手机可见光虹膜识别,能做到 96.57% 了

 

论文:Smartphone-based Iris Recognition through High-Quality Visible Spectrum Iris Capture

 

机构:Clarkson 大学(纽约)

 

发表:arXiv 2412.13063,2024年12月

 用普通智能手机的摄像头,能做虹膜识别吗?答案是:可以,而且效果不差。

 Clarkson 大学团队的完整 Android 方案:YOLOv3-tiny 做实时检测 + G-ATTU-Net 做分割 + 自动对焦变焦优化 + ISO/IEC 29794-6 质量评估。

 
   

🔹 测试结果(47名受试者)

   

可见光(VIS)图像 TAR:96.57%

   

近红外(NIR)图像 TAR:97.95%

   

跨光谱匹配(手机VIS与NIR底库)也能跑通

 
 

   虹膜识别的采集门槛正在降低。
不再必须用专用NIR摄像头,主流智能手机也可以作为采集终端。
   这对虹识技术来说,既是机会,也是挑战。  

▲ 智能手机可见光虹膜识别方案架构示意

· · ·

 行业雷达

 一、基础模型 + 生物识别,正在成为一条新的技术路线

 三篇论文都在传递同一个信号:专用小模型的时代在松动,大模型特征提取 + 轻量任务头,正在成为主流范式。这不是说传统虹膜识别算法(如 Phaselirs™)要被淘汰——在嵌入式端、FPGA/ASIC 场景下,轻量专用算法依然是王道。但在服务器端、云端,大模型路线值得认真评估。

 二、数据闭环越来越重要

 零样本/少样本能力很好,但要在特定场景做到产品级精度,高质量领域数据仍然是核心壁垒。谁有数据,谁就有护城河。

 三、手机虹膜正在走向主流

 可见光智能手机虹膜识别,TAR 已经跨过 96% 的门槛。消费电子巨头一旦跟进,这个场景可能迎来爆发式增长。

· · ·

 大模型进入虹膜识别领域,不是来抢饭碗的,是来改变工具的。

 工程师应该问的不是"大模型会不会取代我们",而是"大模型能让我们的系统更好用在哪里"。特征提取、攻击检测、跨光谱匹配——这些过去需要反复调参的模块,现在可能只需要换一个更好的特征提取器,加一个轻量头,就能大幅提升性能。

 把精力省出来,专注在大模型搞不定的地方:极端光照、长距离采集、芯片端实时性。那才是真正的硬核阵地。


 

虹识微刊

 

虹膜识别技术前沿 · 每周一、周四更新

 

工程师写给工程师 · 武汉虹识技术有限公司 · www.homsh.cn

 论文来源:arXiv | 数据整理:龙山技术研究所

【声明】内容源于网络
0
0
虹识微刊
虹识技术是国内顶尖的虹膜生物识别企业,公司致力于虹膜生物识别核心技术及相关产品的研发、应用服务及产业化。产品可广泛应用于信息安全、国防安全、公共安全、金融安全、出入境安全、智慧城市、智能家居、智能移动终端等领域。
内容 0
粉丝 0
虹识微刊 虹识技术是国内顶尖的虹膜生物识别企业,公司致力于虹膜生物识别核心技术及相关产品的研发、应用服务及产业化。产品可广泛应用于信息安全、国防安全、公共安全、金融安全、出入境安全、智慧城市、智能家居、智能移动终端等领域。
总阅读0
粉丝0
内容0