虹识微刊

2026-03-19

导读：41个VLM零样本达97.55%，DINOv2超越传统PAD，手机虹膜TAR达96.57%。大模型正在重写生物识别的工具箱。

大模型来了，虹膜识别的底层逻辑要变了

虹膜识别技术前沿

虹识微刊 · 第23期 · 2026年3月19日

这期微刊，我们聊一件让虹膜识别工程师既兴奋又有点慌的事：大模型（Foundation Model）正在闯入生物识别领域。

不是那种"我们用了AI"的营销话术——而是在顶级学术会议上，有人拿通用视觉语言大模型跑虹膜识别，不做任何微调，直接拿到了97.55%的识别率。这意味着什么？工程师该怎么接招？我们今天好好拆一拆。

· · ·

论文速读

论文一：基础模型做生物识别，零样本能到什么水平？

论文：Benchmarking Foundation Models for Zero-Shot Biometric Tasks

机构：美国密歇根州立大学（MSU）

发表：arXiv 2505.24214，2025年5月

密歇根州立大学的研究团队一口气跑了 41个视觉语言大模型（VLM），评估它们在六项生物识别任务上的零样本表现。虹膜识别的结果让人眼前一亮：

在 IITD-R-Full 数据集上，不做任何微调的情况下，TMR@1%FMR 达到 97.55%。

大模型为什么能做到这一点？核心在于特征表征的泛化能力。VLM 在训练时接触了数十亿张图像-文本对，学到的特征具有强大的语义结构——哪怕没有专门见过虹膜图像，它也能捕捉到纹理、结构、局部细节等区分性特征。

更有意思的是：在这些嵌入向量上加一个简单的分类器头，就可以同时检测虹膜呈现攻击（PAD）、提取软生物特征、检测深度伪造——一个模型撑起多个下游任务。

🔹 对工程师的启示

① 特征提取可以外包给大模型——直接用 CLIP、DINOv2、SigLIP 提取特征，训练轻量任务头

② 数据瓶颈被部分解除——小样本甚至零样本场景下就能跑通

③ 注意场景边界——97.55% 是标准数据集结果，实际部署还需考虑噪声、光照、模糊等问题

▲ Foundation Model在多项生物识别任务上的零样本性能对比

论文二：DINOv2 + VisualOpenCLIP 做虹膜活体检测

论文：Towards Iris Presentation Attack Detection with Foundation Models

机构：德国达姆施塔特大学（h_da）生物识别与网络安全研究组

发表：arXiv 2501.06312，2025年1月

这篇论文专注于 近红外虹膜呈现攻击检测（NIR Iris PAD）——行业公认的难题：数据集小、真实样本和攻击样本不同源、跨数据集泛化差。

研究者的方案：用 DINOv2（Meta自监督视觉基础模型）和 VisualOpenCLIP 提取特征，在上面接一个小型神经网络作为分类头进行微调——结果超过了此前基于深度学习的 state-of-the-art 方法。

DINOv2 用 1.4亿张图像进行自监督预训练，生成的特征具有极强的泛化性。大模型的通用特征表征，在小数据集的下游任务上，比从头训练的专用模型还好用。

注意：当真实样本和攻击样本都充足时，从头训练的专用模型仍然更优。大模型的优势主要体现在数据受限场景。

论文三：手机可见光虹膜识别，能做到 96.57% 了

论文：Smartphone-based Iris Recognition through High-Quality Visible Spectrum Iris Capture

机构：Clarkson 大学（纽约）

发表：arXiv 2412.13063，2024年12月

用普通智能手机的摄像头，能做虹膜识别吗？答案是：可以，而且效果不差。

Clarkson 大学团队的完整 Android 方案：YOLOv3-tiny 做实时检测 + G-ATTU-Net 做分割 + 自动对焦变焦优化 + ISO/IEC 29794-6 质量评估。

🔹 测试结果（47名受试者）

可见光（VIS）图像 TAR：96.57%

近红外（NIR）图像 TAR：97.95%

跨光谱匹配（手机VIS与NIR底库）也能跑通

虹膜识别的采集门槛正在降低。
不再必须用专用NIR摄像头，主流智能手机也可以作为采集终端。
这对虹识技术来说，既是机会，也是挑战。

▲ 智能手机可见光虹膜识别方案架构示意

· · ·

行业雷达

一、基础模型 + 生物识别，正在成为一条新的技术路线

三篇论文都在传递同一个信号：专用小模型的时代在松动，大模型特征提取 + 轻量任务头，正在成为主流范式。这不是说传统虹膜识别算法（如 Phaselirs™）要被淘汰——在嵌入式端、FPGA/ASIC 场景下，轻量专用算法依然是王道。但在服务器端、云端，大模型路线值得认真评估。

二、数据闭环越来越重要

零样本/少样本能力很好，但要在特定场景做到产品级精度，高质量领域数据仍然是核心壁垒。谁有数据，谁就有护城河。

三、手机虹膜正在走向主流

可见光智能手机虹膜识别，TAR 已经跨过 96% 的门槛。消费电子巨头一旦跟进，这个场景可能迎来爆发式增长。

· · ·

大模型进入虹膜识别领域，不是来抢饭碗的，是来改变工具箱的。

工程师应该问的不是"大模型会不会取代我们"，而是"大模型能让我们的系统更好用在哪里"。特征提取、攻击检测、跨光谱匹配——这些过去需要反复调参的模块，现在可能只需要换一个更好的特征提取器，加一个轻量头，就能大幅提升性能。

把精力省出来，专注在大模型搞不定的地方：极端光照、长距离采集、芯片端实时性。那才是真正的硬核阵地。

虹识微刊

虹膜识别技术前沿 · 每周一、周四更新

工程师写给工程师 · 武汉虹识技术有限公司 · www.homsh.cn

论文来源：arXiv | 数据整理：龙山技术研究所

【声明】内容源于网络

虹识微刊

虹识技术是国内顶尖的虹膜生物识别企业，公司致力于虹膜生物识别核心技术及相关产品的研发、应用服务及产业化。产品可广泛应用于信息安全、国防安全、公共安全、金融安全、出入境安全、智慧城市、智能家居、智能移动终端等领域。

内容 0

粉丝 0

虹识微刊虹识技术是国内顶尖的虹膜生物识别企业，公司致力于虹膜生物识别核心技术及相关产品的研发、应用服务及产业化。产品可广泛应用于信息安全、国防安全、公共安全、金融安全、出入境安全、智慧城市、智能家居、智能移动终端等领域。

总阅读0

粉丝0

内容0