面试过程中,有经验的hr能通过候选人的表情看破其蕴含的情绪。但你是否想过:如果让AI来当"面试官",它是如何从人类的面部表情和神态中识别出人类的情绪波动的?无论是通过摄像头捕捉面部表情,还是分析肢体语言,其核心都依赖于一种强大的深度学习模型——卷积神经网络(Convolutional Neural Network, CNN),AI数字人面试也是通过这种图像识别机制了解学生情绪,为面试者提供专业指导和评价的。
1
在计算机中,图像的本质就是一个由像素值(pixel values)组成的矩阵:
上述的像素值矩阵打印出来,就是如下图像:
而要让AI学习如何辨别这些像素矩阵,核心就在于如何教会AI辨别矩阵图形的显著特征。为了使图片的特征更加明显,我们就需要用数学计算来突出并提取图片中的特征,这一过程就可以使用“卷积运算”。
2
卷积运算就是要通过一个小矩阵(称为 filter卷积核)对计算机中的图片数字矩阵进行运算,来强化矩阵中的局部数值规律,方便AI学习图像的特征(image features)。我们不妨从具体例子来看卷积运算到底是怎么运行的。如果我们设置一个3*3的小矩阵作为卷积核,对先前的“T”字图像矩阵进行运算:
如上所示,卷积运算就是在大矩阵中不断移动小矩阵,让小矩阵覆盖的部分与 3x3 矩阵按对应的像素相乘,然后把 9 个值加起来得到一个新值。按这种方式,以一个像素为单位依次滑动和计算,最后就得到一个加权后的输出矩阵。经过卷积计算后输出的矩阵强化了图像中的某些特征,所以被称为卷积特征(Convolved Feature)。
用卷积核加权处理过后的数字矩阵与图像
观察由卷积核处理后的矩阵,不难看出图片边缘被模糊化了,而图像上部的特征更加显著,这就是一个用于突出图像上部特征的卷积核。
当然,用的卷积核矩阵(filter matrix)不同,得到的特征图(feature maps)也就不同。我们可以凭借此提取出图像各个部分的特征。例如,如果我们想要识别面试者的人像图,我们可以首先采用如下卷积核以突出其边缘特征:
面试者人像
边缘检测卷积核
加权处理图像数字矩阵后,我们可以得到一张边缘强化的图像:
然而,单个卷积核所强化的始终只是图像的部分特征。要想让AI准确的判断面试中面试者的表情、神态,局部的特征是远远不够的。因此,需要把人像中不同部位的特征整合起来分析,这就是CNN卷积神经网络的原理。
3
上文中已经提到,仅仅用单一卷积核所提取图像的局部特征来判断图像,难免会陷入“盲人摸象”的局面。为了能全面对图像进行判断,应将多个卷积核叠加成为卷积层,多卷积层堆叠以逐渐提取更高级别的特征,这就是CNN卷积神经网络的原理。
不难看出,当图像尺寸增大时,其内部的加法、乘法和除法操作的次数会指数上升,很容易使得计算量变得相当庞大。因此需要通过池化(就是将输入图像进行缩小,减少像素信息,只保留重要信息)来降低计算量。
例如,如果我们想对面试者的表情进行AI判断,就需要对眼、眉、口、鼻等多个局部进行特征提取和分析,通过不断重复“卷积—池化—非线性函数计算”的过程,AI最终可以输出代表识别对象的标签,这样AI就最终完成了图像特征的学习并可以实现对用户特定表情的判断。
4
当AI学会了如何像一个面试官一样思考时,就可以模拟求职面试,依据岗位所需的各项能力对学生进行考察。正方AI数字人模拟面试依靠CNN图像识别原理,通过Resnet网络和双向Lstm网络,对模拟面试视频进行逐帧分析,输出学生面对特定问题的表情标签。
依托NLP自然语义理解、深度识别算法、图像识别与分析、情绪特征识别,正方通校园AI深入解析面试过程中的视频和音频数据,生成详尽的面试评估报告,旨在全方位支持学生的自我提升。通过学生面部表情识别,AI可以量化评估面试者的表达能力和情绪管理状态,给出具体反馈以提高学生在求职市场上的竞争力。
5
从像素到特征,AI一步一步学习如何做好一个面试官,卷积神经网络的原理帮我们解构了AI表情识别的原理和数字人考官打分的“标准”。当AI的"脸盲"在不断的迭代训练中被克服,人工智能终将在智慧教育和招聘中担当越来越重要的职责。
参考文献:
1. Prediction of Occupation Stress by Implementing Convolutional Neural Network Techniques. (2021). IGI Global Scientific Publishing.
2. Kulshrestha, S. (2019). Developing an Image Classifier Using TensorFlow: : Convolutional Neural Networks (1st edition) . Apress.
3. https://blog.csdn.net/AI_dataloads/article/details/133250229

