本文共 2087 字,大约阅读时间需要 6 分钟。
本节书摘来自异步社区《人脸识别原理及算法——动态人脸识别系统研究》一书中的1章1.4节人脸图像识别主要研究的问题,作者 沈理 , 刘翼光 , 熊志勇,更多章节内容可以访问云栖社区“异步社区”公众号查看。
1.4 人脸图像识别主要研究的问题
人脸识别原理及算法——动态人脸识别系统研究从人脸图像识别的过程来看,建立人脸模型是一个比较重要的环节,而在这个环节中提取合适的特征采样值又是比较关键的。不同的识别方法所提取的特征值是不一样的,提取方法也是不一样的。但模型特征的最终表现形式都是类似的,以向量的形式表示。人脸图像识别的难度从其图像样本的易受干扰程度也可体现出来,不同的光照、是否有背景以及图像是否倾斜、是否有旋转等都会对图像的样本产生干扰,从而对图像识别结果造成影响。
1.4.1 数据采样
因为人脸是三维目标物体,很难用简单的模型来加以描述,所以一般将其投影到二维空间,得到二维的人脸图像,并用于识别。而对于同一个物体,从不同角度得到的投影图像各不相同,有的甚至相差较大,因此识别时,可能将来源于同一个目标物体的不同投影图像识别为不相同。定义1.1: 设训练样本集合为R,取任一目标S_i ,对S_i进行某些操作Gamma ,由此得到的模式集合为L_i = left{ {o_{i1} ,o_{i2} , cdots ,o_{in} } right} ,则对应R,可得到样本库为K = left{ {o_{11} , cdots ,o_{1n} ,o_{21} , cdots ,o_{2n} , cdots ,o_{i1} , cdots ,o_{in} , cdots ,} right};对于某一待识目标M,若M与K中任一元素o_{ij} 相等或最近似,则认为M = L_i,也即M = S_i;否则,拒识。
在上述定义中,如果L_i 为单元素集合(n=1),即每个训练样本在库中有一个数据,则称之为单样本数据识别;否则,称为多样本数据识别。
对于某个待识别目标,其在库中对应的样本个数越多,则被识别出的可能性越大;反之,则越小。因此,在识别精确度要求高的场合,应该采用多样本数据,并设计相应的识别算法进行识别;但样本数据增加了,对存储空间的要求也就相应增加。另外在某些场合,有时对于每个训练目标只能提供一个样本数据,则这时应该考虑在单样本数据的情况下,如何设计一个较通用的识别算法。
一般进行人脸图像识别的过程是这样的:首先要建立一个训练样本库,对于每个训练样本在库中都有一幅或多幅人脸图像数据,识别时,得到待识目标的相应数据,与库中各样本数据进行比较,如能够得到合适的匹配,则认为识别出;否则,拒识,并将待识目标的相应数据加入样本库中。为了得到一个通用的人脸图像识别系统,一般都基于单样本数据情况。
1.4.2 干扰因素
除了样本数据不足会给识别带来一定的困难外,一些外在的干扰也会影响识别的精度。(1)图像质量
对于拍摄清晰的人脸图像,可从中准确地分辨出人脸各部分的结构信息及纹理信息,有利于人脸图像特征的提取以及提高识别率;反之,如图像质量较差,将会给识别带来一定的困难,有时需要先进行图像的增强处理以及平滑处理。
(2)背景
人类能够在各种环境下识别某些特定的目标,可以认为人类具有将目标从背景中提取出来进行识别的能力,而不是只能在某一特定环境下识别目标。但背景却会对机器识别产生不利影响,因为要从一幅图像中分辨出背景与目标本身也是一个识别任务。如果背景较简单,则目标提取相对容易些;否则,很可能提取不出目标,使得后续的识别很难进行。对于一幅人脸图像而言,背景的存在是必然的,因此必须考虑背景的影响。
(3)光照
光照对于视觉的影响是很大的,即使对于人类,也会由于光线太暗而出现误识。反映到人脸图像的识别上,光照可以影响目标图像的结构,使得目标的轮廓、纹理都会出现偏差;对于同一个人,在不同光照下得到的人脸图像也会不同。因此,对于一个通用性较强的人脸图像识别系统,光照是一个要考虑的因素。
(4)目标的旋转
在进行拍摄时,人的头部会不自主地做些转动,一般可归结为两类旋转,一类为深度旋转,另一类为平面旋转(也可称为平面倾斜)。这两类旋转,尤其是前者,给人脸图像的识别带来很大难度。
(5)尺度
对于人类而言,当一个目标在远处出现时,因其较小,可能识别不出,随着目标的靠近,目标逐渐放大,变得清晰,人类能够准确地将其识别出来;另一方面,如果眼睛距离目标太近,目标过于放大,也可能识别不出。同样,对于人脸图像的识别而言,图像中目标的尺度也必须在一定的范围内,目标太小或太大都将给识别带来困难。
(6)人脸的表情
指纹成像时不会因为带有表情而给识别带来困难,而人脸是具有表情的,并且每次成像时,表情都不会完全一样,反映到人脸图像上,对于同一个人,其表情不同,得到的人脸图像也就不同。
(7)其他
其他因素如头饰、眼镜、胡须、化妆等都会给识别带来困难。
本文仅用于学习和交流目的,不代表异步社区观点。非商业转载请注明作译者、出处,并保留本文的原始链接。