基于Face R—CNN的人脸检测研究
发布时间:2023-04-01 13:17:10
龙源期刊网http://www.qikan.com.cn基于FaceR—CNN的人脸检测研究
作者:张瑞国
来源:《电脑知识与技术》2018年第19期
摘要:FasterR-CNN是目标检测中最具有代表性和最成功的方法之一,并且在各种物体检测应用中变得越来越普遍。本文提出了一种基于FasterR-CNN的鲁棒性深度人脸检测方法。并且开发了一些新的技术,包括设计一个新的多任务损失函数,以及线上示例挖掘,还有多方面的多层次培训策略来提高FasterR-CNN的速度。所提出的方法非常适合于人脸检测,我们称之为FaceR-CNN。并且对FDDB和WIDERFACE两种最具有挑战性的人脸检测数据集进行了实验,以此证明所提出方法相比于现有技术的优越性。
关键词:深度学习;卷积神经网络;人脸检测;候选区域;多尺度信息融合中图分类号:TP301文献标识码:A文章编号:1009-3044(2018)19-0213-05Abstract:FasterR-CNNisoneofthemostrepresentativeandsuccessfulmethodsforobjectdetection,andhasbeenbecomingincreasinglypopularinvariousobjectiondetectionapplications.Inthisreport,weproposearobustdeepfacedetectionapproachbasedonFasterR-CNN.Inourapproach,weexploitseveralnewtechniquesincludingnewmulti-tasklossfunctiondesign,onlinehardexamplemining,andmulti-scaletrainingstrategytoimproveFasterR-CNNinmultipleaspects.Theproposedapproachiswellsuitedforfacedetection,sowecallitFaceR-CNN.Extensiveexperimentsareconductedontwomostpopularandchallengingfacedetectionbenchmarks,FDDBandWIDERFACE,todemonstratethesuperiorityoftheproposedapproachoverstate-of-the-arts.Keywords:DeepLearning;ConvolutionNetwork;facedetection;candidateregion;Multi-scaleInformationFusion1人脸检测概述
人脸检测是计算机视觉和模式识别领域中关于面部应用中所面临的基本问题。但是,由于真实世界的人脸图像的显著变化,它仍然具有很大挑战性。图1就是一个典型的例子,其中的人脸图像表现出了由于遮挡,缩放,照明,姿势和表情而引起的大量变化。
人脸检测是目标检测中的一个特例。最近,基于区域的卷积神经网络[20,21,19,23]在物体检测方面取得了良好的表现。其表现最佳的是基于区域性的CNN检测。其中FastR-CNN[19]和FasterR-CNN[23]是最受欢迎的两种方法。FastR-CNN是根据感兴趣的区域来进行训练,这是由区域建议方法(如选择性搜索)而生成的[9].FasterR-CNN沿用了FastR-CNN的基本框架,它是通过构建区域网络来对生成目标进行改进。FasterR-CNN由于有更快的速度
龙源期刊网http://www.qikan.com.cn和更高的效率,从而成为各种检测任务的主要框架[11,27,1].最近,许多基于FasterR-CNN的识别方法[6,24,29,3]已被开发用于人脸检测任务,并展示出了良好的性能。
尽管基于FasterR-CNN的方法取得了很大进展[6,24,29,3],但这些方法仍然存在一些问题[6,24,29,3],其中的一个常见问题是他们使用softmax损失函数来监督FastR-CNN模块中面部/非面部分类的深度特征学习(遵循FasterR-CNN的标准做法)。然而,已经表明,softmax损失函数只会改善人脸特征的类间变化,但不能改善人脸特征的类内变化。以往的研究表明,类间变化和类内变化对于学习CNN特征的判别力非常重要。为了减少内部的差异,同时扩大学习CNN特征的类间变化,我们通过在最初的多任务损失函数中增加一个新开发的称为中心丢失的损失函数[33]来改进FasterR-CNN框架。通过增加中心损失函数,可以有效减少学习特征的类内变化,从而可以增强学习特征的判别力。
图1:我们展示了一个有关人脸检测的图像,它可以代表人脸在遮挡,比例,照度,姿态和表情方面的一些变化。
因此。为了进一步提高检测精度,本研究还采用了在线硬示例挖掘(OHEM)技术[1]和多尺度训练策略。这项工作的主要贡献总结如下:
1)考虑到人脸检测的特殊性,提出了一种基于FasterR-CNN人脸检测方法,该方法通过集成中心丢失,在线示例挖掘和多尺度训练等多种新兴技术,实现人脸检测。
2)所提出的方法不同于可用的基于FasterR-CNN的人脸检测方法。首先,这是第一次尝试使用中心损失来减少人脸检测中的类内差异。其次,在我们的方法中使用在线示例挖掘不同于其他方法。通过适当设定正样品和负样品之间的比例,OHEM和中心损失函数的组合可以带来更好的性能。
3)所提出的方法在WIDERFACE[25]和FDDB这两个公共领域的人脸检测数据集上获得优于现有技术的性能。2相关工作
过去二十年来,人脸检测因其应用日益广泛而得到普遍关注。早期的研究包括基于级联的方法[17,14,2,18]和基于可变形部件模型(DPM)的方法[13,22,30]。在2004年,Viola和Jones[17]