基于Face R—CNN的人脸检测研究

发布时间：2023-04-01 13:17:10

龙源期刊网http://www.qikan.com.cn基于FaceR—CNN的人脸检测研究
作者：张瑞国
来源：《电脑知识与技术》2018年第19期
摘要：FasterR-CNN是目标检测中最具有代表性和最成功的方法之一，并且在各种物体检测应用中变得越来越普遍。本文提出了一种基于FasterR-CNN的鲁棒性深度人脸检测方法。并且开发了一些新的技术，包括设计一个新的多任务损失函数，以及线上示例挖掘，还有多方面的多层次培训策略来提高FasterR-CNN的速度。所提出的方法非常适合于人脸检测，我们称之为FaceR-CNN。并且对FDDB和WIDERFACE两种最具有挑战性的人脸检测数据集进行了实验，以此证明所提出方法相比于现有技术的优越性。
关键词：深度学习；卷积神经网络；人脸检测；候选区域；多尺度信息融合中图分类号：TP301文献标识码：A文章编号：1009-3044（2018）19-0213-05Abstract：FasterR-CNNisoneofthemostrepresentativeandsuccessfulmethodsforobjectdetection，andhasbeenbecomingincreasinglypopularinvariousobjectiondetectionapplications.Inthisreport，weproposearobustdeepfacedetectionapproachbasedonFasterR-CNN.Inourapproach，weexploitseveralnewtechniquesincludingnewmulti-tasklossfunctiondesign，onlinehardexamplemining，andmulti-scaletrainingstrategytoimproveFasterR-CNNinmultipleaspects.Theproposedapproachiswellsuitedforfacedetection，sowecallitFaceR-CNN.Extensiveexperimentsareconductedontwomostpopularandchallengingfacedetectionbenchmarks，FDDBandWIDERFACE，todemonstratethesuperiorityoftheproposedapproachoverstate-of-the-arts.Keywords：DeepLearning；ConvolutionNetwork；facedetection；candidateregion；Multi-scaleInformationFusion1人脸检测概述
人脸检测是计算机视觉和模式识别领域中关于面部应用中所面临的基本问题。但是，由于真实世界的人脸图像的显著变化，它仍然具有很大挑战性。图1就是一个典型的例子，其中的人脸图像表现出了由于遮挡，缩放，照明，姿势和表情而引起的大量变化。
人脸检测是目标检测中的一个特例。最近，基于区域的卷积神经网络[20，21，19，23]在物体检测方面取得了良好的表现。其表现最佳的是基于区域性的CNN检测。其中FastR-CNN[19]和FasterR-CNN[23]是最受欢迎的两种方法。FastR-CNN是根据感兴趣的区域来进行训练，这是由区域建议方法（如选择性搜索）而生成的[9].FasterR-CNN沿用了FastR-CNN的基本框架，它是通过构建区域网络来对生成目标进行改进。FasterR-CNN由于有更快的速度
龙源期刊网http://www.qikan.com.cn和更高的效率，从而成为各种检测任务的主要框架[11，27，1].最近，许多基于FasterR-CNN的识别方法[6，24，29，3]已被开发用于人脸检测任务，并展示出了良好的性能。
尽管基于FasterR-CNN的方法取得了很大进展[6，24，29，3]，但这些方法仍然存在一些问题[6，24，29，3]，其中的一个常见问题是他们使用softmax损失函数来监督FastR-CNN模块中面部/非面部分类的深度特征学习（遵循FasterR-CNN的标准做法）。然而，已经表明，softmax损失函数只会改善人脸特征的类间变化，但不能改善人脸特征的类内变化。以往的研究表明，类间变化和类内变化对于学习CNN特征的判别力非常重要。为了减少内部的差异，同时扩大学习CNN特征的类间变化，我们通过在最初的多任务损失函数中增加一个新开发的称为中心丢失的损失函数[33]来改进FasterR-CNN框架。通过增加中心损失函数，可以有效减少学习特征的类内变化，从而可以增强学习特征的判别力。
图1：我们展示了一个有关人脸检测的图像，它可以代表人脸在遮挡，比例，照度，姿态和表情方面的一些变化。
因此。为了进一步提高检测精度，本研究还采用了在线硬示例挖掘（OHEM）技术[1]和多尺度训练策略。这项工作的主要贡献总结如下：
1）考虑到人脸检测的特殊性，提出了一种基于FasterR-CNN人脸检测方法，该方法通过集成中心丢失，在线示例挖掘和多尺度训练等多种新兴技术，实现人脸检测。
2）所提出的方法不同于可用的基于FasterR-CNN的人脸检测方法。首先，这是第一次尝试使用中心损失来减少人脸检测中的类内差异。其次，在我们的方法中使用在线示例挖掘不同于其他方法。通过适当设定正样品和负样品之间的比例，OHEM和中心损失函数的组合可以带来更好的性能。
3）所提出的方法在WIDERFACE[25]和FDDB这两个公共领域的人脸检测数据集上获得优于现有技术的性能。2相关工作
过去二十年来，人脸检测因其应用日益广泛而得到普遍关注。早期的研究包括基于级联的方法[17，14，2，18]和基于可变形部件模型（DPM）的方法[13，22，30]。在2004年，Viola和Jones[17]提出了基于Haar-like特征的级联AdaBoost分类器用于人脸检测。之后，一些工作[14，2，18]通过使用更高级的特征和分类器来提高效率和质量[17]。除了基于级联的人脸检测方法外，DPM[22，30，13]提出使用可变形部分模型。DPM的方法是用一系列可变形部件来定义一张脸，并训练一个分类器来查找这些部件及其关系。基于深度学习的方法是目前人脸检测方面的一个主要进展。构建级联CNN以学习从粗到精策略的人脸检测器。最近，有几种方法[6，24，29，3]使用FasterR-CNN框架来改善人脸检测性能。[16]比以前的方法显著提高了人脸检测性能。

龙源期刊网http://www.qikan.com.cn图2：基于FasterR-CNN基本框架。我们首先用预训练的卷积网络提取卷积特征。然后，由RPN产生候选特征（结果），FastR-CNN提炼结果。我们将中心损耗作为辅助信号添加到FastR-CNN的分类层上。PRN和FastR-CNN共享底层卷积功能。
在线示例挖掘的方法已被证明对物体检测任务有效。在文献[1]中，作者提出了一个在线示例挖掘（OHEM）算法（使用FastR-CNN框架进行训练）来提高对象检测性能。[24，29，12]也使用示例挖掘算法来提高人脸检测的性能。
损失函数在深度卷积网络中也起着关键作用。深度卷积网络中最广泛使用的损失函数是softmax损失函数。然而，softmax损失函数关注于类间差异，而忽略了特征学习中的类内变化，这会影响分类精度。为了增强学习特征的判别能力，最近在深度卷积网络中使用了对比损失[32，34]和三重损失[5]。中心损失[33]是通过最小化样本与学习中心之间的距离来提出的。中心损失高效，易于实施，并且可以很好地推广到其他视觉任务。在这份报告中，我们将使用中心损失来改善人脸检测的性能。3基于R-CNN的人脸检测研究
由于FasterR-CNN框架在目标检测任务中获得了很大成功，我们可以将其用作设计人脸检测新模型的通用平台。考虑到人脸检测任务的具体属性，我们从多个方面改进了R-CNN框架。首先，基于新开发中心损失函数[33]，我们在FastR-CNN模型中设计了一个新的多任务损失函数，用于监督面部/非面部分类的有差异的深度学习特征。其次，在深度学习中，我们使用在线示例挖掘算法[1]生成样本（其中正样本与负样本的比率设置为1：1）以供后续处理。第三，我们使用多尺度训练策略来帮助提高检测性能。通过整合上述技术，所提出的方法非常适合于人脸检测任务，这得到了我们实验结果的验证。因此我们称之为FaceR-CNN。FaceR-CNN的详细算法详述如下：3.1FasterR-CNN基本结构
我们使用

基于Face R—CNN的人脸检测研究

推荐内容

相关推荐

2018-2019年毕节市长春堡镇蔡官小学三年级上册科学模拟复习题无答案

关于树的诗句或格言

光威复材：2020年6月1日投资者关系活动记录表(一)

一会儿一会儿一会儿造句

教师人格魅力心得体会范文(精选4篇)(一)

幸福中国作文_1

部编(人教新版)六年级语文下册第四单元知识小结

核心竞争力的概念

专升本研究生复试自我介绍

文物与博物馆学本科专业人才培养方案