图1 人脸特征提取流程
如上图所示百度搭建了一套人脸图片特征流程,包括以下几个步骤:
(1)人脸检测(FaceDetection):人脸检测器负责从原始图像中找到人脸的位置,以便于后续的特征分析。百度人脸算法团队研发了一种语境辅助的pyramidbox人脸检测,引入基于anchor的上下文辅助方法,尺度感知的Data-Anchor-Sampling方法,中稿当年顶级计算机视觉会议ICCV,多次刷新人脸检测最权威榜单WIDERFace世界纪录,后不断迭代Box系列方案,在2019年WiderChallenge竞赛中获得冠军。
(2)人脸对齐(FaceAlignment):人脸对齐是根据一组预定义的参考坐标对人脸图像进行放缩和裁剪,从而使所有输入人脸的五官处于一个标准的位置。这一过程中首先需要使用人脸关键点检测器找到图像中的人脸关键点坐标,然后计算从原始坐标到参考坐标的最佳仿射变换。百度的关键点检测模型也获得了2019ICME人脸关键点检测比赛冠军。
(3)人脸特征提取(FaceRepresentation):在人脸特征表示阶段,由像素表示的原始人脸图像经由特征提取算法被转换为密集且具有区分度的特征向量,这也称为模板(Template)。理想情况下,属于同一人物的所有人脸图像都应该被映射到特征空间中的相近位置。
(4)人脸特征匹配(FaceMatching)。人脸匹配构建块中对输入的两个人脸特征向量进行比较并输出相似度分数,以表明它们属于同一人物的可能性。基于DCQ人脸识别算法,并使用超过2亿张图片的数据进行训练,百度人脸识别准确率已达到99.7%。在一些特殊的场景中,人脸识别技术已成为寻亲过程中不可替代的重要工具。DCQ人脸识别算法已被计算机视觉峰会CVPR2021录用。
图2 整体系统架构图
图3 首页界面图
百度AI寻人平台是面向全社会的公开平台,有寻亲需求的用户均可通过平台发起寻人消息,以及进行照片的比对服务,不会根据用户的年龄、性别做歧视性的限制操作行为。
百度在进行AI算法设计时,会充分考虑算法安全性,在发布新算法或算法存在重大更新时,内部会主动发起安全评估申请,由安全部进行技术支持。
关于应用效果
截至2021年3月1日,百度AI寻人平台共计收到用户上传照片42万余张,寻亲成功数量达到12000多人次。用人工智能切实保护儿童权益,呵护儿童成长,守护千万个普通家庭的幸福,真正响应人工智能为儿童的全球主张。
此外,以人脸生物信息为例,人脸生物信息被复制概率较高,倘若人脸生物信息被不法分子掌握,利用人脸信息进行网络支付,或者冒用、贩卖他人信息都会给受害者带来极大的财产损失和人身安全。因此,作为基于人脸信息进行比对的服务,注重保障生物信息隐私。首先,对采集图片进行base64编码操作,把图像转为字符串,隐藏视觉信息。再通过深度神经网络对图片字符串进行建模,其中包括随机丢弃(dropout)、非线性映射等不可能逆操作,防止从建模特征恢复原始的生物图像信息。同时为了进一步保障数据安全,对建模的特征进行加密操作,减少特征开放带来的安全隐患。经过上述的图片编码、非可逆建模和特征加密三个操作,有效的解决了生物信息安全和隐私问题。