媒体报道

从数据标注赛道来看3D人脸识别,AI训练的趋势将会如何?

2021-05-17 09:32:35 吉布斯科技 1

一、数据标注是什么

要理解数据标注,需先理解AI的作用。其实AI主要的一部分用途就是用来替代人类的认知功能。假如我们学习认识香蕉,那么就需要有人拿着一根香蕉在你面前告诉你,这是一根香蕉。以后再看到了香蕉,你就会认识到这个物品叫做“香蕉”。

人脸识别

同理可以把这个方法用于机器学习。假设我们要教机器认识一个人,直接给它一张附有这个人的人脸图片,它是完全不知道这到底是什么物品。所以我们必须在此人的人脸图片上面标注着“XX”两个字,然后机器通过学习了大量图片中人脸的特征,这时候再给机器任意一张此人的人脸图片,它就能识别出来了。

这边顺带提一下训练集和测试集,训练集和测试集都是标注过的数据。假设有1000张标注图片,那么可以拿其中的900张作为训练集,机器从900张图片中学习得到一个模型;剩下100张作为测试集,由于是机器没有学习过的图片去给它识别,最终我们就能够得到这个模型的准确率。

二、3D人脸识别(3D活体检测)

众所周知,数据是AI公司的必需。“AI建模没有门槛,数据才是门槛”,AI公司通过大量的数据训练来提高AI产品的准确率。

在现实生活中,大量训练数据的驱动计算机视觉表现更加,高价值的人脸识别数据使得计算机识别和感知图像能力不断接近人类的方式和水平。

人脸识别

目前市面上的人脸识别主要分为2D和 3D两种图像识别。

先讲讲2D人脸识别,根据其技术发展可分为两大类:传统人脸识别、基于神经网络人脸识别:

1. 传统人脸识别

传统人脸识别主要采用数学方法,从图像矩阵中提取对应的特征,该特征一般为尺度不变特征,常用的算法有SURF、SIFT、HARRIS等等。

2. 基于神经网络人脸识别

目前2D人脸识别算法在各个人脸识别挑战赛、在各种的开源数据集上测试的识别准确率已经达到了99.80%,识别准确率甚至可以跟人类识别能力相媲美,但在苛刻的金融环境仅作为一种辅助手段,人脸识别之后还需要别的验证手段。

不过2D人脸识别有一定的局限性,在2D人脸识别出现越来越多的“bug”后,越来越多的企业将注意力转移到3D人脸识别,以期提升相关应用的安全性。

为了弥补不足,3D人脸识别应运而生。

人脸识别

3D人脸识别是基于RGBD进行多模态(RGB+IR+深度信息)图像识别或者直接对3D点云进行人脸识别,在识别出人脸所处空间内的每个点位的三维坐标信息后,计算并复原完整的三维图像。

目前3D人脸识别在市场上根据使用摄像头成像原理主要分为:3D结构光、TOF、双目立体视觉。在这三种3D Sensing技术对比中发现,TOF方案与结构光方案因其使用便捷、成本较低等优点而最具前景;3D结构光通过红外光投射器将具有一定结构特征的光线投射到被拍摄物体上,再由专门的红外摄像头进行采集。主要利用三角形相似的原理进行计算,从而得出图像上每个点的深度信息,最终得到三维数据。3D结构光方案在精度方面超越了另外2种方案,非常适合智能终端采用。

总之,3D人脸识别拥有比 2D人脸识别更高的安全性。

近年,利用RGBD数据进行人脸识别的方案已经被广泛采用,目前,苹果、华为、OPPO、小米等主流手机品牌都已开始采用相关的3D人脸识别技术

面向3D人脸识别技术的应用,致力于用高质量的数据推动3D人脸识别技术的发展,冲浪科技设计并研发了多个3D活体检测数据库,例如《10000中国人3D多姿态人脸识别数据库》、《10000中国人3D多表情人脸识别数据库》、《多人种3D多姿态人脸识别数据库》、《多人种3D多表情人脸识别数据库》、《多人种3D面部遮挡人脸识别数据库》、《多人种3D不同光线下人脸识别数据库》、等等。冲浪科技严格遵守相关规定,所采集的数据均已获得被采集人授权,有效保障数据的安全性和合规性。

《10000中国人3D多姿态人脸识别数据库》

人脸识别

简介:1个人的1张证件图片及所对应的6段3D多姿态视频,共10000人。证件图片是证件遮挡个人信息后的照片。3D多姿态视频包括Intel RealSense SR300拍摄的左转头、右转头、上抬头、下低头、摘带眼镜、头部转圈的6段视频。每段视频包含彩色信息(RGB)、红外信息(IR)、深度信息(Depth),以及彩色信息和深度信息的标定(calibration)矩阵。

《10000中国人3D多表情人脸识别数据库》

人脸识别

简介:1个人的1张证件图片及所对应的3段3D多表情视频,共10000人。证件图片是证件遮挡个人信息后的照片。3D多表情视频包括Intel RealSense SR300拍摄的快乐、悲伤、愤怒3段视频。每段视频包含彩色信息(RGB)、红外信息(IR)、深度信息(Depth),以及彩色信息和深度信息的标定(calibration)矩阵。

《多人种3D多姿态人脸识别数据库》

人脸识别

简介:1个人的1张证件图片及所对应的6段多姿态视频,共8400人。证件图片是证件遮挡个人信息后的照片。多姿态视频包括Intel RealSense D435拍摄的正面、左转头、右转头、上抬头、下低头、头部画圈的6段视频。


首页
产品
新闻
联系