人脸识别技术路径
时间:2022-03-22 03:09:01 | 来源:网络推广
时间:2022-03-22 03:09:01 来源:网络推广
在我看来,已颇为成熟的人脸识别技术,倒不失为一次理解机器思维的好机会。
事实上,人脸识别的实现大体可分为四步。第一步当然是人脸检测:根据眼睛,眉毛,嘴巴,鼻子等器官特征和相互几何位置关系检测人脸。第二步则是人脸图像预处理:如前所述,原始图像由于受各种条件的限制和干扰,很多时候无法直接使用,必须在早期阶段对其进行灰度校正,噪声过滤等图像预处理。进一步剖析的话,这种预处理主要包括人脸对准(得到人脸位置端正的人脸图像),图像增强(改善图像质量,在视觉上更清晰,且让图像更利于计算机的处理与识别)以及归一化(取得尺寸一致,灰度取值范围相同的标准化人脸图像)等工作。
人脸识别的第三步就是脸图像特征提取这一步是针对人脸某些特征进行的,也是对人脸进行特征建模的过程。最后一步,即是输出结果的匹配与识别:将待识别的人脸特征与已得到的人脸特征模板进行比较,根据相似程度对人脸的身份信息进行判断。
以上是适用于所有识别用途的理论路径,但李彦宏在提案中涉及的场景则更为复杂:可能孩子是在很小的时候走失的,但他再进入公众视线可能已经上小学了比如办学生证的时候需要拍照片,这种情况下通过人工智能的比对,就有可能比以前更加高效的帮助有关部门和家庭找到走失儿童。
就像章子怡冀望的那样,对比走失儿童是跨年龄人脸识别技术最具社会价值的实现场景。但在影响人脸识别率的所有因素上,时间往往是最难对抗的部分,原因之一是跨年龄识别中类内变化通常会大于类间变化;另外,跨年龄训练数据难寻,若没有海量数据,深度学习神经网络便很难学习到跨年龄的类内和类间变化。不过百度也提出了解决方案:针对第一点,他们选择用度量学习的方法,通过学习一个非线性投影函数,把图像空间投影到特征空间中,在这个特征空间里跨年龄的同一个人的两张人脸距离会比不同人的相似年龄的两张人脸的距离要小;而针对第二点,考虑到跨年龄人脸的稀缺性,通过一个用大规模人脸数据训练好的模型作为底座,然后用跨年龄数据对他做更新。而将上述两点结合,通过端到端的训练,即可以大幅提升跨年龄识别的识别率。
这也正是李彦宏此次提案的理论基础。