新聞中心
【稿件】昨日,《人臉識別有多牛?AIFR 技術分分鐘讓你變“明星”》一文提到面部特征隨著年齡的增長產生變化,并圍繞 AIFR 技術的生成和判別兩大模型進行了技術分析。

(a)輸入圖像(b)人臉變形(c)人臉變形(d)匹配的明星圖像
“你最像哪位明星?”對比照
今天,我們將從技術專家給出的流程圖切入,對“你最像哪位明星?”這張小應用對比照背后的基本流程與算法做解析。
圖1:人臉技術的基本流程
如圖 1 所示,用戶在應用中輸入一張圖像(例如:特朗普的圖像),人臉識別的基本流程如下:
- 通過人臉檢測技術,找到輸入圖像中的人臉位置。
- 關鍵點定位技術,將人臉中的關鍵點位置找到,例如:眼睛、鼻子、嘴巴以及輪廓上的關鍵點。
- 人臉特征提取步驟,將人臉位置進行校正,通過特征提取方法,計算刻畫人臉的特征向量。
- 對于輸入圖像(a),可以計算得到對應的特征向量 A;同時針對應用的明星人臉庫,可以存儲為人臉特征庫 DB。
- 將 A 與 DB 中每一個向量逐一計算相似度,然后根據(jù)相似度排序的結果,就可以將最相似的明星臉找到,例如圖像(d)中的明星。
- 圖像變形的例子(b)和(c),則是采用計算機圖形學方法進行人臉紋理變換的結果。
其中,人臉特征的用途可以分為特征比對和特征搜索兩種:
- 特征比對:將特征向量與預先存儲的人臉特征數(shù)據(jù)庫進行相似度排序,得到與輸入圖像相似度***的返回結果,一般是身份識別的結果。
- 特征搜索:在應用人臉數(shù)據(jù)庫中,返回與輸入圖像相似的結果。
下面分別對上述各步驟所涉及的算法和應用的技術,進行簡單的介紹:
人臉檢測技術
2000 年左右,美國科學家 Paul Viola和Michael J.Jones 提出了一種可以實時運行的人臉檢測方法,即基于 Adaboost 的人臉檢測方法。
該方法采用快速計算的 Harr 特征,通過 Adaboost 算法選擇出有效特征和一系列的弱分類器(weak learner),***以線性組合的方式得到最終的強分類器,提高了檢測的速度和精確率。在 OpenCV 中,它有相應的訓練算法和模型可以調用。
以此為基礎,人們提出了各種不同形式的改進方法,例如基于 PixelDifference(PD)特征的檢測方法。他們采用像素間的灰度差值作為特征,可以進一步提高檢測速度。
更進一步,將 PD 特征進行歸一化,提出了 Normalize Pixel Difference(NPD)特征,提高了對光照的魯棒性。這些方法計算資源消耗少、模型簡單,適合應用于移動設備。
通過近二十年的探索,人臉檢測領域取得了豐富的研究成果,并在很多場合進行了落地應用。近幾年,深度學習發(fā)揮出越來越大的威力,將人臉檢測技術推向了新的高度。
例如:基于 FasterR-CNN 的人臉檢測方法,取得了在 FDDB 測試集合上的優(yōu)秀檢測效果。圖 2 給出了該方法的一些人臉檢測的示例圖。
圖 2:人臉檢測示例圖
上圖的綠色框是人工標注位置,紅色框是算法輸出的檢測結果。
人臉關鍵點定位技術
人臉關鍵點定位的目的是在人臉檢測的基礎上,進一步確定臉部特征點(眼睛、眉毛、鼻子、嘴巴、臉部外輪廓)的位置。
根據(jù)不同應用,人臉關鍵點的數(shù)量定義各不相同,少則幾個,多則上百個。這個技術的核心是如何精確計算出人臉中關鍵點的位置,一般涉及到的算法分成 3 種。
- ASM/AAM 經典算法。它由英國科學家 Tim Cootes 提出,基本思路是將人臉的紋理特征和各個特征點之間的位置進行約束結合。其中,Stam 開源包是 ASM 的一種實現(xiàn)方式,可以在實際中運用。
- 基于 Boosting Tree 的算法。例如基于 Ensemble of RegressionTress(ERT)算法的人臉關鍵點檢測方法,學習每個關鍵點的局部特征,然后將特征組合起來,使用線性回歸檢測關鍵點。
該方法檢測速度快,定位效果也不錯。開源的 dlib 庫中(http://dlib.net/)有這個算法的完整實現(xiàn)方法。
- 基于深度學習的算法。例如香港中文大學的 Tang Xiaoou 教授所在研究組提出了 CNN 的級聯(lián)結構,在關鍵點定位上取得了不錯的效果。
如圖 3 所示,是一些關鍵點定位的示例圖。
圖 3:人臉關鍵點定位的示例圖
人臉特征提取技術
經典的特征描述方法,大都可以運用于人臉特征提取技術,包括著名的特征提取算法 SIFT (Scale-invariant Feature Transform)、HoG(Histogram of Oriented Gradient)等。
這些算法具有很強的特征提取能力,但是手工選取特征是一件非常費力、啟發(fā)式(需要專業(yè)知識)的方法,而且它的調節(jié)需要大量的時間。
在大數(shù)據(jù)時代,人們可以獲得海量的圖像數(shù)據(jù),采用深度學習方法,可以獲得更加高效的人臉特征。目前,深度學習成為了提取特征的主流方法,在人臉識別領域屢創(chuàng)佳績。
人臉識別后續(xù)應用
經過特征提取,人臉圖像信息轉換成了高維特征向量,例如 4096 維浮點的深度學習特征向量。后續(xù)的應用,就可以根據(jù)實際場景進行不同的領域探索了,例如人臉身份識別、人臉圖像搜索、人臉支付等。
除了應用在金融社保、教育安防行業(yè)等比較利益攸關的場合外,人臉識別技術也可以應用在其他輕松娛樂的行業(yè),比如:直播美顏,視頻特效等領域。
- 直播美顏:現(xiàn)在的直播平臺都會提供人臉美顏的功能,讓主播的形象更加光彩照人。
- 視頻特效:通過手機拍攝,在朋友圈中分享一些豐富多彩的特效視頻,是一件很 cool 的事情。
圖 4:視頻特效
這類應用中所涉及的底層技術(人臉檢測、關鍵點跟蹤)大部分都需要在手機上實時運行,帶來的技術挑戰(zhàn)是:如何在保證準確率的同時具有非常高的運行速度,以便達到手機上實時處理的效果。
目前所采用的解決方案大部分是通過算法優(yōu)化和模型優(yōu)化的工程手段,將算法移植到手機端,例如:將基于 Adaboost 的人臉檢測算法,和基于 ERT 的關鍵點檢測算法相結合,分別通過樣本訓練得到較小規(guī)模的模型,從而適合于在手機端運行。
通過這些不同的應用方式,人臉識別技術不但為人們的生活帶來了便利,也增添了生活的樂趣?;ヂ?lián)網(wǎng)時代,人臉識別技術應用到很多場合,如何保證數(shù)據(jù)安全以及技術的合理使用,是不容忽視的課題。只有安全合理的使用,我們才能發(fā)揮好人臉識別技術的作用,為人們生活帶來福利。
張洪明
蘑菇街高級技術專家
張洪明(蘑菇街花名:民達)2015 年加入蘑菇街,負責美麗聯(lián)合集團圖像技術的研發(fā)工作,創(chuàng)建和帶領一個算法團隊,與工程和業(yè)務團隊合作,為集團提供圖像技術支持。主要工作包括:圖像搜索、圖像識別、商品圖像內容分析等;業(yè)務涉及電商導購、直播等場景。在加入蘑菇街之前,分別在 NEC 中國研究院、阿里巴巴集團,從事圖像技術和機器學習的研究和應用。
參考文獻
[1].Viola.Paul, and MichaelJ. Jones. "Robust real-time face detection." International journal ofcomputer vision 57.2 (2004): 137-154.
[2]OpenCV
[3]Marku? N, Frljak M, Pand?i? I S, et al.Object detection with pixel intensity comparisons organized in decisiontrees[J]. arXiv:1305.4537, 2013.
[4]Liao S, Jain A K, Li S Z. A fast andaccurate unconstrained face detector[J]. IEEE transactions on pattern analysisand machine intelligence, 2016, 38(2): 211-223.
[5]Huaizu Jiang, Erik Learned-Miller.FaceDetection with the Faster R-CNN.arXiv:1606.03473,2016
[6]http://personalpages.manchester.ac.uk/staff/timothy.f.cootes/
[7]http://www.milbo.users.sonic.net/stasm/index.html
[8]Kazemi V, Sullivan J. One millisecondface alignment with an ensemble of regression trees. Proceedings of the IEEEConference on Computer Vision and Pattern Recognition. 2014: 1867-1874
[9] http://dlib.net
[10]Y. Sun, X. Wang, and X. Tang. DeepConvolutional Network Cascade for Facial Point Detection.In Proceedings of IEEE Conference on Computer Vision and PatternRecognition (CVPR), 2013
[11]Taigman, Y., Yang, M., Ranzato, M. A.,& Wolf, L. (2014, June).Deepface: Closing the gap to human-levelperformance in face verification. In Computer Vision and Pattern Recognition(CVPR), 2014 IEEE Conference on (pp. 1701-1708).
[12] W. Ouyang, X. Wang, X. Zeng, S. Qiu,P. Luo, Y. Tian, H. Li, S. Yang, Z. Wang, C. C. Loy, and X. Tang,"DeepID-Net: deformable deep convolutional neural networks for objectdetection", IEEE Conf. on Computer Vision and Pattern Recognition,June 2015
[13] Florian Schroff, Dmitry Kalenichenko,James Philbin, "FaceNet: A unified embedding for face recognition andclustering", 2015 IEEE Conference on Computer Vision and PatternRecognition (CVPR), vol. 00, no. , pp. 815-823, 2015
【原創(chuàng)稿件,合作站點轉載請注明原文作者和出處為.com】
網(wǎng)站題目:未來即將“觸臉可及”,人臉識別技術大揭秘!
文章出自:http://www.5511xx.com/article/djcdoec.html


咨詢
建站咨詢
