自從數(shù)碼相機開始取代傳統(tǒng)的膠卷相機后,人工成像技術(shù)開始由從膠卷上“洗”相片的化學(xué)修圖,轉(zhuǎn)向了從數(shù)字相機的光電信號轉(zhuǎn)換為RGB數(shù)字圖形的軟件修圖。并且隨著軟件功能的越來越強大,人工成像技術(shù)漸漸演變成為機器視覺處理技術(shù),由原來的簡單場景復(fù)制,升級到場景互動上來,極大的提升了攝像技術(shù)生產(chǎn)力水平。
在4月26日由手機報在線舉辦,主題為“聚焦AI,決戰(zhàn)手機之巔”的AI手機產(chǎn)業(yè)峰會會議期間,曠視科技Face++副總裁敖翔先生對手機報在線(http://m.micomprapr.com/)表示,曠視科技成功運用在vivoX21智能手機上的跨模態(tài)人臉識別技術(shù),就是通過人工智能軟件技術(shù)來提升攝像頭硬件能力的具體表現(xiàn)??缒B(tài)人臉識別技術(shù)可以實現(xiàn)不受外界光線限制,對訓(xùn)練目標(biāo)內(nèi)容進行全天候智能識別功能。
“表現(xiàn)在智能手機人臉識別檢測解鎖與認(rèn)證上,就是能夠讓手機全天候刷臉,具有方案易用、帶來極致體驗、以及硬件成本的優(yōu)勢。”
據(jù)曠視科技副總裁敖翔介紹:“曠視科技的技術(shù)團隊,通過在海量的RGB可見光2D數(shù)碼圖像數(shù)據(jù)基礎(chǔ)上,加入了2D紅外IR數(shù)據(jù)部分,再結(jié)合不同種族的人臉3D生理特征模型,讓人工智能神經(jīng)網(wǎng)絡(luò)軟件可以精準(zhǔn)的識別出手機使用者的人臉特征,進而確定其真實身份,引導(dǎo)手機完成軟件所設(shè)定的下一步指令。”

曠視科技副總裁敖翔
敖翔先生表示,通過機器進行人臉識別的難度,除了識別的精準(zhǔn)度外,面臨的最大挑戰(zhàn)在于采樣環(huán)境光線的隨時變化引起的圖像數(shù)據(jù)一致性差異,以及環(huán)境光線變化所帶來的光線干擾和陰影成像不同。
所以機器要精準(zhǔn)識別不同環(huán)境光線條件下的人物臉部特征,甚至環(huán)境光線明顯不足的夜晚條件下也要能正常運作,就需要以有限的IR數(shù)據(jù)完成AI人工智能神經(jīng)網(wǎng)絡(luò)軟件的模型訓(xùn)練,并以RGB圖像與IR圖像進行交叉對比,最終通過Domain Transfer Learning域遷移學(xué)習(xí)來完成整個軟、硬件間的協(xié)同作業(yè),完成整個認(rèn)證過程。
“曠視科技的機器視覺AI人工智能技術(shù),不僅可以在任何光線下完成人臉識別功能,并還打造出了融合20多項技術(shù)的人像光效產(chǎn)品,為人像提供不同的光線光效優(yōu)化,對智能手機拍照影像進行場景識別與優(yōu)化、美顏美膚、場景替換等特效處理,滿足影音交互時代人們之間的社交互動需求。”
敖翔先生還對手機報在線透露了曠視科技開發(fā)的3D人臉識別算法技術(shù),除了適配3D攝像頭硬件獲取深度數(shù)據(jù)的3D人臉?biāo)惴夹g(shù)外,前面提到的曠視以RGB可見光2D數(shù)碼圖像數(shù)據(jù),加入部分2D紅外IR數(shù)據(jù),再結(jié)合不同種族的人臉3D生理特征模型等元素AI人工智能神經(jīng)網(wǎng)絡(luò)軟件,能讓普通的攝像頭也能在3D人臉識別上做到很優(yōu)秀。
不過敖翔先生也表示,如果沒有3D攝像頭的深度數(shù)據(jù),即便是通過3D深度數(shù)據(jù)訓(xùn)練過的AI人工智能神經(jīng)網(wǎng)絡(luò)軟件,也只能在2D平面數(shù)據(jù)上,猜測出3D深度數(shù)據(jù)出來,并不能完成真正的3D深度數(shù)據(jù)采樣與比校。
“目前曠視科技在普通攝像頭上,可以用AI人工智能神經(jīng)網(wǎng)絡(luò)軟件完美實現(xiàn)任何光線環(huán)境下的人臉識別過程,但還沒辦法完成需要3D深度信息的人臉認(rèn)證過程。具體到智能手機的‘刷臉’應(yīng)用上,就是可以快速的完成人臉識別,進行解鎖、開啟或進入應(yīng)用程序等操作,但還沒辦法完成支付等場景下的人臉識別認(rèn)證與確認(rèn)工作。”
在3D人臉識別領(lǐng)域,敖翔先生認(rèn)為除蘋果IOS系統(tǒng)外,其它如安卓系統(tǒng)要消化3D人臉識別的軟件原理、硬件設(shè)計等,還需要較長的一段時間才能完成。因為還沒有一個標(biāo)準(zhǔn)的模式給行業(yè)參考,所以操作起來將會十分復(fù)雜。
“在機器視覺的人工智能處理領(lǐng)域,僅以安卓系統(tǒng)手機的人臉識別應(yīng)用為例,就需要根據(jù)不同芯片來設(shè)計不同的AI人工智能神經(jīng)網(wǎng)絡(luò)軟件算法。如AI人工智能神經(jīng)網(wǎng)絡(luò)軟件到底是在CPU芯片上運行,還是在GPU、或FPGA上運行;是只在端上運行,還是在云上運行,還是端跟云相結(jié)合來運行,都需要開發(fā)與之相應(yīng)的AI人工智能神經(jīng)網(wǎng)絡(luò)軟件算法。”
敖翔先生表示,手機人臉識別技術(shù)需要平臺廠商、終端品牌廠商與算法軟件廠商一起協(xié)同開發(fā)才能完成,而高效節(jié)能的運行在終端硬件上則是最基本的要求。“要讓手機人臉識別技術(shù)完美的運行,除了需要有很好AI人工智能神經(jīng)網(wǎng)絡(luò)軟件訓(xùn)練模式,讓識別更為精準(zhǔn)外,如何對神經(jīng)網(wǎng)絡(luò)軟件進行精簡,讓其能在最少的能耗、最短的時間完成工作,也最為關(guān)鍵。”
也正因為算法軟件的高度訂制化特性,所以敖翔先生機器視覺AI人工智能神經(jīng)網(wǎng)絡(luò)軟件的開發(fā)成本十分高昂,除了手機這種有著海量終端銷售來分?jǐn)傞_發(fā)成本的產(chǎn)品,或者有著很高安全成本的行業(yè)應(yīng)用如出行、安檢、金融等領(lǐng)域外,要讓它在所有的行業(yè)應(yīng)用上推廣,目前看起來至少在開發(fā)成本上還有些障礙。
不過敖翔先生認(rèn)為機器視覺的最終目的,肯定是為提升人類的生產(chǎn)力服務(wù),但是要實現(xiàn)到那一步,不管是系統(tǒng)平臺、網(wǎng)絡(luò)通訊協(xié)議、神經(jīng)網(wǎng)絡(luò)算法軟件,還是硬件水平或應(yīng)場景開發(fā)等,都還有很長的路要走。“曠視科技目前專注于人臉識別刷臉驗人的服務(wù),通過基于深度學(xué)習(xí)算法打造的感知識別技術(shù),為金融、安防、手機、地產(chǎn)等行業(yè)提供人為核心的安全、高效、智能的數(shù)據(jù)服務(wù)。”