芯翌科技與清華大學(xué)自動(dòng)化系智能視覺(jué)實(shí)驗(yàn)室合作,發(fā)布了業(yè)界規(guī)模最大的人臉數(shù)據(jù)集WebFace260M,相關(guān)學(xué)術(shù)論文已經(jīng)被計(jì)算機(jī)視覺(jué)國(guó)際頂級(jí)會(huì)議CVPR 2021接收。該數(shù)據(jù)集完全基于全球互聯(lián)網(wǎng)公開人臉數(shù)據(jù)構(gòu)建,包含數(shù)百萬(wàn)ID和數(shù)億圖片,旨在進(jìn)一步推動(dòng)人臉識(shí)別相關(guān)技術(shù)的進(jìn)步,促進(jìn)智能化行業(yè)的發(fā)展,助力AI時(shí)代科技創(chuàng)新。
網(wǎng)站地址:https://www.face-benchmark.org
論文地址:https://arxiv.org/abs/2103.04098
隨著人工智能技術(shù)的不斷發(fā)展,越來(lái)越多生物識(shí)別技術(shù)融入到我們的日常生活中。人臉識(shí)別作為應(yīng)用最廣泛的生物識(shí)別技術(shù),和指紋、虹膜等生物識(shí)別技術(shù)相比,以其非接觸、高精度、便捷的優(yōu)勢(shì),廣泛落地于各行各業(yè),是目前最受歡迎的生物認(rèn)證方式。
1
人臉數(shù)據(jù)集發(fā)布背景
近年來(lái),得益于深度學(xué)習(xí)技術(shù)的發(fā)展,經(jīng)過(guò)業(yè)界多年來(lái)在數(shù)據(jù)集構(gòu)建、神經(jīng)網(wǎng)絡(luò)架構(gòu)、損失函數(shù)設(shè)計(jì)等方面的詳盡研究,人臉識(shí)別技術(shù)在識(shí)別精度上已經(jīng)取得了長(zhǎng)足進(jìn)步,并實(shí)現(xiàn)了大規(guī)模落地。但當(dāng)前人臉識(shí)別仍然面臨公開數(shù)據(jù)規(guī)模小、標(biāo)準(zhǔn)混雜、測(cè)評(píng)無(wú)法對(duì)齊等問(wèn)題。
其中,目前公開的人臉識(shí)別訓(xùn)練數(shù)據(jù)集中,規(guī)模最大的是MegaFace2和MS1M,分別僅擁有67.2萬(wàn)ID和470萬(wàn)圖片,以及10萬(wàn) ID和1000萬(wàn)圖片,遠(yuǎn)遠(yuǎn)無(wú)法滿足實(shí)際人臉識(shí)別系統(tǒng)的數(shù)據(jù)需求??梢哉f(shuō),公開數(shù)據(jù)規(guī)模與實(shí)際落地系統(tǒng)所需數(shù)據(jù)規(guī)模之間的巨大差距,已經(jīng)較大程度上阻礙了當(dāng)前人臉識(shí)別相關(guān)技術(shù)的持續(xù)發(fā)展。
另一方面,評(píng)測(cè)準(zhǔn)則和測(cè)試集也是影響人臉識(shí)別技術(shù)進(jìn)一步發(fā)展的重要制約因素。目前公開的人臉識(shí)別評(píng)測(cè)集,包括LFW、CFP、AgeDB、RFW、MegaFace、IJB系列等,在精度上基本已經(jīng)比較飽和。同時(shí)這些測(cè)試集對(duì)于人臉識(shí)別不同場(chǎng)景下的分類測(cè)評(píng)不夠細(xì)致,沒(méi)有持續(xù)迭代、升級(jí)和維護(hù),也沒(méi)有根據(jù)實(shí)際應(yīng)用限制搭建評(píng)測(cè)準(zhǔn)則。
業(yè)界公認(rèn),NIST-FRVT是一個(gè)完全獨(dú)立的第三方測(cè)評(píng)系統(tǒng),它的測(cè)試集非公開,測(cè)評(píng)指標(biāo)分類詳盡,并且對(duì)提交頻次有嚴(yán)格限制和運(yùn)行時(shí)間有嚴(yán)格要求,是目前唯一符合現(xiàn)實(shí)應(yīng)用的測(cè)評(píng)系統(tǒng)。然而,也由于NIST-FRVT對(duì)提交頻率和提交條件的嚴(yán)格要求,一定程度上也限制了人臉識(shí)別技術(shù)的發(fā)展。
2
WebFace260M數(shù)據(jù)集情況
基于當(dāng)前行業(yè)的現(xiàn)狀,芯翌科技與清華大學(xué)的研究人員在FRVT參賽基礎(chǔ)上,完全基于全球互聯(lián)網(wǎng)公開人臉數(shù)據(jù),聯(lián)合推出了當(dāng)前全球規(guī)模最大的人臉數(shù)據(jù)集WebFace260M,人臉I(yè)D數(shù)目首次達(dá)到數(shù)百萬(wàn),圖片數(shù)目首次達(dá)到數(shù)億規(guī)模,將很大程度上推動(dòng)以深度學(xué)習(xí)為基礎(chǔ)的人臉識(shí)別相關(guān)技術(shù)發(fā)展。
WebFace260M數(shù)據(jù)集和公開數(shù)據(jù)集
在人臉I(yè)D和數(shù)量上的比較
同時(shí)在WebFace260M的基礎(chǔ)上,芯翌科技和清華大學(xué)的研究人員采用自訓(xùn)練全自動(dòng)迭代的清洗流程 (Cleaning Automatically by Self-Training, CAST),得到WebFace42M,是目前全球規(guī)模最大的可直接用于訓(xùn)練的干凈人臉數(shù)據(jù)集。該數(shù)據(jù)集包含200萬(wàn)ID和4200萬(wàn)圖片,ID數(shù)目和圖片數(shù)目相比目前使用最廣泛、最受認(rèn)可的公開數(shù)據(jù)集MS1MV2都提高了一個(gè)數(shù)量級(jí)以上。
針對(duì)目前人臉識(shí)別的評(píng)測(cè)問(wèn)題,研究人員發(fā)布了更貼近實(shí)際應(yīng)用的”時(shí)間受限人臉識(shí)別評(píng)測(cè)準(zhǔn)則“-FRUITS (Face Recognition Under Inference Time conStraint),和分布更廣泛、更具挑戰(zhàn)性、分類更細(xì)致的人臉測(cè)試集,這將推動(dòng)人臉識(shí)別評(píng)測(cè)更靠近真實(shí)場(chǎng)景。同時(shí),研究人員將持續(xù)維護(hù)、迭代和升級(jí)該測(cè)試集以及評(píng)測(cè)系統(tǒng),助力行業(yè)技術(shù)發(fā)展。
數(shù)據(jù)集共同作者、芯翌科技AI算法技術(shù)總監(jiān)黃冠表示:
基于發(fā)布的數(shù)據(jù)集、測(cè)試準(zhǔn)則和測(cè)試集,我們進(jìn)行了廣泛的實(shí)驗(yàn)、對(duì)比和分析。分析結(jié)果表明,在新的高一個(gè)數(shù)量級(jí)的大規(guī)模數(shù)據(jù)、更貼近實(shí)際應(yīng)用的評(píng)測(cè)準(zhǔn)則、更具挑戰(zhàn)的測(cè)試集等多項(xiàng)內(nèi)容的綜合評(píng)判下,大規(guī)模人臉識(shí)別問(wèn)題在算法、系統(tǒng)、數(shù)據(jù)、評(píng)測(cè)等各個(gè)方面,存在相當(dāng)多的問(wèn)題需要學(xué)術(shù)界和工業(yè)界一起去探索和解決。
3
WebFace260M數(shù)據(jù)集指標(biāo)
基于WebFace260M清洗得到的WebFace42M數(shù)據(jù),能夠在目前公開的、最具挑戰(zhàn)性的IJBC測(cè)試集上,達(dá)到新的SOTA (State-Of-The-Art),并把相對(duì)錯(cuò)誤率降低了40%。
基于WebFace42M,在IJBC測(cè)試集上取得了SOTA的性能
同時(shí),僅基于WebFace42M的數(shù)據(jù),芯翌科技在2020年10月NIST-FRVT的榜單上,取得了1:1人臉識(shí)別評(píng)測(cè)綜合排名世界前三的成績(jī)。
更進(jìn)一步,以WebFace42M為基礎(chǔ),在2021年3月最新一期的NIST-FRVT榜單上,芯翌科技在戴口罩人臉識(shí)別評(píng)測(cè)中以絕對(duì)優(yōu)勢(shì)獲得世界第一,并在1:1人臉識(shí)別評(píng)測(cè)綜合排名世界前三。
4
打造開放、共享、安全的數(shù)據(jù)生態(tài)
芯翌科技研發(fā)副總裁都大龍表示:
在數(shù)字經(jīng)濟(jì)和智能化時(shí)代,數(shù)據(jù)資源是最寶貴的生產(chǎn)資料。人們可能需要像對(duì)待傳統(tǒng)的生產(chǎn)資料,如土地資源、生產(chǎn)原料、工具設(shè)備等一樣,去規(guī)劃、生產(chǎn)、分享、交易、使用和保護(hù)新時(shí)代的生產(chǎn)資料——數(shù)據(jù)資源。
然而目前,國(guó)內(nèi)外普遍對(duì)數(shù)據(jù)資源這一重要的生產(chǎn)資料重視程度不夠,行業(yè)規(guī)范不足,分享壁壘嚴(yán)重,缺乏長(zhǎng)期規(guī)劃。生產(chǎn)資料的匱乏,嚴(yán)重影響和制約了數(shù)字經(jīng)濟(jì)和智能化時(shí)代生產(chǎn)力的釋放,限制了行業(yè)的發(fā)展。
芯翌科技和清華大學(xué)的研究人員深刻認(rèn)識(shí)到數(shù)據(jù)資源對(duì)行業(yè)發(fā)展的重要性,合作推出了目前全球最大的公開人臉數(shù)據(jù)集——WebFace260M以及相應(yīng)的Benchmark。通過(guò)這個(gè)數(shù)據(jù)集,希望能夠助力AI時(shí)代科技創(chuàng)新,持續(xù)推動(dòng)智能化產(chǎn)業(yè)落地。同時(shí),也希望和整個(gè)學(xué)術(shù)界、產(chǎn)業(yè)界一起,打造智能化時(shí)代開放、共享、安全的數(shù)據(jù)生態(tài)。
END
推薦閱讀早報(bào) | 特斯拉無(wú)法剎車撞上護(hù)欄,售后實(shí)測(cè)也撞了!最新甩鍋:地面濕滑;華為以及孟晚舟方有4個(gè)鐵證 ;何小鵬回應(yīng)怒懟馬斯克