曠視科技奪獲人工智能頂賽Wider Challenge人臉檢測

發(fā)布時間:2024-12-29
wider face and pedestrian challenge 2018(簡稱 wider challenge)是一項范圍內的計算機視覺賽事,曠視科技(megvii)參戰(zhàn)了其中人臉檢測比賽 wider face,終以 0.5582 的成績技壓群雄,勇奪人臉檢測。曠視科技人臉檢測紀錄早可追溯至 2013 年贏得人臉識別領域 3 項世界。下面,本文將從比賽、技術、團隊以及產業(yè) 4 個維度展開解讀。
wider face 比賽結果
關于 wider challenge
wider challenge 2018 是由計算機視覺頂會 eccv 2018 舉辦的挑戰(zhàn)賽之一,吸引超過 400 多支隊伍參加,比賽及結果公布于 eccv 會前完成,頒獎儀式及相關研討會安排在大會期間(9 月 8 號)。繼 fddb 之后,wider challenge 成為計算機視覺檢測領域的基準比賽,含金量很高,在一定程度上可以清晰反映參賽方技術力量的實況和積淀。
今年,該比賽旨在解決人體檢測領域的 3 個核心問題:人臉的定位,人體的定位,以及人物身份匹配。為此,wider challenge 2018 相應地分為 3 個比賽(track):
wider face, 目標是深掘新方法,刷新人臉檢測當前佳水平。
wider pedestrian, 目標是收集有效而的新方法,優(yōu)化解決自然場景之下的行人檢測問題。
wider person search, 從 192 部電影中進行目標匹配的人物搜索。
自左向右,三個比賽的實例
關于技術
從技術角度講,這次的人臉檢測比賽 wider face 出現(xiàn)了新難點,為此曠視科技給出了一套自己的解決方案,取得名的成績,超越第二名微軟(msra)2 個點。
1、難點
相比以往,wider face 2018 有 2 個顯著的難點。一是數(shù)據(jù)集,二是評估標準。
wider face 比賽使用同名數(shù)據(jù)集,它開源于 cvpr 2016,包含 32,203 張圖像和 393,703 個檢測框標注,是當前不同場景之下人臉類別跨度大的數(shù)據(jù)集,從小臉密集臉、多姿態(tài)臉、遮擋臉、表情臉、化妝臉到模糊臉,。
wider face 數(shù)據(jù)集中不同類別的人臉
前人臉檢測基準 fddb 由于數(shù)據(jù)量小且簡單退出之后,wider face 晉級為人臉檢測領域科學、的基準數(shù)據(jù)集,同時今年還進行了一些優(yōu)化標注甚至是重新標注,堪稱是人臉檢測能力比拼的佳平臺。顯而易見,比賽難度也加大很多。
wider face 2018 評估標準沿用 coco 規(guī)范,更細致更嚴格,對定位要求更高,不僅要大概準,還要非常準,甚至是“變態(tài)準”。具體來講,它不再只使用 ap_50,而是計算檢測框 iou 閾值超過 10 的平均精度,從 ap_50 到 ap_95(步長為 5,共 10 個 ap)進行加權求平均值。這再次加大了比賽奪冠的難度。
2、方法
鑒于上述兩個新挑戰(zhàn),曠視科技在技術沉淀的基礎上,從算法模型、backbone 以及數(shù)據(jù)增強 3 個方面給出了原創(chuàng)性的解決方案。
曠視科技作為 coco ,在物體檢測方面“家底”極厚,身經百戰(zhàn),形成了一套的“演練作戰(zhàn)傳統(tǒng)”。此次針對 wider face 人臉檢測的小臉、模糊臉問題,曠視科技提出一種基于單階段檢測器的新方法,稱之為級聯(lián)檢測網絡(cascade detection network)。
在 backbone 以及數(shù)據(jù)增強方面,曠視同樣做了新探索。比如 backbone 避重就輕,沒有選擇 resnet 101,而是采用了像 densenet 121、 resnet 50 這樣相對輕量化的基礎網絡,或者多個輕模型的融合。曠視科技后續(xù)會針對性地出一篇論文,想了解更多的人請留意關注。
3、結果
通過上述原創(chuàng)技術,曠視科技比賽結果優(yōu)勢明顯,不僅奪得名,成績還大幅超過第二名、第三名,分別高出 2 個點和 5 個點。另外,曠視科技單模型和多模型結果都提交過,結果表明,即使是按照單模型,同樣可以拿到。
值得一提的是,曠視科技上層技術的創(chuàng)新源自底層技術和原創(chuàng)深度學習平臺的支撐。這次打賽過程中,曠視科技自研的深度學習云平臺 brain++ 有力保障了模型訓練的穩(wěn)定性;原創(chuàng)的深度學習引擎(先于 tensorflow)則保證快速地訓練和測試模型,避免時耗。正是因為有后方的保障,才有前方的勝利。
關于團隊
打比賽就像打仗一樣,是一支隊伍,需要團隊協(xié)作。但是曠視這次的比賽,也僅僅動用了 1.5 名實習小礦工:一個為主,一個為輔(外加檢測組負責人和研究員的指導)。這種實習生沖在一線的打賽模式是一種鍛煉和培養(yǎng)新人成長的寶貴機會。名的成績也反證了這種模式的科學性。
1.5 名實習生,這并不是說曠廠缺人,也不是輕視打賽,這恰恰說明了曠廠有一套完備的“演練打賽機制”,不僅節(jié)約了大量人力和時間成本,而且納入這套機制的每一方皆有所獲。本質上這是一種的經驗傳承,實習生獲得大量輸入,再經由天賦的腦瓜,輸出名的成績,由此借假(比賽)修真(能力提升),人與事兩相成。
關于產業(yè)
人臉檢測在曠視的整個計算機視覺技術矩陣中處于中層,屬于核心算法之一,經過工程化包裝或者硬件的加持,形成可復制的模型框架,從而終走向人臉相關的產品線。
人臉檢測是機器視覺技術落地的大場景之一,是曠視圖像識別技術的四大對象之一(人、臉、車、字),也是曠視 ai+iot 戰(zhàn)略中承上啟下的一環(huán)。這一成績所反映出的技術點創(chuàng)新將進一步優(yōu)化曠視的整個技術體系,導向手機、安防、地產、零售等多個產業(yè)領域,為達成 ai+iot 戰(zhàn)略提供了有力的技術支撐。
上一個:桂花樹的扦插技術
下一個:雙十一預售和當天買哪個劃算

熱收縮套膜包裝機-全自動POF膜塑封機
成都:關于加強揚塵污染防治工作的實施意見
緊固件的選擇與安裝
制備型高壓輸液泵LDX-LP0310
茉莉花甘草茶
不銹鋼燒結氈創(chuàng)新說明
動態(tài)消毒水工作站呵護石榴酒食品安全,讓食品遠離微生物污染
白露茶怎么喝
國際物流中的海關清關流程是怎樣的?
寄快遞到法蘭克福(寄快遞到斯洛伐克)
十八禁 网站在线观看免费视频_2020av天堂网_一 级 黄 色 片免费网站_绝顶高潮合集Videos