還在糾結(jié)深度學(xué)習(xí)算法?計(jì)算機(jī)視覺CV的關(guān)鍵在于數(shù)據(jù)采集和標(biāo)注!

發(fā)布時(shí)間:2024-02-23
2012年,alexnet網(wǎng)絡(luò)橫空出世,帶來了前所未有的深度學(xué)習(xí)革命,這也讓多年來進(jìn)展緩慢的計(jì)算機(jī)視覺cv研究,一下被按下了“快進(jìn)鍵”。
人們突然發(fā)現(xiàn),這種模擬人腦抽象和迭代過程的深度學(xué)習(xí)算法,讓計(jì)算機(jī)開始“看見”。從物體的邊緣、輪廓到物體的部分,再向更高級(jí)層層抽象,深度學(xué)習(xí)讓計(jì)算機(jī)終于能夠在一張日常照片中,檢測并識(shí)別出圖上有一只貓,而不是一條狗。
這樣的一小步,人類已經(jīng)等待了二十多年。2016-2018年,深度學(xué)習(xí)成為計(jì)算機(jī)視覺cv研究的算法“標(biāo)配”,人臉識(shí)別、圖像識(shí)別、視頻識(shí)別、物體跟蹤、行人檢測等cv技術(shù)得以進(jìn)一步突破,并快速應(yīng)用到安防、金融、汽車出行、泛娛樂等各個(gè)行業(yè)中。
如今,人們拿起手機(jī)刷臉支付、一鍵美顏、拍照識(shí)圖,背后都有計(jì)算機(jī)視覺cv技術(shù)的身影。而在更廣闊的行業(yè)市場,智慧城市、自動(dòng)駕駛、智能家居、智慧醫(yī)療等多種場景都在渴望計(jì)算機(jī)視覺cv技術(shù)更進(jìn)一步。
過去五年,計(jì)算機(jī)視覺cv領(lǐng)域一度成為國內(nèi)創(chuàng)投圈的“寵兒”。僅2018年,該領(lǐng)域融資額就高達(dá)230億。然而,這樣的盛景并沒有持續(xù)多久。
去年2月,計(jì)算機(jī)視覺奠基人alan l. yuille曾撰文表達(dá)他對當(dāng)下計(jì)算機(jī)視覺cv技術(shù)發(fā)展的擔(dān)憂。他認(rèn)為,計(jì)算機(jī)視覺的發(fā)展面臨瓶頸,深度學(xué)習(xí)在其中起到的作用有限,需要找到新的突破口。
從某種意義上來說,計(jì)算機(jī)視覺cv研究的確已經(jīng)進(jìn)入了瓶頸期。
計(jì)算機(jī)視覺cv困境:受限于ai數(shù)據(jù)的規(guī)模和質(zhì)量
在近幾年的發(fā)展中,圖像分類、對象檢測、目標(biāo)跟蹤、語義分割、實(shí)例分割等計(jì)算機(jī)視覺cv技術(shù)的核心任務(wù),其精確度已經(jīng)達(dá)到了產(chǎn)業(yè)落地的水平,但隨之而來的,卻是計(jì)算機(jī)視覺cv公司技術(shù)的同質(zhì)化。
京東集團(tuán)智能平臺(tái)部投資主管徐博曾表示,在全球范圍內(nèi),計(jì)算機(jī)視覺cv企業(yè)的技術(shù)都差不多,無論從中國還是美國發(fā)布的研究成果看,算法都是類似的。
業(yè)界關(guān)于計(jì)算機(jī)視覺cv技術(shù)已觸及天花板的討論越來越多,而源頭則統(tǒng)一指向了深度學(xué)習(xí)算法。由于深度學(xué)習(xí)高度依賴大量的標(biāo)注數(shù)據(jù),如果計(jì)算機(jī)視覺cv的精確度想要再提高,如:對非常小和模糊的目標(biāo)做檢測,在復(fù)雜光照變化下保證分割結(jié)果穩(wěn)定等,都需要分類更加細(xì)致、標(biāo)注更加細(xì)化的數(shù)據(jù)去“教導(dǎo)”深度學(xué)習(xí)算法。
不僅如此,在工業(yè)界,數(shù)據(jù)規(guī)模更容易成為算法研發(fā)的關(guān)鍵因素。如果有更多的數(shù)據(jù),就可以使用容量更大、更復(fù)雜的模型,得到效果更好的算法。當(dāng)數(shù)據(jù)大到一定程度,數(shù)據(jù)和算法之間可以進(jìn)行反復(fù)迭代,形成壁壘,為公司提供競爭力。
尷尬的是,在計(jì)算機(jī)視覺cv領(lǐng)域,可用數(shù)據(jù)的規(guī)模和質(zhì)量,遠(yuǎn)遠(yuǎn)達(dá)不到進(jìn)一步提升效果的需求。為了解決ai“數(shù)據(jù)荒”,業(yè)界嘗試過多種辦法,如:在少量數(shù)據(jù)基礎(chǔ)上增加特征生成新數(shù)據(jù);再或者,另辟蹊徑去攻克半監(jiān)督或無監(jiān)督學(xué)習(xí)。
但是,種種“曲線救國”的辦法,都解不了計(jì)算機(jī)視覺cv領(lǐng)域?qū)Ω哔|(zhì)量數(shù)據(jù)的“近渴”。落地到工業(yè)界,企業(yè)迫于市場競爭的壓力,對計(jì)算機(jī)視覺cv的感知能力要求還在提升,業(yè)界對大規(guī)模、高質(zhì)量ai數(shù)據(jù)的渴望空前強(qiáng)烈。
以人臉識(shí)別技術(shù)為例,云測數(shù)據(jù)總經(jīng)理賈宇航表示,2015-2016年,人工智能對人臉數(shù)據(jù)訓(xùn)練的還相對粗放。但到了現(xiàn)在這個(gè)階段,由于人工智能應(yīng)用場景的多樣性,對不同年齡、性別、膚色,不同的光線、角度的場景化要求越來越復(fù)雜,而且拍攝設(shè)備也隨著手機(jī)、相機(jī)的不斷進(jìn)化,從單鏡頭到雙鏡頭甚至增加了3d攝像設(shè)備,算法訓(xùn)練對數(shù)據(jù)的要求變得更加精細(xì)、豐富更加具有策略性。
場景化ai數(shù)據(jù):量身定制的數(shù)據(jù)采集和標(biāo)注
事實(shí)上,如今各大企業(yè)在ai產(chǎn)品上的競爭,本質(zhì)上已經(jīng)變成了ai數(shù)據(jù)之爭。
在智能安防領(lǐng)域,產(chǎn)品可以分為監(jiān)控、探測、防護(hù)等等,而視頻監(jiān)控則占據(jù)了其中大頭部分?,F(xiàn)有攝像頭囊括了大量的行人、機(jī)動(dòng)車、自行車等道路場景數(shù)據(jù),而預(yù)警作為智能安防的重要作用之一,則需要識(shí)別諸如:老人摔倒、搶劫、打架、著火等稀有的小場景數(shù)據(jù)。顯然,這種長尾場景的數(shù)據(jù),需要在特定條件下的才能獲取。
在人機(jī)交互領(lǐng)域,除了常規(guī)的語音、動(dòng)作識(shí)別等,很多前沿研究希望通過情緒識(shí)別的方式,感知用戶的心理狀態(tài),進(jìn)而優(yōu)化人機(jī)交互的體驗(yàn)。相對應(yīng)的,人類在各種特定條件下的喜怒哀樂哭笑等精細(xì)的情緒數(shù)據(jù),仍缺乏規(guī)模和質(zhì)量。
在自動(dòng)駕駛領(lǐng)域,由于涉及到駕駛安全,對場景化的數(shù)據(jù)要求更為精細(xì)。以圖像識(shí)別為例,在佐治亞理工學(xué)院的一項(xiàng)研究中,通過對8個(gè)圖像識(shí)別系統(tǒng)的測試,發(fā)現(xiàn)自動(dòng)駕駛汽車的傳感器和攝像頭,更善于檢測膚色較淺的人,而膚色較深被檢測出的準(zhǔn)確率平均會(huì)低5%%u3002
但從技術(shù)角度來看,計(jì)算機(jī)視覺cv是通過rgb或rgbd識(shí)別人/物體的信息,其中黑色是最難被識(shí)別的?,F(xiàn)實(shí)中,由于黑色及深色的數(shù)據(jù)稀少,導(dǎo)致算法模型不夠精確,最終在實(shí)際落地應(yīng)用時(shí)出現(xiàn)差錯(cuò)。
為了獲得規(guī)?;?、高質(zhì)量的ai數(shù)據(jù),工業(yè)界開始尋求一種更具專業(yè)化的數(shù)據(jù)獲取方式,即通過定制的數(shù)據(jù)采集和標(biāo)注,來獲取特定的場景化數(shù)據(jù)。據(jù)云測數(shù)據(jù)總經(jīng)理賈宇航介紹,現(xiàn)階段ai數(shù)據(jù)有著三個(gè)大趨勢:
第一,場景的多元化?;诋a(chǎn)品落地場景,盡可能模擬各種各樣的特定條件,如:光線強(qiáng)度、拍攝角度、噪聲要求、室內(nèi)室外等,以覆蓋豐富多樣的場景,甚至是長尾場景的數(shù)據(jù)需求;
第二,樣本的多樣性。以人的數(shù)據(jù)為例,人是一個(gè)非常多元化的物種,有不同的年齡、人種、性別、國籍等等,除此之外還涉及廣泛的數(shù)據(jù)類型,包括圖片、視頻、音頻、文本數(shù)據(jù)。如果想要發(fā)揮人工智能的普惠性,用ai產(chǎn)品服務(wù)好各種人群,就需要豐富多樣化的樣本。
第三,數(shù)據(jù)的多維化。隨著技術(shù)和行業(yè)的發(fā)展,以智能駕駛領(lǐng)域數(shù)據(jù)需求為例,業(yè)界已逐漸從單攝像頭過渡到多攝像頭的方案。但是2d圖像對于物體的測距仍有著很大的局限性,因此也出現(xiàn)了與激光雷達(dá)、超聲波雷達(dá)等3d傳感器的融合。通過多維度的采集硬件設(shè)備,幫助更多維度數(shù)據(jù)融合加速場景的落地。
目前,處于ai產(chǎn)品落地前夕或者處于重大迭代周期的企業(yè),已經(jīng)開始大力投入場景化數(shù)據(jù)用于算法的訓(xùn)練。以汽車行業(yè)為例,數(shù)據(jù)場景化定制主要集中在ai落地的兩個(gè)方向:自動(dòng)駕駛和車內(nèi)智能駕駛倉。
在自動(dòng)駕駛方向上,業(yè)界對行駛安全尤為關(guān)注,因此加大了對道路上長尾場景的覆蓋,如:行人出現(xiàn)在馬路中間、孩子突然在車前摔倒等,這決定了自動(dòng)駕駛車輛能否及時(shí)識(shí)別出這些狀況,并完成相應(yīng)的控制決策。而在疫情期間,大街上出現(xiàn)了大量戴口罩的行人,這類場景也需要相對應(yīng)的數(shù)據(jù)進(jìn)行算法模型訓(xùn)練。
而在車內(nèi)智能駕駛倉方向上,企業(yè)比拼的是車內(nèi)智能和互動(dòng)的體驗(yàn),如:通過手勢識(shí)別、語音識(shí)別、情緒識(shí)別等ai技術(shù),來關(guān)注車內(nèi)駕駛員是否疲勞駕駛、車內(nèi)是否會(huì)出現(xiàn)爭吵等危險(xiǎn)事件,以便做到及時(shí)識(shí)別和干預(yù)。
事實(shí)上,道路情況千變?nèi)f化。云測數(shù)據(jù)通過自建的“場景實(shí)驗(yàn)室”的方式還原現(xiàn)實(shí)場景,幫助算法模型盡可能多地覆蓋不同場景下的多維數(shù)據(jù),從而提高自動(dòng)駕駛車輛的安全性。而這樣高質(zhì)量的場景化數(shù)據(jù),才得以幫助企業(yè)真正的商業(yè)化落地。
云測數(shù)據(jù):場景化ai數(shù)據(jù)采標(biāo)的引領(lǐng)者
如今,越來越多的行業(yè)在與人工智能技術(shù)結(jié)合。企業(yè)為了保持優(yōu)勢,打造持續(xù)的ai競爭力,開始與ai數(shù)據(jù)服務(wù)商緊密合作,以獲得更高質(zhì)量的場景ai數(shù)據(jù)來進(jìn)行產(chǎn)品落地前的優(yōu)化。
根據(jù)艾瑞《中國人工智能基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)白皮書》顯示,2018 年,數(shù)據(jù)資源定制服務(wù)已在基礎(chǔ)數(shù)據(jù)服務(wù)市場占據(jù)86.2%%u7684份額。各個(gè)行業(yè)的頭部企業(yè)更是一馬當(dāng)先,都在為場景化ai數(shù)據(jù)“下血本”。
目前,眾多ai巨頭、車企巨頭、大型金融機(jī)構(gòu)、互聯(lián)網(wǎng)企業(yè)以及傳統(tǒng)企業(yè)等等,都與云測數(shù)據(jù)建立了良好的合作伙伴關(guān)系。
一旦數(shù)據(jù)采集和標(biāo)注變成專業(yè)化、高質(zhì)量的服務(wù),交付的數(shù)據(jù)就需要在數(shù)據(jù)的規(guī)模、質(zhì)量、時(shí)效性上充分滿足服務(wù)企業(yè)的需求,來助力ai產(chǎn)品達(dá)到商業(yè)化落地的標(biāo)準(zhǔn),而這正是云測數(shù)據(jù)的優(yōu)勢所在。
據(jù)悉,云測數(shù)據(jù)作為國內(nèi)數(shù)據(jù)采集和標(biāo)注領(lǐng)域頭部的服務(wù)商,在創(chuàng)立之初恰逢自動(dòng)駕駛、智能音箱等ai應(yīng)用趨勢興起,各大企業(yè)需要大量的計(jì)算機(jī)視覺cv數(shù)據(jù)以打磨自己的算法和ai能力,由此計(jì)算機(jī)視覺cv也成為云測數(shù)據(jù)至今深耕最久、經(jīng)驗(yàn)最豐富的領(lǐng)域之一。
雖然與文本、語音等數(shù)據(jù)類型相比,計(jì)算機(jī)視覺cv數(shù)據(jù)的維度很多,可以說是數(shù)據(jù)品類最復(fù)雜的一個(gè)領(lǐng)域,但長期與行業(yè)眾多企業(yè)的緊密合作,讓云測數(shù)據(jù)持續(xù)保持著全品類cv數(shù)據(jù)采集和標(biāo)注的優(yōu)勢。
為了提供更為專業(yè)的服務(wù),云測數(shù)據(jù)自建數(shù)據(jù)基地和場景實(shí)驗(yàn)室的方式,打造出ai領(lǐng)域的數(shù)據(jù)“夢工廠”。
結(jié)合標(biāo)準(zhǔn)化的作業(yè)流程,并配以專業(yè)的標(biāo)注工具和平臺(tái),云測數(shù)據(jù)在華東、華南、華北自建的數(shù)據(jù)標(biāo)注基地和場景實(shí)驗(yàn)室,是高效率和高質(zhì)量數(shù)據(jù)交付的強(qiáng)力保障。
其實(shí)對于數(shù)據(jù)標(biāo)注,不同的人有不同的理解,例如:什么樣的光線叫做強(qiáng)光線,在判斷上有很強(qiáng)的主觀性。為了保證企業(yè)客戶和標(biāo)注人員的理解達(dá)成一致,云測數(shù)據(jù)的項(xiàng)目經(jīng)理保持著實(shí)時(shí)的溝通和反饋,并配合行業(yè)培訓(xùn)師對標(biāo)注員們進(jìn)行前期培訓(xùn),以確保在標(biāo)注時(shí)具有領(lǐng)域?qū)I(yè)知識(shí)。在確立了數(shù)據(jù)標(biāo)注標(biāo)準(zhǔn)后,標(biāo)注員全程在線上標(biāo)注系統(tǒng)里完成作業(yè),并最終經(jīng)過層層質(zhì)檢以保證數(shù)據(jù)標(biāo)注的準(zhǔn)確性。
以自動(dòng)駕駛為例,為了讓機(jī)器“看見”復(fù)雜道路環(huán)境中的車道線、路標(biāo)、障礙物、行人、十字路口,以及一些長尾場景如:闖紅燈車輛、橫穿馬路的行人、路邊違章??康能囕v等,數(shù)據(jù)標(biāo)
上一個(gè):中文網(wǎng)址 注冊去哪里比較好?
下一個(gè):華碩刷bios方法(華碩主板刷bios怎么刷)

三星note3怎么剪卡,三星s5如何剪卡
故意傷害罪屬于什么犯罪類型
教你給chrome瀏覽器進(jìn)行安全設(shè)置的方法
農(nóng)村婚宴菜單16個(gè)菜有哪些
電氣設(shè)備地線的設(shè)計(jì)要點(diǎn)
香港買蘋果怎么預(yù)約嗎,現(xiàn)在去香港買IPHONE4S 和IPAD2 還需不需要預(yù)約和證件
園林植物的色彩藝術(shù)簡評(píng)
職工醫(yī)療保險(xiǎn)斷交一個(gè)月有什么影響嗎
何為普洱秋茶?普洱秋茶好在哪里?
家庭花木的植株矮化
十八禁 网站在线观看免费视频_2020av天堂网_一 级 黄 色 片免费网站_绝顶高潮合集Videos