国产色频,国产网站精品,成人在线综合网,精品一区二区三区毛片,亚洲无卡视频,黄色av观看,亚洲福利影视

干貨 | 目標(biāo)檢測(cè)入門,看這篇就夠了(導(dǎo)言)

2018-03-19 16:57:20 csdn  點(diǎn)擊量: 評(píng)論 (0)
近年來(lái),深度學(xué)習(xí)模型逐漸取代傳統(tǒng)機(jī)器視覺(jué)方法而成為目標(biāo)檢測(cè)領(lǐng)域的主流算法,本系列文章將回顧早期的經(jīng)典工作,并對(duì)較新的趨勢(shì)做一個(gè)全景

近年來(lái),深度學(xué)習(xí)模型逐漸取代傳統(tǒng)機(jī)器視覺(jué)方法而成為目標(biāo)檢測(cè)領(lǐng)域的主流算法,本系列文章將回顧早期的經(jīng)典工作,并對(duì)較新的趨勢(shì)做一個(gè)全景式的介紹,幫助讀者對(duì)這一領(lǐng)域建立基本的認(rèn)識(shí)。

 

導(dǎo)言:目標(biāo)檢測(cè)的任務(wù)表述

 

如何從圖像中解析出可供計(jì)算機(jī)理解的信息,是機(jī)器視覺(jué)的中心問(wèn)題。深度學(xué)習(xí)模型由于其強(qiáng)大的表示能力,加之?dāng)?shù)據(jù)量的積累和計(jì)算力的進(jìn)步,成為機(jī)器視覺(jué)的熱點(diǎn)研究方向。

 

那么,如何理解一張圖片?根據(jù)后續(xù)任務(wù)的需要,有三個(gè)主要的層次。

 

 

圖像理解的三個(gè)層次

 

一是分類(Classification),即是將圖像結(jié)構(gòu)化為某一類別的信息,用事先確定好的類別(string)或?qū)嵗齀D來(lái)描述圖片。這一任務(wù)是最簡(jiǎn)單、最基礎(chǔ)的圖像理解任務(wù),也是深度學(xué)習(xí)模型最先取得突破和實(shí)現(xiàn)大規(guī)模應(yīng)用的任務(wù)。其中,ImageNet是最權(quán)威的評(píng)測(cè)集,每年的ILSVRC催生了大量的優(yōu)秀深度網(wǎng)絡(luò)結(jié)構(gòu),為其他任務(wù)提供了基礎(chǔ)。在應(yīng)用領(lǐng)域,人臉、場(chǎng)景的識(shí)別等都可以歸為分類任務(wù)。

 

二是檢測(cè)(Detection)。分類任務(wù)關(guān)心整體,給出的是整張圖片的內(nèi)容描述,而檢測(cè)則關(guān)注特定的物體目標(biāo),要求同時(shí)獲得這一目標(biāo)的類別信息和位置信息。相比分類,檢測(cè)給出的是對(duì)圖片前景和背景的理解,我們需要從背景中分離出感興趣的目標(biāo),并確定這一目標(biāo)的描述(類別和位置),因而,檢測(cè)模型的輸出是一個(gè)列表,列表的每一項(xiàng)使用一個(gè)數(shù)據(jù)組給出檢出目標(biāo)的類別和位置(常用矩形檢測(cè)框的坐標(biāo)表示)。

 

三是分割(Segmentation)。分割包括語(yǔ)義分割(semantic segmentation)和實(shí)例分割(instance segmentation),前者是對(duì)前背景分離的拓展,要求分離開具有不同語(yǔ)義的圖像部分,而后者是檢測(cè)任務(wù)的拓展,要求描述出目標(biāo)的輪廓(相比檢測(cè)框更為精細(xì))。分割是對(duì)圖像的像素級(jí)描述,它賦予每個(gè)像素類別(實(shí)例)意義,適用于理解要求較高的場(chǎng)景,如無(wú)人駕駛中對(duì)道路和非道路的分割。

 

本系列文章關(guān)注的領(lǐng)域是目標(biāo)檢測(cè),即圖像理解的中層次。

 
大云網(wǎng)官方微信售電那點(diǎn)事兒

責(zé)任編輯:售電衡衡

免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與本站無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。
我要收藏
個(gè)贊
?