熱線電話:13121318867

登錄
首頁大數據時代從貓狗不分到實時識別準確率超99%,計算機圖像是如何做到的?
從貓狗不分到實時識別準確率超99%,計算機圖像是如何做到的?
2021-03-01
收藏

CDA數據分析師 出品

編譯:Mika

從貓狗不分到實時識別<a href='/map/zhunquelv/' style='color:#000;font-size:inherit;'>準確率</a>超99%,計算機圖像是如何做到的?

【導讀】

十年前,研究人員認為讓計算機來區分貓和狗幾乎是不可能的。如今,計算機視覺識別的準確率已超過99%。Joseph Redmon通過一個叫YOLO的開源目標檢測方法,可以迅速識別圖像和視頻中的目標。

10年前,計算機視覺研究者認為,要讓一臺電腦去分辨出一只貓和狗的不同之處,這幾乎是不可能的,即便是在當時人工智能已經取得了重大突破的情況下。

從貓狗不分到實時識別<a href='/map/zhunquelv/' style='color:#000;font-size:inherit;'>準確率</a>超99%,計算機圖像是如何做到的?

Joseph Redmon家養的貓

從貓狗不分到實時識別<a href='/map/zhunquelv/' style='color:#000;font-size:inherit;'>準確率</a>超99%,計算機圖像是如何做到的?

Joseph Redmon家養的狗

但如今我們已經可以做到讓它的正確率在99%以上。這個方法叫做圖像分類,給它一張圖,再給這張圖貼上標簽。通過這種方式,計算機就可以知道數千種的分類。

我是華盛頓大學的一名研究生,我正致力于一個名叫Darknet的項目,這是一個用來訓練和測試計算機視覺模型的神經網絡結構。

從貓狗不分到實時識別<a href='/map/zhunquelv/' style='color:#000;font-size:inherit;'>準確率</a>超99%,計算機圖像是如何做到的?

Joseph Redmon所進行的Darknet項目

讓我們來看看Darknet是如何看待這張圖片。

從貓狗不分到實時識別<a href='/map/zhunquelv/' style='color:#000;font-size:inherit;'>準確率</a>超99%,計算機圖像是如何做到的?

當我們在這張圖片上運行識別器時,我們注意到,它不僅能判斷出圖片上是貓是狗,還能給出它是哪個品種的預測。這就是我們目前所達到的粒度級別。

它的預測是正確的,我的狗的確是一只阿拉斯加雪橇犬。

很明顯,我們在圖像識別上取得了驚人的進步。但是如果我們對這樣一張圖片運行識別器,會如何呢?

從貓狗不分到實時識別<a href='/map/zhunquelv/' style='color:#000;font-size:inherit;'>準確率</a>超99%,計算機圖像是如何做到的?

看一下,我們看到識別器給出了一個非常相似的預測。而且是正確的,圖中是有一只阿拉斯加雪橇犬。但只使用這一個標簽,我們并不能真正的了解這張圖片,我們需要更強大的檢測器。

我正在研究一個叫做目標檢測的問題,也就是嘗試將一張圖上的所有目標物都找出來,然后將它們分別框起來,再加上標注。

這就是我們對這張照片運行檢測器時所發生的?;谶@樣的結果,我們可以用計算機視覺算法做更多的事情。

我們發現,它知道這里有一只貓和一只狗。知道它們的相對位置,它們的大小,甚至還知道一些額外的信息,例如背景里有一本書。

從貓狗不分到實時識別<a href='/map/zhunquelv/' style='color:#000;font-size:inherit;'>準確率</a>超99%,計算機圖像是如何做到的?

如果你想建立一個基于計算機視覺的系統,比如說無人駕駛汽車或者機器人系統,這就是你想要得到的信息。你需要一個能與物質世界互動的系統。

速度對于目標檢測至關重要

當我最開始開展目標檢測項目時,它要花20秒去處理一張圖片。

為了理解為什么速度在這個領域是如此重要。舉一個例子,這是一個2秒鐘就能處理一張圖片的檢測器。這個檢測器的速度要比處理每張圖需要20秒的檢測器快10倍??梢钥吹皆谒龀鲱A測的時候,被檢測的世界已經發生變化了。這對于一個應用來說是沒有多大用處的。

從貓狗不分到實時識別<a href='/map/zhunquelv/' style='color:#000;font-size:inherit;'>準確率</a>超99%,計算機圖像是如何做到的?

每2秒處理一張圖

如果我們將它的速度再提升10倍,這個檢測器每秒可處理5張畫面,這就好很多了。

從貓狗不分到實時識別<a href='/map/zhunquelv/' style='color:#000;font-size:inherit;'>準確率</a>超99%,計算機圖像是如何做到的?

每秒處理5張圖

但是,舉個例子。如果有任何重大的移動,它就反應不過來了。我可不想讓這樣的一個系統來駕駛我的汽車。

這是在我電腦上運行的實時檢測系統。當我在移動時,它能順利地追蹤我。而且它強大到能適應不同的物體大小、姿勢、向前、向后的改變,很了不起。

從貓狗不分到實時識別<a href='/map/zhunquelv/' style='color:#000;font-size:inherit;'>準確率</a>超99%,計算機圖像是如何做到的?

實時檢測系統

如果我們想要建造一個基于計算機視覺的系統,那么這就是我們真正需要的。

僅僅是幾年的時間,我們就從每張圖20秒提升到了每張圖20毫秒,速度提高了1000倍。我們是如何做到的呢?

目標檢測將圖片分成小區域進行識別

過去,目標檢測系統會將這張圖片分成很多小區域,然后在每一塊區域運行一下識別器。在識別器中獲得最高分數的輸出就會被認為是這張圖片的檢測結果。這涉及到要在一張圖片上運行數千次識別器,以及數千次的神經網絡評估才能獲得檢測結果。

從貓狗不分到實時識別<a href='/map/zhunquelv/' style='color:#000;font-size:inherit;'>準確率</a>超99%,計算機圖像是如何做到的?

而現在,我們訓練了可以做出所有檢測的單一網絡,它能同時生成邊界盒和類別概率。

使用我們的系統,不需要為了生成檢測結果去重復上千數次地看同一張圖片,只看一次就行了。這也是為什么我們稱之為,目標檢測的"YOLO(you only look once)法"(只看一次)。

從貓狗不分到實時識別<a href='/map/zhunquelv/' style='color:#000;font-size:inherit;'>準確率</a>超99%,計算機圖像是如何做到的?

有了這個速度,我們就不僅限于識別圖像了,還可以實時處理視頻?,F在我們不僅看到了貓和狗,還能看到它們走來走去,互相嘻戲。

從貓狗不分到實時識別<a href='/map/zhunquelv/' style='color:#000;font-size:inherit;'>準確率</a>超99%,計算機圖像是如何做到的?

這是一個我們在微軟的COCO數據庫上,用80種不同種類的物品訓練過的檢測器。包含了各種東西,像勺子、叉子、碗等常見物品。

從貓狗不分到實時識別<a href='/map/zhunquelv/' style='color:#000;font-size:inherit;'>準確率</a>超99%,計算機圖像是如何做到的?

還有各種奇特的東西,動物、汽車、斑馬、長頸鹿。

從貓狗不分到實時識別<a href='/map/zhunquelv/' style='color:#000;font-size:inherit;'>準確率</a>超99%,計算機圖像是如何做到的?

現在我們要做點兒有趣的事情,我們的攝像頭將要對準觀眾區看看能檢測出什么。

我們把檢測閥值調低一點,這樣就可以找出更多的觀眾??聪挛覀兡懿荒苷页鲞@些停車標志,我們發現了一些背包。所有這些都是在電腦上實時處理的。

從貓狗不分到實時識別<a href='/map/zhunquelv/' style='color:#000;font-size:inherit;'>準確率</a>超99%,計算機圖像是如何做到的?

請大家記住,這是一個通用的目標檢測系統。因此我們可以將它訓練用于任何領域的圖像識別。

拓展到自動駕駛汽車、機器人甚至癌癥檢測等應用領域

我們在無人駕駛汽車中,用來發現停車標志 行人和自行車的代碼,同樣可以用于在組織活檢中找出癌細胞。全球已經有很多研究者正在利用這一技術在醫學、機器人學等方面取得了進展。

今天早上,我剛讀到一篇文章,人們在內羅畢國家公園對動物數量進行普查,使用了YOLO作為檢測系統的一部分。因為Darknet是一個開源項目,在公共領域任何人都可以免費使用。

但是我們想要讓檢測器能被更多人使用,也更好用因此通過結合模型優化,網絡二值化和近似法,我們實際上已經可以在手機上進行目標檢測了。

從貓狗不分到實時識別<a href='/map/zhunquelv/' style='color:#000;font-size:inherit;'>準確率</a>超99%,計算機圖像是如何做到的?

我真的很激動,因為我們在初級計算機視覺問題上有了強大的解決方案,同時任何人都可以使用它來做些什么。

接下來就看所有在座的各位,以及世界上所有能夠使用這個軟件的人了。我已經等不及想要看看,人們會用這一技術創造出什么來了,謝謝大家。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢