
CDA數據分析師 出品
編譯:Mika
十年前,研究人員認為讓計算機來區分貓和狗幾乎是不可能的。如今,計算機視覺識別的準確率已超過99%。Joseph Redmon通過一個叫YOLO的開源目標檢測方法,可以迅速識別圖像和視頻中的目標。
10年前,計算機視覺研究者認為,要讓一臺電腦去分辨出一只貓和狗的不同之處,這幾乎是不可能的,即便是在當時人工智能已經取得了重大突破的情況下。
Joseph Redmon家養的貓
Joseph Redmon家養的狗
但如今我們已經可以做到讓它的正確率在99%以上。這個方法叫做圖像分類,給它一張圖,再給這張圖貼上標簽。通過這種方式,計算機就可以知道數千種的分類。
我是華盛頓大學的一名研究生,我正致力于一個名叫Darknet的項目,這是一個用來訓練和測試計算機視覺模型的神經網絡結構。
Joseph Redmon所進行的Darknet項目
讓我們來看看Darknet是如何看待這張圖片。
當我們在這張圖片上運行識別器時,我們注意到,它不僅能判斷出圖片上是貓是狗,還能給出它是哪個品種的預測。這就是我們目前所達到的粒度級別。
它的預測是正確的,我的狗的確是一只阿拉斯加雪橇犬。
很明顯,我們在圖像識別上取得了驚人的進步。但是如果我們對這樣一張圖片運行識別器,會如何呢?
看一下,我們看到識別器給出了一個非常相似的預測。而且是正確的,圖中是有一只阿拉斯加雪橇犬。但只使用這一個標簽,我們并不能真正的了解這張圖片,我們需要更強大的檢測器。
我正在研究一個叫做目標檢測的問題,也就是嘗試將一張圖上的所有目標物都找出來,然后將它們分別框起來,再加上標注。
這就是我們對這張照片運行檢測器時所發生的?;谶@樣的結果,我們可以用計算機視覺算法做更多的事情。
我們發現,它知道這里有一只貓和一只狗。知道它們的相對位置,它們的大小,甚至還知道一些額外的信息,例如背景里有一本書。
如果你想建立一個基于計算機視覺的系統,比如說無人駕駛汽車或者機器人系統,這就是你想要得到的信息。你需要一個能與物質世界互動的系統。
當我最開始開展目標檢測項目時,它要花20秒去處理一張圖片。
為了理解為什么速度在這個領域是如此重要。舉一個例子,這是一個2秒鐘就能處理一張圖片的檢測器。這個檢測器的速度要比處理每張圖需要20秒的檢測器快10倍??梢钥吹皆谒龀鲱A測的時候,被檢測的世界已經發生變化了。這對于一個應用來說是沒有多大用處的。
每2秒處理一張圖
如果我們將它的速度再提升10倍,這個檢測器每秒可處理5張畫面,這就好很多了。
每秒處理5張圖
但是,舉個例子。如果有任何重大的移動,它就反應不過來了。我可不想讓這樣的一個系統來駕駛我的汽車。
這是在我電腦上運行的實時檢測系統。當我在移動時,它能順利地追蹤我。而且它強大到能適應不同的物體大小、姿勢、向前、向后的改變,很了不起。
實時檢測系統
如果我們想要建造一個基于計算機視覺的系統,那么這就是我們真正需要的。
僅僅是幾年的時間,我們就從每張圖20秒提升到了每張圖20毫秒,速度提高了1000倍。我們是如何做到的呢?
過去,目標檢測系統會將這張圖片分成很多小區域,然后在每一塊區域運行一下識別器。在識別器中獲得最高分數的輸出就會被認為是這張圖片的檢測結果。這涉及到要在一張圖片上運行數千次識別器,以及數千次的神經網絡評估才能獲得檢測結果。
而現在,我們訓練了可以做出所有檢測的單一網絡,它能同時生成邊界盒和類別概率。
使用我們的系統,不需要為了生成檢測結果去重復上千數次地看同一張圖片,只看一次就行了。這也是為什么我們稱之為,目標檢測的"YOLO(you only look once)法"(只看一次)。
有了這個速度,我們就不僅限于識別圖像了,還可以實時處理視頻?,F在我們不僅看到了貓和狗,還能看到它們走來走去,互相嘻戲。
這是一個我們在微軟的COCO數據庫上,用80種不同種類的物品訓練過的檢測器。包含了各種東西,像勺子、叉子、碗等常見物品。
還有各種奇特的東西,動物、汽車、斑馬、長頸鹿。
現在我們要做點兒有趣的事情,我們的攝像頭將要對準觀眾區看看能檢測出什么。
我們把檢測閥值調低一點,這樣就可以找出更多的觀眾??聪挛覀兡懿荒苷页鲞@些停車標志,我們發現了一些背包。所有這些都是在電腦上實時處理的。
請大家記住,這是一個通用的目標檢測系統。因此我們可以將它訓練用于任何領域的圖像識別。
我們在無人駕駛汽車中,用來發現停車標志 行人和自行車的代碼,同樣可以用于在組織活檢中找出癌細胞。全球已經有很多研究者正在利用這一技術在醫學、機器人學等方面取得了進展。
今天早上,我剛讀到一篇文章,人們在內羅畢國家公園對動物數量進行普查,使用了YOLO作為檢測系統的一部分。因為Darknet是一個開源項目,在公共領域任何人都可以免費使用。
但是我們想要讓檢測器能被更多人使用,也更好用因此通過結合模型優化,網絡二值化和近似法,我們實際上已經可以在手機上進行目標檢測了。
我真的很激動,因為我們在初級計算機視覺問題上有了強大的解決方案,同時任何人都可以使用它來做些什么。
接下來就看所有在座的各位,以及世界上所有能夠使用這個軟件的人了。我已經等不及想要看看,人們會用這一技術創造出什么來了,謝謝大家。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25在當今數字化時代,數據分析師的重要性與日俱增。但許多人在踏上這條職業道路時,往往充滿疑惑: 如何成為一名數據分析師?成為 ...
2025-04-24以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《劉靜:10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda ...
2025-04-23