熱線電話:13121318867

登錄
首頁精彩閱讀神經網絡的優點和缺點
神經網絡的優點和缺點
2018-04-28
收藏

神經網絡的優點和缺點

深度學習目前大受追捧。人們總想在各個方面使用神經網絡,但它們總是正確的選擇嗎?

在本文中我們將探討如今深度學習如此受歡迎的原因。在讀完本文后,你將了解神經網絡的主要優缺點,并且當你為解決機器學習問題選擇合適類型的算法時,你將做到心中有數。你還將了解目前在機器學習中我們遇到了哪些主要問題。

為什么深度學習如此熱門?

深度學習如此熱門的主要包括以下四個原因,即數據、計算能力、算法和市場營銷。接下來我們將一一探討。

1. 數據

深度學習大受追捧的一個因素是,如今有大量可使用的數據,這些數據是在過去幾年,幾十年中收集的。這使得神經網絡能夠真正發揮其潛力,因為神經網絡獲得的數據越多,表現越好。

相比之下,傳統的機器學習算法在達到一定水平時,獲得更多的數據并不會提高其性能。以下圖表說明了這一點:

2. 計算能力

另一個非常重要的因素是,如今可用的計算能力能夠讓我們處理更多的數據。

根據人工智能的領軍人物Ray Kurzweil的說法,在每個時間單位,計算能力以乘以某個常數的速度增長(例如,每年增加一倍),而不是逐漸增加。這意味著計算能力呈指數增長。

3. 算法

深度學習大受追捧的第三個因素是算法本身的進步。最近算法開發方面的突破讓其比以前運行得更快,從而能夠讓我們使用越來越多的數據。

4. 市場營銷

同時,市場營銷也很重要。神經網絡已經存在了幾十年(在1944年首次提出),當時已經有一些宣傳,但沒有人相信以及愿意進行投資。

深度學習”讓其有了一個高大上的名字,讓其更好進行宣傳,同時也讓許多人錯誤地認為深度學習是一個全新的領域。

此外,其他因素也促成了深度學習的市場推廣。例如漢森機器人公司有爭議的機器人Sophia,以及機器學習主要領域的幾項突破等等。

神經網絡 VS 傳統算法

你應該使用神經網絡還是傳統的機器學習算法?這是一個難以回答的問題,因為這很大程度上取決于你想要解決的問題。

我們要明確的是并不存在一種“完美的”機器學習算法,能夠出色地解決任何問題。對于某個問題,有的方法是適合的,有的則反之。

但我認為這正是機器學習有趣的地方所在。這也說明為什么你需要精通多種算法;在練習中反復試錯才是成為優秀機器學習工程師或數據科學家的唯一方法。

下面我將提供一些方法,幫助你理解何時要選擇哪種類型的算法。

神經網絡的主要優勢在于,它的性能優于幾乎其他的機器學習算法。但同時也存在一些缺點,這也是你需要重點關注的。正如我之前所說的,是否應該使用深度學習,這主要取決于你需要解決的問題。例如,在癌癥檢測中,高性能至關重要,因為性能越好,越多的人可以接受治療。但是對于一些機器學習問題,傳統算法可以提供更好的結果。

1. 黑箱


神經網絡最廣為人知的缺點是“黑箱”性質,這意味著你不知道神經網絡如何以及為何會得出一定的輸出。例如,當你將一張貓的圖像輸入神經網絡,神經網絡預測這是汽車時,很難理解為什么會導致它產生這個預測。當你有可解釋的特征時,就能更容易的理解其錯誤的原因。相比起來,像決策樹這樣的算法更容易理解。這是很重要的,因為在某些領域可解釋性至關重要。

這就是為什么許多銀行不使用神經網絡來預測客戶是否有信用,因為他們需要向客戶解釋為什么他們無法獲得貸款。否則用戶會產生誤解和不滿,因為他不明白為什么自己無法獲得貸款。

像Quora這樣的網站也是如此。如果他們通過機器學習算法決定刪除某個用戶的帳戶,他們需要向用戶解釋當中的原因。如果僅僅說”這是計算機的決定”,這樣的答案是不盡人意的。

制定重要的商業決策時也是如此。你能想象大公司的CEO在做出關于數百萬美元的決定,而不探究當中的原因,僅僅因為計算機的決策嗎?

2. 開發時間


雖然像Keras這樣的庫讓神經網絡的開發變得簡單,但有時你需要更多地控制算法的細節。特別是當你試圖解決機器學習中之前沒人做過的難題時。

接著你可能會使用Tensorflow,它為你提供了更多的機會,但同時因為它也更復雜,開發時間更長。對于公司管理層來說,他們需要決定是否值得這么做。使用深度學習,工程師需要花費數周的時間進行開發,而用更簡單的算法能夠更快的解決問題。

3. 數據量

與傳統的機器學習算法相比,神經網絡通常需要更多的數據,至少需要數千甚至數百萬個標記樣本。這不是一個容易解決的問題,但如果使用其他算法,則可以用更少的數據解決相關的機器學習問題。

盡管有些情況下,神經網絡在很少的數據下也能很好的解決問題,但這是少數情況。在這種情況下,像樸素貝葉斯這樣的簡單算法能通過少量數據解決問題,這顯然是更好的選擇。


4. 計算成本

通常在計算方面,神經網絡比傳統算法更昂貴。先進的深度學習算法,若想成功完成訓練,可能需要幾周的時間。而大多數傳統的機器學習只需花費少于幾分鐘,幾個小時或者幾天。

神經網絡所需的計算能力很大程度上取決于數據的大小,也取決于網絡的深度和復雜程度。例如,將比具有1000個決策樹隨機森林,具有一層和50個神經元的神經網絡要快得多。同時,相,具有50層的神經網絡將比僅有10個決策樹隨機森林更慢。

總結

現在你知道對于某些任務來說神經網絡是不錯的選擇,而對于某些任務來說并非如此。

大量的數據、更多的計算能力、更好的算法和智能的營銷促進了深度學習的受歡迎程度,并使其成為目前最熱門的領域之一。

最重要的是,你已經了解到神經網絡幾乎優于所有其他機器學習算法,以及與之相伴隨的缺點。那就是“黑箱”性質,更長的開發時間,所需的數據量以及高昂的計算成本。

結論

在我看來,目前深度學習有點過度炒作,并且期望超過了其實際能力。但這并不意味著深度學習是沒有用的。

如今機器學習變得越來越普遍,越來越多的人可以用它來構建有用的產品。同時,機器學習可以解決很多問題,這都是未來幾年內會實現的。

其中一個主要問題是,只有少數人了解可以用深度學習做些什么,并知道如何構建出色的數據科學團隊,為公司帶來真正的價值。一方面,我們擁有博士級工程師,他們熟知機器學習背后的理論,但缺乏對商業方面的理解。另一方面,公司的領導層和管理人員,他們不知道深度學習可以做些什么,并認為它將在未來幾年解決所有的問題。在我看來,我們需要更多的人才來填補來彌補當中的差距,這將會為我們的社會帶來更多有用的產品。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢