
神經網絡的優點和缺點
深度學習目前大受追捧。人們總想在各個方面使用神經網絡,但它們總是正確的選擇嗎?
在本文中我們將探討如今深度學習如此受歡迎的原因。在讀完本文后,你將了解神經網絡的主要優缺點,并且當你為解決機器學習問題選擇合適類型的算法時,你將做到心中有數。你還將了解目前在機器學習中我們遇到了哪些主要問題。
為什么深度學習如此熱門?
深度學習如此熱門的主要包括以下四個原因,即數據、計算能力、算法和市場營銷。接下來我們將一一探討。
1. 數據
深度學習大受追捧的一個因素是,如今有大量可使用的數據,這些數據是在過去幾年,幾十年中收集的。這使得神經網絡能夠真正發揮其潛力,因為神經網絡獲得的數據越多,表現越好。
相比之下,傳統的機器學習算法在達到一定水平時,獲得更多的數據并不會提高其性能。以下圖表說明了這一點:
2. 計算能力
另一個非常重要的因素是,如今可用的計算能力能夠讓我們處理更多的數據。
根據人工智能的領軍人物Ray Kurzweil的說法,在每個時間單位,計算能力以乘以某個常數的速度增長(例如,每年增加一倍),而不是逐漸增加。這意味著計算能力呈指數增長。
3. 算法
深度學習大受追捧的第三個因素是算法本身的進步。最近算法開發方面的突破讓其比以前運行得更快,從而能夠讓我們使用越來越多的數據。
4. 市場營銷
同時,市場營銷也很重要。神經網絡已經存在了幾十年(在1944年首次提出),當時已經有一些宣傳,但沒有人相信以及愿意進行投資。
“深度學習”讓其有了一個高大上的名字,讓其更好進行宣傳,同時也讓許多人錯誤地認為深度學習是一個全新的領域。
此外,其他因素也促成了深度學習的市場推廣。例如漢森機器人公司有爭議的機器人Sophia,以及機器學習主要領域的幾項突破等等。
神經網絡 VS 傳統算法
你應該使用神經網絡還是傳統的機器學習算法?這是一個難以回答的問題,因為這很大程度上取決于你想要解決的問題。
我們要明確的是并不存在一種“完美的”機器學習算法,能夠出色地解決任何問題。對于某個問題,有的方法是適合的,有的則反之。
但我認為這正是機器學習有趣的地方所在。這也說明為什么你需要精通多種算法;在練習中反復試錯才是成為優秀機器學習工程師或數據科學家的唯一方法。
下面我將提供一些方法,幫助你理解何時要選擇哪種類型的算法。
神經網絡的主要優勢在于,它的性能優于幾乎其他的機器學習算法。但同時也存在一些缺點,這也是你需要重點關注的。正如我之前所說的,是否應該使用深度學習,這主要取決于你需要解決的問題。例如,在癌癥檢測中,高性能至關重要,因為性能越好,越多的人可以接受治療。但是對于一些機器學習問題,傳統算法可以提供更好的結果。
1. 黑箱
神經網絡最廣為人知的缺點是“黑箱”性質,這意味著你不知道神經網絡如何以及為何會得出一定的輸出。例如,當你將一張貓的圖像輸入神經網絡,神經網絡預測這是汽車時,很難理解為什么會導致它產生這個預測。當你有可解釋的特征時,就能更容易的理解其錯誤的原因。相比起來,像決策樹這樣的算法更容易理解。這是很重要的,因為在某些領域可解釋性至關重要。
這就是為什么許多銀行不使用神經網絡來預測客戶是否有信用,因為他們需要向客戶解釋為什么他們無法獲得貸款。否則用戶會產生誤解和不滿,因為他不明白為什么自己無法獲得貸款。
像Quora這樣的網站也是如此。如果他們通過機器學習算法決定刪除某個用戶的帳戶,他們需要向用戶解釋當中的原因。如果僅僅說”這是計算機的決定”,這樣的答案是不盡人意的。
制定重要的商業決策時也是如此。你能想象大公司的CEO在做出關于數百萬美元的決定,而不探究當中的原因,僅僅因為計算機的決策嗎?
2. 開發時間
雖然像Keras這樣的庫讓神經網絡的開發變得簡單,但有時你需要更多地控制算法的細節。特別是當你試圖解決機器學習中之前沒人做過的難題時。
接著你可能會使用Tensorflow,它為你提供了更多的機會,但同時因為它也更復雜,開發時間更長。對于公司管理層來說,他們需要決定是否值得這么做。使用深度學習,工程師需要花費數周的時間進行開發,而用更簡單的算法能夠更快的解決問題。
3. 數據量
與傳統的機器學習算法相比,神經網絡通常需要更多的數據,至少需要數千甚至數百萬個標記樣本。這不是一個容易解決的問題,但如果使用其他算法,則可以用更少的數據解決相關的機器學習問題。
盡管有些情況下,神經網絡在很少的數據下也能很好的解決問題,但這是少數情況。在這種情況下,像樸素貝葉斯這樣的簡單算法能通過少量數據解決問題,這顯然是更好的選擇。
4. 計算成本
通常在計算方面,神經網絡比傳統算法更昂貴。先進的深度學習算法,若想成功完成訓練,可能需要幾周的時間。而大多數傳統的機器學習只需花費少于幾分鐘,幾個小時或者幾天。
神經網絡所需的計算能力很大程度上取決于數據的大小,也取決于網絡的深度和復雜程度。例如,將比具有1000個決策樹的隨機森林,具有一層和50個神經元的神經網絡要快得多。同時,相,具有50層的神經網絡將比僅有10個決策樹的隨機森林更慢。
總結
現在你知道對于某些任務來說神經網絡是不錯的選擇,而對于某些任務來說并非如此。
大量的數據、更多的計算能力、更好的算法和智能的營銷促進了深度學習的受歡迎程度,并使其成為目前最熱門的領域之一。
最重要的是,你已經了解到神經網絡幾乎優于所有其他機器學習算法,以及與之相伴隨的缺點。那就是“黑箱”性質,更長的開發時間,所需的數據量以及高昂的計算成本。
結論
在我看來,目前深度學習有點過度炒作,并且期望超過了其實際能力。但這并不意味著深度學習是沒有用的。
如今機器學習變得越來越普遍,越來越多的人可以用它來構建有用的產品。同時,機器學習可以解決很多問題,這都是未來幾年內會實現的。
其中一個主要問題是,只有少數人了解可以用深度學習做些什么,并知道如何構建出色的數據科學團隊,為公司帶來真正的價值。一方面,我們擁有博士級工程師,他們熟知機器學習背后的理論,但缺乏對商業方面的理解。另一方面,公司的領導層和管理人員,他們不知道深度學習可以做些什么,并認為它將在未來幾年解決所有的問題。在我看來,我們需要更多的人才來填補來彌補當中的差距,這將會為我們的社會帶來更多有用的產品。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25