
今天小編給大家分享的文章是:為什么我們的神經網絡需要激活函數。神經網絡是機器學習里極為重要的一門技術。學習神經網絡不僅能讓讓我們掌握一門強大的機器學習方法,還有利于我們理解深度學習技術。希望通過這篇文章能讓大家對神經網絡有一個更深刻的理解,對大家的機器學習有所幫助。
文章來源: DeepHub IMBA微信公眾號
作者:P**nHub兄弟網站
如果你正在讀這篇文章,那么很可能你已經知道什么是神經網絡,什么是激活函數,但是,一些關于機器學習的入門課程并不能很清楚地說明,為什么我們需要這些激活函數。我們需要它們嗎?沒有它們,神經網絡還能工作嗎?
首先讓我們回顧一下關于神經網絡的一些事情。它們通常被可視化地表示為一個類似圖表的結構,如下圖所示:
如上圖所示,神經網絡有3層:輸入層、隱藏層、輸出層,共3、4、2個神經元。輸入層的節點數量與數據集的特性數量相同。對于隱藏層,您可以自由選擇需要多少節點,并且可以使用多個隱藏層。
網絡中的每個神經元,除了那些在輸入層的神經元,可以被認為是一個線性分類器,它將前一層神經元的所有輸出作為輸入,并計算這些輸出加上一個偏置項的加權和。然后,下一層的神經元將前一層線性分類器計算的值作為輸入,然后計算這些值的加權和,依此類推。我們希望,通過以這種方式結合線性分類器,我們可以構建更復雜的分類器,可以代表我們的數據中的非線性模式。
讓我們看看下面的例子數據集:
這個數據集不是線性可分的,我們不能將一個類從另一個通過一條線分開。但我們可以通過使用兩條線作為決策邊界來實現這種分離。
所以,我們可能認為兩個中間神經元可以完成這個工作。這兩個神經元將學習上圖中的兩條分離線。然后我們需要一個輸出神經元它將之前的兩個神經元作為輸入,這樣它就能正確地進行分類。
對于最后一個做正確分類的神經元,它需要n1和n2隱藏神經元的輸出是線性可分的,如果我們把它們畫在一個二維平面上。上面畫的兩條線有方程:
這意味著這兩個隱藏的神經元正在計算輸入x1和x2的如下線性組合:
我們畫出n1和n2看看它們是否有用。
我們對我們的小神經網絡感到失望。n1和n2的輸出仍然不是線性可分的,因此輸出神經元不能正確分類。那么,問題是什么呢?
問題是,任何線性函數的線性組合仍然是線性的,在一張紙上證明它是正確的并不難。這一事實的證據在本文的結尾。所以,不管我們用了多少層或多少神經元,按照我們目前的方式,我們的神經網絡仍然只是一個線性分類器。
我們需要更多的東西。我們需要將每個神經元計算出的加權和傳遞給一個非線性函數,然后將這個函數的輸出看作那個神經元的輸出。這些函數稱為激活函數,它們在允許神經網絡學習數據中的復雜模式時非常重要。
[1] 已經證明,具有2層(輸入層除外)和非線性激活函數的神經網絡,只要在這些層中有足夠多的神經元,就可以近似任何函數。那么,如果只有兩層就夠了,為什么人們現在還在使用更深層次的網絡呢?嗯,僅僅因為這兩層網絡“能夠”學習任何東西,這并不意味著它們很容易優化。在實踐中,如果我們的網絡產能過剩,他們就會給我們提供足夠好的解決方案,即使他們沒有盡可能地優化。
還有更多種類的激活函數,我們想在上面的示例中使用其中的兩種。它們分別是ReLU(直線單元)和tanh(雙曲正切),如下圖所示。
如果我們在示例中使用ReLU激活,將會發生什么?下圖是應用ReLU激活后n1和n2神經元的輸出。
現在,我們的這兩類點可以用直線分開,這樣輸出神經元就可以正確地對它們進行分類。
如果我們使用tanh激活,也會發生類似的事情,但這次我們的點之間的差距更大。
同樣,輸出神經元可以正確地分類這些點。
這里有一個簡單的數學證明,證明任何線性函數的線性組合仍然是線性的:
其中a0, a1,…,an是不依賴于輸入x1,…,xn的常數。
我希望這篇文章對你有用,謝謝閱讀!
參考
[1] Cybenko, G.V. (2006). “Approximation by Superpositions of a Sigmoidal function”. In van Schuppen, Jan H. (ed.). Mathematics of Control, Signals, and Systems. Springer International. pp. 303–314.
作者:Dorian Lazar
deephub翻譯組
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25