熱線電話:13121318867

登錄
首頁精彩閱讀機器學習之隨機森林(二)
機器學習之隨機森林(二)
2019-02-20
收藏


在上一篇文章中我們簡單給大家介紹了關于機器學習的知識,順便也講了講機器學習誤差的原因。其實不管是什么算法都是有方差和偏差存在的。在理想情況下,機器學習的誤差就會小的很多。隨機森林是可以減少方差的,而我們在上一篇文章中也留給大家兩個問題,第一是隨機森林是怎么減少這種誤差?第二個問題是隨機森林有什么優缺點。帶著這兩個問題,我們給大家介紹一下這些內容。


其實隨機森林一種可以減少方差的算法,如果大家接觸過決策樹的話,那么大家一定知道,決策樹以高方差、低偏差。這主要是因為它能夠對復雜的關系,甚至是過擬合數據中的噪聲進行建模。也就是說決策樹訓練的模型通常是精確的,但常常在同一數據集中的不同數據樣本之間顯示出很大程度的變化。而隨機森林則是通過聚合單個決策樹的不同輸出來減少可能導致決策樹錯誤的方差。通過多數投票算法,我們可以找到大多數單個樹給出的平均輸出,從而平滑了方差,這樣模型就不容易產生離真值更遠的結果。


說到這里,我們就不得不說一說隨機森林的思想,隨機森林思想是取一組高方差、低偏差決策樹,并將它們轉換成低方差、低偏差的新模型??吹竭@里,大家的腦海里有一個問題,那就是為什么隨機森林是隨機的?這是因為隨機森林中的隨機來源于算法用訓練數據的不同子集訓練每個單獨的決策樹,用數據中隨機選擇的屬性對每個決策樹的每個節點進行分割。通過分割打亂元素,使其具有隨機性。通過引入這種隨機性元素,該算法能夠創建彼此不相關的模型。這導致可能的誤差均勻分布在模型中,意味著誤差最終會通過隨機森林模型的多數投票決策策略被消除。這就是隨機森林的思想,同時也是隨機森林為什么能夠降低方差和偏差的原因。


我們在這篇文章中給大家介紹了關于隨機森林降低偏差和方差的方式,通過這些內容我們可以從側面了解到隨機森林的工作原理。由于篇幅原因我們在這篇文章中無法給大家講解隨機森林優缺點的知識了,我們會在下一篇文章中為大家介紹剩余部分的內容。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢