熱線電話:13121318867

登錄
首頁精彩閱讀簡單介紹樹回歸的算法原理
簡單介紹樹回歸的算法原理
2018-08-06
收藏

簡單介紹樹回歸的算法原理

線性回歸方法可以有效的擬合所有樣本點(局部加權線性回歸除外)。當數據擁有眾多特征并且特征之間關系十分復雜時,構建全局模型的想法一個是困難一個是笨拙。此外,實際中很多問題為非線性的,例如常見到的分段函數,不可能用全局線性模型來進行擬合。

樹回歸將數據集切分成多份易建模的數據,然后利用線性回歸進行建模和擬合。

構建回歸樹算法偽代碼:

尋找當前最佳待切特征特征值并返回

如果當前最佳特征沒有找到,不可切分,則把當前結點的數據均值作為葉節點

否則用最佳特征特征值構建當前結點

切分后的左右節點分別遞歸以上算法

尋找最佳特征算法偽代碼:

如果該數據集的特征值只有一種,不可切分,返回當前結點的數據均值作為特征

否則重復一下步驟直到找到最小總方差

遍歷每一列

遍歷每列的值

用該值切分數據

計算總方差

如果總方差差值小于最初設定的閾值,不可切分

如果左右樣本數小于最初設定的閾值,不可切分

否則返回最佳特征和最佳特征值。

需要輸入的參數有:數據集,葉節點模型函數(均值),誤差估計函數(總方差),允許的總方差最小下降值,節點最小樣本數。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢