熱線電話:13121318867

登錄
首頁精彩閱讀機器學習中涉及到的算法有哪些(下)
機器學習中涉及到的算法有哪些(下)
2019-03-26
收藏


從上一篇文章中我們可以看出,機器學習涉及到的很多算法,其實這些算法都是非常實用的,也正是由于這些算法,我們的機器學習才能夠解決很多問題,那么大家還知道機器學習有哪些算法呢?下面我們就給大家介紹一下關于機器學習算法的最后一部分內容。


首先我們給大家介紹一下Boosting 和 AdaBoost,首先,Boosting 是一種集成技術,它試圖集成一些弱分類器來創建一個強分類器。這通過從訓練數據中構建一個模型,然后創建第二個模型來嘗試糾正第一個模型的錯誤來完成。一直添加模型直到能夠完美預測訓練集,或添加的模型數量已經達到最大數量。而AdaBoost 是第一個為二分類開發的真正成功的 boosting 算法。這是理解 boosting 的最佳起點?,F代 boosting 方法建立在 AdaBoost 之上,最顯著的是隨機梯度提升。當然,AdaBoost 與短決策樹一起使用。在第一個決策樹創建之后,利用每個訓練實例上樹的性能來衡量下一個決策樹應該對每個訓練實例付出多少注意力。難以預測的訓練數據被分配更多權重,而容易預測的數據分配的權重較少。依次創建模型,每一個模型在訓練實例上更新權重,影響序列中下一個決策樹的學習。在所有決策樹建立之后,對新數據進行預測,并且通過每個決策樹在訓練數據上的精確度評估其性能。所以說,由于在糾正算法錯誤上投入了太多注意力,所以具備已刪除異常值的干凈數據十分重要。


而學習向量量化也是其中的一個算法,可能大家不知道的是,K近鄰算法的一個缺點是我們需要遍歷整個訓練數據集。學習向量量化算法(簡稱 LVQ)是一種人工神經網絡算法,它允許你選擇訓練實例的數量,并精確地學習這些實例應該是什么樣的。而學習向量量化的表示是碼本向量的集合。這些是在開始時隨機選擇的,并逐漸調整以在學習算法的多次迭代中最好地總結訓練數據集。在學習之后,碼本向量可用于預測。最相似的近鄰通過計算每個碼本向量和新數據實例之間的距離找到。然后返回最佳匹配單元的類別值或作為預測。如果大家重新調整數據,使其具有相同的范圍,就可以獲得最佳結果。當然,如果大家發現KNN在大家數據集上達到很好的結果,請嘗試用LVQ減少存儲整個訓練數據集的內存要求。


在這篇文章中我們給大家介紹了關于機器學習的算法的剩余部分內容能夠,通過對這個算法的講解相信大家能夠更好地理解機器學習。正是由于這些算法,機器學習才如此強大。

 

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢