熱線電話:13121318867

登錄
首頁精彩閱讀機器學習中涉及到的算法有哪些(中)
機器學習中涉及到的算法有哪些(中)
2019-03-26
收藏


機器學習中有很多算法,比如說線性回歸、Logistic 回歸、線性判別分析等等,而這些算法我們在上面的文章中給大家介紹了實際情況,在這篇文章中我們會繼續為大家介紹一下機器學習算法的相關知識,喜歡人工智能的朋友一定要好好地學起來喲。


首先我們給大家介紹一下決策樹的知識,決策樹是預測建模機器學習的一種重要算法。決策樹模型的表示是一個二叉樹。這是算法和數據結構中的二叉樹,沒什么特別的。每個節點代表一個單獨的輸入變量x和該變量上的一個分割點。而決策樹的葉節點包含一個用于預測的輸出變量y。通過遍歷該樹的分割點,直到到達一個葉節點并輸出該節點的類別值就可以作出預測。當然決策樹的有點就是決策樹學習速度和預測速度都很快。它們還可以解決大量問題,并且不需要對數據做特別準備。


然后我們給大家介紹一下樸素貝葉斯。其實樸素貝葉斯是一個簡單但是很強大的預測建模算法。而這個模型由兩種概率組成,這兩種概率都可以直接從訓練數據中計算出來。第一種就是每個類別的概率,第二種就是給定每個 x 的值,每個類別的條件概率。一旦計算出來,概率模型可用于使用貝葉斯定理對新數據進行預測。當我們的數據是實值時,通常假設一個高斯分布,這樣我們可以簡單的估計這些概率。而樸素貝葉斯之所以是樸素的,是因為它假設每個輸入變量是獨立的。這是一個強大的假設,真實的數據并非如此,但是,該技術在大量復雜問題上非常有用。所以說,樸素貝葉斯是一個十分實用的功能。


最后我們說一下K近鄰算法,K近鄰算法簡稱KNN算法,KNN 算法非常簡單且有效。KNN的模型表示是整個訓練數據集。KNN算法在整個訓練集中搜索K個最相似實例(近鄰)并匯總這K個實例的輸出變量,以預測新數據點。對于回歸問題,這可能是平均輸出變量,對于分類問題,這可能是眾數類別值。而其中的訣竅在于如何確定數據實例間的相似性。如果屬性的度量單位相同,那么最簡單的技術是使用歐幾里得距離,我們可以根據每個輸入變量之間的差值直接計算出來其數值。當然,KNN需要大量內存或空間來存儲所有數據,但是只有在需要預測時才執行計算。我們還可以隨時更新和管理訓練實例,以保持預測的準確性。


在這篇文章中我們給大家介紹了關于機器學習的算法的另一部分內容,其實總的來說機器學習算法都是有自己的特點,這就使得機器學習能夠解決更多的問題,希望這篇文章能夠更好的幫助大家理解機器學習。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢