熱線電話:13121318867

登錄
首頁精彩閱讀機器學習中常見算法優缺點之樸素貝葉斯算法
機器學習中常見算法優缺點之樸素貝葉斯算法
2019-04-01
收藏


機器學習中有很多算法,而有一種算法有著堅實的數學背景,并且被廣泛使用,這種算法就是樸素貝葉斯算法。當然,樸素貝葉斯算法的優點有很多,但這種算法的缺點也是我們不能忽視的,那么大家知道不知道樸素貝葉斯算法的優點和缺點是什么呢?下面我們就給大家介紹一下這個問題。


那么什么是樸素貝葉斯算法呢?其實樸素貝葉斯屬于生成式模型,也就是關于生成模型和判別式模型,主要還是在于是否需要求聯合分布,這種算法是一種比較簡單的算法,你只需做一堆計數即可。如果注有條件獨立性假設,樸素貝葉斯分類器的收斂速度將快于判別模型,比如邏輯回歸,所以你只需要較少的訓練數據即可。即使NB條件獨立假設不成立,NB分類器在實踐中仍然表現的很出色。它的主要缺點是它不能學習特征間的相互作用,用mRMR中R來講,就是特征冗余。


那么樸素貝葉斯算法的優點是什么呢?這種算法的優點有五個,第一就是樸素貝葉斯模型發源于古典數學理論,有著堅實的數學基礎,以及穩定的分類效率。第二就是對大數量訓練和查詢時具有較高的速度。即使使用超大規模的訓練集,針對每個項目通常也只會有相對較少的特征數,并且對項目的訓練和分類也僅僅是特征概率的數學運算而已。第三就是對小規模的數據表現很好,能個處理多分類任務,適合增量式訓練(即可以實時的對新增的樣本進行訓練)。第四就是對缺失數據不太敏感,算法也比較簡單,常用于文本分類。第五就是樸素貝葉斯對結果解釋容易理解。


當然,樸素貝葉斯算法的缺點也是很明顯的,樸素貝葉斯算法的缺點有四點,第一就是需要計算先驗概率。第二就是分類決策存在錯誤率。第三就是對輸入數據的表達形式很敏感。第四就是對由于使用了樣本屬性獨立性的假設,所以如果樣本屬性有關聯時其效果不好。


那么樸素貝葉斯應用領域是什么呢?其實樸素貝葉斯算法在欺詐檢測中使用較多。當然,我們還可以用樸素貝葉斯算法來決定一封電子郵件是否是垃圾郵件。還可以用樸素貝葉斯算法判斷一篇文章應該的類別,同時也能夠使用貝葉斯算法去判斷一段文字表達的是積極的情緒還是消極的情緒。從中我們可以看出樸素貝葉斯算法是一個十分實用的算法。


在這篇文章中我們給大家介紹了關于樸素貝葉斯算法優缺點的相關知識,通過對這些知識的講解相信大家已經對樸素貝葉斯算法有了一定的了解,希望這篇文章能夠幫助大家。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢