熱線電話:13121318867

登錄
首頁精彩閱讀數據挖掘中的分類技術
數據挖掘中的分類技術
2018-02-27
收藏

數據挖掘中的分類技術

KNN(K最近鄰算法)

算法核心:如果一個樣本在特征空間中K個最相似的樣本中的大多數屬于一個類別,則該樣本也屬于這個類別,并具有這個類別的特征

在確定分類時只依靠最鄰近的一個或幾個樣本的類別來決定待分樣本所屬類別,在做決策時只與極少數的相鄰樣本有關

由于KNN方法主要依靠周圍有限的臨近樣本,而不是依靠判別類域的方法來確定樣本所屬類別。對于類域交叉或重疊較多的待分樣本集來說,KNN方法較其他方法更合適

決策樹

決策樹要解決的問題是用哪些屬性充當這棵樹的各個節點的問題,決策樹按分裂標準不同可以分為基于信息論的方法和基于最小GINI指標方法

神經網絡

神經網絡的學習是一個過程,并按照一定的規則(學習算法)調整各層的權值矩陣,待網絡各層權值都收斂到一定值,學習過程結束

支持向量機SVM

盡量把樣本中從更高維度看起來在一起的樣本合在一起

支持向量機的目的是找到一個最優超平面,使分類間隔最大。最優超平面就是要求分類面不但能將兩類正確分開,而且使分類間隔最大

在兩類樣本中離分類面最近且位于平行于最優超平面上的點就是支持向量,為找到最優超平面,只要找到所有的支持向量即可

對于非線形支持向量機,通常做法為把線形不可分轉換成線形可分,通過一個非線形映射將低維輸入空間中的數據特征映射到高維。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢