熱線電話:13121318867

登錄
首頁精彩閱讀機器學習中的有監督和無監督都包括些什么?
機器學習中的有監督和無監督都包括些什么?
2020-05-29
收藏


機器學習算法通常分為有監督的(訓練數據有標記答案)和無監督的(可能存在的任何標簽均未顯示在訓練算法中)。有監督機器學習問題又分為分類(預測非數字答案,例如錯過抵押貸款的可能性)和回歸(預測數字答案,例如下個月在曼哈頓商店出售的小部件的數量)。

無監督學習可進一步分為聚類(查找類似對象的組,例如跑鞋,步行鞋和正裝鞋),關聯(查找對象的常見序列,例如咖啡和奶油)和降維(投影,特征選擇) ,以及特征提取。

分類算法

分類問題是有監督的學習,要求在兩個或多個類別之間進行選擇,通常為每個類別提供概率。除了需要大量高級計算資源的神經網絡深度學習之外,最常見的算法是樸素貝葉斯,決策樹,邏輯回歸,K最近鄰和支持向量機SVM)。也可以使用集成方法(模型的組合),例如“隨機森林”,其他“裝袋”方法以及增強方法(例如,AdaBoost和XGBoost)。

回歸算法

回歸問題是有監督的學習,要求模型預測數字。最簡單,最快的算法是線性(最小二乘)回歸,但一般不應止步于此,因為它通常會返回一個中等的結果。其他常見的機器學習回歸算法(缺少神經網絡)包括樸素貝葉斯,決策樹,K最近鄰,LVQ(學習矢量量化),LARS套索,彈性網,隨機森林,AdaBoost和XGBoost。值得注意的是,用于回歸和分類的機器學習算法之間存在一些重疊。

聚類算法

聚類問題是一種無監督的學習問題,它要求模型查找相似數據點的組。最受歡迎的算法是K-Means聚類;其他包括均值漂移聚類,DBSCAN(基于噪聲的應用程序基于空間的聚類),GMM(高斯混合模型)和HAC(分層聚類)。

降維算法

降維是一個無監督的學習,它要求模型刪除或組合對結果影響很小或沒有影響的變量。這通常與分類或回歸結合使用。降維算法包括刪除具有許多缺失值的變量,刪除具有低方差的變量,決策樹,隨機森林,刪除或組合具有高相關性的變量,后向特征消除,前向特征選擇,因子分析和PCA(主成分分析)。

優化方法

訓練和評估可以通過優化監督算法的參數權重,找到最適合數據真實性的一組值,從而將監督學習算法轉變為模型。算法通常將最速下降的變量用于優化程序,例如隨機梯度下降,它是從隨機起始點多次執行的最速下降。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢