熱線電話:13121318867

登錄
首頁大數據時代機器學習中有監督學習和無監督學習的區別表現在什么方面?
機器學習中有監督學習和無監督學習的區別表現在什么方面?
2020-07-23
收藏

機器學習主要分為:有監督學習,無監督學習,以及半監督學習等。小編今天給大家分享的主要是有監督學習和無監督學習的比較,希望對于大家機器學習有所幫助。

一、首先來了解一下有監督學習和無監督學習的概念

1、有監督學習(supervised learning)是指從給定的訓練數據集中學習出一個函數(模型參數),當新的數據到來時,可以根據這個函數預測結果。有監督學習的訓練集要求包括輸入輸出,也可以說是特征和目標。訓練集中的目標是由人標注的。

以此可以總結出 有監督學習的特點:

(1)有標簽的就是有監督學習。

(2)  已經標記好的數據(labelled data),用來做訓練來預測新數據的類型(class),或者是值。預測已有類型叫做分類(classification),預測一個值叫做回歸(regression)。

(3)   常見的有監督學習算法:回歸分析和統計分類。

常見的有監督學習算法:回歸分析和統計分類。最典型的算法是KNNSVM。

2、無監督學習(或者非監督學習,unsupervised learning)輸入數據沒有被標記,也沒有確定的結果。樣本數據類別未知,需要根據樣本間的相似性對樣本集進行分類(聚類,clustering)試圖使類內差距最小化,類間差距最大化。無監督學習是另一種研究的比較多的學習方法,它與監督學習的不同之處,在于我們事先沒有任何訓練樣本,而需要直接對數據進行建模。

無監督學習的方法分為兩大類:

(1)    一類為基于概率密度函數估計的直接方法:指設法找到各類別在特征空間的分布參數,再進行分類。

(2)    另一類是稱為基于樣本間相似性度量的簡潔聚類方法:其原理是設法定出不同類別的核心或初始內核,然后依據樣本與核心之間的相似性度量將樣本聚集成不同的類別。

利用聚類結果,可以提取數據集中隱藏信息,對未來數據進行分類和預測。應用于數據挖掘,模式識別,圖像處理等。

PCA和很多deep learning算法都屬于無監督學習。

二、有監督學習和無監督學習的區別

1.有監督學習方法必須要有訓練集與測試樣本。在訓練集中找規律,而對測試樣本使用這種規律。而無監督學習沒有訓練集,只有一組數據,在該組數據集內尋找規律。

2.有監督學習的方法就是識別事物,識別的結果表現在給待識別數據加上了標簽。因此訓練樣本集必須由帶標簽的樣本組成。而無監督學習方法只有要分析的數據集的本身,預先沒有什么標簽。如果發現數據集呈現某種聚集性,則可按自然的聚集性分類,但不予以某種預先分類標簽對上號為目的。

3.無監督學習方法在尋找數據集中的規律性,這種規律性并不一定要達到劃分數據集的目的,也就是說不一定要“分類”。在這一點上無監督學習比有監督學習方法的用途要廣。

4.用無監督學習方法分析數據集的主分量與用K-L變換計算數據集的主分量又有區別。后者從方法上講不是學習方法。因此用K-L變換找主分量不屬于無監督學習方法,即方法上不是。而通過學習逐漸找到規律性這體現了學習方法這一點。在人工神經元網絡中尋找主分量的方法屬于無監督學習方法。

三、如何選擇有監督學習和無監督學習

最簡單的方法就是從定義入手,

有訓練樣本則考慮采用監督學習方法;

無訓練樣本,則一定不能用監督學習方法。

需要注意的是,實際應用中,即使在沒有訓練樣本的情況下,我們也能夠從待分類的數據中,對一些樣本進行人工標注,并將它們作為訓練樣本,這樣一來,就能夠把條件進行改善,使用有監督學習方法來做。在不同的場景,正負樣本的分布如果會存在偏移,這種情況下,有監督學習的效果可能沒有無監督學習的效果好。

以上就是小編今天跟大家分享的關于有監督學習和無監督學習的區別。在機器學習中,有監督學習和無監督學習是最常用的兩種學習方法了,大家一定要清楚兩者之間的區別,以及兩者的適用場景。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢