
機器學習主要分為:有監督學習,無監督學習,以及半監督學習等。小編今天給大家分享的主要是有監督學習和無監督學習的比較,希望對于大家機器學習有所幫助。
1、有監督學習(supervised learning)是指從給定的訓練數據集中學習出一個函數(模型參數),當新的數據到來時,可以根據這個函數預測結果。有監督學習的訓練集要求包括輸入輸出,也可以說是特征和目標。訓練集中的目標是由人標注的。
以此可以總結出 有監督學習的特點:
(1)有標簽的就是有監督學習。
(2) 已經標記好的數據(labelled data),用來做訓練來預測新數據的類型(class),或者是值。預測已有類型叫做分類(classification),預測一個值叫做回歸(regression)。
(3) 常見的有監督學習算法:回歸分析和統計分類。
常見的有監督學習算法:回歸分析和統計分類。最典型的算法是KNN和SVM。
2、無監督學習(或者非監督學習,unsupervised learning)輸入數據沒有被標記,也沒有確定的結果。樣本數據類別未知,需要根據樣本間的相似性對樣本集進行分類(聚類,clustering)試圖使類內差距最小化,類間差距最大化。無監督學習是另一種研究的比較多的學習方法,它與監督學習的不同之處,在于我們事先沒有任何訓練樣本,而需要直接對數據進行建模。
無監督學習的方法分為兩大類:
(1) 一類為基于概率密度函數估計的直接方法:指設法找到各類別在特征空間的分布參數,再進行分類。
(2) 另一類是稱為基于樣本間相似性度量的簡潔聚類方法:其原理是設法定出不同類別的核心或初始內核,然后依據樣本與核心之間的相似性度量將樣本聚集成不同的類別。
利用聚類結果,可以提取數據集中隱藏信息,對未來數據進行分類和預測。應用于數據挖掘,模式識別,圖像處理等。
PCA和很多deep learning算法都屬于無監督學習。
1.有監督學習方法必須要有訓練集與測試樣本。在訓練集中找規律,而對測試樣本使用這種規律。而無監督學習沒有訓練集,只有一組數據,在該組數據集內尋找規律。
2.有監督學習的方法就是識別事物,識別的結果表現在給待識別數據加上了標簽。因此訓練樣本集必須由帶標簽的樣本組成。而無監督學習方法只有要分析的數據集的本身,預先沒有什么標簽。如果發現數據集呈現某種聚集性,則可按自然的聚集性分類,但不予以某種預先分類標簽對上號為目的。
3.無監督學習方法在尋找數據集中的規律性,這種規律性并不一定要達到劃分數據集的目的,也就是說不一定要“分類”。在這一點上無監督學習比有監督學習方法的用途要廣。
4.用無監督學習方法分析數據集的主分量與用K-L變換計算數據集的主分量又有區別。后者從方法上講不是學習方法。因此用K-L變換找主分量不屬于無監督學習方法,即方法上不是。而通過學習逐漸找到規律性這體現了學習方法這一點。在人工神經元網絡中尋找主分量的方法屬于無監督學習方法。
最簡單的方法就是從定義入手,
有訓練樣本則考慮采用監督學習方法;
無訓練樣本,則一定不能用監督學習方法。
需要注意的是,實際應用中,即使在沒有訓練樣本的情況下,我們也能夠從待分類的數據中,對一些樣本進行人工標注,并將它們作為訓練樣本,這樣一來,就能夠把條件進行改善,使用有監督學習方法來做。在不同的場景,正負樣本的分布如果會存在偏移,這種情況下,有監督學習的效果可能沒有無監督學習的效果好。
以上就是小編今天跟大家分享的關于有監督學習和無監督學習的區別。在機器學習中,有監督學習和無監督學習是最常用的兩種學習方法了,大家一定要清楚兩者之間的區別,以及兩者的適用場景。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25在當今數字化時代,數據分析師的重要性與日俱增。但許多人在踏上這條職業道路時,往往充滿疑惑: 如何成為一名數據分析師?成為 ...
2025-04-24以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《劉靜:10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda ...
2025-04-23