熱線電話:13121318867

登錄
首頁精彩閱讀如何學好數據挖掘(二)
如何學好數據挖掘(二)
2019-02-22
收藏


在上一篇文章中我們給大家介紹了學習數據挖掘的第一條路線,第一條路線講述的是如何學習機器學習的第一部分,主要是數據挖掘方面,懂得了這些我們才能夠進行下一步的工作,那么學習數據挖掘的第二條路線是什么呢?我們在這篇文章中給大家介紹一下相關的知識。


首先給大家說一下數據挖掘的技術過程,數據挖掘的技術過程有很多,比如數據清理(消除噪音或不一致數據)、數據集成(多種數據源可以組合在一起)、數據選擇(從數據庫中提取與分析任務相關的數據)、數據變換(數據變換或統一成適合挖掘的形式;如,通過匯總或聚集操作)、數據挖掘(基本步驟,使用智能方法提取數據模式)、模式評估(根據某種興趣度度量,識別提供知識的真正有趣的模式)、知識表示(使用可視化和知識表示技術,向用戶提供挖掘的知識)。


然后給大家說一下數據挖掘的第二條路線,就是K-means,然后是EM,然后是樸素貝葉斯,然后是貝葉斯網絡,然后是隱馬爾科夫模型(基本模型,前向算法,維特比算法,前向-后向算法),然后是卡爾曼濾波。這條線路所涉及的基本都是那些各種畫來畫去的圖模型,一個學術名詞是 PGM。這條線的思路和第一條是截然不同的!貝葉斯網絡、HMM(隱馬爾科夫模型),K-means 和 EM 具有與生俱來的聯系,認識到這一點才能說明你真正讀懂了它們。而EM算法要在HMM的模型訓練中用到,所以我們要先學EM才能深入學習HMM。所以盡管在EM中看不到那種畫來畫去的圖模型,但還把它放在了這條線路中,這也就是原因所在。樸素貝葉斯里面的很多內容在,貝葉斯網絡和HMM里都會用到,類似貝葉斯定理,先驗和后驗概率,邊緣分布等等(主要是概念性的)。最后,卡爾曼濾波可以作為HMM的一直深入或者后續擴展。盡管很多有的書里沒把它看做是一種機器學習算法(或許那些作者認為它應該是信號處理中的內容),但是它也確實可以被看成是一種機器學習技術。很多科學家也深刻地揭示了它與HMM之間的緊密聯系。


關于數據挖掘的學習路線我們就給大家介紹到這里了,想必大家看了這篇文章以后已經知道了數據挖掘怎么學習了吧?大家在進行學習數據挖掘的時候還是要根據自己的進度進行學習,這樣才能夠得出一個極好的效果。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢