熱線電話:13121318867

登錄
首頁精彩閱讀如何提高數據挖掘能力(四)
如何提高數據挖掘能力(四)
2019-01-16
收藏


我們在上一篇文章中給大家講述了數據挖掘的四條原則,遵守了這四條原則可以幫助我們更好地應對數據挖掘的工作,但是數據挖掘還是需要模型的,我們對數據挖掘模型的選擇也會影響我們的工作。那么怎么選對模型提升呢?下面我們就來給大家講一講選對模型提升的方法。


通常來說,沒有深刻的業務理解去做數據挖掘往往是事倍功半,行業的業務理解越透徹,就越能抓住數據中本質的特征,諸如圖像識別等場景已經可以靠神經網絡來自動查找特征了,但大多數行業領域不行,還是要靠業務專家,多組織一次討論獲取的靈感可能遠遠好過于在算法上折騰一個月。而沒有更多更好的數據去訓練模型,這就是一件十分困難的事情了,一定要相信數據的重要性遠遠超過算法,很多初級的建模師算法能力很強,但就是做不成事,往往是因為其對于自身企業的數據理解太淺所致,這些都是我們需要注意到的事情。


如果數據不變,數據挖掘訓練的邊際效益并不高,同樣的一份數據用不同的算法反復訓練,比如F1差值并不是很大大,如果要盡快的提升模型的效果,要講究點方法,盡量遵循以下優先級:業務>數據>算法。只有遵循了這個優先級,知道孰輕孰重,那么我們才能夠做好模型的選擇。


而一般來說,企業的數據挖掘師都需要通過長時間的取數訓練,如果能做過數據倉庫的更好,這樣對于企業的數據體系有個全局的認識,在特征選擇時有更多的發揮空間,大數據中最強調的一個特征是維度多,也一定程度說明了數據多樣的重要性。比如基于運營商的語音通話數據可以初步判定欺詐電話,但這個準確率還不高,如果加上社交網絡數據,判定就變得很準確了,這就是多維數據的力量,同時數據建模師如果不理解運營商的業務和數據,則可能無法想到這個維度。所以,數據挖掘師還是要清楚這些內容的。


通過這些文章我們給大家介紹了很多提高數據挖掘能力的方法,在進行數據挖掘工作的時候,也是不斷地對我們數據挖掘能力的培養與鍛煉,只有提高的數據挖掘的能力,我們才能夠做好數據挖掘工作,提高自己的職業競爭力。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢