熱線電話:13121318867

登錄
首頁精彩閱讀聊一聊統計學和數據挖掘的區別(四)
聊一聊統計學和數據挖掘的區別(四)
2019-02-13
收藏


前幾篇文章中我們都是從統計學的角度給大家講解數據挖掘和統計學的區別所在,但是對于統計學來說,數據挖掘中的核心就是準則,數據挖掘意味著數據集的規模,它常常標示著傳統的準則不可用,我們在這篇文章中給大家詳細地介紹一下這些內容。


相對于統計學而言,數據挖掘中準則起著更為核心的作用,數據挖掘所繼承的學科如計算機科學及相關學科也是如此。數據集的規模常常意味著傳統的統計學準則不適合數據挖掘問題,不得不重新設計。部分地,當數據點被逐一應用以更新估計量,適應性和連續性的準則常常是必須的。盡管一些統計學的準則已經得到發展,但更多的應用是機器學習。


在很多情況下,數據挖掘的本質是很偶然的發現非預期但很有價值的信息。這說明數據挖掘過程本質上是實驗性的。這和確定性的分析是不同的。實際上,一個人是不能完全確定一個理論的,只能提供證據和不確定的證據。確定性分析著眼于最適合的模型建立一個推薦模型,這個模型也許不能很好的解釋觀測到的數據。很多,或許是大部分統計分析提出的是確定性的分析。然而,實驗性的數據分析對于統計學并不是一個新生事務,或許這是統計學家應該考慮作為統計學的另一個基礎,而這已經是數據挖掘的基礎。所有這些都是正確的,但事實上,數據挖掘所遇到的數據集按統計標準來看都是巨大的。在這種情況下,如果使用統計工具可能會得出一個不準確的結果,這是因為百萬個偶然因素可能就會使其失效。


而且,如果數據挖掘的主要目的是發現,那數據挖掘就不關心統計學領域中的在回答一個特定的問題之前,如何很好的搜集數據,例如實驗設計和調查設計。數據挖掘本質上假想數據已經被搜集好,關注的只是如何發現其中的秘密。這些秘密往往就是數據分析工作中要找到的規律。


在這篇文章中我們給大家介紹了數據挖掘和統計學中的不同點,數據挖掘中的準則起著核心的作用,而統計學不是這樣的。當然,數據挖掘的本質就是發現非預期但很有價值的信息,懂得了這些才能夠發現數據挖掘工作的意義。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢