熱線電話:13121318867

登錄
首頁精彩閱讀聊一聊統計學和數據挖掘的區別(二)
聊一聊統計學和數據挖掘的區別(二)
2019-02-13
收藏


不管是在數據分析中還是數據挖掘中,都少不了統計學的身影,所以當我們在進行數據分析工作或者數據挖掘工作的時候,一定要重視統計學的知識,我們在這篇文章中給大家介紹一下統計學的性質以及和數據挖掘的區別,希望這篇文章能夠幫助大家更好地理解這兩門學科。


在我們學習統計學的時候,我們其實對統計學定義是沒有太大的意義的,雖然我們可能夠做到定義統計學,但是也會有不同的爭議,這就需要我們關注統計學不同于數據挖掘的特性。


首先來說,統計學和數據挖掘的不同點就是相關,統計學是一門比較保守的學科,目前有一種趨勢是越來越精確。當然,這本身并不是壞事,只有越精確才能避免錯誤,發現真理。但是如果過度的話則是有害的。這個保守的觀點源于統計學是數學的分支這樣一個看法,很多人是不同意這個觀點的。盡管統計學確實以數學為基礎,但它同其它學科還有緊密的聯系。所以我們正確認識到這個事情。


在數學背景和追求精確加強了這樣一個趨勢,那就是在采用一個方法之前先要證明,而不是象計算機科學和機器學習那樣注重經驗。這就意味著有時候和統計學家關注同一問題的其它領域的研究者提出一個很明顯有用的方法,但它卻不能被證明或不被證明。正是統計文獻顯示了統計的數學精確性。同時還顯示了其對推理的側重。盡管統計學的一些分支也側重于描述,但是瀏覽一下統計論文的話就會發現這些文獻的核心問題就是在觀察了樣本的情況下如何去推斷總體。當然這也常常是數據挖掘所關注的。


數據挖掘的一個特定屬性就是要處理的是一個大數據集。這就意味著,由于可行性的原因,我們常常得到的只是一個樣本,但是需要描述樣本取自的那個大數據集。然而,數據挖掘問題常??梢缘玫綌祿傮w,在這種情形下,推斷就沒有價值了,因為觀測到的值也就是估計參數。


由此可見,數據挖掘和統計學的區別之一就在于這些特定屬性,這些都是我們需要了解的,不管我們在進行數據挖掘工作還是統計學知識的學習還是要側重這兩點的內容的,這樣才能夠保證在后續的工作中順利進行。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢