熱線電話:13121318867

登錄
首頁精彩閱讀統計分析、數據挖掘和分析報告有哪些不同
統計分析、數據挖掘和分析報告有哪些不同
2016-02-11
收藏

統計分析、數據挖掘和分析報告有哪些不同

對數據的分析工作,可以分為三個層次,初級是統計分析,再是OLAP,最后是數據挖掘,這也是隨著數據的數量級遞增的。關于數據挖掘的作用,Berry and Linoff的定義盡管有些言過其實,但清晰的描述了數據挖掘的作用?!胺治鰣蟾娼o你后見之明 (hindsight);統計分析給你先機 (foresight);數據挖掘給你洞察力 (insight)”。

舉個例子說。

你看到孫悟空跟二郎神打仗,然后寫了個分析報告,說孫悟空在柔韌性上優勢明顯,二郎神在力氣上出類拔萃,所以剛開始不相上下;結果兩個人跑到竹林里,在竹子上面打,孫悟空的優勢發揮出來,所以孫悟空贏了。這叫分析報告。

孫悟空要跟二郎神打架了,有個賭徒找你預測。你做了個統計,發現兩人斗爭4567次,其中孫悟空贏3456次。另外,孫悟空斗牛魔王,勝率是89%,二郎 神斗牛魔王勝率是71%。你得出趨勢是孫悟空贏。因為你假設了這次勝利跟歷史的關系,根據經驗作了一個假設。這叫統計分析。

你什么都沒做,讓計算機自己做關聯分析,自動找到了出身、教育、經驗、單身四個因素。得出結論是孫悟空贏。計算機通過分析發現貧苦出身的孩子一般比皇親國 戚功夫練得刻苦;打架經驗豐富的人因為擅長利用環境而機會更多;在都遇得到明師的情況下,貧苦出身的孩子功夫可能會高些;單身的人功夫總比同樣環境非單身的高。孫悟空遇到的名師不亞于二郎神,而打架經驗絕對豐富,并且單身,所以這次打頭,孫悟空贏。這叫數據挖掘。

數據挖掘跟LOAP的區別在于它沒有假設,讓計算機找出這種背后的關系,而這種關系可能是你所想得到的,也可能是所想不到的。比如數據挖掘找出的結果發現在2億條打斗記錄中,姓孫的跟姓楊的打,總是姓孫的勝利,孫悟空姓孫,所以,悟空勝利。

用在現實中,我們舉個例子來說,做OLAP分析,我們找找哪些人總是不及時向電信運營商繳錢,一般會分析收入低的人往往會繳費不及時。通過分析,發現不及時繳錢的窮人占71%。而數據挖掘則不同,它自己去分析原因。原因可能是,家住在五環以外的人,不及時繳錢。這些結論對推進工作有很深的價值,比如在五環外作市場調研,發現需要建立更多的合作渠道以方便繳費。這是數據挖掘的價值。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢