熱線電話:13121318867

登錄
首頁精彩閱讀數據分析師與統計學
數據分析師與統計學
2016-05-20
收藏

數據分析師與統計學

1.數據分析師有三條腿,數據處理,統計分析,業務理解。

既然你是從業人員,那么你一定聽過一句話,“數據挖掘有80%的時間花在了數據準備上”,當然,這80%的時間反而是最不能體現工作價值的地方。如果你處理過從不同業務部門匯集來的數據,就會明白。。?!按蟆钡牟粌H是價值,而且迫切需要一種新型的技術路徑來解決需求。我試過R,Clementine,甚至excel的插件,面對不能精確匹配的場景總是乏力,事實上我處理的還都是完全結構化的數據。


2.多數時候,統計分析所需要的并非算術技能,而是數學思想。

到這就要提第二句話,“大數據分析的關鍵不是因果,而是相關性”。啤酒和尿布的故事想必我無需再講?;诰_建模、大量數據、反復迭代來預測人類社會的多數變量,都會是南轅北轍。一般而言的,基于金融工程衍生來的各種數學、統計,并不能在大數據場景中得到應用。歸根結底,大數據活動并非是一個在嚴密邏輯框架下進行理論推演的科學,而是一個自下而上,由數據的挖掘、分析中發現結論的科學?;诖髷祿椒ǖ贸龅暮媒Y論,必然應該是后驗的,而非先驗的。大數據的價值在于可以發現細節規律,而不是推演未來。石油價格預測這種的,是數學家的事,不是數據科學家的事。

3.需求導向仍是IT領域設計解決方案的最高法則。

需求導向放在大數據場景里,也就是對業務的理解。有些業務很好理解,比如啤酒和尿布,有些業務比較難,比如一些面向研究部門的對細節數據的組織需求。商業組織里,應用任何新技術的目的,都應該是提高生產力。所以我認為,一個半吊子分析能力的從業人員,能夠比一個既懂數學又懂計算機的書呆子設計出更好地解決方案,因為對需求的理解。
基于以上三點,我認為如果你想做一個數據科學家,更好地選擇是去了解具體業務,而非學統計。實干的建議就是,可以隨便找幾本統計學專業書來翻翻,看看里面到底有沒有東西能幫你更好地滿足用戶需求。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢