熱線電話:13121318867

登錄
首頁精彩閱讀數據分析不是為了寫一份報告
數據分析不是為了寫一份報告
2016-06-26
收藏

數據分析不是為了寫一份報告

今天這篇文章的直接原因,是為了校正之前發表的“按流程進行數據分析”一文的部分觀點。

文中簡單描述了數據分析流程:明確分析目的;按照數據分析的目的、具體內容,收集所需數據;對數據進行初步的質量篩查;運用合理的數據分析方法進行分析;最后得到分析的結論,撰寫解決問題的建議性報告。

乍讀,這個流程好像沒什么問題,再讀,上面所講的流程可能更適合調研性工作,提供基于數據分析的解決辦法,嚴格來講,這個流程遺漏了最為寶貴的環節,沒有將數據分析的結論應用到實踐中。換句話講,就是為了報告而分析!

為什么要進行數據分析?肯定不是為了報告。數據分析報告僅是其中的一部分,更為重要的是將數據分析得到的模型或者建議付諸實踐,在應用過程中不斷的反饋并對模型進行優化調整,最終使業務得以提升,這可能是一個不斷往復優化的迭代過程。

數據分析流程,嚴謹點來說,可以參考CRISP-DM(跨行業數據挖掘標準流程),如上圖所示,它將整個數據挖掘過程分解為商業理解、數據理解、數據準備、建立模型、模型評估和結果部署6個步驟。CRISP-DM認為,數據挖掘過程是循環往復的探索過程,6個步驟在實踐中并不是按照直線順序進行,而是在實際項目中經?;氐角懊娴牟襟E進行不斷優化調整。

商業理解:理解項目目標和從業務的角度理解需求,同時將商業問題轉化為數據挖掘問題,并制定完成目標的初步計劃。

數據理解:從初始的數據收集開始,通過一預處理分析,目的是了解和掌握數據概況,識別數據的質量問題,發現數據的內部屬性,或是探索有趣的數據集。

數據準備:涵蓋了從原始粗糙數據中構建最終數據集(將作為建模工具的分析對象)的全部工作。數據準備工作有可能被實施多次,而且其實施順序并不是預先規定好的。這一階段的任務主要包括:制表,記錄,數據變量的選擇和轉換,以及為適應建模工具而進行的數據清理等等。

構建模型:選擇和應用不同的模型技術,模型參數被調整到最佳的數值。比較典型的是,對于同一個數據挖掘的問題類型,可以有多種方法選擇使用。一些建模方法對數據的形式有具體的要求,因此,在這一階段,重新回到數據準備階段執行某些任務有時是非常必要的。

模型評估:進行最終的模型部署之前,更加徹底的評估模型,回顧在構建模型過程中所執行的每一個步驟,是非常重要的,這樣可以確保這些模型是否達到了企業的目標。

模型部署:模型的創建并不是數據分析的最終目的。模型的作用是從數據中找到知識,獲得的知識需要便于用戶使用的方式重新組織和展現。根據需求,這個階段可以產生簡單的報告,或是實現一個比較復雜的、可重復的數據挖掘過程。在很多案例中,這個階段是由客戶而不是數據分析人員承擔部署的工作。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢