熱線電話:13121318867

登錄
首頁精彩閱讀理想VS現實的數據分析流程
理想VS現實的數據分析流程
2016-09-03
收藏

理想VS現實的數據分析流程

數據分析師的工作流程,理想情況下,可以分為四個步驟。

1、提取數據。利用SQL語言從數據倉庫中提取你分析需要的字段。所以數據分析師一定要對SQL語言相對比較精通。

2、處理數據。提取出來的數據,一般都要進行一些預處理。例如:對缺失值、異常值進行處理、數據進行轉換(例如:文字轉換成數值,男->1)、數據離散(例如把年齡根據分析的目標分為不同的年齡段)。

3、分析數據。通過作圖、進行基本統計,分析數據異常背后的發生了什么。許多時候你需要用到各種各樣的模型,例如:聚類,分析會員的類型,不同類型的會員有什么特點。你可能會把數據放在EXCEL、SAS、SPSS等上進行分析。

4、分析報告。數據分析的結果最終一般都會以報告的形式呈現。在分析報告中,根據數據進行問題進行描述,或者說發現問題的所在,同樣的通過數據你找到解決問題的辦法或者方向,說明你的觀點。

實際工作流程


但是現實與理想總是存在那么、那么、那么大的差距,在實際工作中,數據分析是一個循環、迭代的過程(如圖2)

在你處理數據的時候,你有可能發現你提的數據有問題,可能是缺少字段、或者時間不對?;蛘甙l現數據的邏輯有問題,在寫SQL的時候可能出現重復數據。

在進行數據分析步驟后,你可能發現,根據分析的問題,你可能需要提取更多的數據來進行支持。特別對數據分析是針對探索性的問題時候。

有分析數據的時候,你可能發現,你的數據預處理沒有達到目的,例如你的年齡分段可能之前是按5歲來進行等距分隔的,現在你希望是按等箱進行分析隔,或者你希望按用戶的所處階段(學生、職場新人、白領、結婚、有小孩……)從而你需要又回到前面那個步聚。

甚至在你完成分析告訴后,你會收到這樣的需要說,我覺得某個問題可能需要從其它維度進行分析,從而更深入的了解這個問題,這個時間又回到定義問題的階段。

所以數據分析不是一蹴而就的事情,而是一個迭代、循環的過程。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢