熱線電話:13121318867

登錄
首頁精彩閱讀數據分析學習總結(一):數據分析那些事兒?
數據分析學習總結(一):數據分析那些事兒?
2014-11-10
收藏


數據分析學習總結(一):數據分析那些事兒



上周從買了兩本書《誰說菜鳥不會數據分析》和《大數據時代》,學習過程中想把書本內容通過總結、理解、實踐、內化掌握來變成自己的東西,把握好學習的節奏,堅持就好。

    初級階段我更多的是來轉述前輩們總結出的東西,但自己若有實踐中的體會也會寫入其中(自己的體會粗體標出)。本來就是記錄菜鳥成長過程,所以內容對行家來說太小兒科,對新手入門來說或許會有些幫助。

    以下開始是對《誰說菜鳥不會分析數據》一書的學習總結,第一章:數據分析那些事兒。

一、數據分析是神馬?

1.何謂數據分析?

    用適當的統計分析方法對收集來的大量數據進行詳細研究和概括總結,以求最大化地發揮數據的作用,提取有用信息和形成結論,這一過程叫做數據分析。

2.數據分析的三大作用:現狀分析、原因分析、預測分析。

二、數據分析六步曲:

1.明確分析思路:

    首先要明確分析目的:菜鳥與數據分析師的區別就在于菜鳥做分析時目的不明確,從而導致分析過程非常盲目。這點有比較深的體會,在公司里做過關于搜索和新手的產品數據分析,自己對分析目的沒考慮太多,靠的是前人留下的上期數據分析結果,倘若讓我從零開始做,估計會很盲目。

    然后確定分析思路:梳理分析思路,并搭建分析框架,把分析目的分解成若干個不同的分析要點,即如何具體開展數據分析,需要從哪幾個角度進行分析,采用哪些分析指標。

    最后還要確保分析框架的體系化,使分析結果具有說服力:營銷方面的理論模型有4P、用戶使用行為、STP理論、SWOT等;管理方面的理論模型有PEST、5W2H、時間管理、生命周期、邏輯樹、金字塔、SMART等。在上周一個匯報上使用了SWOT分析方法,對這些營銷或管理的模型還都很陌生。

2.數據收集:

    一般數據來源于以下幾種方式:數據庫、公開出版物(統計年鑒或報告)、互聯網、市場調查。

3.數據處理:

    數據處理主要包括數據清洗、數據轉化、數據提取、數據計算等處理方法。導師提過在做數據處理時,不要在原始數據上進行數據處理以防原始數據丟失,保留數據處理過程以便發現錯誤時查找。

4.數據分析:

    數據分析是指用適當的分析方法及工具,對處理過的數據進行分析,提取有價值的信息,形成有效結論的過程。

    與數據挖掘的關系是數據挖掘側重解決四類數據分析問題:分類、聚類、關聯和預測,重點在尋找模式與規律。

5.數據展現:

    一般情況下,數據是通過表格和圖形的方式來呈現的。常用的數據圖表包括餅圖、柱形圖、條形圖、折線圖、散點圖、雷達圖等。進一步加工整理變成我們需要的圖形,如金字塔圖、矩陣圖、漏斗圖、帕雷托圖等。

    在一般情況下,能用圖說明問題的就不用表格,能用表說明問題的就不用文字。

6.報告撰寫:

    一份好的數據分析報告,首先需要有一個好的分析框架,并且圖文并茂,層次明晰,能夠讓閱讀者一目了然。結構清晰、主次分明可以使閱讀者正確理解報告內容;圖文并茂,可以令數據更加生動活潑,提高視覺沖擊力,有助于閱讀者更形象、直觀地看清楚問題和結論,從而產生思考。

    另外,數據分析報告需要有明確的結論,沒有明確結論的分析稱不上分析,好的分析報告一定要有建議或解決方案。

三、數據分析的三大誤區:

1.分析目的不明確,為分析而分析。

2.缺乏業務知識,分析結果偏離實際:數據分析師的任務不是單純做數學題,數據分析師還必須懂營銷,懂管理,更要懂策略。上周五聽了公司專門做數據分析的同事做的關于新手留存的數據分析專題,他們數理統計專業知識必然過硬,而且對業務比較熟悉,能通過數據結合不同業務做出相應結論,還能為不同業務提出改進意見,不熟悉業務不懂策略怎行?

3.一味追求使用高級分析方法,熱衷研究模型。

四、數據分析師的職業發展:

1.數據分析的廣闊前景:根據美國勞工部預測,到2018年,數據分析師的需求量將增長20%。就算你不是數據分析師,但數據分析技能也是未來必不可少的工作技能之一。

2.數據分析師的職業要求:懂業務,懂管理,懂分析,懂工具,還要懂設計。

    其中,懂分析中,基本的分析方法有:對比分析法、分組分析法、交叉分析法、結構分析法、漏斗圖分析法、綜合評價分析法、因素分析法、矩陣關聯分析法等;高級的分析方法有:相關分析法、回歸分析法、聚類分析法、判別分析法、主成分分析法、因子分析法、對應分析法、時間序列等。

    懂工具中,常用的數據分析工具有Excel、Access、SPSS、SAS,先學會用Excel,它能解決80%甚至100%的問題。

    懂設計中,圖表的設計是大學問,如圖形的選擇、版式的設計、顏色的搭配等,都需要掌握一定的設計原則。

五、幾個常用指標和術語:

    以下幾個常見的只是提一下:平均數、絕對數和相對數、百分比和百分點、頻數和頻率、比例和比率。

    另外倍數與番數、同比與環比,我之前有疑問的特別提下。番數是指原來數量的2的N次方倍,比如翻一番為原來數量的2倍(2的一次方),翻兩番為4倍(2的二次方)。同比是與歷史同時期進行比較得到的數值,環比是指與前一個統計期進行比較得到的數值。(文章來源:CDA數據分析師培訓官網)


    這部分主要是對數據分析有了一個全面的了解而又粗略的認識,說實話這樣的總結復述后很多地方我印象也不深,但總比看過一遍后不再管能多記住一些,當然能實踐才會印象更深。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢