熱線電話:13121318867

登錄
首頁精彩閱讀利用SPSS進行數據分析的基本步驟
利用SPSS進行數據分析的基本步驟
2016-06-24
收藏

利用SPSS進行數據分析的基本步驟


大家都知道數據分析的基本流程為明確分析的目的和內容——數據收集——數據處理——數據分析——數據展現——報告撰寫,今天這里所要說的是如何利用SPSS進行數據分析,也就是整個數據分析流程的中間部分(是指從將數據導入SPSS工具到利用SPSS工具產生分析結果,對結果進行整理,形成圖表并解讀分析的過程)。

利用SPSS等工具進行統計分析時,需要經過數據準備、數據轉換、數據分析和數據展現這樣四個階段,下面中國統計網將對這幾個階段一一講述:

(一) 數據準備

FAQ:這里為什么用數據準備而不用數據采集?

數據采集是一個非常繁雜漫長的過程,數據采集來源、采集頻率、采集人員安排等等這些足夠寫一篇文章,同時這里所要談的這個過程是從數據開始說起的,至于這些數據如何而來,這里不作討論。

數據準備過程主要包括兩部分內容:SPSS數據文件的建立和變量編輯。在SPSS數據文件建立之前,我們需要分析的數據可能以各種各樣的形態存在,可能需要手動錄入(小批量的數據,但通常數據的錄入不在SPSS中直接進行),也可能是以其他格式形態存在,例如:.xls/.xlsx/.xlsm格式,.txt文本格式或.CSV格式,SPSS支持多種數據格式文件的導入。

除此之外,SPSS還可以直接從數據庫中導入數據,利用數據庫導入方式導入數據。這里需要注意的是,SPSS每執行一條指令,都會重新讀取所需的數據,如果你所取的數據是利用SQL語句從遠程數據庫中調用的數據文件,那么將會非常耗時,此時的小技巧是利用好Cache data功能,建立活動的數據緩存區,那樣SPSS的運算速度會提升很多。

SPSS數據文件成功建立后,接下來的準備工作則是對變量屬性進行適當的調整和完善。例如你從公司的網站后臺提取銷售數據,后臺數據庫為了記錄方便通常是將各種渠道銷售數據用數字代碼表示,而將這些數據成功的建成SPSS數據文件后,此時你需要對渠道代碼進行編碼說明,對缺失值進行標記等等。


(二) 數據清洗

此過程主要為下一步數據分析做進一步的準備,最終將數據清洗為滿足分析需求的具體數據集。期間主要內容包括:

1)數據集的預先分析:對數據進行必要的分析,如數據分組、排序、分布圖、平均數、標準差描述等,以掌握數據的基本特點和基本情況,保證后續工作的有效性,也為確定應采用的統計檢驗方法提供依據

2) 相關變量缺失值的查補檢查

3)分析前相關的校正和轉換工作,如根據銷售額對觀測值進行分類,形成新的分類變量,從對應的身份證信息中提取出地區、年齡、性別等新的變量信息等

4)觀測值的抽樣篩選,如抽取銷售額大于10萬的產品等

5)其他數據清洗工作

Tips:期間注意規劃好清洗步驟和數據備份工作。

(三) 數據分析
此階段主要根據需求,選擇合適的統計方法進行統計分析和數據圖表的制作,這里選擇合適的方法是關鍵,相關操作SPSS軟件已經標準流程化,我們只需要選擇合適的參數進行相關操作即可。下表是根據自變量與因變量數目對各種統計方法的一個歸類:


除了上述方法外,SPSS 17.0以上的版本還提供了一個直銷模塊,這部分內容是對市場營銷活動中的用的比較多的模型的整理濃縮,本貼暫時不對數據分析的相關內容做深入詳細的介紹,以后將針對案例對這部分內容進行詳細敘述。


(四) 數據展現 

常常聽到有人抱怨SPSS輸出的圖表太丑,修改編輯起來太麻煩,真的是這樣嗎?其實SPSS軟件有提供很多的圖表供大家選擇,太多的時候,我們所使用的只是其中的一種而已。除此之外,SPSS也提供自己定義圖表模版功能供我們自由操作。


SPSS的菜單操作通常會輸出很多多余的結果,對這些結果進行有針對性的挑選和組合才是工作的重點,而不是一味的將所有分析結果一股腦的全搬到報告中去,在寫報告前對這些結果進行合理的簡化和整合是必須的,與此同時,相應的結果解釋(探討是否接受或拒絕研究假設,解釋結果形成的原因)以及相關含義衍生都在此部分完成。例如,我們進行方差分析時,SPSS可能直接輸出如下圖的結果,但我們展現結果的時候并不需要這么多看起來讓人眼花的數據結果,只需要從下表中提取出需要的那部分即可。

變異來源

型Ⅲ SS df 均方

F Sig.

整體模型

391.628 6 65.271

4.894 .001

Day

Round

Gender

271.367 3 90.456

106.297 2 53.148

13.964 1 13.964

6.783 .001

3.985 .026

1.047 .312

注:這里舉這個示例只是表達一種方法,對于模型的結果完整性并未作太多的考究

從上表三因素方差分析表可知,整體模型達顯著水平。其中Day和Round的主效應達到顯著水平,但Gender的主效應未達到顯著水平。除此之外,此模型還未考慮三者之間的交互效應……(結合其他圖表的結果作深一步的分析說明,并結合業務情況對結果進行分析說明)。



數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢