熱線電話:13121318867

登錄
首頁精彩閱讀產品運營數據分析—SPSS數據分組案例
產品運營數據分析—SPSS數據分組案例
2016-01-20
收藏

產品運營數據分析—SPSS數據分組案例

當我們的樣本量過大,譬如以前講過的,EXCEL2010最大只支持1048576行、16384列,尤其是當行數大于30萬,一般的辦公電腦處理都比較吃力,所以推薦數據分析師們做大數據量處理,還是用SPSS。

今天分享SPSS的數據分組,在SPSS里面,這個功能路徑是:【轉化——重新編碼為相同變量】、【轉化——重新編碼為不同變量】,常用的是第二個,不會覆蓋原有的變量數據。

第一步,數據錄入

繼續沿用之前的EXCEL數據文檔,把數據拷貝到SPSS軟件,設定好變量名稱,如下圖:

數據視圖:


變量視圖


這里注意將【PV】這個變量定義為【數值型】,選擇了【逗號】表示用千分位區分;

第二步,進入編碼功能


第三步,選擇編碼變量

這里選擇【頁面PV】,點擊紅圈中的箭頭,選入右邊的變量框;


第四步,定義輸出變量

這里定義的新變量名是【PV_G】,標簽是【PV分組】;


第五步,設定舊值和新值

入口是上圖中的【舊值和新值】,進入后,看到下面的界面,左右兩大部分,左邊是原有的舊值設定,右邊是編碼后產生的新值;數據分析師培訓

開始編碼,編碼標準,按照昨天的分類,如下圖:


指定舊值范圍

第一組,是0-10萬,大于等于0,小于10萬,因此,舊值部分是:從最小值到99999;


注意這里的輸出變量名稱是【0-10萬】,下面有個勾選【輸出變量為字符串】,并指定寬度,默認是8,我們定義為12,為何不是8,后面看下結果,就知道了。

定義好之后,點擊【添加】,舊值和新值就定義好了,依次定義各個分組的數值。


最后一組,我們通常定義為【范圍,從值到最高】,不至于遺漏數據,正如第一組,我們會定義為【范圍,從最低值】。


定義好舊值新值,點擊【繼續】,返回設定頁面,這時候,【確定】按鈕激活,點擊后,編碼完成。


第六步,編碼完成


如圖,數據分組后的界面,注意這里有兩個分組變量,第一個是【PV_G】,這是字符串寬度為8的時候,第二個是【PV_GROUP】,字符串是寬度為12,區別和原因,大家自己想想就明白。想了解更多關于數據分析師方面的知識,到cda數據分析師官網

數據分組后的變量視圖

 

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢