熱線電話:13121318867

登錄
首頁大數據時代SPSS科研統計:數據的排序、拆分與合并
SPSS科研統計:數據的排序、拆分與合并
2017-09-11
收藏

SPSS科研統計:數據的排序、拆分與合并

通常在進行統計分析之前,可能要對數據文件進行基本的處理操作,讓數據格式更加適合用于將要用到的統計分析方法。數據文件的基本操作主要包括數據的排序、數據的分組、數據的合并、數據的轉置、對變量值的求秩、對變量的編碼、計算新變量、數據的匯總與加權。整理數據文件的功能主要通過“數據”菜單和“轉換”菜單來完成。

一、數據的排序

一般我們創建的數據文件在編輯窗口中個案的前后次序是隨機的,其先后順序由錄入時決定。在做數據統計分析時,有時希望按某種順序來觀察一批數據,以便于更好地了解數據信息。例如:多城市兒童身高,希望身高是按從高到低的順序觀察。SPSS中的數據排序就是將數據編輯窗口中的數據,按照指定的某一個或多個變量值的升序或降序重新排列,所指定的變量稱為排序變量。當排序變量只有一個時,為單值排序,則按照排序變量取值的大小次序對個案數據重新整理后顯示。當排序變量有多個時,為多重排序。多重排序的第一個排序變量稱為主排序變量,其他排序變量依次稱為第二排序變量、第三排序變量等。在多重排序時,個案先按主排序變量值的大小排序,當主排序變量值一致時,再按第二排序變量值大小排序,依次類推。數據排序的主要操作方法如下:


單擊“數據” |“排序個案”命令,彈出“排序個案“對話框,排序前數據如下圖所示。將排序變量選定后,設置好排序方式,如排序個案圖所示,單擊“確定”按鈕,會自動 跳轉到排序后的數據編輯窗口。

(1)   “排序依據”框是選擇指定的排序變量,若排序變量有多個,將自動按照它們在此列表的顯示次序,依次對數據進行排序。


二、數據的拆分

在進行統計分析時,只需要對具有某種特性的數據進行分析,那么就涉及到分組分析,則可以通過拆分數據集來加以實現,它能使數據分析過程按照分組變量進行分組分析,得到各個組的結果。通過拆分功能,還可以實現對原始數據的重新排序,使某一變量取值相同的個案集中在一起,便于觀察和比較。具體的操作方法如下:


單擊“數據”丨“拆分文件”命令,彈出“分割文件”對話框

(1)   “分組方式”框用于選擇拆分的變量,此變量可以是一種及以上。

(2)   指定拆分方式。

分析所有個案,不創建組:是系統的默認值,表示分析所有的個案,取消拆分,它可恢復分組前的狀態;

比較組:分組分析,按組間比較的形式輸出結果;

按組組織輸出:分組分析,分別顯示各組所得的結果。

(3)   指定排序方式。

按分組變量排序文件:拆分時將數據按所用的拆分變量排序,這是系統默認選項;

文件已排序:標識數據己經按分組變量排序了,不需要重新排序。

拆分前數據

數據拆分的參數設置

選中拆分變量后,單擊“確定”按鈕,自動彈出拆分后的數據編輯窗口,如上圖所示。右下側會出現“拆分條件”的提示,表明所做的拆分正在生效,它將在以后的分析中一直有效,而且會被存儲在數據集中,直到再次進行設定為止。數據進行拆分后,其分析結果的顯示表格,如下圖所示

拆分后收數據


三、數據的合并

當數據量很大時,經常需要將一份大的數據分成幾個小部分,由不同的人對數據進行錄入,以提高錄入效率。這樣就會出現一份大的數據分別存儲在幾個不同的數據文件中的現象。因此,將這些若干個小的數據文件合并成一個大的數據文件,是進行各種統計分析的前提。SPSS數據文件的合并方式有兩種:縱向合并和橫向合并。在SPSS系統中,進行合并的文件必須都存儲為SPSS數據格式。


(1)縱向合并

縱向合并指的是幾個數據集中的數據縱向相加,組成一個新的數據集,新數據集中的記錄數是原來幾個數據集中記錄數的總和,實質就是將兩個數據文件的變量列,按照各個變量名的含義,一一對應進行首尾連接合并。合并的兩個數據文件的變量相同,合并的目的是增加分析個案。


實現SPSS數據文件的縱向合并應遵循兩個條件:第一,兩個待合并的SPSS數據文件,其內容合并是有實際意義的;第二,為方便SPSS數據文件的合并,在不同數據文件中,數據含義相同的列,最好起相同的名字,變量類型和變量長度也要盡量相同。這樣,將方便SPSS對變量的自動對應和匹配。

(2)橫向合并

橫向合并指的是按照記錄的次序,或者某個關鍵變量的數值,將不同數據集中的不同變量合并為一個數據集,新數據集中的變量數是所有原數據集中不重名變量的總和,實質就是將兩個數據文件的記錄,按照記錄對應,一一進行左右對接。合并的兩個數據文件的變量不同,但具有相同個案例數。


實現SPSS數據文件的橫向合并應遵循三個條件,第一,如果不是按照記錄號對應的規則進行合并,則兩個數據文件必須至少有一個變量名相同的公共變量,這個變量是兩個數據文件橫向對應合并的依據,稱為關鍵變量。如學號、貴賓卡號等,關鍵變量可以是多個;第二,如果是使用關鍵變量進行合并的,則兩個數據文件都必須事先按關鍵變量進行升序排列;第三,為方便SPSS數據文件的合并,在不同數據文件中,數據含義不相同的列,變量名不應取相同的名稱。數據合并的操作方法如下:單擊“數據”丨“合并文件”丨“添加個案”命令,彈出添加個案文件選擇對話框操作即可。

打開數據合并窗口。因是橫向合并,所以選擇“添加變量”。第二個圖片顯示合并的數據文件。

“已排除的變量”是兩個文件中共同擁有的變量名,選擇它作為“關鍵變量”?!靶碌幕顒訑祿笔亲詈笳故驹诮Y果中的變量名。變量名后的“*”表示當前數據編輯窗口中的量,“+”表示指定文件中的變量?!鞍凑张判蛭募械年P鍵變量匹配個案”中通常選擇第一個,即“兩個文件都提供個案”。


推薦學習書籍

《CDA一級教材》適合CDA一級考生備考,也適合業務及數據分析崗位的從業者提升自我。完整電子版已上線CDA網校,累計已有10萬+在讀~

免費加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢