一、SPSS數據文件的特點
(1)SPSS數據文件是一種有結構的數據文件,它由數據結構和內容兩部分組成,
(2)數據結構是對SPSS中各列變量及其屬性的描述,主要記錄數據變量的名稱、類型、變量寬度、小數位數、變量名標簽、變量值標簽、缺失值、顯示寬度、對齊方式和計量尺度等必要信息,
(3)數據的內容才是那些待分析的具體數據。
(4)相關概念:個案(或記錄)、變量、變量值。
個案:數據編輯窗口中的一行稱為一個個案Case)或記錄(Record),所有個案組成SPSS數據文件的內容。
變量:數據編輯窗口的一列稱為一個變量(Variable),每個變量都有一個名字,稱為變量名,它是訪問和分析SPSS每個變量的唯一標志。 SPSS數據文件的結構就是對每個變量及相關特征的描述。
變量值:單元格中的具體數值。
創建SPSS數據文件的方法
基于上述特點,建立SPSS數據文件時應完成兩項任務:
(1)描述數據的結構:在數據編輯器窗口的變量視圖界面定義變量的各個屬性,如:變量名,類型、變量寬度、小數位數、變量名標簽、變量值標簽、缺失值、顯示寬度、對齊方式和度量尺度等等。
(2)錄入編輯數據:在數據編輯器窗口的數據視圖界面中錄入已定義各變量的變量值,即原始數據。
二、SPSS數據的結構和定義方法
SPSS數據的結構是對SPSS每列變量及其相關屬性的描述,主要包括變量名、數據類型、變量寬度、變量名標簽、變量值標簽、顯示寬度、缺失值、對齊方式、計量尺度等信息。
1、變量名:
變量名是變量訪問和分析的唯一標志。在定義SPSS數據結構時應首先給出每列變量的變量名。變量的命名規則如下:
1.首字符應以英文字母開頭,后面可以跟除了!、?、*之外的字母或數字。下劃線、圓點不能為變量名的最后一個字符。SPSS允許用漢字作為變量名。
2.SPSS12.0版本以前,變量名的字符個數最好不多于8個;變量名不區分大小寫字母。
3. SPSS有默認的變量名,以字母“VAR”開頭,后面補足5位數字,如VAR00001,VAR00012等。變量名不能與SPSS內部特有的具有特定含義的保留字同名,如ALL,BY,AND,NOT,OR等。
4.變量名最好與其代表的數據含義相對應,每個變量名必須具有唯一性。
2、變量類型
變量類型是指每個變量取值的類型。
SPSS中有三種基本變量類型:
(1)數值型
(2)字符型(String)
(3)日期型(Date)
(1)數值型
?數值型是SPSS最常用的變量類型,其變量取值通常由阿拉伯數字和其它特殊符號(圓點、逗號、美元符號)等組成。如工資、年齡、產量、考試成績等需要定義為數值型變量。
?SPSS關于數值型變量提供了五種不同的數據顯示方法:
(1)標準型(Numeric)
(2)科學記數法型(Scientific Notation)
(3)逗號型(Comma)
(4)圓點型(Dot)
(5)美元符號型(Dollar)
其中的標準型( Numeric )是SPSS默認的變量類型。
默認的顯示寬度為8位,小數位默認為2位。
(2)字符型(String)
?字符型也是SPSS較常用的變量類型,其變量取值由一個字符串(字母、漢字或數字)組成。字符型變量其取值不能夠進行算術運算,如職工號碼、姓名、地址、性別、職稱等變量都可以定義為字符型。
?注意:字符型數據在SPSS命令處理過程中應用一對雙引號括起來,但在輸入數據時不應輸入雙引號,否則雙引號將會作為字符型數據的一部分。
(3)日期型(Date)
?日期型數據用來表示日期或者時間,如生日、成立日期等變量可以定義為日期型數據。顯示格式:dd-mmm-yyyy;mm/dd/yyyy等等,其中
?“dd”是用兩位數來表示日期?!癲dd”是用三位數來表示從元月一日算起的日數。
?“mm”是用數字表示的月份數?!癿mm”是用英文月份單詞的前三個字母表示的月份。
?“yy” 是用兩位數來表示的年份?!皔yyy” 是用四位數來表示的年份。
?“hh”表示小時;“mm”表示分;“ss”表示秒。
敬請期待下回講解








暫無數據