熱線電話:13121318867

登錄
首頁大數據時代SPSS統計基礎-交叉表功能的使用
SPSS統計基礎-交叉表功能的使用
2017-06-08
收藏

SPSS統計基礎-交叉表功能的使用

 交叉表過程形成二階和多階表,并提供了各種二階表關聯檢驗和度量。表的結構以及類別是否排序決定了要使用的檢驗或度量。

僅對二階表計算交叉表關聯統計量和度量。如果指定一行、一列和一個層因子(控制變量),交叉表過程將為層因子(或兩個或更多控制變量的值組合)的每個值形成一個關聯統計量和量度面板。例如,如果性別是一個已婚(是、否)與生活(生活充滿激情、循規蹈矩或索然無味)相對照的表的層因子,則女性的二階表結果將與男性的二階表結果分開計算,并打印成互相接續的面板格式。

關聯統計量和度量。Pearson 卡方、似然比卡方、線性關聯檢驗、Fisher 的精確檢驗、Yates 校正卡方、Pearson 的r、Spearman 的rho、列聯系數、phi、Cramér 的V,、對稱和非對稱lambda、Goodman 和Kruskal 的tau、不確定性系數、gamma、Somers 的d、Kendall 的tau-b、Kendall 的tau-c、eta 系數、Cohen 的kappa、相對風險估計、幾率比、McNemar 檢驗、Cochran 和Mantel-Haenszel 統計量以及列比例統計量。

數據。要定義每個表變量的類別,請使用數值或字符串(八個或八個以下字節)變量的值。例如,對于gender,您可用將數據編碼為1 和2,或編碼為male 和female。

假設。如有關統計量一節中所述,某些統計量和度量假定已排序的類別(有序數據)或數量值(定距或者定比數據)。另有一些統計量則在表變量具有未排序的類別(名義數據)時有效。對于基于卡方的統計量(phi、Cramér 的V 和列聯系數),數據應為來自多項分布的隨機樣本。

獲取交叉制表

E 從菜單中選擇:

分析> 描述統計> 交叉表...

根據需要,您可以:

選擇一個或多個控制變量。

單擊統計量以獲取二階表或子表的關聯檢驗和度量。

單擊單元格以獲取觀察值和期望值、百分比值和殘差。

單擊格式以控制類別的順序

交叉表:層

如果選擇一個或多個層變量,則將對每個層變量(控制變量)的每個類別產生單獨的交叉制表。例如,如果有一個行變量、一個列變量和一個具有兩個類別的層變量,則可為層變量的每個類別生成一個二階表。要形成另一層控制變量,請單擊下一個。為每個第一層變量與每個第二層變量(等等)的每種類別組合生成子表。如果請求了關聯統計量和度量,則它們僅應用于二階子表。

交叉表復式條形圖

顯示復式條形圖。復式條形圖可幫助匯總個案組的數據。對于在“行”下指定的變量的每個值,均有一個聚類條形圖。定義每個聚類內的條形圖的變量就是您在“列”下指定的變量。對于此變量的每個值,均有一組不同顏色或圖案的條形圖。如果您在“列”或“行”下指定多個變量,則為每個雙變量組合生成一個復式條形圖。

交叉表統計量

卡方。對于兩行兩列的表,請選擇卡方以計算Pearson 卡方、似然比卡方、Fisher 的精確檢驗和Yates 修正卡方(連續性修正)。對于2 × 2 表,如果表不是從具有期望頻率小于5 的單元的較大表中的缺失行或列得來的,則計算Fisher 的精確檢驗。對所有其他2 × 2 表計算Yates 修正卡方。對于具有任意行列數的表,選擇卡方來計算Pearson 卡方和似然比卡方。當兩個表變量都是定量變量時,卡方將產生線性關聯檢驗。

相關性。對于行和列都包含排序值的表,相關將生成Spearman 相關系數rho(僅數值數據)。Spearman 的rho 是秩次之間的關聯的測量。當兩個表變量(因子)都是定量變量時,相關產生Pearson 相關系數r,這是變量之間的線性關聯的定量。

名義。對于名義數據(無內在順序,如天主教、新教和猶太教),可以選擇列聯系數、Phi(系數)和Cramér 的V、Lambda(對稱和非對稱lambda 以及Goodman 和Kruskal的tau)和不確定性系數。

相依系數. 一種基于卡方的關聯性測量。值的范圍在0 到1 之間,其中0 表示

行變量和列變量之間不相關,而接近1 的值表示變量之間的相關度很高??赡?

的極大值取決于表中的行數和列數。

Phi and Cramer's V. Phi 是基于卡方統計量的關聯性測量,它將卡方檢驗統計量除以樣本大小,并取結果的平方根。Cramer 的V 是基于卡方統計量的關聯性測量。

Lambda. 一種相關性測量,它反映使用自變量的值來預測因變量的值時,誤差成比例縮小。值為1 表示自變量能完全預測因變量。值為0 表示自變量對于預測因變量沒有幫助。

不定性系數. 一種相關性的測量,它表示當一個變量的值用來預測其他變量的值時,誤差成比例下降的程度。例如,值0.83 指示如果知道一個變量的值,則在預測其他變量的值時會將誤差減少83%。程序同時計算不定性系數的對稱版本和不對稱版本。

有序。對于行和列都包含已排序值的表,請選擇Gamma(對于2 階表,為零階;對于3階到10 階表,為條件)、Kendall 的tau-b 和Kendall 的tau-c。要根據行類別預測列類別,請選擇Somers 的d。

Gamma. 兩個有序變量之間的相關性的對稱度量,它的范圍是從-1 到1。絕對值接近1 的值表示兩個變量之間存在緊密的關系。接近0 的值表示關系較弱或者沒有關系。對于二階表,顯示零階gamma。對于三階表到n 階表,顯示條件gamma。

Somers d.兩個有序變量之間相關性的測量,它的范圍是從-1 到1。絕對值接近1的值表示兩個變量之間存在緊密的關系,值接近0 則表示兩個變量之間關系很弱或沒有關系。Somers 的d 是gamma 的不對稱擴展,不同之處僅在于它包含了未約束到自變量上的成對的數目。還將計算此統計量的對稱版本。

Kendall's tau-b. 將結考慮在內的有序變量或排序變量的非參數相關性測量。系數的符號指示關系的方向,絕對值指示強度,絕對值越大則表示關系強度越高??赡艿娜≈捣秶菑?1 到1,但-1 或+1 值只能從正方表中取得。

Kendalls tau-c. 忽略結的有序變量的非參數關聯性測量。系數的符號指示關系

的方向,絕對值指示強度,絕對值越大則表示關系強度越高??赡艿娜≈捣秶菑?1 到1,但-1 或+1 值只能從正方表中取得。

按區間標定。當一個變量為分類變量,而另一個變量為定量變量時,請選擇Eta。分類變量必須進行數值編碼。

Eta. 范圍在0 到1 之間的相關性測量,其中0 值表示行變量和列變量之間無相關性,接近1 的值表示高度相關。Eta 適用于在區間尺度上度量的因變量(例如收入)以及具有有限類別的自變量(例如性別)。計算兩個eta 值:一個將行變量視為區間變量,另一個將列變量視為區間變量。

Kappa. 當兩個估計方在估計同一個對象時,Cohen 的kappa 度量兩者的估計之間的一致性。值為1 表示完全一致。值為0 表示幾乎完全不一致。Kappa 基于平方表,其中列和行值代表相同刻度。在任何單元格中,如果有一個變量有觀察值但另一個變量沒有觀察值,則單元格會分配計數0。如果這兩個變量的數據存儲類型(字符串或數值)不同,Kappa 不計算。對于字符串變量,這兩個變量必須有相同的定義長度。風險. 對于2 x 2 表,某因子的存在與某事件的發生之間關聯性強度的測量。如果該統計量的置信區間包含值1,則不能假設因子與事件相關。當因子出現很少時,幾率比可用作估計或相對風險。

McNemar(M). 兩個相關二分變量的非參數檢驗。使用卡方分布檢驗響應改變?!爸芭c之后”設計中的試驗干預會導致響因變量發生變化,它對于檢測到這些變化很有用。對于較大的正方表,會報告對稱性的McNemar-Bowker 檢驗。

Cochran's and Mantel-Haenszel 統計量. Cochran 和Mantel-Haenszel 統計量可以用于檢驗二分因子變量和二分響應變量之間的條件獨立性,條件是給定一個或多個分層(控制)變量定義的協變量模式。請注意:其他統計逐層計算,而Cochran 和Mantel-Haenszel 統計對所有層進行一次性計算。

交叉表:單元顯示

計數。如果行和列變量彼此獨立,則這是實際觀察的個案數和期望的個案數。您可以選擇隱藏低于指定整數的計數。隱藏值將顯示為

比較列的比例。該選項將計算列屬性的成對比較,并指出給定行中的哪對列明顯不同。使用下標字母以APA 樣式格式在交叉表中標識顯著性差異,并以0.05 顯著性水平對其進行計算。

注意:如果指定該選項并且不選擇觀察計數或列百分比,則觀察計數包含在

交叉表中,并且會以APA 樣式下標字母標識列比例檢驗的結果。

調整p 值(Bonferroni 方法)。列比例的成對比較使用了Bonferroni 修正,可在進行了多個比較后調整觀察到的顯著性水平。

百分比。百分比值可以跨行或沿列進行相加。還提供表(一層)中表示的個案總數的百分比值。注意:如果在“計數”組中選擇隱藏小計數,也會隱藏與隱藏計數相關的百分比。

殘差。未標準化的原始殘差給出了觀察值和期望值之間的差。還提供標準化殘差和經過調整的標準化殘差。

未標準化. 觀察值與期望值之間的差。如果兩個變量之間沒有關系,則期望值是期望在單元中出現的個案數。如果行變量和列變量獨立,則正的殘差表示單元中的實際個案數多于期望的個案數。

標準化. 殘差除以其標準差的估計。標準化殘差也稱為Pearson 殘差,它的均

值為0,標準差為1。

調節的標準化. 單元格的殘差(觀察值減去期望值)除以其標準誤的估計值。生成的標準化殘差表示為均值上下的標準差單位。

非整數權重。單元計數通常為整數值,因為它們代表每個單元中的個案個數。但是,如果數據文件當前按某個帶小數值(例如1.25)的權重變量進行加權,則單元計數也可能是小數值。在計算單元計數之前可以進行截斷或舍入,或為表顯示和統計計算都使用小數單元計數。

四舍五入單元格計數. 在計算任何統計之前,個案權重按原樣使用,但單元中的累積權重要四舍五入。

截短單元格計數. 在計算任何統計之前,個案權重按原樣使用,但截短單元中

的累積權重。

四舍五入個案權重. 在使用之前對個案權重進行四舍五入。

截短個案權重. 在使用之前對個案權重進行截短。

無調節. 個案權重按原樣使用且使用小數單元計數。但是,當需要“精確”統計

(僅由“精確檢驗”選項提供)時,在計算“精確”檢驗統計之前,單元中的累積

權重或者截短或者四舍五入。


推薦學習書籍
《CDA一級教材》適合CDA一級考生備考,也適合業務及數據分析崗位的從業者提升自我。完整電子版已上線CDA網校,累計已有10萬+在讀~

免費加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢