
SPSS統計基礎-交叉表功能的使用
交叉表過程形成二階和多階表,并提供了各種二階表關聯檢驗和度量。表的結構以及類別是否排序決定了要使用的檢驗或度量。
僅對二階表計算交叉表關聯統計量和度量。如果指定一行、一列和一個層因子(控制變量),交叉表過程將為層因子(或兩個或更多控制變量的值組合)的每個值形成一個關聯統計量和量度面板。例如,如果性別是一個已婚(是、否)與生活(生活充滿激情、循規蹈矩或索然無味)相對照的表的層因子,則女性的二階表結果將與男性的二階表結果分開計算,并打印成互相接續的面板格式。
關聯統計量和度量。Pearson 卡方、似然比卡方、線性關聯檢驗、Fisher 的精確檢驗、Yates 校正卡方、Pearson 的r、Spearman 的rho、列聯系數、phi、Cramér 的V,、對稱和非對稱lambda、Goodman 和Kruskal 的tau、不確定性系數、gamma、Somers 的d、Kendall 的tau-b、Kendall 的tau-c、eta 系數、Cohen 的kappa、相對風險估計、幾率比、McNemar 檢驗、Cochran 和Mantel-Haenszel 統計量以及列比例統計量。
數據。要定義每個表變量的類別,請使用數值或字符串(八個或八個以下字節)變量的值。例如,對于gender,您可用將數據編碼為1 和2,或編碼為male 和female。
假設。如有關統計量一節中所述,某些統計量和度量假定已排序的類別(有序數據)或數量值(定距或者定比數據)。另有一些統計量則在表變量具有未排序的類別(名義數據)時有效。對于基于卡方的統計量(phi、Cramér 的V 和列聯系數),數據應為來自多項分布的隨機樣本。
獲取交叉制表
E 從菜單中選擇:
分析> 描述統計> 交叉表...
根據需要,您可以:
選擇一個或多個控制變量。
單擊統計量以獲取二階表或子表的關聯檢驗和度量。
單擊單元格以獲取觀察值和期望值、百分比值和殘差。
單擊格式以控制類別的順序
交叉表:層
如果選擇一個或多個層變量,則將對每個層變量(控制變量)的每個類別產生單獨的交叉制表。例如,如果有一個行變量、一個列變量和一個具有兩個類別的層變量,則可為層變量的每個類別生成一個二階表。要形成另一層控制變量,請單擊下一個。為每個第一層變量與每個第二層變量(等等)的每種類別組合生成子表。如果請求了關聯統計量和度量,則它們僅應用于二階子表。
顯示復式條形圖。復式條形圖可幫助匯總個案組的數據。對于在“行”下指定的變量的每個值,均有一個聚類條形圖。定義每個聚類內的條形圖的變量就是您在“列”下指定的變量。對于此變量的每個值,均有一組不同顏色或圖案的條形圖。如果您在“列”或“行”下指定多個變量,則為每個雙變量組合生成一個復式條形圖。
交叉表統計量
卡方。對于兩行兩列的表,請選擇卡方以計算Pearson 卡方、似然比卡方、Fisher 的精確檢驗和Yates 修正卡方(連續性修正)。對于2 × 2 表,如果表不是從具有期望頻率小于5 的單元的較大表中的缺失行或列得來的,則計算Fisher 的精確檢驗。對所有其他2 × 2 表計算Yates 修正卡方。對于具有任意行列數的表,選擇卡方來計算Pearson 卡方和似然比卡方。當兩個表變量都是定量變量時,卡方將產生線性關聯檢驗。
相關性。對于行和列都包含排序值的表,相關將生成Spearman 相關系數rho(僅數值數據)。Spearman 的rho 是秩次之間的關聯的測量。當兩個表變量(因子)都是定量變量時,相關產生Pearson 相關系數r,這是變量之間的線性關聯的定量。
名義。對于名義數據(無內在順序,如天主教、新教和猶太教),可以選擇列聯系數、Phi(系數)和Cramér 的V、Lambda(對稱和非對稱lambda 以及Goodman 和Kruskal的tau)和不確定性系數。
相依系數. 一種基于卡方的關聯性測量。值的范圍在0 到1 之間,其中0 表示
行變量和列變量之間不相關,而接近1 的值表示變量之間的相關度很高??赡?
的極大值取決于表中的行數和列數。
Phi and Cramer's V. Phi 是基于卡方統計量的關聯性測量,它將卡方檢驗統計量除以樣本大小,并取結果的平方根。Cramer 的V 是基于卡方統計量的關聯性測量。
Lambda. 一種相關性測量,它反映使用自變量的值來預測因變量的值時,誤差成比例縮小。值為1 表示自變量能完全預測因變量。值為0 表示自變量對于預測因變量沒有幫助。
不定性系數. 一種相關性的測量,它表示當一個變量的值用來預測其他變量的值時,誤差成比例下降的程度。例如,值0.83 指示如果知道一個變量的值,則在預測其他變量的值時會將誤差減少83%。程序同時計算不定性系數的對稱版本和不對稱版本。
有序。對于行和列都包含已排序值的表,請選擇Gamma(對于2 階表,為零階;對于3階到10 階表,為條件)、Kendall 的tau-b 和Kendall 的tau-c。要根據行類別預測列類別,請選擇Somers 的d。
Gamma. 兩個有序變量之間的相關性的對稱度量,它的范圍是從-1 到1。絕對值接近1 的值表示兩個變量之間存在緊密的關系。接近0 的值表示關系較弱或者沒有關系。對于二階表,顯示零階gamma。對于三階表到n 階表,顯示條件gamma。
Somers d.兩個有序變量之間相關性的測量,它的范圍是從-1 到1。絕對值接近1的值表示兩個變量之間存在緊密的關系,值接近0 則表示兩個變量之間關系很弱或沒有關系。Somers 的d 是gamma 的不對稱擴展,不同之處僅在于它包含了未約束到自變量上的成對的數目。還將計算此統計量的對稱版本。
Kendall's tau-b. 將結考慮在內的有序變量或排序變量的非參數相關性測量。系數的符號指示關系的方向,絕對值指示強度,絕對值越大則表示關系強度越高??赡艿娜≈捣秶菑?1 到1,但-1 或+1 值只能從正方表中取得。
Kendalls tau-c. 忽略結的有序變量的非參數關聯性測量。系數的符號指示關系
的方向,絕對值指示強度,絕對值越大則表示關系強度越高??赡艿娜≈捣秶菑?1 到1,但-1 或+1 值只能從正方表中取得。
按區間標定。當一個變量為分類變量,而另一個變量為定量變量時,請選擇Eta。分類變量必須進行數值編碼。
Eta. 范圍在0 到1 之間的相關性測量,其中0 值表示行變量和列變量之間無相關性,接近1 的值表示高度相關。Eta 適用于在區間尺度上度量的因變量(例如收入)以及具有有限類別的自變量(例如性別)。計算兩個eta 值:一個將行變量視為區間變量,另一個將列變量視為區間變量。
Kappa. 當兩個估計方在估計同一個對象時,Cohen 的kappa 度量兩者的估計之間的一致性。值為1 表示完全一致。值為0 表示幾乎完全不一致。Kappa 基于平方表,其中列和行值代表相同刻度。在任何單元格中,如果有一個變量有觀察值但另一個變量沒有觀察值,則單元格會分配計數0。如果這兩個變量的數據存儲類型(字符串或數值)不同,Kappa 不計算。對于字符串變量,這兩個變量必須有相同的定義長度。風險. 對于2 x 2 表,某因子的存在與某事件的發生之間關聯性強度的測量。如果該統計量的置信區間包含值1,則不能假設因子與事件相關。當因子出現很少時,幾率比可用作估計或相對風險。
McNemar(M). 兩個相關二分變量的非參數檢驗。使用卡方分布檢驗響應改變?!爸芭c之后”設計中的試驗干預會導致響因變量發生變化,它對于檢測到這些變化很有用。對于較大的正方表,會報告對稱性的McNemar-Bowker 檢驗。
Cochran's and Mantel-Haenszel 統計量. Cochran 和Mantel-Haenszel 統計量可以用于檢驗二分因子變量和二分響應變量之間的條件獨立性,條件是給定一個或多個分層(控制)變量定義的協變量模式。請注意:其他統計逐層計算,而Cochran 和Mantel-Haenszel 統計對所有層進行一次性計算。
交叉表:單元顯示
計數。如果行和列變量彼此獨立,則這是實際觀察的個案數和期望的個案數。您可以選擇隱藏低于指定整數的計數。隱藏值將顯示為
比較列的比例。該選項將計算列屬性的成對比較,并指出給定行中的哪對列明顯不同。使用下標字母以APA 樣式格式在交叉表中標識顯著性差異,并以0.05 顯著性水平對其進行計算。
注意:如果指定該選項并且不選擇觀察計數或列百分比,則觀察計數包含在
交叉表中,并且會以APA 樣式下標字母標識列比例檢驗的結果。
調整p 值(Bonferroni 方法)。列比例的成對比較使用了Bonferroni 修正,可在進行了多個比較后調整觀察到的顯著性水平。
百分比。百分比值可以跨行或沿列進行相加。還提供表(一層)中表示的個案總數的百分比值。注意:如果在“計數”組中選擇隱藏小計數,也會隱藏與隱藏計數相關的百分比。
殘差。未標準化的原始殘差給出了觀察值和期望值之間的差。還提供標準化殘差和經過調整的標準化殘差。
未標準化. 觀察值與期望值之間的差。如果兩個變量之間沒有關系,則期望值是期望在單元中出現的個案數。如果行變量和列變量獨立,則正的殘差表示單元中的實際個案數多于期望的個案數。
標準化. 殘差除以其標準差的估計。標準化殘差也稱為Pearson 殘差,它的均
值為0,標準差為1。
調節的標準化. 單元格的殘差(觀察值減去期望值)除以其標準誤的估計值。生成的標準化殘差表示為均值上下的標準差單位。
非整數權重。單元計數通常為整數值,因為它們代表每個單元中的個案個數。但是,如果數據文件當前按某個帶小數值(例如1.25)的權重變量進行加權,則單元計數也可能是小數值。在計算單元計數之前可以進行截斷或舍入,或為表顯示和統計計算都使用小數單元計數。
四舍五入單元格計數. 在計算任何統計之前,個案權重按原樣使用,但單元中的累積權重要四舍五入。
截短單元格計數. 在計算任何統計之前,個案權重按原樣使用,但截短單元中
的累積權重。
四舍五入個案權重. 在使用之前對個案權重進行四舍五入。
截短個案權重. 在使用之前對個案權重進行截短。
無調節. 個案權重按原樣使用且使用小數單元計數。但是,當需要“精確”統計
(僅由“精確檢驗”選項提供)時,在計算“精確”檢驗統計之前,單元中的累積
權重或者截短或者四舍五入。
推薦學習書籍
《CDA一級教材》適合CDA一級考生備考,也適合業務及數據分析崗位的從業者提升自我。完整電子版已上線CDA網校,累計已有10萬+在讀~
免費加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25在當今數字化時代,數據分析師的重要性與日俱增。但許多人在踏上這條職業道路時,往往充滿疑惑: 如何成為一名數據分析師?成為 ...
2025-04-24