
SPSS:T檢驗、方差分析、非參檢驗、卡方檢驗的使用要求和適用場景
一、T檢驗
1.1 樣本均值比較T檢驗的使用前提
正態性;(單樣本、獨立樣本、配對樣本T檢驗都需要)
連續變量;(單樣本、獨立樣本、配對樣本T檢驗都需要)
獨立性;(獨立樣本T檢驗要求)
方差齊性;(獨立樣本T檢驗要求)
1.2 樣本均值比較T檢驗的適用場景
單樣本T檢驗(比較樣本均數和總體均數);
操作:打開 分析—比較均值—單樣本t檢驗
要求:正態性(可以用K-S檢驗法,在SPSS中的“分析”–“非參數檢驗”—“單樣本”中;或者直接根據直方圖、P-P圖,Q-Q圖來觀察或根據偏度峰度法來分析)
說明:由中心極限定理可知,即使原數據不符合正態分布,只要樣本量足夠大時樣本均數分布仍然是正態的。只要數據不是強烈的偏正態,沒有明顯的極端值,一般而言單樣本t檢驗都是可以使用的,分析結果都是穩定的。
獨立樣本T檢驗(比較成組設計的兩個樣本);
操作:打開 分析—比較均值—獨立樣本t檢驗
我們輸入數據的時候,兩個樣本的數據是要在一列變量里的,另外還有一列二分類變量為這列因變量做標注。
要求:獨立性、正態性(對正態性有耐受性)、方差齊性(影響大,檢驗更有必要,使用Levene’s檢驗,兩樣本T檢驗中提供Levene’s檢驗,如需更詳細的檢驗結果可在“分析”–“描述統計”–“探索”中進行)
說明:各樣本相互獨立,且均來自于正態分布的樣本,各樣本所在總體的方差相等;
* 疑問:獨立性怎么檢驗?有些數據可以根據現實環境判斷;*
配對樣本T檢驗(如用藥前和用藥后的兩個人群的樣本、同一樣品用兩種方法的比較)
操作:打開 分析—比較均值—配對樣本t檢驗
要求:正態性(配對樣本等價于單樣本T檢驗,檢驗的是兩個樣本對應的差值,初始假設為差值等于0)
二、單因素方差分析
2.1 單因素方差分析的基本思想
基本思想:變異分解,總變異=隨機變異+處理因素導致的變異,又可以分解為總變異=組內變異+組間變異,F=組間變異/組內變異,F的值越大,處理因素的影響越大。
2.2 單因素方差分析的使用前提
獨立性:不滿足獨立性會有很大的影響,因為信息存在“重疊”的部分
疑問:在哪兒可以驗證?卡方檢驗?卡方檢驗檢驗的是兩個分類變量
正態性:對正態性的要求是穩健的
方差齊性:檢驗方法除了Levene’s檢驗,還可以有其他的檢驗方法:Bartleet法(比較各組方差的加權算數平均數和幾何均數)、Hartley法(樣本量相同時使用)、Cochran法(樣本量相同時使用)。
方差分析對變量的類型有要求嗎?應該分析的都是連續變量
2.3 單因素方法分析的使用前提不滿足時變換方法
對數變換、平方根變換、平方根反正弦變換、平方變換、倒數變換、Box-Cox變換(分段函數)
2.4 單因素方差分析的適用場景
T檢驗只能檢驗兩組樣本的均數差,多組樣本的時候就需采用方差分析;
操作:打開分析—比較均值—均值 進行預分析,可以大致看出各均值是否相同,方差是否齊性;再進行 打開 分析—比較均值—單因素anova;
適用場景:均數間的多重比較(全部兩兩比較)、各組均數的精細比較(可以指定要比較的兩個組,通過設定系數)、組間均數的趨勢檢驗(為了利用分組變量中體現出的次序信息,目的不是為了擬合線性或非線性的模型,而是希望知道因素的水平改變時均數的變化趨勢)
2.5 方差分析結束后如均值不同可進行兩兩比較(事前比較、事后比較)
LSD法:用于事先計劃好的比較,最靈敏;檢驗水準沒有校正,每次都是α
Sidak法:第二靈敏;
Bonferroni法:用于事先計劃好的比較,第三靈敏;
Scheffe法:多用樣本含量不等的情況,第四靈敏;
Dunnett法:常用于多個實驗組和一個對照組的比較,第五靈敏;
尋找同質亞組的檢驗方法:
S-N-K法:將所有樣本分為多個子集;
Tukey法:任意兩組比較,要求樣本含量相同,MEER不超過α;
Duncan法:與SNK法類似;
備注:
CER:每進行一次比較犯一類錯誤錯誤的概率;
EERC:完全無效假設檢驗下,做完全部比較犯一類錯誤的概率;
MEER:部分或者任何完全假設下,犯一類錯誤的最大概率值,即最大實驗誤差率。
疑問:單因素方差分析的事前檢驗和事后檢驗有什么區別,為什么結果不同??
三、非參數檢驗
3.1 非參數檢驗的基本思想
非參數檢驗的意思是指整個推斷過程和結論均和原總體參數無關,而不是不利用參數
3.2 非參數檢驗的優勢
穩健性;
對數據的測量尺度、數據類型無約束;
適用于小樣本、無分布樣本、數據污染樣本、混雜樣本等;
3.3 非參數檢驗使用前提
有序、名義變量,這類數據的分布形態一般未知,均值方差等數據無意義;
樣本分布未知;
樣本數據不滿足正態分布,即便是經過變量變換;
方差齊性不滿足,即便是經過變量變換;
總體分布正態,連續變量,但樣本容量極小,如10以下;
3.2 非參數檢驗適用情形
單樣本非參數檢驗
K-S檢驗:針對連續變量,考察是否符合正態分布
操作:打開–分析–非參數檢驗–單樣本
二項分布檢驗:針對兩分類變量,考察是否符合二項分布
操作:打開–分析–非參數檢驗–單樣本
游程檢驗:考察總體的隨機性
操作:打開–分析–非參數檢驗–單樣本
兩個獨立樣本的非參數檢驗(無效假設為兩樣本的中心位置是否相等)
Mann-Whitney U檢驗,兩樣本秩和檢驗,應用范圍最廣;
Kolmogorov-Smirnov Z檢驗:檢驗兩個樣本的累積頻數分布曲線,判斷兩個樣本的分布是否相同;
Moses Extreme Reactions 檢驗:Moses極端反應檢驗,單側檢驗
Wald-Wolfowitz Runs 檢驗:單側檢驗,無論是集中趨勢、離散趨勢、偏度的波動情況都能檢測出來,如果只是檢查中心位置,最好不用,檢驗兩樣本是否來自同樣的分布;
操作:打開 分析—非參數檢驗—獨立樣本
多個獨立樣本的非參數檢驗
Kruskal-Wallis H檢驗(類似Wilcoxon符號秩檢驗,兩樣本在多樣本上的推廣)
中位數檢驗
Jonckheere-Terpstra檢驗:對連續變量和有序分類資料都使用,分組變量為有序分類資料時,檢驗效能要高于Kruskal-Wallis H檢驗
操作:打開 分析—非參數檢驗—獨立樣本
兩個配對樣本(求出差值,查看中位數是否為0,目的就是為了檢驗均值是否相等)
sign符號檢驗:只利用了符號信息,差值是否一半為正一半為負;
Wilcoxon符號秩檢驗:利用了符號和差值的大小順序(符號+秩序)
操作:打開 分析—非參數檢驗—相關樣本
多個相關樣本非參數檢驗
Friedman 檢驗:基本思想是同區組的處理值和計算的秩比較才有意義,還附帶齊性子集結果給出了準確的兩兩比較信息;
Kendall協和系數檢驗:為了檢驗各組評價是否一致,Friedman檢驗只能說明尚不能認為有差異,但是無法評判一致性,Kendall方法針對連續變量,
Cochran檢驗:有些評價只能用是否、好壞等二元數據來判斷,Cochran只適用于二分類變量,用Kendall方法會有很多的打結現象。
操作:打開 分析–非參數檢驗–相關樣本
通用方法—秩變換分析方法
前面有關秩的分析方法其實都是秩變換方法的不同應用,分析方法中可以直接將秩求出后再進行分析。
操作:轉換 — 個案排秩(也可以指定生成符合正態分布的秩)
四、卡方檢驗
4.1 卡方檢驗的基本思想
以卡方分布為基礎,計算觀察值和期望值之間的偏離程度;
4.2 卡方檢驗的使用前提
最小期望頻數均大于1
至少4/5的單元格期望頻數大于5
計算時如果單元格期望頻數小于5要和其他種類合并
樣本觀察值量超過50
4.3 卡方檢驗的使用目的
考察無序分類變量各水平在兩組或多組間的分布是否一致;
檢驗某個連續變量的分布是否和理論分布一致;
分類變量的概率是否等于指定概率;
檢驗兩個分類變量是否獨立;
檢驗控制了其中幾個因素后,剩余的兩個分類變量是否獨立;
檢驗兩種方法的結果是否一致;
4.4 卡方檢驗的適用場景
單樣本卡方檢驗
操作: 打開 分析–非參數檢驗–單樣本
兩樣本卡方檢驗
操作: 打開 分析–描述統計–交叉表
兩分類變量間關聯程度的度量:定性描述兩個分類變量是否存在關聯(更為詳細的可以根據相關分析)
操作: 打開 分析–描述統計–交叉表
Kappa一致性檢驗(用于配對樣本,如兩個人針對一個事物的評價)
用于配對樣本的檢驗,Kappa檢驗的結果是兩個人的評價是否是相關的
操作: 打開 分析–描述統計–交叉表
Mcnemar 配對卡方檢驗
Kappa檢驗只能看出兩者是否有關聯,但是不能判斷是否一致,Mcnemar 配對卡方檢驗就可以解決兩者是否一致的問題
操作: 打開 分析–描述統計–交叉表
分層卡方檢驗
可以控制一個因素,如收入對車輛購買率的影響,可以將城市作為分層因素,從而可以得到更準確的結果,但是SPSS中只能進行兩分類變量的檢驗,不能進行多分類的檢驗,且分層因素和要分析的因素之間如果存在交互關系也不能進行檢驗。
操作: 打開 分析–描述統計–交叉表
4.5 備注
相對危險度(RR)
RR=試驗人群反應陽性的概率/對照組人群反應陽性的概率
RR=1,說明試驗因素反應陽性沒有關聯
RR<1,說明試驗因素導致反應陽性的發生率降低
RR>1,說明試驗因素導致反應陽性的發生率升高
優勢比(OR)
OR=(反應陽性組中實驗因素陽性人數/反應陽性組中實驗因素陰性人數)/(反應陰性組中實驗因素陽性人數/反應陰性組中實驗因素陰性人數)
OR>1,說明該試驗因素更容易導致實驗結果為陽性
推薦學習書籍
《CDA一級教材》適合CDA一級考生備考,也適合業務及數據分析崗位的從業者提升自我。完整電子版已上線CDA網校,累計已有10萬+在讀~
免費加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25