
【連載3】如何使用spss做非參數檢驗
非參數檢驗是一個相當宏大的命題。由于實際情況的復雜多變,因此非參數檢驗包括了許多的各種各樣的檢驗方法。之前我們提過,參數檢驗的使用條件是被檢驗的樣本總體服從正態分布,而非參數檢驗的使用條件自然就是總體不服從或不確定是否服從正態分布。(實際上,這里要特別說明一下,盡管非參數檢驗的使用條件更寬松,但是考慮到精確性,不是特殊要求的話,我們還是盡可能的使用均值檢驗。)
比較常見的單樣本非參數檢驗包括游程檢驗和單樣本K-S檢驗。
游程檢驗:
它通常用于檢測兩個不同的觀測值出現的次序是否具有隨機性。舉個例子,假如我們想知道每天來門診就診的人是否生病的次序是否隨機,那么我們就使用游程檢驗。我們記錄下來個案依次是否生病,比如是為1,否為0。然后我們就有了一個由0和1構成的變量列,
我們選擇分析——非參數檢驗——舊對話框——游程,在主面板的檢驗變量列表里選入我們的0,1變量列。選項卡里邊選擇描述性,其他默認。割點可以全選。
輸出結果看p值就可以了(我真的不想再重復怎么看p值了)。
單樣本K-S檢驗;
這個就比較重要了。這個檢驗的目的在于觀測樣本的分布。哦,想想也知道很重要。只要我們想做相關和回歸,那我們就最好用K-S檢驗來檢查一下樣本的分布。畢竟pearson相關系數有效的一個重要條件就是樣本服從正態分布。
我們選擇分析——非參數檢驗——舊對話框——1樣本K-S,在主對話框的檢驗變量列表里邊選入我們想檢驗分布的變量(比如一群病號的血細胞數),選項卡里勾選描述性和四分位數,其他默認。在檢驗分布的下邊有四個供勾選的框框,這個要注意一下,常規指的就是正態分布,相等則是指均勻分布,勾選你想檢驗的分布(一般是正態分布)。確定以后就可以看結果了。
描述性統計量表會給你一些基本指標,幫助你感受這些數據。K-S檢驗表的p值會告訴你樣本是否服從指定的分布,如果是的話,表里邊還有一些其他的指標可以參考。
單樣本非參數檢驗已經結束了(怎么這么少?),下邊我們說一下獨立樣本非參數檢驗。
兩獨立樣本非參數檢驗:
打開菜單分析——非參數檢驗——舊對話框——2個獨立樣本,在主面板里邊檢驗變量選入檢驗變量,分組變量選入分組變量,選項卡中選入描述性,四分位數,其他默認。在檢驗類型里邊有四個供勾選的框框,我們一一學習。
Mann-whitney 檢驗:
就是大名鼎鼎的秩和檢驗。
這個檢驗利用樣本觀察值得秩來推斷兩樣本所在總體的分布是否相同(不曉得什么是秩的回去翻一遍你們的高數課本)。這是一個最常用的檢驗。舉例,假設我們知道一組患病的人和不患病的人的血細胞數,想檢查是否具有差異,那么我們就使用秩和檢驗,我保證沒舉錯例子,這個例子確實也可以用獨立樣本t檢驗來做(希望大家還記得什么叫獨立樣本t檢驗),當然也可以用秩和檢驗來做。
它會給出描述性統計量,秩表,檢驗統計量表。在最后的一個表里邊我們通過p值判斷差異是否顯著。
Moses極端反應檢驗:
它適用于實驗條件導致兩個不同方向的極端反應情況(多用于醫學,比如有的藥物會導致一部分病人好轉的同時也會導致一部分病人惡化)。
它通過比較實驗組和觀察組,會告訴你是否產生了極端反應。(很神奇是不是?)
兩樣本K-S檢驗:
這個檢驗用來判斷兩個樣本的分布是否相同。也是看p值哈。
Wald wolfowit游程檢驗:
用來檢驗兩樣本是否來自相同的總體。
注意:K-S檢驗適用于數值變量資料或者有序分類資料。
多個獨立樣本非參數檢驗:
打開菜單分析——非參數檢驗——舊對話框——K 獨立檢驗,在主面板的檢驗變量選入想檢驗的變量,分組變量選入分組變量。
檢驗類型有三種
K-W檢驗:
用來判斷各樣本分別代表的總體是否一致,(相當于單因素方差分析),適用于數值變量和有序分類變量。結果會給出秩,檢驗統計量。通過p值判斷差異性。若想在進行兩兩比較,那就要用到上邊介紹的秩和檢驗來進行比較了。
中位數:
適用于數值變量資料。用來檢驗樣本代表的總體中位數是不是相等。這個用途還是比較廣泛的。
Jonckheere-Terpstra檢驗:
這個檢驗用來處理完全隨機的資料,比如研究隨著年齡增加,學習成績是否也增加?這種有序分組的變量就用這個檢驗來檢驗。(我真有點懶得介紹這么冷門的檢驗的沖動,不過為了完整還是寫一下吧。)
兩相關樣本非參數檢驗:
打開兩個關聯樣本檢驗主面板,檢驗對里邊選擇兩個相關變量,檢驗類型有四種。
Wilcoxon:
它用來檢驗兩個變量的分布是否有差異。比較常用。比如一種藥物治療前和治療后是否有差別?就用這個檢驗。
符號檢驗和wilcoxon差不多,也是檢查差值的。
Mcnemar檢驗:
上邊兩個都是數值型的連續性資料,這個檢驗則用于配對計數資料,將兩組人進行配對,觀察他們的某個指標是否有差異。
邊際同質性檢驗是mcnemar檢驗的一般化和擴展,用于多分類配對計數資料。比如檢驗甲觀察的分類結果和乙觀察的分類結果是否有差異。(分好多類)
多個相關樣本非參數檢驗:
打開多個相關樣本檢驗主面板,選入檢驗變量,檢驗類型一共有三種。
Friedman檢驗:
用于檢驗多個相關樣本是否來自同一總體,是wilcoxon的擴展。
KendallW檢驗:
檢驗樣本的一致性的好壞(不考慮分布的形狀,僅考慮分布是否一致)。
Cochran Q檢驗:
用于二分數據時,是mcnemar檢驗的延伸,可以比較多個二分變量的比例的差異是否顯著。
非參數檢驗大概就是這些內容了。和參數檢驗一樣,這些檢驗的操作操作并不復雜,結果也不難判斷,學習的難點在于記住這些不同的檢驗方法的適用的不同范圍。需要多做一些練習,才可以鞏固掌握住非參數檢驗的內容。CDA數據分析師培訓
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25