
SPSS非參數檢驗:單樣本
一、概念:
單樣本非參數檢驗使用一個或多個非參數檢驗識別單個字段中的差別。非參數檢驗不假定您的數據呈正態分布。非參數檢驗(Nonparametric tests)是統計分析方法的重要組成部分,它與參數檢驗共同構成統計推斷的基本內容。參數檢驗是在總體分布形式已知的情況下,對總體分布的參數如均值、方差等進行推斷的方法。但是,在數據分析過程中,由于種種原因,人們往往無法對總體分布形態作簡單假定,此時參數檢驗的方法就不再適用了。非參數檢驗正是一類基于這種考慮,在總體方差未知或知道甚少的情況下,利用樣本數據對總體分布形態等進行推斷的方法。由于非參數檢驗方法在推斷過程中不涉及有關總體分布的參數,因而得名為“非參數”檢驗。
二、目標(分析-非參數檢驗-單樣本-目標)
您的目標是什么?目標允許您快速指定常用的不同檢驗設置。
2.1、自動比較觀察數據和假設數據。該目標對僅具有兩個類別的分類字段應用二項式檢驗,對所有其他分類字段應用卡方檢驗,對連續字段應用Kolmogorov-Smirnov檢驗。
2.2、檢驗隨機序列。該目標使用游程檢驗來檢驗觀察到的隨機數據值序列。
2.3、自定義分析。當您希望手動修改“設置”選項卡上的檢驗設置時,選中此選項。注意,如果您隨后在“設置”選項卡上更改了與當前選定目標不一致的選項,則會自動選擇該設置。
三、選擇檢驗(分析-非參數統計-單樣本-設置-選擇檢驗)
1、根據數據自動選擇檢驗。該設置對僅具有兩個有效(非缺失)類別的分類字段應用二項式檢驗,對所有其他分類字段應用卡方檢驗,對連續字段應用Kolmogorov-Smirnov檢驗。
2、自定義檢驗。這些設置允許您選擇要執行的特定檢驗。
2.1、比較觀察二分類可能性和假設二分類可能性(二項式檢驗)。二項式檢驗可以應用到所有字段。這將生成一個單樣本檢驗,可以檢驗標記字段(只有兩個類別的分類字段)的觀察分布是否與指定的二項式分布期望相同。此外,您還可以請求置信區間。
2.2、比較觀察可能性和假設可能性(卡方檢驗)??ǚ綑z驗可以應用到名義和有序字段。這將生成一個單樣本檢驗,它可以根據字段類別的觀察和期望頻率間的差異來計算卡方統計量。
2.3、檢驗觀察分布和假設分布(Kolmogorov-Smirnov檢驗)。Kolmogorov-Smirnov檢驗可以應用到連續字段。這將生成一個單樣本檢驗,即字段的樣本累積分布函數是否為齊次的均勻分布、正態分布、泊松分布或指數分布。
2.4、比較中位數和假設中位數(Wilcoxon符號秩檢驗)。Wilcoxon符號秩檢驗可以應用到連續字段。這將生成一個字段中位數值的單樣本檢驗。指定一個數字作為假設中位數。
2.5、檢驗隨機序列(游程檢驗)。游程檢驗可以應用到所有字段。這將生成一個單樣本檢驗,即對分字段的值序列是否為隨機序列。
四、二項式檢驗(分析-非參數統計-單樣本-設置-選擇檢驗-自定義檢驗-二項式檢驗)
二項式檢驗適用于標記字段(只有兩個類別的分類字段),但可通過使用定義“成功”的規則應用到所有字段。在生活中有很多數據的取值是二值的,例如,人群可以分成男性和女性,產品可以分成合格和不合格,學生可以分成三好學生和非三好學生,投擲硬幣實驗的結果可以分成出現正面和出現反面等。通常將這樣的二值分別用1或0表示。如果進行n次相同的實驗,則出現兩類(1或0)的次數可以用離散型隨機變量X來描述。如果隨機變量X為1的概率設為P,則隨機變量X值為0的概率Q便等于1-P,形成二項分布。SPSS的二項分布檢驗正是要通過樣本數據檢驗樣本來自的總體是否服從指定的概率為P的二項分布,其原假設是:樣本來自的總體與指定的二項分布無顯著差異。
1、假設比例。這指定了定義為“成功”的記錄的期望比例,或p。指定一個大于0且
小于1的值。默認值為0.5。
2、置信區間??梢允褂靡韵路椒ㄓ嬎?a href='/map/erfenlei/' style='color:#000;font-size:inherit;'>二分類數據的置信區間:◎Clopper-Pearson(精確)?;诶鄯e二項式分布的精確區間?!騄effreys?;趐的后驗分布且應用Jeffreys先驗的Bayesian區間?!蛩迫槐??;趐的似然函數的區間。
3、定義分類字段的成功。這可以指定如何為分類字段定義對照假設比例檢驗數據值的“成功”?!蚴褂迷跀祿姓业降牡谝粋€類別將使用在樣本中找到的第一個定義“成功”的值執行二項式檢驗。此選項僅適用于只有兩個值的名義或有序字段;如果使用了此選項,則在“字段”選項卡中指定的所有其他分類字段都不會檢驗。這是默認值?!蛑付ǔ晒χ祵⑹褂弥付ㄒ远x“成功”的值列表來執行二項式檢驗??梢灾付ㄗ址驍抵盗斜?。列表中的值不需要在樣本中出現。
4、定義連續字段的成功值。這可以指定如何為連續字段定義對照檢驗值檢驗數據值的“成功”。成功被定義為等于或小于割點的值?!驑颖局悬c在最小值和最大值的平均值上設置割點?!蜃远x割點允許您為割點指定一個值。
五、卡方檢驗(分析-非參數統計-單樣本-設置-選擇檢驗-自定義檢驗-卡方檢驗)
卡方檢驗方法可以根據樣本數據,推斷總體分布與期望分布或某一理論分布是否存在顯著差異,是一種吻合性檢驗,通常適于對有多項分類值的總體分布的分析。它的原假設是:樣本來自的總體分布與期望分布或某一理論分布無差異。
1、所有類別具有相等的概率。這將在樣本中的所有類別間生成均等的頻率。這是默認值。
2、自定義期望可能性。這允許您為指定的類別列表指定不相等的頻率??梢灾付ㄗ址驍抵盗斜?。列表中的值不需要在樣本中出現。在類別列中,指定類別值。在相對頻率列中,為每個類別指定一個大于0的值。自定義的頻率被視為比率,例如,指定頻率1、2和3等同于指定頻率10、20和30,兩者均指定了期望1/6的記錄屬于第一個類別,1/3的記錄屬于第二個類別,1/2的記錄屬于第三個類別。在指定自定義期望可能性時,自定義類別值必須包括數據中的所有字段值;否則將不對該字段執行檢驗。
六、單樣本K-S檢驗(分析-非參數統計-單樣本-設置-選擇檢驗-自定義檢驗-K-S檢驗)
K-S檢驗方法能夠利用樣本數據推斷樣本來自的總體是否服從某一理論分布,是一種擬合優度的檢驗方法,適用于探索連續型隨機變量的分布。例如,收集一批周歲兒童身高的數據,需利用樣本數據推斷周歲兒童總體的身高是否服從正態分布。再例如,利用收集的住房狀況調查的樣本數據,分析家庭人均住房面積是否服從正態分布。單樣本K-S檢驗的原假設是:樣本來自的總體與指定的理論分布無顯著差異,SPSS的理論分布主要包括正態分布、均勻分布、指數分布和泊松分布等。
1、正態。使用樣本數據使用觀察到的均值和標準差;自定義允許您指定值。
2、均勻。使用樣本數據使用觀察到的最小值和最大值;自定義允許您指定值。
3、指數分布。樣本均值使用觀察到的均值;自定義允許您指定值。
4、泊松。樣本均值使用觀察到的均值;自定義允許您指定值。
七、游程檢驗(分析-非參數統計-單樣本-設置-選擇檢驗-自定義檢驗-游程檢驗)
變量值隨機性檢驗通過對樣本變量值的分析,實現對總體的變量值出現是否隨機進行檢驗。它的原假設是:總體變量值出現是隨機的。變量隨機性檢驗的重要依據是游程。所謂游程是樣本序列中連續出現相同的變量值的次數??梢灾苯永斫?,如果硬幣的正反面出現是隨機的,那么在數據序列中,許多個1或許多個0連續出現的可能性將不太大,同時,1和0頻繁交叉出現的可能性也會較小。因此,游程數太大或太小都將表明變量值存在不隨機的現象。
游程檢驗適用于標記字段(只有兩個類別的分類字段),但可通過使用定義組的規則
應用到所有字段。
1、定義分類字段的組 ◎樣本中僅有2個類別使用在定義組的樣本中找到的值來執行游程檢驗。此選項僅適用于只有兩個值的名義或有序字段;如果使用了此選項,則在“字段”選項卡中指定的所有其他分類字段都不會檢驗?!驅祿匦戮幋a為2個類別使用指定以定義某個組的值列表來執行游程檢驗。樣本中的所有其他值定義其他組。列表中的值不需要在樣本中出現,但每個組中必須至少有一條記錄。
2、定義連續字段的割點。這可以指定如何為連續字段定義組。第一組定義為等于或小于割點的值?!驑颖局形粩翟跇颖局形粩堤幵O置割點?!驑颖揪翟跇颖揪堤幵O置割點?!蜃远x允許您為割點指定一個值。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25在當今數字化時代,數據分析師的重要性與日俱增。但許多人在踏上這條職業道路時,往往充滿疑惑: 如何成為一名數據分析師?成為 ...
2025-04-24以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《劉靜:10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda ...
2025-04-23