熱線電話:13121318867

登錄
首頁精彩閱讀SPSS非參數檢驗:單樣本
SPSS非參數檢驗:單樣本
2018-01-05
收藏

SPSS非參數檢驗:單樣本

一、概念:

單樣本非參數檢驗使用一個或多個非參數檢驗識別單個字段中的差別。非參數檢驗不假定您的數據呈正態分布。非參數檢驗(Nonparametric tests)是統計分析方法的重要組成部分,它與參數檢驗共同構成統計推斷的基本內容。參數檢驗是在總體分布形式已知的情況下,對總體分布的參數如均值、方差等進行推斷的方法。但是,在數據分析過程中,由于種種原因,人們往往無法對總體分布形態作簡單假定,此時參數檢驗的方法就不再適用了。非參數檢驗正是一類基于這種考慮,在總體方差未知或知道甚少的情況下,利用樣本數據對總體分布形態等進行推斷的方法。由于非參數檢驗方法在推斷過程中不涉及有關總體分布的參數,因而得名為“非參數”檢驗。

二、目標(分析-非參數檢驗-單樣本-目標)

您的目標是什么?目標允許您快速指定常用的不同檢驗設置。

2.1、自動比較觀察數據和假設數據。該目標對僅具有兩個類別的分類字段應用二項式檢驗,對所有其他分類字段應用卡方檢驗,對連續字段應用Kolmogorov-Smirnov檢驗。

2.2、檢驗隨機序列。該目標使用游程檢驗來檢驗觀察到的隨機數據值序列。

2.3、自定義分析。當您希望手動修改“設置”選項卡上的檢驗設置時,選中此選項。注意,如果您隨后在“設置”選項卡上更改了與當前選定目標不一致的選項,則會自動選擇該設置。

三、選擇檢驗(分析-非參數統計-單樣本-設置-選擇檢驗)

1、根據數據自動選擇檢驗。該設置對僅具有兩個有效(非缺失)類別的分類字段應用二項式檢驗,對所有其他分類字段應用卡方檢驗,對連續字段應用Kolmogorov-Smirnov檢驗。

2、自定義檢驗。這些設置允許您選擇要執行的特定檢驗。

2.1、比較觀察二分類可能性和假設二分類可能性(二項式檢驗)。二項式檢驗可以應用到所有字段。這將生成一個單樣本檢驗,可以檢驗標記字段(只有兩個類別的分類字段)的觀察分布是否與指定的二項式分布期望相同。此外,您還可以請求置信區間。

2.2、比較觀察可能性和假設可能性(卡方檢驗)??ǚ綑z驗可以應用到名義和有序字段。這將生成一個單樣本檢驗,它可以根據字段類別的觀察和期望頻率間的差異來計算卡方統計量。

2.3、檢驗觀察分布和假設分布(Kolmogorov-Smirnov檢驗)。Kolmogorov-Smirnov檢驗可以應用到連續字段。這將生成一個單樣本檢驗,即字段的樣本累積分布函數是否為齊次的均勻分布、正態分布、泊松分布指數分布。

2.4、比較中位數和假設中位數(Wilcoxon符號秩檢驗)。Wilcoxon符號秩檢驗可以應用到連續字段。這將生成一個字段中位數值的單樣本檢驗。指定一個數字作為假設中位數。

2.5、檢驗隨機序列(游程檢驗)。游程檢驗可以應用到所有字段。這將生成一個單樣本檢驗,即對分字段的值序列是否為隨機序列。

四、二項式檢驗(分析-非參數統計-單樣本-設置-選擇檢驗-自定義檢驗-二項式檢驗)

二項式檢驗適用于標記字段(只有兩個類別的分類字段),但可通過使用定義“成功”的規則應用到所有字段。在生活中有很多數據的取值是二值的,例如,人群可以分成男性和女性,產品可以分成合格和不合格,學生可以分成三好學生和非三好學生,投擲硬幣實驗的結果可以分成出現正面和出現反面等。通常將這樣的二值分別用1或0表示。如果進行n次相同的實驗,則出現兩類(1或0)的次數可以用離散型隨機變量X來描述。如果隨機變量X為1的概率設為P,則隨機變量X值為0的概率Q便等于1-P,形成二項分布。SPSS的二項分布檢驗正是要通過樣本數據檢驗樣本來自的總體是否服從指定的概率為P的二項分布,其原假設是:樣本來自的總體與指定的二項分布無顯著差異。

1、假設比例。這指定了定義為“成功”的記錄的期望比例,或p。指定一個大于0且

小于1的值。默認值為0.5。

2、置信區間??梢允褂靡韵路椒ㄓ嬎?a href='/map/erfenlei/' style='color:#000;font-size:inherit;'>二分類數據的置信區間:◎Clopper-Pearson(精確)?;诶鄯e二項式分布的精確區間?!騄effreys?;趐的后驗分布且應用Jeffreys先驗的Bayesian區間?!蛩迫槐??;趐的似然函數的區間。

3、定義分類字段的成功。這可以指定如何為分類字段定義對照假設比例檢驗數據值的“成功”?!蚴褂迷跀祿姓业降牡谝粋€類別將使用在樣本中找到的第一個定義“成功”的值執行二項式檢驗。此選項僅適用于只有兩個值的名義或有序字段;如果使用了此選項,則在“字段”選項卡中指定的所有其他分類字段都不會檢驗。這是默認值?!蛑付ǔ晒χ祵⑹褂弥付ㄒ远x“成功”的值列表來執行二項式檢驗??梢灾付ㄗ址驍抵盗斜?。列表中的值不需要在樣本中出現。

4、定義連續字段的成功值。這可以指定如何為連續字段定義對照檢驗值檢驗數據值的“成功”。成功被定義為等于或小于割點的值?!驑颖局悬c在最小值和最大值的平均值上設置割點?!蜃远x割點允許您為割點指定一個值。

五、卡方檢驗(分析-非參數統計-單樣本-設置-選擇檢驗-自定義檢驗-卡方檢驗)

   卡方檢驗方法可以根據樣本數據,推斷總體分布與期望分布或某一理論分布是否存在顯著差異,是一種吻合性檢驗,通常適于對有多項分類值的總體分布的分析。它的原假設是:樣本來自的總體分布與期望分布或某一理論分布無差異。

1、所有類別具有相等的概率。這將在樣本中的所有類別間生成均等的頻率。這是默認值。

2、自定義期望可能性。這允許您為指定的類別列表指定不相等的頻率??梢灾付ㄗ址驍抵盗斜?。列表中的值不需要在樣本中出現。在類別列中,指定類別值。在相對頻率列中,為每個類別指定一個大于0的值。自定義的頻率被視為比率,例如,指定頻率1、2和3等同于指定頻率10、20和30,兩者均指定了期望1/6的記錄屬于第一個類別,1/3的記錄屬于第二個類別,1/2的記錄屬于第三個類別。在指定自定義期望可能性時,自定義類別值必須包括數據中的所有字段值;否則將不對該字段執行檢驗。

六、單樣本K-S檢驗(分析-非參數統計-單樣本-設置-選擇檢驗-自定義檢驗-K-S檢驗)

   K-S檢驗方法能夠利用樣本數據推斷樣本來自的總體是否服從某一理論分布,是一種擬合優度的檢驗方法,適用于探索連續型隨機變量的分布。例如,收集一批周歲兒童身高的數據,需利用樣本數據推斷周歲兒童總體的身高是否服從正態分布。再例如,利用收集的住房狀況調查的樣本數據,分析家庭人均住房面積是否服從正態分布。單樣本K-S檢驗的原假設是:樣本來自的總體與指定的理論分布無顯著差異,SPSS的理論分布主要包括正態分布、均勻分布、指數分布泊松分布等。

1、正態。使用樣本數據使用觀察到的均值和標準差;自定義允許您指定值。

2、均勻。使用樣本數據使用觀察到的最小值和最大值;自定義允許您指定值。

3、指數分布。樣本均值使用觀察到的均值;自定義允許您指定值。

4、泊松。樣本均值使用觀察到的均值;自定義允許您指定值。

七、游程檢驗(分析-非參數統計-單樣本-設置-選擇檢驗-自定義檢驗-游程檢驗)

變量值隨機性檢驗通過對樣本變量值的分析,實現對總體的變量值出現是否隨機進行檢驗。它的原假設是:總體變量值出現是隨機的。變量隨機性檢驗的重要依據是游程。所謂游程是樣本序列中連續出現相同的變量值的次數??梢灾苯永斫?,如果硬幣的正反面出現是隨機的,那么在數據序列中,許多個1或許多個0連續出現的可能性將不太大,同時,1和0頻繁交叉出現的可能性也會較小。因此,游程數太大或太小都將表明變量值存在不隨機的現象。

游程檢驗適用于標記字段(只有兩個類別的分類字段),但可通過使用定義組的規則

應用到所有字段。

1、定義分類字段的組 ◎樣本中僅有2個類別使用在定義組的樣本中找到的值來執行游程檢驗。此選項僅適用于只有兩個值的名義或有序字段;如果使用了此選項,則在“字段”選項卡中指定的所有其他分類字段都不會檢驗?!驅祿匦戮幋a為2個類別使用指定以定義某個組的值列表來執行游程檢驗。樣本中的所有其他值定義其他組。列表中的值不需要在樣本中出現,但每個組中必須至少有一條記錄。

2、定義連續字段的割點。這可以指定如何為連續字段定義組。第一組定義為等于或小于割點的值?!驑颖局形粩翟跇颖局形粩堤幵O置割點?!驑颖揪翟跇颖揪堤幵O置割點?!蜃远x允許您為割點指定一個值。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢