熱線電話:13121318867

登錄
首頁精彩閱讀R語言實施皮爾森卡方檢驗
R語言實施皮爾森卡方檢驗
2018-01-15
收藏

R語言實施皮爾森卡方檢驗

檢查兩個數據集中的類別分量是否不同,在統計中會碰到離散型數據與計數數據,比如性別分男、女,某個問題的態度分為贊成、反對,成績可分優良差,能力可分高中低。對這類數據的統計處理的假設檢驗一般用計數數據的統計方法進行非參數檢驗。
卡方檢驗主要用于兩個方面,一是對總體分布進行擬合性檢驗,檢驗觀查次數是否與某種理論次數相一致。
二是獨立性檢驗,用于檢驗兩組或者多組資料相互關聯還是彼此獨立。
操作示例(獨立性檢驗)

#mtcars$am有0,1兩個因素表示行,mtcars$gear 有3,4,5三個因素表示列
library(stats)
data("mtcars)
ftable = table(mtcars$am,mtcars$gear)
ftable = table(mtcars$am,mtcars$gear)
ftable = table(mtcars$am,mtcars$gear)
> ftable

     3  4  5
  0 15  4  0
  1  0  8  5

#繪制列聯表的馬賽克圖
mosaicplot(ftable,main ="number of forward gears within automatic and manual cars",color = TRUE )

對列聯表執行卡方檢驗,以檢測自動檔與手動檔汽車前驅的齒輪數目是否相同:

chisq.test(ftable)

    Pearson's Chi-squared test

data:  ftable
X-squared = 20.945, df = 2, p-value = 2.831e-05

Warning message:
In chisq.test(ftable) : Chi-squared近似算法有可能不準
總結

卡方檢驗用于發現兩個類別變量之間是否存在某種關聯,最適用于數組中非成組信息的檢驗。使用條件:1.數據都為類別數據2.變量包括兩個或者兩個以上獨立數據組。
H0:變量A與變量B相互獨立(gear數目相同)
H1:變量A與變量B相互不獨(gear數目不相同)
由圖知:自動檔的gear要小于手動檔的gear.p-value<0.05,拒絕H0,接收H1.
樣例輸出了一個警告信息,此次卡方檢驗的結果可能不正確,這是因為列聯表的個數小于5

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢