熱線電話:13121318867

登錄
首頁精彩閱讀雙因子方差分析:R中的雙因子ANOVA
雙因子方差分析:R中的雙因子ANOVA
2017-10-26
收藏

雙因子方差分析:R中的雙因子ANOVA

單因子方差分析是驗證多個群組均值是否相等的非常有用的技術。但一些更復雜的問題這個技術就無能為力了。例如,有時需要考慮變異的兩個因子來決定群組之間的平均依賴于群組分類(“zone”),還是第二級需考慮的變量(“block”)。在這個情形中應該使用雙因子方差分析(雙因子ANOVA)。

我們立刻以一個例子開始,以便于理解這個統計方法。收集的數據組織在雙項表(double entry tables)中。

公司董事收集了5年的收入(thousand dollars),而每年都統計到每個月份。你想看看收入是依賴于年呢,還是依賴于月份,或者與這兩個因素都無關。

理論上,這個問題可以用horizontal ANOVA和vertical ANOVA來解決,以便于驗證每年的平均收入是否相同,或者由月份計算的平均收入是否相等。這需要許多計算,因而我們更愿意用雙因子ANOVA,能夠及時提供結果。這是已統計的收入表,分別由年和月份分類:

首先將數據錄入,然后創建月份和年兩個維度的因子變量:
[plain] view plain copy

    revenue = c(15,18,22,23,24, 22,25,15,15,14, 18,22,15,19,21,   
             23,15,14,17,18, 23,15,26,18,14, 12,15,11,10,8, 26,12,23,15,18,   
             19,17,15,20,10, 15,14,18,19,20, 14,18,10,12,23, 14,22,19,17,11,   
             21,23,11,18,14)  
    months = gl(12,5)  
    years = gl(5, 1, length(revenue))  


現在就擬合線性模型和產生ANOVA表:
[plain] view plain copy

    fit = aov(revenue ~ months + years)  
      
    anova(fit)  
      
    Analysis of Variance Table  
      
    Response: revenue  
              Df Sum Sq Mean Sq F value Pr(>F)  
    months    11 308.45   28.04  1.4998 0.1660  
    years      4  44.17   11.04  0.5906 0.6712  
    Residuals 44 822.63   18.70    


這樣來解釋結果:

不同月份之間差異額顯著性為:F=1.4998。這個值比查表值低,并且p-value>0.05。因此我們接受null hypothesis,即根據月份來評估的收入均值都相等,所以變量“月份”在收入上沒有影響。

不同年之間差異額顯著性為:F=0.5906。這個值比查表值低,并且p-value>0.05。因此我們接受null hypothesis,即根據年來評估的收入均值都相等,所以變量“年”在收入上沒有影響。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢