熱線電話:13121318867

登錄
首頁精彩閱讀【從零開始學統計】6.通俗理解T和F檢驗
【從零開始學統計】6.通俗理解T和F檢驗
2014-07-04
收藏
       T檢驗是統計推斷中常用的一種檢驗方法,在統計分析中,它主要用于檢驗參數的顯著性。前一次,我們已經講了假設檢驗的一些初步知識,那么這些T檢驗啊F檢驗啊,都是建立在假設檢驗的基礎上的。
首先我們簡單了解一下什么是T檢驗
       T檢驗是最常見的一種假設檢驗類型,主要驗證總體均值間是否存在顯著性差異,屬于參數假設檢驗,所以它適用的范圍是數值型的數據。T檢定改進了Z檢驗。在樣本數量大(超過30等)時,可以應用Z檢定,但Z檢定用在小的樣本會產生很大的誤差,因此樣本很小的情況下得改用T檢驗。
       T檢驗需要符合兩個個條件——總體符合正態分布,n < 30。當n>30時用Z檢驗或者T檢驗均可,此時用Z檢驗較簡單。
       T檢驗分為單樣本和雙樣本兩類,單樣本檢驗是檢驗一個樣本平均數與一個已知的總體平均數的差異是否顯著。當總體分布是正態分布,如總體標準差未知且樣本容量小于30,那么樣本平均數與總體平均數的離差統計量呈t分布。檢驗統計量為: 單樣本.jpg 


雙樣本檢驗是檢驗兩個樣本平均數與其各自所代表的總體的差異是否顯著。雙總體tt檢驗又分為兩種情況,一是獨立樣本T檢驗,一是配對樣本T檢驗,兩者的檢驗統計量分別為:兩樣本獨立公式.jpg ,配對公式.jpg 

做T檢驗的一般步驟為:
步驟1 — 提出假設
步驟2 — 確定假設的顯著水平α,
步驟3 — 求兩尾概率t,即:在無效假設H0成立的前提下,計算無效假設正確的概率,也稱差異由誤差引起的概率。
步驟4 — 作統計判斷,確定接受和否定哪一個假設。

結合這之前的假設檢驗,我們來做一個簡單的單樣本T檢驗例題:
例1 難產兒出生體重。N=35,樣本均值=3.42, S=0.40,一般嬰兒出生體重μ0=3.30(大規模調查獲得),問相同否?
    解: H0:μ= μ0,難產兒與一般嬰兒體重相同
         H1:μ≠ μ0,難產兒與一般嬰兒體重不同
         計算檢驗統計量: 例題計算公式.jpg 




查找相應臨界值表,查表得,t0.05 / 2.34 = 2.032,t < t0.05 / 2.34,不拒絕H0,認為兩者體重相同。
例題作為一個引導,相對應的雙總體檢驗就不在多述,大致步驟一樣,只是公式換一換,臨界值換一換而已。


當然,T檢驗不光光是能做這些,我們也還經常在做回歸分析當中運用到它。在回歸分析中,它主要用于檢驗回歸系數的顯著性。在回歸分析中,原假設通常是H0:β=0;H1:β≠0。接下去的步驟就和例題一樣了。
有人要問,為什么要做回歸系數的檢驗?
我的答案是,做這個檢驗是為了驗證x對y的影響程度是否顯著。如果不拒絕原假設,則說明y與x之間沒有線性關系(即x對y沒有直接影響)。(上述針對的是一元回歸)
若要做多元的回歸,那情況則就復雜的多了(不光要逐個對參數系數做檢驗,還要模型整體檢驗,這就涉及到F檢驗了……)
都說到多元回歸了,那就簡單說說F檢驗了。聊起F檢驗,往往會閃過一個問題:T檢驗和F檢驗有什么區別?那我想最大的區別也許在于F檢驗基于的是方差(檢驗方差齊性),T檢驗則對應的是均值。(不知道這樣的理解會否有些偏頗,敬請拍磚……)在兩樣本中,首先要判斷兩總體方差是否相同,即方差齊性。若兩總體方差相等,則直接用T檢驗,若不等,可采用t'檢驗或變量變換或秩和檢驗等方法。引申到回歸分析中,T檢驗的就是各個參數與y的顯著性,F檢驗則是對整個模型的顯著性做檢驗。
對于初學者,可能還有一個問題就是F檢驗和ANOVA(方差分析)是什么關系?我的答案是方差分析和F檢驗基本是一致的,區別在于方差分析是一種分析思路,利用了F檢驗的統計量。
方差分析的基本思路又是什么?
我覺得基本思想就是將所有測量值間的總變異按照其變異的來源分解為多個部份,然后進行比較,評價由某種因素所引起的變異是否具有統計學意義。說到變異,我們可以把總的變異分為組間變異和組內變異(組間變異:各組的均數與總均數間的差異;組內變異:每組的每個測量值與該組均數的差異),離差平方和可分解為SS總=SS組間+SS組內,MS組間=SS組間/V組間;MS組內=SS組內/V組內。F統計量可表述為:F=MS組間/MS組內。
我們拿一張方差分析表來做一下分析:
<a href='/map/fangchafenxi/' style='color:#000;font-size:inherit;'>方差分析</a>圖.jpg 
通常我們可以通過計算得到的F值去對應的臨界值表中查找,然后判斷是否拒絕原假設。不過有一個更直觀的數據,那就是P值,從表中的P值,我們若選取α=0.05的話,此時的P值小于0.05,則拒絕原假設,認為其是有統計學意義的。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢