
作者 | CDA數據分析師
假設(hypothesis),又稱統計假設,是對總體參數的具體數值所作的陳述。假設檢驗(hypothesis test) 是先對總體參數提出某種假設,然后利用樣本信息判斷假設是否成立的過程。
假設檢驗的特點就是采用邏輯上的反證法和依據統計上 的小概率原理。小概率事件在單獨一次的試驗中基本上不會發生,可以不予考慮。在假設檢驗中,我們做出判斷時所依據的邏輯是:如果在原假設正確的前提下,檢驗統計量的樣本觀測值的出現屬于小概率事件,那么可以認為原假設不可信,從而否定它,轉而接受備擇假設。
一個完整的假設檢驗過程,包括以下幾個步驟:
(1)提出假設;
(2)構造適當的檢驗統計量,并根據樣本計算統計量的具體數值;
(3)規定顯著性水平,建立檢驗規則;
(4)做出判斷。
(1)對陳述正確性的檢驗
在這種情況下,原假設通常是基于假定的陳述是正確的。然后建立備擇假設,為拒絕提供統計證據,從而證明這個假定的陳述是錯誤的。
(2)對研究性假設的檢驗
在研究性假設檢驗的調查研究中,應該建立原假設和備擇假設,并用備擇假設來表示研究性假設,這樣如果拒絕,將支持樣本所得出的結論以及應該采取某些行動。
(3)對決策情況下的檢驗
在決策情況下的檢驗研究中,決策者必須從兩種措施中挑選其中一種,無論是接受還是拒絕,都必須采取一定的措施。
(1)P值規則
所謂P值,實際上是檢驗統計量超過(大于或小于)具體樣本觀測值的概率。如果P值小于所給定的顯著性水平,則認為原假設不太可能成立;如果P值大于所給定的標準,則認為沒有充分的證據否定原假設。
(2)臨界值規則
假設檢驗中,還有另外一種做出結論的方法:根據所提出的顯著性水平標準(它是概率密度曲線的尾部面積)查表得到相應的檢驗統計量的數值,稱作臨界值,直接用檢驗統計量的觀測值與臨界值作比較,觀測值落在臨界值所劃定的尾部(稱之為拒絕域)內,便拒絕原假設;觀測值落在臨界值所劃定的尾部之外(稱之為不能拒絕域)的范圍內,則認為拒絕原假設的證據不足。這種做出檢驗結論的方法,我們稱之為臨界值規則。
?第Ⅰ類錯誤 (type Ⅰ error)
又稱棄真錯誤,當原假設為真時拒絕原假設。犯第Ⅰ類錯誤的概率通常記為α 。
?第Ⅱ類錯誤(type Ⅱ error)
又稱取偽錯誤,當原假設為假時沒有拒絕原假設。犯第Ⅱ類錯誤的概率通常記為β。
在統計實踐中,進行假設檢驗時一般先控制第Ⅰ類錯誤發生的概率,并確定犯第Ⅰ類錯誤的概率最大值,稱為檢驗的顯著性水平。在樣本容量n不變的條件下,犯兩類錯誤的概率常常呈現反向的變化,要使α和β 都同時減小,除非增加樣本的容量。因此,統計學家奈曼與皮爾遜提出了一個原則:即在控制犯第一類錯誤的概率情況下,盡量使犯第二類錯誤的概率小。
在實際問題中,我們往往把要否定的陳述作為原假設,而把擬采納的陳述本身作為備擇假設,只對犯第一類錯誤的概率加以限制,而不考慮犯第二類錯誤的概率。
(1)雙側檢驗
雙側檢驗屬于決策中的假設檢驗。也就是說,不論是拒絕H0,還是接受H1 ,都必需采取相應的行動措施。
(2)單側檢驗
單側檢驗又可分兩種形式:
a、檢驗研究中的假設
將所研究的假設作為備擇假設H1,將認為研究結果是無效的說法或理論作為原假設H0?;蛘哒f,把希望(想要)證明的假設作為備擇假設。再做這類假設檢驗時應先確立備擇假設H1。
b、檢驗某項聲明的有效性
將所作出的說明(聲明)作為原假設,對該說明的質疑作為備擇假設,在做這類單側檢驗時,應先確立原假設H0。除非我們有證據表明“聲明”無效,否則就應認為該“聲明”是有效的。
以均值為例進行如下分析分析,看適合哪種檢驗。
以均值差為例進行如下分析分析,看適合哪種檢驗。
以上就是我總結的假設檢驗的內容,希望能對你的知識梳理起到幫助。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25