熱線電話:13121318867

登錄
首頁精彩閱讀【從零開始學統計】3.置信度置信的到底是什么?
【從零開始學統計】3.置信度置信的到底是什么?
2014-07-04
收藏
前兩期樓主分別作了均值和擬合優度的專題,今天就來說說置信度。

要說置信度,首先老師肯定會在此前已經介紹過了點估計了,那么引入這個概念的目的自然是為了配合一個叫做區間估計,估算置信區間。通常都是用點估計(點估計一般就是用概率論導出的一個估計值)算出來的數據加上一個變動幅度形成一個區間。在這個變動幅度里,涉及到一個參數就是置信度。
  • 首先我們要問為什么要用區間估計?
咱來看個例子:你打槍打10次,你可以得到一個平均值,比如是8.那么我問你,總體的期望是不是就是8呢?你要說是,那就太草率了吧,因為你再打10次可能就是7了,那么總體的期望就變成7了嘛?當然不是,總體的期望是客觀存在不會變的。實際上均值等于期望的概率是0啊,所以說,以點估點是不準確的。但是既然樣本是從總體中抽出來的,那么樣本的均值和總體的期望應該差的不遠吧?你射擊的均值是8,總體的期望總不能是1吧?所以,你若換句話說打槍的平均環數是[6,8],那么相信的人就會很多了??梢?,雖然擴大了總體均值的取值范圍,但是可信度明顯高了。

當然你不能簡單無限度擴大區間范圍,畢竟統計也要講究一定的精度。所以咱就有了置信度,也就是說,你測得的均值,和總體真實情況的差距小于這個給定的值的概率,說你測得的均值就是總體期望是很草率的,但是說,我有95%的把握認為我測得的均值,非常接近總體的期望了,聽起來就靠譜的多。
  • 平時我們常說的95%置信度到底是什么意思呢?
要理解置信度,就要理解好置信區間。要理解置信區間,就要從統計學最基本最核心的思想去思考,那就是用樣本估計總體。在統計學中,非常容易把概念模糊化,很容易把95%置信區間理解成為在這個區間內有95%的概率包含真值。
但是這里有兩個容易混淆的地方
1.真值指得是樣本參數還是總體參數?這個問題的答案是總體參數,我們取的數據是樣本數據,點估計是樣本參數的真實值,我們要估計總體參數。
2.95%的概率,變動的是誰?這里95%的概率,變動的是置信區間。

錯誤理解:假如有100個考生,100個學生中有95個考分落在(70,80)這個區間內。這就是95%置信度。
這是非常錯誤的理解,樣本與總體的關系沒有思考清楚。置信區間是估測總體參數的真值,這個值只有一個,且不會變動。
那正確的應該怎么理解呢?
樣本數目不變的情況下,做一百次試驗,有95個置信區間包含了總體真值。置信度為95%。換言之,若擴大樣本容量,考100次試,這100名學生的成績組成改的區間有95次包含了總體真正的均值,那這才是95%置信度。說白了,我們有95%的把握說總體的真值在這個區間內。
  • 那么還有一個問題,是不是置信度越高越好?
這個問題就要看你需要統計的是什么?經濟效益是什么?通常情況下,95%被作為常用的置信度,原理就在于3西格瑪控制(在一些嚴格的領域甚至會用到6西格瑪),此時已經有很高的置信度了,那在往上去,隨著置信度的上升,置信區間的跨度也就越大,對參數估計的精度必定降低。點估計就一個值,精度高,但置信度則低,精度與置信度相互的取舍則要全由分析者自行選擇了。

樓主tips:置信度這個問題,其實核心問題就是要理解我們的核心思想是用樣本估計總體,保證的是總體參數的精確度,這個區間是為總體設計的即可。


補充一張圖片 liuxigema.gif

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢