熱線電話:13121318867

登錄
首頁精彩閱讀統計之 - 列聯表_數據分析師
統計之 - 列聯表_數據分析師
2014-12-24
收藏

統計之 - 列聯表_數據分析師


頻數表是將數據集按照某個特定列分類(分組)時觀察每個類/組中數據出現次數的表;列聯表也是頻數表,只不過它會分析的是將數據集按兩個或兩個以上類別變量聯合分組時觀察數據在每個分組中出現頻數的表,所以又稱交叉分類表。

簡介

特殊地,如果我們使用樣本數據的兩個屬性構建列聯表,而且每個屬性只有兩個等級,那么我們會得到兩行兩列的的列聯表,又稱× 2四格表。例如對隨機抽取的1000個人按照性別(/)色覺(正常/色盲)兩個屬性分組來構建列聯表。一般地,如果我們使用數據集的兩個屬性A、B來構建列聯表,其中Ar個等級A1,A2,…. Ar,Bc個等級B1,B2,…Bc,那么我們最終會得到一個rc列的列聯表,簡稱× c,nij為等級AiBj處的頻數。更一般地,如果我們使用多個屬性構建列聯表時,我們會得到多維列聯表。

作用

列聯表分析的基本問題是:觀察各屬性之間是否獨立?如在前面的例子中,性別與色盲是否有關系?在× c中,若以pi,pj,pij表示數據集中數據屬于Ai等級的頻數,屬于Bj的頻數及同時屬于AiBj的頻數(pi,pj屬于邊際概率,pij屬于格概率),那么“A、B兩屬性無關”這個假設成立的可表述為H0pij = pi*pj。

 

如果變量的無關假設被拒絕了,那么我們需要某種度量來刻畫變量間的相關程度,例如對于× c,可用列聯系數來度量關聯的程度。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢