熱線電話:13121318867

登錄
首頁精彩閱讀SPSS中異常值檢驗的幾種方法介紹(6)_數據分析師
SPSS中異常值檢驗的幾種方法介紹(6)_數據分析師
2015-01-04
收藏

SPSS中異常值檢驗的幾種方法介紹(6)_數據分析師



這樣就可以得到統一視圖下的選擇圖了!

數據可視化的藝術——用圖表吸引目光(四)——Excel 金字塔圖 數據可視化的藝術——用圖表吸引目光(四)——Excel 金字塔圖

這次介紹一個 Excel 的小技巧,關于單元格格式中【數字】這一項的設定。 請看上圖所示的金字塔圖,有沒有發現問題? 比如下圖

按照常規的作圖方式, 圖中突出的兩個地方的數字應該是“-9508”和“-15000”。 但是在 表示人口數量的時候使用負數顯然是不合適的。因此我們可以想個辦法將 Excel 中的圖標 轉換成 y 軸左右都是正數的形式。

調查數據的加權處理技術

很多人在進行統計分析和市場研究的時候, 都涉及到對數據進行加權的問題, 這是一個搞數 據分析和從事市場

研究的人都會碰到的問題, 需要大家正確理解并解釋, 并采用合理的操作 技術和處理方法。 什么是加權呢? 簡單地說,就是要“讓一些人變得比另一些人更重要!” 要能夠比較好的理解加權,首先你要了解抽樣設計,特別是設計權數:每個樣本單位所代表 的被調查總體的單位數。設計權數由抽樣設計決定,用 Wd 表示。 設計權數 Wd=1/入樣概率; 入樣概率:在抽樣設計中,如果一個樣本的入樣概率=1/50,那么該樣本的設計權數=50。 也就是說,這個樣本代表了總體中的 50 個單位。 關于自加權抽樣設計:如果所用樣本的設計權數是相等的,那么這樣的抽樣設計是自加 權的。也就是說,總體中的每個單元被抽中的可能性相等,具有等可能性、具有相等的入樣概率。如果是自加權的,在總體均值、比例估計時不用考慮設計權數,對總量的估計只要擴 大樣本。 滿足自加權的抽樣設計:等概率抽樣、簡單隨機抽樣、系統抽樣、分層抽樣—各層大小 成比例,每層內簡單隨機抽樣、多階段抽樣—最后階段等概率,其它階段與單位大小成比例 概率抽樣。 不等概率抽樣往往不滿足自加權, 對于不等概率抽樣, 正確使用設計權數就尤為重要了!

下面我們看看如何進行加權處理! 加權:通過對總體中的各個樣本設置不同的數值系數(即加權因子-權重),使樣本呈現希望 的相對重要性程度; 基本加權等于:設計加權=某個變量或指標的期望比例/該變量或指標的實際比例;

什么情況下要進行加權? 情景 1:我們在抽樣調查得到的樣本結構與總體人口統計結構狀況不相符,我們可以通過加 權來消除/還原這種結構差異,達到糾偏的目的; 例如,在城市和農村各調查 300 樣本,城市與農村人口比例“城市:農村=1:2”(假設),在 分析時我們希望將城市和農場看作一個整體,這時候我們就可以賦予農村樣本一個 2 倍于 城市樣本的權重; 情景 2:除了人口統計結構,有時候我們在調查樣本的某些變量或指標上樣本的代表性可能 也會相對總體的實際狀況過高/過低,此時,需要加權進行調整;

這類不匹配大多是我們“故意”而為(通過“追加”樣本實現),比如在配額抽樣的時候,設置配 額要求某類被訪者對某產品的使用者必須達到 50%,但實際情況是總體市場中實際使用者 僅有 10%; 有時,則是“非情愿”的出現,比如設置了能反映總體的配額比例,但實際操作卻出現了比例 偏高/偏低; 情景 3:在樣本組配額實驗設計中,進行不同子總體對比檢驗,也會通過加權來調整不同組 間的樣本屬性不相匹配的情形(通常設有相同的配額,但執行有可能會出現差異);通常,加 權對結果產生的差異很小,更多的是對結果從準確度上進行修飾; 情景 4:所測試樣本出現了較多的缺失值,需要加權來糾正結果;對于面向特定客戶的專項 研究,在調查前基本都協議有要完成的樣本量,故這種情形較少;



數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢