熱線電話:13121318867

登錄
首頁精彩閱讀三招揪出問卷中的李鬼_數據分析_大數據
三招揪出問卷中的李鬼_數據分析_大數據
2014-09-09
收藏

      三招揪出問卷中的李鬼_數據分析_大數據

相信許多做個調查報告的人都會有這樣的問題——問卷的不真實使得數據分析不能。但是如果能在問卷整理的時候就及時發現問題,那么你就不會在deadline的前夜被劣質的數據折磨的如此狼狽不堪?,F在,我"數據分析師"分享一下數據抓鬼的三班斧,一來能幫你審核數據、辨識真假,使得從統計秘籍上學來的分析招數能有用武之地;二來也能間接自律一下前線的調研,順便整治一下市調行業的不良之風。
 第一招:設置同質題目,一個問題,多處提問。
      同質題目是指一個問題在問卷中設置兩種問法,對一個受訪者訪問兩次,只要這兩個答案不一致,哈哈虛假數據!比如:年齡和身份證號碼一起問,小孩的年齡與年級一起問。還有就是利用態度量表,設計正反問法。例如在一份測度啤酒消費習慣的態度量表中,問題1是:“我很喜歡喝啤酒”和問題5是“要不是應酬的需要,我絕對不喝啤酒”一對同質問題,設置“非常符合、比較符合、不太符合、與表述相反” 并賦值“1、2、3、4”。當某個案,問題1與問題5的選項之和超出【4,6】的范圍,我們可以判定是虛假個案。比如:問題1選1,問題5選2,兩者相加得分為3;問題1選3,問題5選4,兩者相加得分為7。3分和7分都超出了所能容忍的范圍,判處該個案死刑。
 第二招:測度選項比例,判定虛假。
    一般來說,數據分析師通過分析每一份個案中同一選項的比例,可以發現虛假數據。比如,在某個30道題目的調查問卷中,某選項的比例超過70%,比如70%的選項全是C,則可將該份問卷判定為虛假問卷。同理,通過計算某個訪問員所有調查問卷中選項的比例,如果某一項的比例超過閥值,則可以認定該訪問員造假。那么不要手軟,堅決對該訪問員判死刑。
 第三招:測度總分分布,衡量整體質量。
    這里重點介紹如何通過測度數據的分布,來判定調查問卷數據的可靠性。以滿意度調查為例。數據分析師在對數據量表量化之后,可以計算出每個個案所有量表的總分。比如,一共有30題,每題的得分范圍為1-10分。那么總分的理論取值范圍就是30-300。如果我們一共收集了500份問卷,那么就應該有500個總得分。理論上講,一項服務的滿意度應該服從正態分布。因為大多數被訪者的評價應該差不多,高分和低分的評價應該比較少。當然,這只是經驗判斷。那么現在我們來看,調查結果的總得分分布,如果接近正態分布,則可以說明該調查數據是可信的。如果數據遠遠偏離正態分布,則認為該數據存在比較嚴重的質量問題。這樣任何分析都是沒有意義的,應該對本次調查判死刑。
招外招:記錄填寫時間,越短越可疑。
    最后,分享一個招外招。如果你做的是網絡調查,那么這一招很管用,堪稱絕招。具體做法就是系統自動記錄用戶的答題時間。如果用戶答題所用的時間很短,則認為該用戶純粹是在騙獎品。如果你們的服務器很牛b,牛b到可以記錄被訪者填寫每一道題目的時間耗費,那么縱然李鬼潛伏的再深,也得乖乖束手就擒。cda數據分析師培訓

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢