熱線電話:13121318867

登錄
首頁精彩閱讀大數據時代,容易被數據誤導的八個問題
大數據時代,容易被數據誤導的八個問題
2016-02-19
收藏

大數據時代,容易被數據誤導的八個問題

現在做銷售、市場的人如果不懂得數據分析,用數據說話那真是落伍了。沒見很多企業領導開口就是“拿數據給我看,沒有數據我怎么做決策???”??梢姅祿治鲈诋斀竦钠髽I管理中占據做非常重要的地位,并且數據分析師也是未來十年最有前途的十大職業之一。 

先看一個利用數據忽悠人的案例: 在美國和西班牙交戰期間,美國海軍的死亡率是千分之九,而同時期紐約居民的死亡率是千分之十六。后來海軍征兵人員就用這些數據來證明參軍更安全。你認為這個結論正確嗎?當然不正確,這兩個數字根本就是不匹配的,當兵的都是身強力壯的年輕人,而居民的死亡率是包括老弱病殘的數據,這些人相對來說,死亡率是高的。所以正常應該是用同年齡段的海軍數據和紐約居民來對比。

其實你發現9‰和16‰根本就不具有可對比性。
企業管理人員對“假”數據是深惡痛疾。原因不言而喻:“假數據”造成資源浪費,決策失誤,貽誤戰機等等。簡單總結一下“有問題數據”的幾個方面,幫助大家早日練成火眼金睛。需要提醒大家的是“有問題的數據”并不代表一定是“假”的數據,因為有的數據是真的,但是結論確實“假”的。常見的利用數據來
誤導大家的情況有以下幾種:
一、隨意制造“假”的數據來忽悠客戶或消費者
請原諒我用了“制造”這個動詞。
這種情況隨處可見,對于某些人或組織來說,數據的嚴肅性根本就是一句空話,他們是要什么數據就編什么數據,他們的名字叫”編“委。對于這種情況,我們一定要多問幾個為什么,問清楚數據源就可以了。記住“無數據(源)就沒有真相”。比如報紙的發行量永遠是世界上最難解的謎題,我也不知道答案,我只知道:
1、媒體自己公布的發行量實際上是他們的最高發行記錄,一般來講大家習慣去掉“最高”二字
2、當年某些報紙為了創造最高發行量,直接把報紙從印刷廠拉倒垃圾站,這種情況是公然而無恥的作假,后被禁止
大家看看這句話中的數字是否有錯誤:公司業務員小強有24個客戶,4月不重復客戶購買比率為78%(備注:不重復客戶購買比例=有訂單的客戶總數/總客戶數)。答案是錯誤的,因為永遠算不出來78%這個數據。
二、定向取值問題
這種一種具有隱蔽性和欺騙性的手段。何為定向取值?就是先假定一個結論,然后選取最利于這個結論的人群進行市場調查或研究,最后號稱這個規律或結論具有普遍性。比如平均工資,我要讓他高,就去寫字樓訪問,我要讓他低,那就如勞務市場吧!這種方法是一種騙人的伎倆,要不得,可是很多人非常熱衷!
把這種方法用到極致的是市場調查公司或某些政府機關。比如某年某地區說要在半年內將房價降價多少以上,半年以后他們真的做到了,可是老百姓并沒有感到房價下降的趨勢,為什么呢?原來他們玩了個數字游戲,半年前的樣本是城區的房價平均,半年后加上了郊區的房價后取平均。
大部分市場調查公司是定向取值的熱衷者。很多企業的老板會要求市調公司按照他們的結論來采樣調查,然后用這個數據去做廣告、公關,欺騙消費者。有些公司的調查數據是真的(即調查的樣本數足夠多,且沒有定向選取調查對象),但結論卻是假的。因為企業也可以定向取結論。比如(此事例是為了說明問題,假設的數據,千萬不要當真),比如某種牙膏宣傳:使用該品牌的牙膏后將使蛀牙減少23%,這個數據是市場調查后的數據。當然這個數據對你一定是有誘惑力的。因為你認為減少的反義詞就是沒減少!可你是否知道他的背后有可能是這樣的:23%的人蛀牙減少,40%的人沒有任何反應,37%的人蛀牙反而增多了(只是這種可能性不大)。
看看這幅畫你就懂了
三、田忌賽馬
田忌賽馬的故事大家想必都聽說過,利用田忌賽馬來誤導的情況也是比較多見的??匆粋€例子,2010年底某知名B2C網站搞了一個“全民瘋搶”活動,活動結束后,某人在微博上寫道:就成交數據看,在大促四日里的日均交易額已經遠遠超過了09年度國美、蘇寧和百聯三家線下大賣場的總和日均銷售額。就這句話來說是沒有問題的,錯在前后數據沒有可對比性,用自己促銷時的最大值和別人的常規日銷售來做對比,這樣的對比沒有任何意思。這個就好像劉翔參加殘奧會比賽得了冠軍又能如何?根本就不是一個組別。
再來看一組數據:2010年12月20日到12月26日電影《非誠勿擾2》和《讓子彈飛》的周票房分別為2.4億和2.1億(備注:非2是12月22日上市,讓是12月16日上市)。從這兩個數據是否我們可以得出這樣的結論:“非2”票房大大超越“讓”的票房。從純數據的角度來說,實際上這兩個數據沒有可對比性,不匹配。因為12.20-12.26是“非2”上影的第一周,是“讓”上影的第二周。正常大片的票房高點都是在第一周。如果我們單看他們第一周的票房數據:讓上市第一周4天票房共2.9億,平均每天0.7億,非2上影前5天票房2.4億,平均票房約0.5億元,“讓”票房反而高很多!
田忌賽馬實際上就是在選擇數據的結論。數據的匹配性是我們時刻都需要提防的,這方面是極易犯錯誤的,有時候我們看起來非常合理的對比也有可能是非常不合理的。
四、數據分析的系統誤差
數據分析有的時候是人為因素影響,有的時候還可能有系統誤差出現。舉說來說:假設人事部要在一個公司內部調查一下大家對新來的總經理的看法,選項有五個:非常喜歡、喜歡、沒感覺、不喜歡、非常不喜歡。要求匿名投票。收回選票后結果如下:非常喜歡25%,喜歡40%,沒感覺20%,不喜歡10%,非常不喜歡5%。由于是匿名投票你可能認為這個數據沒問題了吧(假設沒有拍馬屁的現象)。
我的回答是不一定。因為很可能還有很多員工根本就沒有投票。他們不投票的原因有可能是不知道該調查或忙沒來得及投票等,還有就是這些棄權票很可能都是要投“不喜歡”的人,他們不想表達自己的真實想法,所以他們有“目的”的放棄了投票。想想聯合國大會的棄權票吧,有點這個意思的吧。另外如果這個調查的五個選項改成如下排序:非常不喜歡、不喜歡、沒感覺、喜歡、非常喜歡。還是剛才投完票的那些人來投,結果可能不一樣哦!
五、眼見為虛、圖表的忽悠
如果上面的幾點還不能忽悠你,那再來個數據加圖表,雙重忽悠。讓你覺得有圖有真相??纯聪旅孢@兩張圖,你喜歡那張?



發現不同了嗎?其實上面兩張圖的數據源一模一樣,市場占有率都是從05年的23.5%增長到2010年24.8%,僅僅增長了1.3%。第一張圖初一看市場占有率增長得氣勢如虹,第二張毫無亮點!有些公司更缺德,把左邊的數據比率還給隱藏起來,名為保護公司機密!如果那樣你就徹底被忽悠了。
對某些人來說,這兩張圖各有用處,比如第一張可以給消費者看,可以夸大公司的市場占有率,第二張在向董事局要錢的時候給董事們看,說明市場占有率增長不大,需要投入!當你需要罵人的時候第二張也可以給下屬看。當然這是開玩笑,Y軸的值一般EXCEL會自動調整,不過也可以人為調整,但如果調整過大(比如本例)就一定要醒目的標注出來,否則就有誤導之嫌!
六、預設結論
這個好理解,就是先有結論后用數據來證明這個結論。比如下面這個磚家的分析,為了去匹配國家提出的65歲退休年齡他也是蠻拼的:


再看一個預設結論的案例,繼續上圖。這是早幾年微博瘋傳的一張圖,原題為“我終于發現1-9的秘密”。


這個“秘密”就是1有一個角,2有兩個角,3有三個角……依此類推。這就是預設結論的典范。其中4有4個角我勉強能接受,7有7個角怎么講?還有最奇葩的是9,為了證明9有9個角作者也是蠻拼的。
其實,我們很多企業領導人有時候會無意識的犯預設結論的毛?。ㄓ幸庾R的預設結論就不說了)。比如某天領導對下屬說:小王,你看看這個月銷售不好是不是會員復購率低的原因?這算輕度的預設結論吧,下屬會朝著你指明的復購率去找問題。
重度預設結論是那種領導?比如在年底是,老板對小王說了:小王,你分析分析明年我們的目標能完成10億嗎?這算暗示嗎?這是明示啊。你放心,“懂事”的小王一定會去想辦法證明這10億目標的合理性,可是苦了的就是下面那些賣命的兄弟們。
七、算也算不清楚的各種率
據說離婚率前三位城市是北京39%,上海38%,深圳36%(數據來源于新聞媒體)。仔細一查,發現這個離婚率公式是這樣的:離婚率=離婚數/結婚總數,乍一看,沒有任何問題。2010年的離婚率就是2010年離婚數除以2010年結婚數?錯了!不是蘋果對蘋果!2010年離婚的人和結婚的人根本就不是一個概念。這樣計算的結果不但毫無可信度,而且還給被廣大人民群眾造成誤解!目前媒體上有關離婚率的數字應該都是這樣計算出來的。
那怎樣計算離婚率呢?我們可以將上面的公式修改一下就可以了。2000年結婚人群在2010年的離婚率=2000年結婚且2010年離婚總數/2000年的結婚總數。順便說一下,如果我們對2000年結婚人群每年都計算一個離婚率的話,你還可以分析是否有七年之癢存在。
很多零售企業每個月都會計算退貨率,實際上和離婚率是一個概念,需要分門別類才能正確的計算出來的。
八、“如果…那么…”忽悠法
這種忽悠方法常存在于一些創業公司或者騙子公司中。常用句式是“如果全國人民每人給我一分錢,那我就是10億富翁了”,大家是不是很熟悉這種忽悠套路?
進化版:中國有13億人口,其中我們產品的目標人群占30%,如果其中有20%的人購買我們的產品,每人消費100塊的話。那我們的銷售額就能做到近100億,所以說這個市場規模很大,我們有很大的機會!
還有這個,春節期間只2天時間微信便綁定個人銀行卡2億張。若30%的人發100元紅包,共形成60億元的資金流動,延期一天支付,民間借貸目前月息2%,每天保守收益就420萬元,若30%的用戶沒選擇領取現金,那么其賬戶可以產生18億元的現金沉淀,無利息成本.
如果你們注意一下,目前我們很多微商是很流行這種忽悠術。
數據障眼法很多,特別是在中國這個盛產山寨和騙子的地方,所以各位,還是擦亮自己的眼睛吧。祝你早日練成火眼金睛。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢