
沒有可對比性的數據分析就是耍流氓
在數據分析的對比、細分、溯源六字箴言中,對比占據著重要的地位,也是最簡單的數據分析方法之一,可以說無對比不分析,但是沒有可對比性的對比一定是耍流氓。
沒有可對比性的案例無處不在,在《統計數字會撒謊》一書中提到一個案例,在美國和西班牙交戰期間,美國海軍的死亡率是9‰,而同時期紐約居民的死亡率是16‰,于是美國海軍征兵海報口號就是:來參軍吧,參軍更安全!
這個案例問題在于9‰和16‰這兩個數據沒有可對比性,當兵的人群都是年輕力壯的,一般只會戰死,而紐約居民卻是各式各樣,有自然死亡的、老弱病殘而死的、交通事故致死的等。
之前正好看見一條新聞,題目就是《建筑工地民工月薪最高1.4萬秒殺白領》。這顯然是標題黨干的,用民工最高工資和白領對比這也是沒有對比性的。
數據可對比性的四個“一致”原則:
1、對象一致
前面征兵那個案例就是屬于對比的對象不一致。
2、時間屬性一致
A公司的銷售員離職率是12%,B公司的銷售員的離職率是4%,如果你據此就認為B公司的人員更穩定的話就大錯特錯了,你必須要再問一下他們的時間屬性是否是一致的,是否都是月離職率或年離職率等。
3、定義和計算方法一致
我給你倆舉一個典型案例,關于“青年”的定義。我查閱了大量的資料,發現至少有六種對青年的定義。國家統計局“青年”的定義為15-34歲為青年人口(用于人口普查);共青團的相關定義為14-28歲為青年人口(這是《團章》中的規定);青聯的相關規定為18-40歲為青年人口(見青聯章程);國務院的規定五四青年節為14-28周歲的青年放假半天;而聯合國人口基金定義為14-25歲,世界衛生組織的標準又是14-44歲為青年人口。如果下次你們看見我國青年人占人口總數的**%的數據,一定要問一下它的青年定義是什么。
4、數據源一致:
數據源不一致產生的差異一般比較隱蔽。
對比雖然是最簡單的分析方法,但是使用之前一定要慎重,一定要考慮清楚,一定要堅守可對比性的原則。
被濫用的同比和環比
對比是最常用的分析方法,而同比和環比又是對比中最常用的兩種分析方法。同比是本期和去年同期的對比,環比是本期和上一期的對比。例如2015年12月和2014年12月的對比是同比,和2015年11月的對比是環比,這是統計學上的定義,但在實際業務中同比和環比則會復雜一些,實際業務過程中也經常被濫用。
問:在零售業的日銷售分析中2016年7月12日的零售額同比是否應該是對比2015年7月12日的零售額?
考慮到具體的行業就不是這樣算同比了。具體到零售業2016年7月12日和2015年7月12日的零售額并沒有實際的對比意義。因為2016年的這一天是星期二,而2015年7月12日卻是周日,對零售企業來說這是不同業務背景的日子,所以不能簡單的按統計學的定義來對比。我認為和2015年7月14日的零售額對比更有意義,因為都是星期二。
數據分析必須在業務中靈活應用才有意義。對于零售企業來說日零售額的同比應該首先遵循星期幾對比星期幾的原則,其次應該遵循節日原則,如中秋對比中秋、端午對比端午、除夕對比除夕、情人節對比情人節、圣誕對比圣誕等,最后應該遵循假日放假規則,如十一放假第一天和上年十一放假第一天對比等。不過現在的銷售分析軟件基本上是按照統計學的定義來設定對比原則的,不能不說是一個遺憾。需要注意,這里說的是零售企業,不過餐飲業、電子商務等也應該遵循這個原則。
問:2016年2月的零售額同比2015年2月的零售額同比有意義嗎?
二者可以對比,不過沒有太大的業務意義。首先2016年2月是29天,2015年2月是28天,其次春節假期的因素,對零售企業來說這兩個因素都是影響零售額的重要因素。所以這兩個月的零售數據同比沒有多大意義,同比增長率也沒有太大實際意義。
上面這兩個實例都屬于違背了之前對比原則中提到的時間屬性一致的原則。另外,我們再看一下2013年11月和2012年11月,這兩個月都是30天,并且沒有其他特定節日干擾,是不是他們就有嚴格的同比意義了呢?
首先這兩個月的可對比性大大超過前兩組日期,但如果你們倆仔細觀察的話,一定會發現2013年11月有9天周末休息日,而2012年11月只有8天,少一個休息日對傳統零售業來說意義可不小。按照周銷售指數的概念來計算,在沒有其他因素影響的前提下,因為2013年11月多一個休息日,零售額相應會多2-3%。如果某個店鋪恰好11月的同比增長是2-3%,你必須要明白,這增長的零售額是時間屬性賦予的。
如果照這樣分析,是不是所有的月份同比零售額都沒有對比意義了?
當然不是,同比是一種統計方法,只要符合統計學定義都可以做對比分析,只是作為數據分析人員,你們必須了解對比結果在業務層面的實際意義的大小,一定要知道數據背后的故事。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
2025 年,數據如同數字時代的 DNA,編碼著人類社會的未來圖景,驅動著商業時代的運轉。從全球互聯網用戶每天產生的2.5億TB數據, ...
2025-05-27CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25