
數據可視化 真正可以遵循的制圖技巧
可視化有許多“規則”。有的是實際的規則,有的則是幫助你做出選擇的建議。如果是出于數據的要求,而且你也知道該怎么做,那么許多實際的規則也不必遵守。
但是,的確有一些規則不應該違背。這些規則通常是用于一些特定種類、幾乎只能用特定方式閱讀的圖表。當這些規則被打破,閱讀過程中,數據有可能被誤讀。這會有點棘手。
條形圖的基線必須從零開始
條形圖依賴長度來呈現數據。短的條塊代表較低的值,長一些的則表示較高的值。條形圖的原理就是通過比較條塊的長度來比較值的大小。
當基線被改變了,視覺效果也就扭曲了。
舉例來說,請看上圖。左邊第一幅條形圖比較了兩個值:50和100,它有一條并且它有一條以零為起點的基線。很好。代表數值100的條塊長度正好是數值50的兩倍長,為100正好也是50的兩倍大小。
但當你把基線變為一個更高的、非零的值時,第一個條形的長度變短了,而另外一個條形的長度卻沒有變。此時值為100的條形不再是值為50的條形的兩倍長。以此類推,當最后左邊代表數值50的條形徹底消失了,意味著100無限地大于50了。
條形圖的基線必須從零開始。
例:這張條形圖是經??怂剐侣劀试S使用的。
3月31日目標的值為7,066,000,比6,000,000高17.8%,然而第二個條形幾乎是第一個條形長度的三倍。
有人也許會反駁說,這張圖的重點在于兩個值的差而非這兩個值本身。即便如此,用條形圖來表示本身就是一個錯誤的選擇。使用時間序列來呈現月累積數也許會更好。
不要過分熱衷于餅圖
有些人認為,應該完全避免餅圖。他們也許是對的,也許又不是。有些人也許會說,使用餅圖完全是一種不可原諒的錯誤。對此,我不同意。不管怎樣,事實情況是人們仍然使用餅圖,所以我們至少可以爭取正確地使用它們。
避免過度切割餅圖,否則最終對它的閱讀將難以為繼。
那么多少是“太多”?這是一個判斷力的問題。不過,如果已經很難從圖中看出其中一塊扇形是另一塊兩倍大,或者好幾個較小的扇形區域看起來差不多大時,在扇形切割上面就該收手了。此時可以考慮把較小的類目歸入一個更大的:“其他”。圓環圖也是一樣。
同時也考慮一下用其他種類的圖表來表示比例。
不要太依賴于餅圖。
例:這張餅圖來自維基百科,它展示了國家的不同區域。
左邊這張餅圖中已經切割了許多塊,但旁邊另分離出一張餅圖,顯示了左圖中看不清楚的更小國家的情況,以此來提供更多的信息。有許多方式可以展示這組數據,比如樹狀圖、按照數據比例制作的圖標,或者就用普通的地圖。單薄的餅圖只適用于顯示只有幾組值的數據。
尊重部分所占整體的比例
相較于呈現數值,有些圖更著重于表現部分與整體的關系,它們表現的數據是部分所占整體比例。比如,堆積式條形圖,堆積區域圖,樹狀圖,馬賽克圖,圓環圖以及餅圖。在這些圖表中,每一個部分都表示一個獨立的、不重疊的比例。
關于這一條,最常見的錯誤發生在調查問題允許多選時。比如說:“你上周使用了哪一種交通工具?可以多選?!边@樣的話,在人們多選的問題上就會出現比例的重疊,不同選項的百分比之和大于一。為了避免這種情況,你不能直接把比例做成統計圖。
例:這張餅圖來自??怂剐侣勏聦贆C構,它表現了三個不屬于同一個整體的百分比。
每一個值都是一個單獨的整體,因此在這一例中,用三個堆積式條塊(或普通的條塊)會更直觀地表現每個值的比例。
展示數據
讓讀者看到數據,這是可視化的重點。如果數據的呈現不夠清晰,就違背了做圖表的初衷。這常常是因為一張圖里的數據太多,于是讀者的興趣就被分散了。
這是一個經典的“繪圖過度”的問題,相關的研究有很多。但是對于基本的圖表,也有一些簡單的解決方式。
首先是可以改變符號的大小,這樣上圖中的小圓點(或者是其他的符號)就不會占據太多空間。為了讓數據直觀清晰,主要要增加空白。
調節透明度,多層次的圖案就不會被覆蓋。
通過取樣或者把對數據進行分類的方式,把總體分成幾個更小的子群。從中,你可以采取小而多的方式,這樣每張表里的信息就會少一些。
數據進行再統計及分門別類。
總而言之,更好地呈現數據。
例:這張圖展示了金州勇士隊在2008-09賽季的每個投籃。
這張圖最終形成了一個球場的形狀,并得出了對于球員們投籃最多的地點的一個小結論——近框,中距離,以及三分球。但是它們之間的差距是很小的,讀者并不能看清真正量級上的差距。
數據聚合法將有助于解決此類問題。
解釋編碼
通過一定的形狀、顏色和幾何圖形的結合,將數據呈現出來。為了讓讀者能讀清楚,圖表設計者就要把這些圖形解碼回數據值。經典的例子是沒有標注的坐標軸。
有時編碼不需要解釋。比如說,讀者也許知道怎樣讀條形圖,就不必解釋條的長度表示的是值的大小了。但是設計者的確應該解釋數據,也就是圖表的單位和主題。
所以標明坐標軸代表的含義。要給讀者提供線索或圖例,解釋圖表。
例:這個錯誤標注的圖表來自溫尼伯太陽報:
我們要是能知道這是統計關于什么的問題就好了。
大功告成
搞定了。最后一件事就是確保你沒有違反最基礎的可視化規則——這都是關于理解數據轉換可視化圖形的過程。如果能弄明白怎數據是如何轉換成幾何圖形的,你就可以創作自己的可視化作品了。但對于特定的幾種只能用特定方式來讀取的圖表,是沒有什么改變的余地的。
總之,一定要學會把數據轉換成可視化圖形。然后真正理解可視化制圖中“規則”和“建議”的不同之處。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25