熱線電話:13121318867

登錄
首頁精彩閱讀數據可視化之旅(五):常用圖表對比
數據可視化之旅(五):常用圖表對比
2019-09-26
收藏
<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(五):常用圖表對比

作者 | Destiny

來源 | 木東居士

0x00 前言

在之前分享的【數據圖表的選擇】三篇文章中,已經把不同類型數據圖表的用法和適用場景做了一遍梳理。但是,在實際的業務場景中,如何根據擁有的數據集、想要展現的數據模式,去選擇最合適的圖表,需要不斷的去實踐和總結。

因此,今天這篇文章分享的內容,是來對比常見相似圖表的差別和適用的數據集。

本篇將通過一些來源于實際業務場景的數據集實例,來進行不同的可視化方案對比,從而總結出根據可視化目的、數據集特征,去選擇圖表類型的一般套路。圖表對比部分,會選擇一些常見的,且比較容易混淆的圖表類型來做對比,以「可視化目標→數據集準備→圖表選擇和對比→經驗總結」的方式來行文。

0x01 常用圖表對比

1.柱狀圖 VS 條形圖

1)可視化目標

展示2019年上半年`銷售額Top10的手機品牌`、`銷售額Top10的手機型號`。

2)數據集準備

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(五):常用圖表對比

3)圖形對比

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(五):常用圖表對比

4)總結

  • 相同點:
  • 柱狀圖條形圖的數據結構是相同的,都是由「一個分類字段+一個連續數值字段」構成。
  • 當數據的記錄數不大于12條,分類字段的字符長度小于5時,此時柱狀圖條形圖可以互換。
  • 不同點:
  • 柱狀圖
  • 若分類字段,恰好是「時間序列」,此時建議使用柱狀圖,因為柱狀圖能更好地體現數據隨時間的變化情況。
  • 條形圖
  • 若分類字段的字符長度較長,且數據的記錄數大于12,此時建議使用條形圖。
  • 一方面,斜置的文字和用戶閱讀的習慣相悖,同時也占用頁面空間,影響可視化圖表的美感。

2.柱狀圖 VS 直方圖

1)可視化目標

  • 展示某家出售小商品的店鋪,不同品類的商品銷售數量。
  • 已知某家出售小商品的店鋪,其商品定價范圍在[0,100)之間,現需展示該店鋪在售商品的價格分布,要求每10元作為一個區間。

2)數據集準備

數據集1:

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(五):常用圖表對比

數據集2:

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(五):常用圖表對比

3)圖形對比

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(五):常用圖表對比

4)總結

  • 相同點:
  • 柱狀圖直方圖的數據結構是相同的,都是由「一個分類/分組字段+一個連續數值字段」構成。
  • 都是由柱形條構成。
  • 不同點:
  • 分析目的和適用場景不同。
  • 柱狀圖」主要是比較數據的大小,「直方圖」是用來展示數據的分布。
  • 映射到X軸上的數據屬性不同。
  • 柱狀圖中,X軸上的變量是分類數據,例如不同的手機品牌、店鋪或網站在售商品的分類。
  • 直方圖中,X軸上是連續的分組區間,這些區間通常表現為數字,且一般情況下組距是相同的,例如將在售商品的價格區間分為的“0-10元,10-20元……”。
  • 寬度代表的意義不同。
  • 柱狀圖中,柱子的寬度沒有實際的含義,一般為了美觀和整齊,會要求寬度相同;
  • 直方圖中,柱子的寬度代表了區間的長度(即組距),根據區間的不同,柱子的寬度可以不同,但其寬度原則上應該為組距的整倍。
  • 表示數據大小的方式不同。
  • 柱狀圖,是通過柱形條的高度,來映射數據的大小,且柱子之間有間隔;
  • 直方圖,是通過面積來表示數據的大小,且柱子之間緊密相連,沒有間隔。

3.堆疊柱狀圖 VS 百分比堆疊柱狀圖

1)可視化目標

  • 展示某影院2019年上半年總票房趨勢及華語片、外語片趨勢。
  • 展示某影院2019年上半年總票房收入構成占比趨勢。

2)數據集準備

數據集1:票房收入(元)

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(五):常用圖表對比

數據集1:票房收入占比

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(五):常用圖表對比

3)圖形對比

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(五):常用圖表對比

4)總結

  • 相同點:
  • 堆疊柱狀圖和百分比堆疊柱狀圖,都適合用來展示分類數據的構成對比或構成隨時間的變化趨勢。
  • 當映射到X軸上的數據為時間序列時,此時可以用堆疊面積圖or百分比堆疊面積圖來代替。
  • 不同點:
  • 堆疊柱狀圖
  • 既可以對比各構成部分的數值差異,還可以觀測各組數據的整體差距。
  • 百分比堆疊柱狀圖
  • 只能對比整體中的各構成部分的占比差異,無法對比不同整體的差異。

4.折線圖 VS 面積圖

1)可視化目標

  • 展示2019年上半年,全國承運包裹量趨勢。
  • 展示2019年上半年,中通、圓通、申通三家快遞公司的承運包裹量趨勢。
  • 展示2019年上半年,全國及主流快遞公司的承運量趨勢。
  • 展示2019年上半年,主流快遞公司的承運量占全國總承運量的趨勢。

2)數據集準備

數據集1:全國承運包裹量

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(五):常用圖表對比

數據集2:中通、圓通、申通三家快遞公司的承運包裹量

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(五):常用圖表對比

數據集3:全國及主流快遞公司的承運量趨勢

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(五):常用圖表對比

數據集4:主流快遞公司的承運量占全國總承運量的趨勢

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(五):常用圖表對比

3)圖形對比

  • 折線圖和面積圖可以互換的情況:
<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(五):常用圖表對比
  • 折線圖和面積圖不能互換的情況:
  • 顯示構成或占比時,應該使用面積圖?堆疊面積圖or百分比堆疊面積圖。
<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(五):常用圖表對比

4)總結

  • 相同點:
  • 折線圖和面積圖展示的是數據隨時間的變化趨勢,因此映射到X軸的數據類型一般為「時間/日期」。
  • 二者均可以展現一個或多個變量和時間的關系,這種關系包括,周期性變化、季節性變化、異常波動等。
  • 在大部分情況下,折線圖和面積圖是可以互換的。
  • 不同點:
  • 折線圖
  • 通過數據點的縱坐標來映射數值的大小,一般只用來表示數據的趨勢。
  • 面積圖:
  • 通過面積來映射數值的大小,「面積圖」除了可以替換折線圖外,還可以用來表示整體及其構成部分隨時間的變化趨勢。
  • 注意點:
  • 當使用面積圖表示多系列的趨勢時,需要對代表不同系列的面積區塊顏色設置透明度,透明度可以減少不同系列之間的遮蓋,幫助我們看到不同序列之間的重疊關系和更多信息。
  • 當一個圖表中,系列值過多時,折線圖會比面積圖更直觀,因為減少了系列的覆蓋和重疊,能更清晰的看看到各個系列的趨勢變化。

5.堆疊面積圖 VS 百分比堆疊面積圖

1)可視化目標

  • 若某家公司主要有電商、物流、云計算三塊的業務,現需要展示2015~2019這五年,集團的年度收入趨勢及其三大業務的收入趨勢。
  • 若某家公司主要有電商、物流、云計算三塊的業務,現需要展示2015~2019這五年,三大業務對集團的年度收入的貢獻比例。

說明:假設集團有且只有這三項業務,且總收入=電商業務收入+物流業務收入+云計算業務收入。

2)數據集準備

數據集1:總收入構成

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(五):常用圖表對比

數據集2:總收入貢獻占比

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(五):常用圖表對比

3)圖形對比

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(五):常用圖表對比

4)總結

  • 相同點:
  • 堆疊面積圖和百分比堆疊面積圖,映射到X軸的均為【時間序列】。
  • 兩者都可以展示各構成部分,隨時間的變化趨勢,只不過「堆疊面積圖」的是構成部分的實際值隨時間的變化趨勢,「百分比堆疊面積圖」展示的是構成部分的占比隨時間的變化趨勢。
  • 不同點:
  • 堆疊面積圖:
  • 除了可以展示各構成部分隨時間的變化趨勢,還可以展示整體隨時間的變化趨勢。
  • 百分比堆疊面積圖:
  • 只能展示各構成部分占總體的比例隨時間的變化,無法觀測總體隨時間的變化趨勢。
  • 此外,從任何一個時間節點縱切下來,各部分占比之和必須為100%,即必須等于該節點的整體。

6.堆疊面積圖 VS 堆疊柱狀圖

1)可視化目標

  • 展示某個國家,近6年來GDP的增長趨勢及其三大產業的產值趨勢。
  • 展示2019年第二季度,6大主流手機品牌的總出貨量排名,及其各品牌在5大洲的出貨量對比。

2)數據集準備

數據集1:三大產業產值單位為【元】

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(五):常用圖表對比

數據集2:出貨量單位為【部】

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(五):常用圖表對比

3)圖形對比

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(五):常用圖表對比

4)總結

  • 相同點:
  • 堆疊面積圖和堆疊柱狀圖的數據集格式類似,都是由「一個分類字段+多個連續數值字段」構成,且多個連續數值字段,是一個整體的各組成部分。
  • 兩者都可以觀測某一節點的總體數值和各組成部分的具體數值,都有數據對比的功能。
  • 不同點:
  • 堆疊面積圖:
  • 堆疊面積圖的分類字段,一般是時間序列。
  • 當既需要分析整體隨時間的變化趨勢,又要了解整體的各構成項隨時間的變化情況時,應該使用【堆疊面積圖】。
  • 從其目的可以看出,堆疊面積圖的分類字段(即時間序列),是按照時間的先后順序排列的。
  • 堆疊柱狀圖
  • 堆疊柱狀圖的分類字段,一般是非時間類型的分類數據。
  • 當既要對比不同整體的數據大小,又要觀測整體各構成項的數據大小時,應該使用【堆疊柱狀圖】。
  • 若整體的構成項過多,為了突出重點,需要對構成項進行重新歸類,展示TOP5的分類,剩下則歸為「其他」。

7.散點圖 VS 氣泡圖

1)可視化目標

  • 展示華為不同型號手機的售價和成本的分布。
  • 展示華為手機不同型號手機的售價、成本和對應型號的銷量。

2)數據集準備

數據集1:

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(五):常用圖表對比

數據集2:

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(五):常用圖表對比

3)圖形對比

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(五):常用圖表對比

4)總結

  • 相同點:
  • 散點圖氣泡圖,均是用來展示數據分布情況的一種圖形。
  • 散點圖氣泡圖,都是將兩個字段映射到x,y軸的位置上,(x,y)的取值確定一個圓點或氣泡在直角坐標系中的位置。
  • 不同點:
  • 散點圖
  • 一般用來展示二維數據(x,y)的分布,側重于研究二維數據的兩個變量x,y之間的相關性,如身高和體重之間的相關關系。
  • 散點圖中,還可以展示多組數據系列的對比,比如男性身高體重和女性身高體重分布規律的對照。
  • 氣泡圖
  • 一般用來展示三維數據(x,y,z)的分布情況,相較于散點圖,氣泡圖增加了一個維度的數據展示,且將其數值映射到氣泡的大小上。
  • 氣泡圖,也可以展示多組數據系列的分布,以發現不同系列的分布規律和差異。
  • 注意點:
  • 一般來說,散點圖主要是用于研究數據集的分布規律和相關性,并不是很側重去看每個數據點的具體取值。
  • 當數據集數量過大時,不適合將全部數據點展示在散點圖中,此時需要對總體進行抽樣顯示,通常采用分層抽樣的方法進行,但是分層抽樣的依據和影響因素需要依據具體的業務場景而定。
  • 相較于散點圖,氣泡圖不太適合過多數據容量的情況,氣泡太多會使圖表難以閱讀。
  • 此外,對于氣泡圖中隱藏的一些數據信息,通??梢允褂媒换磔o助圖標信息的閱讀,如懸停顯示詳細數據、縮放觀測被遮蓋的數據點等。

0xFF 總結

不知不覺發現寫的內容有點多,為了方便大家更快的獲取信息,將圖表對比部分進行了精簡,參考如下:

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(五):常用圖表對比

贅述一句:可視化之前,最重要的是弄清楚可視化的目的是什么,你期望展示或探索數據的什么規律。因為,這不僅決定了應該選擇什么類型的圖表,如何統計和組裝你的數據集,也決定了可視化出來的結果是否能達到你的預期目標。

聲明:以上圖表數據純屬虛構,圖形部分由Excel完成,部分由Sketch繪制。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢