熱線電話:13121318867

登錄
首頁精彩閱讀數據可視化之旅(一):數據可視化過程
數據可視化之旅(一):數據可視化過程
2019-09-20
收藏
<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(一):<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>過程

作者 | Destiny

來源 | 木東居士

0x00 前言

前面寫過一篇文章,叫做《數據可視化的基本流程》,是站在可視化過程中的上下游關系,來梳理和介紹數據可視化的全過程,及其各個環節的主要工作內容。今天這篇文章,也是介紹數據可視化的過程,但是更多的是站在產品經理的視角,去呈現一個數據需求,從需求提煉、分析,到最終可視化呈現的一個過程。

可視化的終極目標是洞悉蘊含在數據中的現象和規律,從而幫助用戶高效而準確的進行決策。

0x01 可視化過程

一個完整的數據可視化過程,主要包括以下4個步驟:

  • 確定數據可視化的主題;
  • 提煉可視化主題的數據;
  • 根據數據關系確定圖表;
  • 進行可視化布局及設計;
<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(一):<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>過程

0x02 確定數據主題

可視化過程的第一步:確定數據主題,即確定需要可視化的數據是圍繞什么主題或者目的來組織的。

在可視化過程中的4個步驟之中,第一步是相對來說較容易的一步。

業務運營中的具體場景和遇到的實際問題,公司層面的某個戰略意圖,都是確定數據可視化主題的來源和依據。簡而言之,一個具體問題或某項業務、戰略目標的提出,其實就可以對應一個數據可視化的主題。

比如,銀行分析不同城市用戶的儲蓄率、儲蓄金額,電商平臺進行雙十一的實時交易情況的大屏直播,物流公司分析包裹的流向、承運量和運輸時效,向政府機構或投資人展示公司的經營現狀等,都可以確定相應的數據主題。

0x03 提煉數據

確定數據圍繞什么主題進行組織之后,我們接下來要了解我們擁有哪些數據,如何來組織數據,這里面又衍生出另外三個問題。

1. 確定數據指標

分析和評估一項業務的經營現狀通常有不同的角度,這也就意味著會存在不同的衡量指標。同樣一個業務問題或數據,因為思考視角和組織方式的不同,會得出截然不同的數據分析結果。

例如,要評估寄件這項業務,有人想了解寄件量,有人想知道不同快遞公司的運輸時效,有人想知道寄件用戶的下單渠道,還有人想了解寄件收入。

拿起數據,就開始畫圖,會讓整個數據可視化作品沒有重點、雜亂無章,是一種用戰術上的勤勞掩蓋戰略上的懶惰,最終的呈現效果一般不理想。

2. 明確數據間的相互關系

基于不同的分析目的,所關注的數據之間的相互關系也截然不同,這一步實質上是在進行數據指標的維度選擇。

例如,都要統計寄件量,有人希望知道各個快遞公司的寄件量是多少,有人想了解一天內的寄件量高峰位于哪個時段,還有人想知道寄件量TOP10的城市排名。這里的快遞公司、時段、城市,都是觀察寄件量這個指標的不同維度。

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(一):<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>過程

通常,數據之間的相互關系包含如下幾類:

  • 趨勢型:
  • 通常研究的是某一變量隨另一變量的變化趨勢,常見的有時間序列數據的可視化。
  • 對比型:
  • 對比兩組或者兩組以上的數據,通常用于分類數據的對比。
  • 比例型:
  • 數據總體和各個構成部分之間的比例關系。
  • 分布型:
  • 展現一組數據的分布情況,如描述性統計中的集中趨勢、離散程度、偏態與峰度等。
  • 區間型:
  • 顯示同一維度上值的不同分區差異,常用來表示進度情況。
  • 關聯型:
  • 用于直觀表示不同數據之間的相互關系,如包含關系、層級關系、分流關系、聯結關系等。
  • 地理型:
  • 通過數據在地圖上的地理位置,來展示數據在不同地理區域上的分布情況,根據空間維度不同,通常分為二維地圖和三維地圖。

3. 確定用戶關注的重點指標

確定了要展示的數據指標和維度之后,就要對這些指標的重要性進行一個重要性排序。

因為對于一個可視化展示的終端設備而言,其屏幕大小有限,且用戶的時間有限、注意力也極其容易分散。如何讓用戶在短時間內,更有效率的獲取到重要的信息,這是評估一個可視化產品好壞的重要因素。

在可視化設計之前,不妨問用戶兩個問題:

(1)如果整個版面只能展示一個最重要的信息,你希望是什么?

(2)你希望展現這些信息的理由是什么?通過用戶對這些問題的回答,你能了解到,在已確定的指標和維度中,用戶最關注的是哪個或哪些。

通過確定用戶關注的重點指標,才能為數據的可視化設計提供依據,從而通過合理的布局和設計,將用戶的注意力集中到可視化結果中最重要的區域,提高用戶獲取重要信息的效率。

0x04 確定圖表

數據之間的相互關系,決定了可采用的圖表類型。常見的數據關系和圖表類型的對應關系如下圖所示:

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(一):<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>過程

通常情況下,同一種數據關系,對應的圖表類型是有多種方式可供選擇,是不是隨機選擇一種方式就可以了呢?

當然不是,圖表的目的是為了更好的去呈現數據中的現象和規律,那么必然,可視化圖表的效果也極大的受到實際數據的影響,這個后續再分享。

0x05 可視化設計

在做好了以上的需求收集和整理之后,接下來就要開始進入可視化的設計和呈現的階段。這一步主要包括兩個方面:一是進行可視化布局的設計,二是數據圖形化的呈現。

1. 頁面布局

可視化設計的頁面布局,要遵循以下三個原則:

(1)聚焦

設計者應該通過適當的排版布局,將用戶的注意力集中到可視化結果中最重要的區域,從而將重要的數據信息凸顯出來,抓住用戶的注意力,提升用戶信息解讀的效率。

(2)平衡

要合理的利用可視化的設計空間,在確保重要信息位于可視化空間視覺中心的情況下,保證整個頁面的不同元素在空間位置上處于平衡,提升設計美感。

(3)簡潔

在可視化整體布局中,要突出重點,避免過于復雜或影響數據呈現效果的冗余元素。

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>之旅(一):<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數據可視化</a>過程

2. 圖表制作

影響圖表呈現效果的,主要有兩個影響因素,一個是數據層面的,一個是非數據層面的。

(1)數據層面

若數據中存在極端值或過多分類項等,會極大影響可視化的效果呈現,如柱形圖中柱形條的高度、氣泡圖中氣泡的大小、餅圖中的分類項太多等。

對于數據本身造成的可視化效果不佳的情況,我們是不是就束手無策了呢?當然不是,在以往的可視化過程中,本人雖然也踩了很多坑,但是對于如何解決這類問題也積累了一些經驗,下次專題分享。

(2)非數據層面

非數據層面,但是影響圖表呈現效果的因素,通常在設計過程中就可以解決。

比如圖表的背景顏色、網格線的深淺有無、外邊框等等,這類元素是輔助用戶理解圖表的次要元素,但如果不加處理全部放出,視覺上就不夠聚焦,干擾到你真正想展示的數據信息。

因此,對于此類非數據層面,但是影響圖表視覺呈現的元素,應該盡量隱藏和弱化。

0xFF 總結

最后一句個人經驗:作為數據可視化的設計者,你應該在可視化設計之前,全面了解此次數據的分布情況、量級,通常幾行sql就可以搞定,這樣在進行可視化設計的時候,可以少踩很多坑。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢