熱線電話:13121318867

登錄
首頁精彩閱讀利用Python繪制誘人的特定流程圖:?;鶊D
利用Python繪制誘人的特定流程圖:?;鶊D
2020-05-12
收藏

大家好,我是小z~


最近,不止一次收到群里小伙伴的截圖追問:


利用Python繪制誘人的<a href='/map/sangjitu/' style='color:#000;font-size:inherit;'>?;鶊D</a>


“這個圖叫什么???”


“這個圖真好看?。?!怎么畫???”


小z本沒有干貨,問的人多了,也便有了干貨。


此圖姓桑名基,平素不喜露面。奈何天生麗質,偶有露面,必引眾人圍觀。


利用Python繪制誘人的<a href='/map/sangjitu/' style='color:#000;font-size:inherit;'>?;鶊D</a>


時人有云:“?;;?,高貴美麗!”


1

?;呛卧S圖也


據小z不嚴謹的抽樣提問統計,90%想學習?;鶊D的旁友,都是被她妖艷炫酷的外表所吸引。


?;鶊D真正代表了什么?和類似圖表相比的獨特性是什么?卻幾乎無人問津。


害!人真的是視覺動物!


利用Python繪制誘人的<a href='/map/sangjitu/' style='color:#000;font-size:inherit;'>?;鶊D</a>


言歸正傳,我們來看看百科的官方解釋:


?;鶊D(Sankey diagram),即?;芰糠至鲌D,也叫?;芰科胶鈭D。它是一種特定類型的流程圖,圖中延伸的分支的寬度對應數據流量的大小,通常應用于能源、材料成分、金融等數據的可視化分析。因1898年Matthew Henry Phineas Riall Sankey繪制的"蒸汽機的能源效率圖"而聞名,此后便以其名字命名為"?;鶊D"。


Emmm,有點內個意思了,結合其他資料,做進一步的匯總提煉:


  • ?;鶅蓚€字取自“發明”者的名字
  • 屬于流程圖的一種,核心在于展示數據的流轉
  • 主要由節點、邊和流量三要素構成,邊越寬代表流量越大
  • 遵循守恒定律,無論怎么流動,開端和末端數據總是一致的


文字太蒼白,下面我們用Python來繪制一個具體的實例~


2

Python手把手繪制?;鶊D


動手之前,我們再次敲黑板,回顧?;鶊D組成要素的重點——節點、邊和流量。


任何?;鶊D,無論展現形式如何夸張,色彩如何艷麗,動效如何炫酷,本質都逃不出上述3點。


只要我們定義好上述3個要素,Python的pyecharts庫能夠輕松實現?;鶊D的繪制。


這里我們用“當代青年熬夜原因分析”數據為例:


數據來源:這個數據是小z近兩周賣炒粉時口頭做的調研


利用Python繪制誘人的<a href='/map/sangjitu/' style='color:#000;font-size:inherit;'>?;鶊D</a>


很規整的性別、熬夜原因、人數三列數據。


不過,要用pyecharts來畫圖,得入鄉隨俗,按照它定的規則來規整數據源。


首先是節點,這一步需要把所有涉及到的節點去重規整在一起。也就是要把性別一列的“男”、“女”和熬夜原因一列的“打游戲”、“加班”、“看劇”以列表內嵌套字典的形式去重匯總:


利用Python繪制誘人的<a href='/map/sangjitu/' style='color:#000;font-size:inherit;'>?;鶊D</a>


接著,定義邊和流量,數據從哪里流向哪里,流量(值)是多少,循環+字典依然可以輕松搞定:


利用Python繪制誘人的<a href='/map/sangjitu/' style='color:#000;font-size:inherit;'>?;鶊D</a>


source-target-value的字典格式,很清晰的描述了數據的流轉情況。


這兩塊數據準備完畢,?;鶊D已經完成了80%,剩下的20%,只是固定格式的繪圖代碼:


from pyecharts.charts import Sankeyfrom pyecharts import options as optspic = (    Sankey()    .add('', #圖例名稱         nodes,    #傳入節點數據         linkes,   #傳入邊和流量數據         #設置透明度、彎曲度、顏色         linestyle_opt=opts.LineStyleOpts(opacity = 0.3, curve = 0.5, color = "source"),         #標簽顯示位置         label_opts=opts.LabelOpts(position="right"),         #節點之前的距離         node_gap = 30,    )    .set_global_opts(title_opts=opts.TitleOpts(title = '熬夜原因?;鶊D')))pic.render('test.html')


一個回車下去,看看成果:


利用Python繪制誘人的<a href='/map/sangjitu/' style='color:#000;font-size:inherit;'>?;鶊D</a>


果然,男打游戲女看劇,加班熬夜是兒戲。


如果想要垂直顯示,只需要在add函數里面加一個orient="vertical"就好:


pic = (    Sankey()    .add('',         nodes,         linkes,         linestyle_opt=opts.LineStyleOpts(opacity = 0.3, curve = 0.5, color = "source"),         label_opts=opts.LabelOpts(position="top"),         node_gap = 30,         orient="vertical",      #更改的是這里    )    .set_global_opts(title_opts=opts.TitleOpts(title = '熬夜原因細分?;鶊D')))pic.render('test2.html')


利用Python繪制誘人的<a href='/map/sangjitu/' style='color:#000;font-size:inherit;'>?;鶊D</a>


OK!不過,還有同學意猶未盡,這個是涉及到兩層的流轉,那如果三層,需要怎么畫呢?


不慌,先導入(狗糧)數據:


利用Python繪制誘人的<a href='/map/sangjitu/' style='color:#000;font-size:inherit;'>?;鶊D</a>


這是某寵物品牌,3月份主要產品購買路徑(第一次和第二次)的數據,先是品類,其次是第一次購買的產品類型,接著是第二次購買的產品類型,最后一列對應人數。


注:這里第一次購買的產品前面加了“1-”,第二次購買加了“2-”的區分標識。


畫圖必備的nodes節點實現很簡單,所有節點(品類、第一次購買、第二次購買)做去重匯總,對上面生成nodes代碼稍作調整就可以:


利用Python繪制誘人的<a href='/map/sangjitu/' style='color:#000;font-size:inherit;'>?;鶊D</a>


而linkes只接受source-traget-value的格式,得先對源數據進行格式調整,分別形成“品類-第一次購買-人數”,“第一次購買-第二次購買-人數”的樣式,再統一匯總:


利用Python繪制誘人的<a href='/map/sangjitu/' style='color:#000;font-size:inherit;'>?;鶊D</a>


規整匯總好之后,只需要復用上面的linkes代碼:


利用Python繪制誘人的<a href='/map/sangjitu/' style='color:#000;font-size:inherit;'>?;鶊D</a>


畫圖代碼幾乎沒變,只是改了個標題:


pic = (    Sankey()    .add('',         nodes,         linkes,         linestyle_opt=opts.LineStyleOpts(opacity = 0.3, curve = 0.5, color = 'source'),         label_opts=opts.LabelOpts(position = 'top'),         node_gap = 30,    )    .set_global_opts(title_opts=opts.TitleOpts(title = '客戶購買路徑流轉圖')))pic.render('test3.html')


大功告成,So easy!無論是多少層數據的流轉,只要定義好nodes和linkes,就能以不變應萬變。


利用Python繪制誘人的<a href='/map/sangjitu/' style='color:#000;font-size:inherit;'>?;鶊D</a>


最后,通過上面的?;鶊D,我們能夠非常直觀的洞察到客戶購買流轉規律:


  • 出于試錯成本的考量,大部分客戶第一次購買的是小規格狗糧。
  • 第一次購買小規格狗糧的客戶,流失(第二次未購買)情況嚴重,且再次購買客戶,更傾向于繼續選擇小規格狗糧嘗試,而不是信任性的購買大規格狗糧。
  • 第一次購買大規格狗糧的客戶,留存下來的客戶已經建立起對品牌的信任感,再次購買大部分選擇了大規格狗糧。
  • 購買狗糧的客戶第二次復購鮮有嘗試玩具的,而第一次購買玩具的客戶,也并未建立起對品牌狗糧的興趣。


原本死板的數據,在?;难b扮之下,變得楚楚動人。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢