熱線電話:13121318867

登錄
首頁大數據時代南方人過冬有多難?用Python帶你分析全網取暖器銷量數據
南方人過冬有多難?用Python帶你分析全網取暖器銷量數據
2020-12-08
收藏

 CDA數據分析師 出品  

作者:Mika

數據:真達  

如果說冬天對北方人來說只是一個季節,而對南方人來說是一場“渡劫”。北方的冷是干冷,物理攻擊,多穿一點就好了。而且室內有暖氣,在室內可以穿著短袖吃冰棍。

而南方的冷是濕冷,魔法攻擊,穿再多沒有用。而且室內還沒暖氣,各種段子也是層出不窮:

“你在北方的暖氣里四季如春,我在南方的寒冬下凍成冰棍兒”

“北方人過冬靠的是暖氣,南方人過冬靠的是一身正氣”

“我是一只來自北方的狼,來到南方卻被凍成了狗”


一到冬天南方人除了靠一身浩然正氣,空調、電熱毯、油汀、電暖氣等各類花式取暖電器都得安排上。


內貿批發平臺1688上獲取的數據顯示,進入11月以來,暖氣片在南方城市的銷量比去年同期增長了300%,平臺上取暖小家電品類整體營業額同比增幅達到200%,其中發熱墊的同比增速甚至高達600%。


據顯示,暖氣片和暖氣設備銷量貢獻最大的國內客戶,主要都是來自長江沿線城市,以江浙滬、安徽、湖南、湖北、重慶、四川等地居多,一時間“南方取暖設備被買爆”話題登上了微博熱搜,讓人不禁感嘆南方人過個冬天實在是太難了。

那么取暖器的全網銷售數據是怎樣的呢?今天我們就帶你用看一看。

用Python分析全網取暖器數據

我們使用Python獲取了淘寶網搜索關鍵詞暖氣片、取暖器、壁掛爐的商品數據,并進行了數據分析。


1.讀取數據

首先導入獲取的數據。

# 導入工具包 import numpy as np  import pandas as pd  from pyecharts.charts import Bar, Pie, Map, Page from pyecharts import options as opts import jieba 
# 讀取數據 df_all = pd.read_csv('../data/導出數據.csv')
df_all.head() 

df_all.shape (13212, 7)


2.數據清洗和整理

此處我們需要對數據集進行數據清洗以便后續分析和可視化,主要工作內容如下:

  • 刪除記錄的重復值
  • goods_price列處理:提取數值
  • purchase_num列處理:提取數值
  • 計算銷售額sales_volume = goods_price*purchase_num
  • 刪除多余的列

代碼實現如下:

df = df_all.copy() # 去除重復值 df.drop_duplicates(inplace=True)
df.shape
(6849, 7)
# 篩選記錄 df = df[df['purchase_num'].str.contains('人付款')] # goods_price列處理 df['goods_price'] = df['goods_price'].str.extract('(d+.{0,1}d*)')  
df['goods_price'] = df['goods_price'].astype('float') # purchase_num列處理 df['num'] = df['purchase_num'].str.extract('(d+.{0,1}d*)')
df['num'] = df['num'].astype('float') 
df['unit'] = [10000 if '萬' in i else 1 for i in df['purchase_num']] # 計算銷量 df['purchase_num'] = df['num'] * df['unit'] # 計算銷售額 df['sales_volume'] = df['goods_price'] * df['purchase_num'] # 提取省份字段  df['province_name'] = df['location'].astype('str').str.split(' ').apply(lambda x:x[0])  # 刪除多余的列 df.drop(['num''unit''detail_url'], axis=1, inplace=True) # 重置索引 df = df.reset_index(drop=True)
df.head() 



3.數據可視化

此處我們對店鋪銷量、產地分布、商品價格等方面進行可視化分析:

市場上的取暖器種類較多,有暖風機、小太陽、電熱膜、油汀、快熱爐、踢腳線等取暖設備,我們首先看到這些取暖器的標題詞云。

商品標題詞云圖

可以看到"取暖器" "暖風機" "暖氣片"都是出現的高頻詞。在特征方面"家用" "節能" "速熱"都十分常見。

接著,看到店鋪月銷量排名Top10。

店鋪月銷量排名Top10


可以看到店鋪銷量前十,凱瑞萊旗艦店位居第一。其后春尚電器專營店和蘇寧易購分別是第二第三名。排在前十的還有美的、tcl等品牌。

# 計算top10店鋪 shop_top10 = df.groupby('shop_name')['purchase_num'].sum().sort_values(ascending=False).head(10)

全國各省份產地銷量排名Top10

這些取暖器的產地都在哪兒呢?經過分析發現,浙江是生產取暖器的頭號大省,在產地銷量排名中一騎絕塵位居第一。之后排在第二位的是廣東。湖南、江蘇、山東分別位居第三第四第五名。

# 計算銷量top10 province_top10 = df.groupby('province_name')['purchase_num'].sum().sort_values(ascending=False).head(10)

不同價格區間的商品數量占比

取暖器都賣多少錢呢?經過分析發現,100元以下的商品是最多占比高達34.76%。其次是200-500元的商品,占比22.09%。

不同價格區間的銷量占比

與此同時,在銷量方面,價格在100元以下和100-200元之間的取暖產品也是銷量最好的,全網銷售量分別占比37.49%和35.92%。


結語

有了各式各樣的取暖器,南方冬天就好過了嗎?并不,空調開久了干,踢腳線耗電高,油汀等電暖氣更適合局部取暖,大空間制熱效果差。

雖然近年來也有很多南方家庭選擇全房裝地暖的,然而電暖用起來一個月電費就高達2、3千,這可能就是北方一個冬天的暖氣費用了。這么對比起來,似乎還是開空調和取暖器實在啊。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢