
淘寶網,是全球最受歡迎的網購零售平臺之一,擁有近5億的注冊用戶數,每天有超過6千萬的固定訪客,同時每天的在線商品數已經超過了8億件,平均每分鐘售出4.8萬件商品。
作為電商行業的標桿,淘寶網的用戶行為數據,一定程度上反映了用戶的購買行為規律。本項目利用MySQL對淘寶用戶行為數據進行分析,探索不同用戶的消費習慣,結合店鋪營銷策略,以實現精準化運營,減少運營成本,增加店鋪營收。
探索目標:每日不同時段流量走勢,質量如何?用戶行為轉化情況怎樣?如何提高留存、增加復購?如
何判斷高價值用戶,針對不同用戶如何進行個性化營銷?
分析思路:
1.數據獲取
數據集來源于淘寶APP移動端,2014年11月18日至2014年12月18日的用戶行為數據。
2.數據理解
表中有7個字段:用戶ID、商品ID、商品類目ID、用戶行為類型、用戶所在地理位置、用戶行為時間、金額,一共有12256905條數據。限于電腦性能,僅提取前1048575條記錄用作分析。
3.數據清洗
3.1建表導數:
create database taobao;
use taobao;
create table UserBehavior(
user_id int,
item_id int,
item_category int,
behavior_type varchar(10),
user_geohash varchar(10),
times datetime,
amount decimal(5,2)
);
load data infile "C:/ProgramData/MySQL/MySQL Server
8.0/Uploads/UserBehavior.csv"
into table UserBehavior
fields terminated by ','
ignore 1 lines;
3.2缺失值處理:
查詢結果中發現user_geohash字段存在缺失值,缺失比例超過50%。缺失嚴重的數據在后續分析中意義不大,可做刪除處理。
3.3異常值檢查
檢查發現該數據集中不存在異常值。
3.4重復記錄處理
該數據集有86478條重復記錄,篩選不重復的記錄共962097行。
3.5字段處理:
根據times字段增加計算字段用戶行為日期、周和小時,排除后續分析不需要的user_geohash字段,并將篩選后的結果保存到新表。
清洗后的數據集共962097條記錄,展示了2014-11-18至2014-12-18這一個月內,8477位用戶對7095個類目下701609個商品產生的902050次點擊,29016次加購,20930次收藏,10101次購買行為。
1.流量指標分析
查詢結果中發現瀏覽量PV、訪客量UV和人均瀏覽量的總體變化趨勢是相同的。11月18-29日,PV在25000-28000之間,UV在5800-6200之間,人均瀏覽量在4.1-4.6之間,成交量在260-320之間,銷售額在20000-28000之間;11月30日-12月10日,PV在27000-31000之間,UV在6000-6400之間,人均瀏覽量在4.4-4.9之間,成交量在280-370之間,銷售額在22000-30000之間;12月11日、12日因雙12的緣故,PV分別達到了35851、51034,UV分別為6576、7049,人均瀏覽量分別為5.5、7.2,成交量分別為409、569,銷售額分別為32022.71、46100.93;而在雙12之后,PV也穩定在28000-30000之間,UV在6000-6200之間,人均瀏覽量在4.6-4.8之間,成交量在280-340之間,銷售額在22000-28000之間,遠遠優于11月29日之前的數據,說明雙12的營銷活動對用戶行為有顯著影響。
同時,在11月21、28日,12月5日,瀏覽量PV、訪客量UV、人均瀏覽量、成交量和銷售額都出現了不同程度的下滑。細查發現以上三天都是周五,觀察流量的周期性變化中發現,每周二到周四數據比較穩定,周五到周一會出現小幅度下滑,這跟大部分用戶的工作和生活習慣息息相關。
從每天的時間段來看,21點和22點是用戶活躍的高峰時間,人均瀏覽量在10次以上,22點之后一路下降,一直到凌晨4點降到最低值,4點到10點漸漸回溫,10點到18點基本穩定,18點之后開始一路攀升,商家可以集中資源,在用戶活躍度較高的時間段采取一些引流手段。
2.行為轉化分析
瀏覽人數:點擊產品詳情頁的用戶數
收藏人數:收藏產品產品詳情頁的用戶數
加購人數:將產品添加到購物車的用戶數
購買人數:下單的用戶數
在所有用戶行為數據中瀏覽產品詳情頁后產生購買行為的用戶只有4330人,占瀏覽用戶的51%,也就是說,還有49%的用戶行為是沒有轉化為成交的,用戶在瀏覽商品詳情頁后出現了大量的流失。那么從瀏覽到購買,每個環節的轉化率是多少?用戶主要是在哪個環節流失的呢?
對比發現,從瀏覽到收藏的轉化率僅為38.73%,而瀏覽到加購的轉化率為61.41%。因為收藏和加購行為之間并沒有直接的先后關系,且加入收藏后并沒有可以下單的入口,如果需要購買必須重新點擊商品進入詳情頁才能下單,所以用戶更愿意將感興趣或有購買意向的商品添加到購物車。
在瀏覽-加購-購買的購物行為路徑中,加購轉化率為61.41%,購買轉化率為83.21%,也就是說大部分的用戶更偏向于將商品添加到購物車后下單,可能是為了湊單參加滿減優惠。
分析每天瀏覽-加購-購買的轉化率情況發現,瀏覽-加購的轉化率變化并不明顯,雙十二之前穩定在10%-13%之間,僅在雙十二當天達到17.26%,且在雙十二之后轉化率明顯下降。而加購-購買的轉化率波動較大,在感恩節、服飾煥新和雙十二活動前后分別達到了45.48%、44.21%、42.81%,而雙十二之后的數據表現也明顯優于雙十二之前,說明部分商品在雙十二之后依然有返場活動,促進用戶消費。
3.消費偏好分析
根據二八法則即20%的產品貢獻了80%的銷售額甚至更多,將產品的貢獻定量分析,哪些類目的商品貢獻了多少的消費額。
在2066個商品類目中,銷售額排名前623個類目貢獻了646009.09的銷售額,可集中人力和財力優化這些類目的商品及渠道。
4.用戶價值分析
通過對用戶價值的細分,進行差異化的精細運營,從而提升運營效率和用戶體驗。RFM模型是衡量客戶價值和客戶創利能力的重要工具,通過客戶的消費時間間隔(Recency)、消費頻率(Frequency)以及消費金額(Monetary)三項指標來描述客戶的價值狀況。
-- 查詢每個用戶消費時間間隔、消費頻次、消費金額
+-----------+--------------+----------+----------+----------+
| user_id | 最近消費時間 | 間隔天數 | 購買次數 | 消費金額 |
+-----------+--------------+----------+----------+----------+
| 101260672 | 2014-11-20 | 29 | 1 | 72.55 |
| 116730636 | 2014-12-18 | 1 | 4 | 372.04 |
| 104811265 | 2014-12-09 | 10 | 1 | 120.71 |
| 106230218 | 2014-12-16 | 3 | 3 | 132.73 |
| 100684618 | 2014-12-12 | 7 | 3 | 203.67 |
| 103802946 | 2014-12-18 | 1 | 2 | 139.38 |
| 103891828 | 2014-12-15 | 4 | 6 | 496.24 |
| 116678892 | 2014-11-23 | 26 | 1 | 129.20 |
| 106557109 | 2014-11-22 | 27 | 1 | 38.06 |
| 104221274 | 2014-11-30 | 19 | 2 | 138.21 |
+-----------+--------------+----------+----------+----------+
-- RFM評分
+-----------+-------+-------+-------+
| user_id | R評分 | F評分 | M評分 |
+-----------+-------+-------+-------+
| 101260672 | 1 | 1 | 1 |
| 116730636 | 5 | 4 | 4 |
| 104811265 | 4 | 1 | 2 |
| 106230218 | 5 | 3 | 2 |
| 100684618 | 4 | 3 | 3 |
| 103802946 | 5 | 2 | 2 |
| 103891828 | 5 | 5 | 5 |
| 116678892 | 1 | 1 | 2 |
| 106557109 | 1 | 1 | 1 |
| 104221274 | 2 | 2 | 2 |
+-----------+-------+-------+-------+
-- RFM均值
+------------+------------+------------+
| avg(R評分) | avg(F評分) | avg(M評分) |
+------------+------------+------------+
| 3.5984 | 2.1039 | 2.2051 |
+------------+------------+------------+
-- RFM用戶價值
+-----------+-------+-------+-------+-------+-------+------+------------+
| user_id | R評分 | F評分 | M評分 | R程度 | F程度 | M程度 | 用戶價值 |
+-----------+-------+-------+-------+-------+-------+------+------------+
| 101260672 | 1 | 1 | 1 | 低 | 低 | 低 | 一般挽留用戶 |
| 116730636 | 5 | 4 | 4 | 高 | 高 | 高 | 重要價值用戶 |
| 104811265 | 4 | 1 | 2 | 高 | 低 | 低 | 一般發展用戶 |
| 106230218 | 5 | 3 | 2 | 高 | 高 | 低 | 一般價值用戶 |
| 100684618 | 4 | 3 | 3 | 高 | 高 | 高 | 重要價值用戶 |
| 103802946 | 5 | 2 | 2 | 高 | 低 | 低 | 一般發展用戶 |
| 103891828 | 5 | 5 | 5 | 高 | 高 | 高 | 重要價值用戶 |
| 116678892 | 1 | 1 | 2 | 低 | 低 | 低 | 一般挽留用戶 |
| 106557109 | 1 | 1 | 1 | 低 | 低 | 低 | 一般挽留用戶 |
| 104221274 | 2 | 2 | 2 | 低 | 低 | 低 | 一般挽留用戶 |
+-----------+-------+-------+-------+-------+-------+------+------------+
對用戶進行價值分層后,針對不同價值類型的用戶實行不同的營銷策略。
一般挽留用戶占比34.36%,占比最高,其交易時間間隔長,交易頻率低,消費金額低,存在流失風險,可以及時與用戶取得聯系,明確流失原因或了解用戶需求,想辦法挽回用戶。
一般發展用戶占比31.29%,占比排名第二,其交易時間間隔短,但消費頻率和消費金額都很低,可以利用推薦系統推薦其平時瀏覽的同類商品,或與此類客戶有相同購買屬性人群購買的商品,發送滿減優惠券等,避免用戶流失。
重要價值客戶占比23.86%,其交易時間間隔短,消費頻率高,消費金額高,應加強交流與互動,深入了解用戶需求,提供個性化服務,增加用戶粘性??梢詫υ擃愑脩籼峁¬IP服務機制,提升用戶體驗與忠誠度。
根據流量數據指標分析,每天的18-22時是用戶活躍高峰期,可集中資源在該時間段進行引流與營銷活動,如推送爆款及暢銷商品,同時發送商家折扣優惠、直播帶貨及促銷活動消息,提高商品購買率。
從用戶行為轉化漏斗分析,瀏覽到加購的轉化率遠遠高于瀏覽到收藏的轉化率,且加購到購買的轉化率高達83.21%。交易流程越多,用戶流失的可能性就越大,瞬間購買欲望的涌現,往往時效性較短,每多一步流程,就多一份流失率。所以刪除不必要的跳轉界面,讓交易的完成時間更短,不要給用戶過多的猶豫時間。例如優惠券的選擇,還需要繁瑣的領取步驟,滿足優惠條件默認領取相應最大的優惠,并在最后付款界面突出優惠券帶來的滿減信息,促使用戶的成交花費時間更短。關于購物車,可以增加一個清理機制,比如加入購物車以后多少天不成交就清除,每隔一段時間就提醒用戶購物車內還有什么商品未下單,什么時間商品將被清除。收藏和購物車的功能有一定的同質性,關于這一點,淘寶沒有做明顯的區分,導致購物車只是簡便版的收藏。反觀同電商領域的拼多多,沒有設置購物車功能,并且成交環節縮短至4步。
根據用戶消費偏好分析,將流量更多地聚焦于暢銷的商品,通過明星效應/網紅推薦,結合主題活動和節日,打造爆款的產品,并利用爆款產品帶動整體商品的銷售。
根據RFM用戶價值分類結果,一般挽留用戶存在流失風險,可適當給予折扣或捆綁銷售政策,通過一些補貼優惠,培養用戶的購買習慣。一般發展用戶存在價值潛力,要想辦法主動聯系客戶,如短信、郵件、push提醒等方法,進行好物推薦等,提高用戶的復購率。重要價值客戶其交易時間間隔短,消費頻率高,消費金額高,應加強交流與互動,比如優化個人信息界面,加入成長值系統,到達一定等級,享受一些特權或優惠,可參考騰訊游戲的心悅會員制度。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25在當今數字化時代,數據分析師的重要性與日俱增。但許多人在踏上這條職業道路時,往往充滿疑惑: 如何成為一名數據分析師?成為 ...
2025-04-24