
數據挖掘之用戶價值分析
這里要介紹的是基于每個用戶行為的綜合性的分析和評定,主要包括用戶的忠誠度和用戶的價值?!耙杂脩魹橹行摹钡睦碚撘缶W站不斷優化改善用戶的體驗,進而提升用戶的滿意度,當用戶的預期不斷被滿足時,用戶就會喜歡上這個網站,進而發展成為網站的忠誠用戶,同時不斷地為網站輸出價值。忠誠用戶不但自身為網站創造價值,而且可以為網站帶來許多隱性的收益,比如品牌和口碑的推廣,帶動其他用戶的進入和成長。所以網站的忠誠用戶是網站生存和持續發展的基石,我們需要掌握每個用戶的忠誠度,同時也需要了解每個用戶的價值體現。
這次的數據分析需求來自網站的營銷部門,營銷部門的同事需要跟進一些網站的已付費用戶和潛在的付費用戶,以便更好地推廣網站的產品,為客戶提供更好的服務,引導新用戶的消費和老客戶的持續性消費。營銷部門因為資源有限,面對不斷擴大的客戶群體開始犯愁,他們沒有精力對每位用戶進行跟進和服務,于是他們請求數據分析師的幫助,幫他們尋找定位目標客戶,以便提升工作效率。銷售部門發來了數據分析的需求郵件。 看來這個問題確實困擾著營銷部的同事,如果他們所做的營銷工作大部分用戶沒有任何響應,這是一件讓人非常沮喪的事情。他們的目的就是縮小目標群體,定位那么有意愿有潛力的價值客戶,以便減少日常的無效工作,提升效率。他們需要的就是用戶忠誠度的分析、用戶價值的評定和用戶價值的持續發展情況。我們用數據分析的方法來一一解決這些問題。
基于用戶行為的忠誠度分析
用戶忠誠度(Loyalty)是用戶出于對企業或品牌的偏好而經常性重復購買的程度。對于網站來說,用戶忠誠度則是用戶出于對網站的功能或服務的偏好而經常訪問該網站的行為。根據客戶忠誠理論,傳統銷售行業的忠誠度可由以下4個指標來度量:
l 重復購買意向(Repurchase Intention):購買以前購買過的類型產品的意愿;
l 交叉購買意向(Cross-buying Intention):購買以前為購買的產品類型或擴展服務的意愿;
l 客戶推薦意向(Customer Reference Intention):向其他潛在客戶推薦,傳遞品牌口碑的意愿;
l 價格忍耐力(Price Tolerance):客戶愿意支付的最高價格。
以上4個指標對于電子商務網站而言,可能還有適用性,但對于大多數網站是不合適的,所以為了讓分析具有普遍的適用性,同時為了滿足所有的指標都可以量化(上面的客戶推薦意向比較難以量化),以便進行定量分析的要求,我們選擇所有網站都具備的基于訪問的用戶行為指標:用戶訪問頻率、最近訪問間隔時間、平均停留時長和平均瀏覽頁面數,這些也是Google Analytics原版本中用戶忠誠度模塊下的4個指標。
這4個指標在上文已經多次提到了,定義不再重復介紹。統計數據的時間區間也是根據網站的特征來定的,如果網站的信息更新較快,用戶訪問較為頻繁,那么可以適當選取較短的時間段,這樣數據變化上的靈敏度會高些;反之,則選擇稍長的時間段,這樣用戶的數據更為豐富,指標的分析結果也會更加準確有效。在統計得到這4個指標的數值之后,單憑指標數值還是無法得到用戶忠誠度的高低,需要對指標進行標準化處理得到相應的評分,通過評分就可以分辨用戶的忠誠度在總體中處于什么樣的程度。
這里使用min-max歸一化的方法,將4個指標分別進行歸一化后縮放到10分制(0~10分)的評分區間。這里需要注意的是,min-max歸一化會受到異常值的影響,比如用戶瀏覽頁面數有一個50的異常大的數值,那么歸一化后大部分的值都在集中在較小的分值區域,所以建議在歸一化之前排查一下各指標是否存在異常值,如果存在,可以對異常值進行轉換或過濾;同時這里的最近訪問間隔時間同樣適用“天”為單位,注意歸一化的時候需要進行特殊處理,因為間隔天數越大,相應的評分應該越小,不同于其他3個指標,其他3個指標使用公式(x-min) / (max-min),最近訪問間隔天數要使用(max-x) / (max-min)的方式進行處理。我們使用近一個月的用戶訪問數據,選擇其中3個用戶列舉一下用戶行為數據的處理情況,見表6-2。
表 6-1 用戶忠誠度指標評
表6-2中,用戶忠誠度的4個分析指標經過標準化處理后統一以十分制的形式輸出,這樣就能直接區分每個用戶的每項指標的表現好壞?;诿總€指標的評分,可以對用戶進行篩選,比如營銷部門重點跟進經常訪問網站的用戶,可以選擇訪問頻率評分大于3分的用戶,或者重點跟進用戶訪問參與度較高的用戶,可以篩選平均停留時間和平均訪問頁面數都大于3分的用戶,這樣能夠幫助營銷部門迅速定位忠誠用戶。
這里我們用4個用戶行為指標來評價用戶的忠誠度,這類基于多指標從多角度進行評價最常見的展現方式就是雷達圖,或者叫蛛網圖,在電腦游戲里面比較常見,比如一些足球游戲使用雷達圖來表現球員的各方面的能力指數,如防守、進攻、技術、力量、精神等,所以這里也可以借用雷達圖用4個指標來展現用戶的忠誠度表現情況,如圖6-18所示。
圖 6-1 用戶忠誠度雷達圖
圖6-18使用了表6-2中三位用戶的評分數據繪制而成,能夠非常形象地表現用戶忠誠度在各指標上的表現情況,用戶1的整體忠誠度較低,用戶2在訪問頻率和訪問間隔具有較好表現,而用戶3的訪問具有相對較高的參與度。使用雷達圖分析用戶的忠誠度主要有如下優勢:
u 可以完整地顯示所有評價指標;
u 顯示用戶在各指標評分中的偏向性,在哪些方面表現較好;
u 可以簡單觀察用戶整體的忠誠情況,即圖形圍成的面積大?。僭O4個指標的權重相等,若重要程度存在明顯差異,則不能用面積來衡量);
u 可以用于用戶間忠誠度的比較。
所以,基于雷達圖展現用戶的忠誠度之后,營銷部門可以直接查看哪些用戶具有較好的忠誠度,哪些用戶值得他們重點跟進。
基于用戶行為的綜合評分
上面介紹的用戶忠誠度分析使用用戶的4個行為指標來進行評估,但我們只能看到各指標的表現,無法評定用戶忠誠度的總體水平,所以需要對所有的相關指標做匯總處理,獲取一個綜合評分,就像足球游戲中球員的綜合能力值(Overall)。上面忠誠度的相關指標經過標準化已經統一了度量區間,最簡單的方法就是取所有相關指標評分的均值來計算得到忠誠度綜合評分,這樣的處理將所有指標以同等的重要性進行對待,但現實情況下不同指標對綜合評分的影響是不一樣的,有些指標比較關鍵,有些則相對次要,所以這里引入AHP的方法來設定不同指標的權重。
AHP(層次分析法)是美國運籌學家T. L. Saaty教授于20世紀70年代初期提出的,AHP是對定性問題進行定量分析的一種簡便、靈活、實用的多準則決策方法。它的特點是把復雜問題中的各種因素通過劃分為相互聯系的有序層次,使之條理化,根據對一定客觀現實的主觀判斷將每個層次元素兩兩比較的重要性進行定量描述。而后,利用數學方法計算反映每一層次元素的相對重要性次序的權值,通過所有層次之間的總排序計算所有元素的相對權重并進行排序。層次分析法適用于多目標決策,用于存在多個影響指標的情況下,評價各方案的優劣程度。當一個決策受到多個要素的影響,且各要素間存在層次關系,或者有明顯的類別劃分,同時各指標對最終評價的影響程度無法直接通過足夠的數據進行量化計算的時候,就可以選擇使用層次分析法。
了解了AHP之后,我們以上面的忠誠度評分為例,先簡單介紹AHP的應用。首先根據忠誠度的影響指標構建層次模型,這里只需要兩層,上層是忠誠度,下層是影響忠誠度的4個指標,如圖6-19所示。
圖 6-2 忠誠度評分層次模型
我們需要計算底層的4個指標對忠誠度的影響權重,需要構建對比矩陣,即運用9標度對需要賦權的同層各影響要素間進行兩兩比較,例如模型中的要素i相對于要素j對上層的重要程度,1表示i與j同等重要,3表示i比j略重要,5表示i比j重要,7表示i比j重要很多,9表示i比j極其重要,可以用Wi/Wj表示該重要程度,兩兩比較后可以得到以下矩陣:
兩兩比較的結果可以得到矩陣對角線上方的各個比值,而這個矩陣對角線兩邊的對稱元素是相互的倒數,并且對角線的所有元素的值都為1,所以得到對角線一側的數值就可以得到整個矩陣。因為矩陣的數值是兩兩比較的結果,所以可能存在A元素比B元素重要,B元素比C元素重要,但C元素卻比A元素重要的情況,也就是矩陣的不一致性,所以首先需要驗證該對比矩陣的一致性??梢酝ㄟ^計算矩陣的最大特征值的方法來衡量矩陣的一致性,相關的指標有一致性指標CI,隨機一致性指標RI,一致性比率CR=CI/RI,一般當CR<0.1時,我們認為該對比矩陣的一致性是可以被接受的。如果矩陣的一致性滿足要求,則可以根據矩陣的最大特征值進一步計算得到對應的特征向量,并通過對特征向量進行標準化(使特征向量中各分量的和為1)將其轉化為權向量,也就是我們要求的結果,權向量中的各分量反映了各要素對其相應的上層要素的影響權重。
因為層次分析法AHP的計算過程設計一些高等數學相關方面的知識,需要詳細了解可以參考一些統計學、運籌學和決策學方面的書籍和資料,也可以在網上直接搜索AHP的分析軟件,一些工具支持在輸入指標兩兩比較的結果后就可以直接輸出一致性檢驗結果及各層次指標的權重系數。
表 6-2 用戶忠誠度加權評分
表6-3中,通過加權的方式計算得到用戶忠誠度評分之后,就可以直接比較忠誠度評分來評價哪個用戶的忠誠度綜合值較高、哪個較低,營銷部門的同事就有了對用戶更直接的取舍依據。
上面只是對用戶的忠誠度做了評定,無法體現用戶創造的價值,而營銷部門的第二個需求點就是對用戶的綜合價值的評定,比如電子商務網站的用戶可能具備一定的忠誠度,但如果只看不買,仍然無法為網站帶來足夠的價值,所以需要進一步評定用戶的價值輸出,電子商務類網站尤其可以關注這一點。為了體現用戶的價值輸出,我們在選擇指標的時候需要考慮與用戶購買消費相關的指標,這里羅列了5個指標供參考:
1. 最近購買間隔:可以取用戶最近一次購買距當前的天數,反映用戶是否繼續保持在網站的消費;
2. 購買頻率:用戶在一段時間內購買的次數,重點反映用戶的消費黏度;
3. 購買商品種類:用戶在一段時間內購買的商品種類或商品大類,反映用戶需求的廣度,可以分析用戶價值輸出的多樣性和擴展空間;
4. 平均每次消費額:用戶在一段時間內的消費總額÷消費的次數,即客單價,反映用戶的平均消費能力;
5. 單次最高消費額:用戶在一段時間內購買的單次最高支付金額,反映用戶的支付承受能力,同時也能體現用戶對網站的信任度。
上面的5個指標從不同的角度反映了用戶的價值輸出能力,并且是可量化統計得到的,同樣有時間區間的限制,需要注意選擇合適的時間段長度。為了能夠統一衡量價值,同樣需要對上面的5個指標進行標準化,使用10分制的方式輸出進行評定,還是使用雷達圖,如圖6-20所示。
圖 6-3 用戶價值雷達圖
圖6-20用雷達圖展現了3個用戶各指標的數據表現來反映用戶的價值特征,根據每個指標的屬性可以將用戶的價值進一步分為兩塊,其中最近購買間隔、購買頻率和購買商品種類用來表現用戶的購買忠誠度,而平均每次消費額和單次最高消費額用于反映用戶的消費能力,圖6-20中框起來的兩塊區域,雷達圖的上半部分用于表現用戶的購買忠誠度,下半部分用于表現用戶的消費能力,從圖中3個用戶的數據進行分析,用戶3的整體價值較低,用戶1和2的價值較高,而且用戶1的價值集中體現在較高的消費能力,用戶2的價值更多地體現在較高的購買忠誠度。
雷達圖很好地展現了用戶價值在不同指標中的體現,再結合層次分析法,就可以對用戶的價值進行綜合評分,基礎的數據源于上面5個指標的評分結果,使用AHP不僅可以得到最終的用戶價值評分,同時還可以得到上面的購買忠誠度和消費能力這兩方面的評分。
圖 6-4 用戶價值評分層次模型
圖6-21是使用AHP的方法構建的用戶價值評分層次模型,底層是5個基礎指標,中間層是用戶價值的兩個方面,分別對應各自的指標,最上層就是用戶的綜合價值。這里需要使用3次AHP來計算:
購買忠誠度和消費能力對用戶價值的影響權重;
最近購買間隔、購買頻率和購買產品種類對購買忠誠度的影響權重;
平均每次消費額和單次最高消費額對消費能力的影響權重。
經過3次兩兩比較計算后就可以得到圖上的每一層指標對上次的影響權重,正如連接線上標注的數值,轉化為公式的結果如下:
用戶價值 = 購買忠誠度×0.67 + 消費能力×0.33
忠誠度 = 最近購買時間×0.12 + 購買頻率×0.64 + 購買產品種類×0.24
消費能力 = 平均每次消費額×0.67 + 單詞最高消費額×0.33
經過推導,我們可以用底層5個指標的評分直接計算得到用戶的綜合價值評分:
用戶綜合價值評分=(最近購買間隔評分×0.12+購買頻率評分×0.64+購買產品種類評分×0.24)×0.67+(平均每次消費額評分×0.67+單次最高消費額評分×0.33)×0.33
用戶綜合價值評分=最近購買間隔評分×0.08+購買頻率評分×0.43+購買產品種類評分×0.16+平均每次消費額評分×0.22+單次最高消費額評分×0.11
有了上面的計算公式,圖6-21中所有層次的評分都可以計算得到了,我們根據雷達圖中舉例的3個用戶的數據來計算一下他們的綜合得分情況,見表 6-4。
表 6-3 用戶價值加權評分
表中不僅計算得到了綜合價值評分,同時得到了購買忠誠度和消費能力這兩個中間層的得分,這樣我們不僅能夠通過直接比較用戶的綜合價值評分獲取網站的重要用戶,同時忠誠度和消費能力的評分也為針對用戶的細分提供了一個有力的量化數值參考依據,如圖6-22所示。
圖 6-5 用戶價值評價細分圖
圖中展示了100位用戶的價值評分數據,根據購買忠誠度和消費能力的評分情況分成了4塊,從中可以看出電子商務網站用戶特征的分布情況:
從C區域可以看出用戶較多地分布在忠誠度和消費能力評分為3附近的區域,也是網站最普遍的客戶群;
B區域的用戶是網站的最有價值客戶(VIP),但是數量相當稀少,可能不到10%;
在A區域有一個點密集區間(忠誠度1~2、消費能力8~9),可以認為是網站的高級消費用戶群,他們消費不多,但消費額很高,如果你的網站提供高價值消費品、批量購買等服務的話,那么他們就可能是那方面的客戶群;
D區域的用戶雖然消費能力也不強,但他們是網站的忠實粉絲,不要忽視這些用戶,他們往往是網站線下營銷和品牌口碑傳播的有利擁護者。
通過類似上面的分析過程,可以發現電子商務網站用戶的某些特征,為網站的運營方向和營銷策略提供一定的決策支持。如果你要制訂針對用戶的營銷策略,你會先從A、B、C、D這4類用戶群體中的哪類先下手?
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25在當今數字化時代,數據分析師的重要性與日俱增。但許多人在踏上這條職業道路時,往往充滿疑惑: 如何成為一名數據分析師?成為 ...
2025-04-24