熱線電話:13121318867

登錄
首頁精彩閱讀網站數據分析實戰—用戶偏好分析_數據分析師
網站數據分析實戰—用戶偏好分析_數據分析師
2014-12-19
收藏

網站數據分析實戰—用戶偏好分析_數據分析師


熟悉網站分析的朋友們都知道,GA(Google Analytics)中可以關聯不同的維度(Dimension),比如“城市”和“產品”,通過關聯(Sub-relation),我們可以得到不同城市下,各產品的相關數據。在Omniture的幾個網站分析工具中,也同樣能夠對某個eVar根據按另一個eVar來breakdown。

好了,廢話不多說,接下來就讓我們一起去發現一些有趣的事情!

Step 1. 獲取數據

1.a 請生成一張報表,

維度(Dimension):城市(Cities)

指標(Metric):購買數量/銷量(Units)

時間段可根據需要設定,時間粒度(Granularity)在Omniture中選None/aggregate,表示把時間以聚合的方式展現,而不是按daily、monthly等方式來劃分,GA中同理。

好了,我們得到了一張關于各個城市的訪客所產生的訂單數的報告,第三列Ratio是經過計算得到的各城市訂單數占總體的比例。這里假定了只有圖表中所列出的10個城市,所有數據均為模擬數據。

1.b 類似上一張城市報告,我們再獲得一份產品類(Product Category)的報告,維度:Category, 指標:Units,獲得的報告如下

* 這里需要注意,你所看到的兩張表中的Units總量是一樣的,但如果你選擇了Orders作為Metric的話,那么品類報告中的Orders應該會大一些,因為有些用戶的單個訂單橫跨了不同的產品類。比如實際情況是你下了一個訂單,包含了一臺VAIO和一臺DSC,那么在產品類報告中這1個訂單會被分拆為2個,各自歸屬到2個品類中。如果Orders總量相差不大,那不用太在意這個差異,如果你覺得差異讓你無法接受的話,那也不難,對城市報告中的數據做個簡單處理:處理后各城市訂單數 = 處理前各城市訂單數 * (產品類報告訂單總數 / 處理前城市訂單總數)。但是這樣的處理會稍許影響到后續介紹的計算過程,當然,只要你保持頭腦清醒,相信在理解了算法后根據需要來修改也不是難事。

1.c 獲得一份Sub-relation的報告,第一個維度選擇城市,第二個維度選產品類,指標仍然是Units,報表如下:

City Breakdown by Category
限于篇幅,圖中只顯示了Shanghai的數據,實際應該是所有其它城市都會得到跟Shanghai類似結構的數據。由于本例中共有10個城市和10個產品類,因此得到的數據應該是10*10=100行。同樣,這里的Units總量應該與之前的相同。

從表中我們可以知道,在Shanghai所產生的962個Units中,VAIO占了378個,DSC占了112個,這個很容易理解。

Step 2. 數據處理

Difference
如上圖所示,我們在1.c報表的基礎上,新增一列Predicted Units,作為我們預測的商品銷量,怎么計算呢?Predicted Units = 1.a中Shanghai的 Units * 1.b中VAIO的Ratio(或者1.a中Shanghai 的 Ratio * 1.b中VAIO的Units也是一樣的)

然后我們再新增一列Difference,表示實際值與預測值的差異程度,計算方式為:

Difference = (Units – Predicted Units) / Predicted Units

Step 3. 數據解讀

不難理解,如果實際值大于預測值,Difference為正,反之為負,實際值與預測值差異越大,Difference的絕對值越大。

既然需要的數據都有了,該怎么看我們用戶的偏好呢?如何去發現那些有價值的信息呢?

Difference 一列中,最抓人眼球(eye-catching)的顯然是Shanghai-DSC那行了,372%。這表示,Shanghai的用戶比我們想象中的更熱衷于DSC產品,而且是遠遠大于預期。同樣,VAIO、Tablet等產品在Shanghai用戶中的銷售情況也比我們的預期要好。而HIFI的-80%,MDR的-59%,說明了Shanghai的用戶對這些產品并不是非常感興趣。當然,如果在做這個分析前,你已經對你的某些產品做了定向投放,那么會一定程度上影響該報告的解讀,這時候,我的建議是:

1. case by case的來分析那些定向投放了的產品,需要綜合考慮你的投放情況及業務情況

2. 剔除那部分定向投放了的產品及密切相關的產品,從而解讀那些未受太大影響的產品數據。

到這里,如果在讀這篇文章的你正從事Online Marketing等相關的工作,不知道有沒有能夠觸動到你的神經呢?SEM、adwords等廣告投放平臺中的地理位置定位,能通過這個分析得到改進嗎?花錢買的廣告,真的投放給那些感興趣的用戶了嗎?……

本文所謂的預測,并沒有基于什么很高級的算法,只是先假定了我們的所有用戶的偏好是一致的,基于這個假設,兩個維度關聯后的情況應當與兩個維度獨立時所推斷的情況一致。還是舉個簡單的例子來說明吧。假定雙胞胎姐妹總共吃了4個水果,又知道水果中香蕉被吃了2個,蘋果也被吃了2個。如果姐妹倆的偏好一致,我們可以認為姐妹應該各自吃了1個香蕉1個蘋果。然而真實的情況是姐姐吃了2兩個香蕉,妹妹吃了2兩個蘋果,也就是說,姐姐比我們所認為的多吃了1個香蕉而少吃了1個蘋果,那么她的偏好應該是愛吃香蕉而不愛吃蘋果。

當然,這樣的預測方法由于少考慮了很多因素而并變得不是很精準,但筆者認為,這不會是什么很大的問題。雖然我們的計算過程是定量的,但我們的目的只是定性而已,380%的Difference在這個方法中跟370%沒有什么太大的區別。而且,以損失一些精度為代價,獲得更高的效率并非什么不可原諒的事,畢竟我們是在商場里作戰,而不是在學校碼論文。

最后想說的是,本文所舉例子是不同城市用戶關于不同產品類的購買偏好分析,實際上,朋友們完全可以根據自己的業務需求來驅動類似的分析,比如關聯用戶的操作系統(Operating System)和瀏覽器(Browser),指標選擇訪問數(Visits),便能了解到你網站的用戶在不同操作平臺上更喜歡用哪種瀏覽器。

理論上來說,任意兩個維度都可以關聯起來,且能說明些問題,但不建議強行地去關聯兩個維度,然后絞盡腦汁地去賦予它某種意義,不要為了分析而分析。還是那句話,以業務需求來確定分析目標,再以分析結果來驅動業務發展。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢