
作者 | CDA數據分析師
前言
用戶畫像又稱用戶角色,作為一種勾畫目標用戶、聯系用戶訴求與設計方向的有效工具,用戶畫像在各領域得到了廣泛的應用。用戶畫像最初是在電商領域得到應用的,在大數據時代背景下,用戶信息充斥在網絡中,將用戶的每個具體信息抽象成標簽,利用這些標簽將用戶形象具體化,從而為用戶提供有針對性的服務。
用戶畫像是一種目標用戶的人物原型,它不僅可以快速了解用戶的基本信息并快速歸類,并且可以進一步精準地分析用戶行為習慣和態度偏好。用戶畫像雖然是用戶的虛擬代表,但必須基于的是真實用戶和真實數據。
嘗試去做一個用戶畫像,往往是基于以下情景:
從用戶畫像的使用情境也可以看出,用戶畫像適用于各個產品周期:從潛在用戶挖掘到新用戶引流,再到老用戶的培養與流失用戶的回流,用戶畫像都有用武之地。
采用定性的方法(如,深度訪談、焦點小組)或定量的方法(如,定量問卷、行為日志數據)都能夠完成用戶畫像的構建,不同的方法各有優缺點:
但是,不論是選擇定性還是定量的方法,都首先需要對用戶類型有一個基本“量”的了解,否則在選用樣本時就會產生偏差。那么如何通過定量的方法(聚類)構建用戶畫像呢?
選擇那些指標?
用戶指標的選擇,可以是封閉性的,也可以是開放性的。在封閉的指標中,用戶群的類型是固定的,所有用戶類型構成了全部的用戶整體,比如輕度用戶、重度用戶;男性用戶,女性用戶。但是這種劃分方式維度可能過于單一,無法體現用戶群的復雜性,并且不利于指標體系的補充改進和迭代,因此在研究中我們更傾向于采用開放性的分類方式,可以根據不同應用場景變更或者拓展指標。
開放式的指標體系包括用戶人口屬性、行為操作屬性、態度偏好屬性、用戶價值屬性等,用戶的行為和態度是不斷變化的。
其中,注意一點,封閉式指標中的人口屬性指標是相對穩定的靜態數據。通常,從我們的經驗和掌握到的用戶信息,我們對用戶的年齡結構、性別比例都已經明確,如果在聚類中人口屬性指標對聚類干擾較大(共線性較強),或在模型中作為因子影響過高,可以在聚類時重點關注用戶的行為操作和態度偏好等指標,聚類成功之后再比較每一種用戶類型的人口學背景信息等。
如何獲得和篩選數據?
在確定指標后,我們需要確定指標的來源。有些數據是后臺行為日志可以記錄到的,有些是需要用問卷調查的。一般而言,行為層面的指標可以用后臺日志,更加準確。而態度層面的則要用問卷來獲取。兩種數據渠道各有優缺點:
理論上,所有的數據都可以通過問卷獲得。但是,為了最優化研究效果,我們采取了問卷+行為日志結合的方式。在發問卷的同時,抓取了用戶的設備號和ID,以匹配后臺數據。
在保證問卷效度的前提下,問卷設計還需要注意結合用戶特征,以提高填答率以及數據準確率。比如,針對二次元用戶,在用戶群年齡結構偏小的前提下問卷不能太長,不能出現深奧的專業術語;同時問卷的語句表達以及頁面風格也要相應調整,使其沒有距離感。同時,注意篩除多次填答和注冊的馬甲賬號問卷。此外還要注意新用戶的占比,需要評估填答問卷中新注冊用戶的比例是否與投放期新用戶正常增量一致。用戶畫像是否需要包含新用戶取決于項目目的,也可以和產品方討論后決定。
把用戶分成幾種類型?
聚類分析是探索性的研究,他根據指標或者變量之間的距離判斷親疏關系,將相似性的聚為一類,因此會出現多個可能的解,并不會給出一個最優的解,最終選擇哪一種方案是取決于研究者的分析判斷。
把用戶分的類型越少,顆粒度就越粗,每種類型之間的特征就不會很分明;用戶類型越多,顆粒度也就越細,但復雜的類型劃分也會給產品定位和運營推廣帶來負擔。因此,細化顆粒度不僅需要定量的聚類來調整,還需要結合產品經驗來驗證。同時,因為采用的是開放性的指標體系,我們不可能像區分“男性用戶、女性用戶”那樣清楚地知道用戶類型的數量,因此,在用數據進行用戶畫像時,最關鍵的一步就是確定把用戶分成幾種類型。
我們將數據導入spss嘗試進行聚類分析。如果變量數據形式不統一(選擇的指標有定序、有定類),則需要首先對數據進行標準化;其次,兩個強相關的變量和其他變量一起進行聚類會加大因子的權重,使聚類效果不理想,所以我們還要使用因子分析對選擇的指標提取公共因子,對因子共線性判斷,因子分析是選擇合適變量進行聚類的前提,如果因子之間共線性強,則提取公因子進行聚類,若共線性不強,則直接聚類。
如何選擇合適的聚類方法?
在確定因子之后需要選擇合適的聚類方法。不同方法適用的情況不同,常用的是K均值聚類以及層次聚類。
K均值聚類也稱快速聚類,內存少,復雜程度低,快速高效,適用大數據量。但是需要提前明確分類數目,并對均值進行定義。只能對樣本聚類,不能對變量聚類,樣本的變量需是連續性變量。
層次聚類可以對變量聚類,也可以對樣本聚類,可以是連續變量也可以是分類變量。能提供多種計算距離的方法,但是計算復雜度高,適用小數據量,我們需要結合項目的具體情況,包括項目周期、數據形式、數據量、聚類特征等等來確定聚類方法。
最后通過嘗試不同的聚類數、距離算法和分類方法,我們可以根據以下幾點來確定分類的數量:
聚類效果好壞的評估可以從聚類中心之間的距離、組件與組內的方差以及群組數量之間的比例是否符合產品特征、比例是否協調以及劃分的類型對產品是否有意義等方面去評估。
5、把數據還原成用戶
在已經得知了分類結果并且分析得出了每一類用戶在各項指標上的特征之后,構建用戶畫像的工作也就好比在一副骨架上填充血肉。一方面,我們可以直接利用獲取的數據,找到具有顯著特征的信息,賦予到用戶身上。比如第一類用戶60%使用iOS系統,而其他三類均不超過20%,我們就可以將第一類用戶抽象為一個平時使用iPhone 的人。除了問卷數據之外,想要使人物形象更加鮮明,可以對問卷本文題進行分析,或者根據產品經驗、用戶反饋或已有研究進行畫像,這樣可以使用戶形象更加有血有肉。
但是,把數據還原成用戶本身用戶也需要遵循幾個原則,畫像(Persona)意味著一個令人信服的用戶角色要滿足七個條件:
通過定量化的調研可以快速對用戶建立一個精準的認識,對不同數量、不同特征的用戶進行比較統計分析,在后期產品迭代改進的過程中可以將用戶進行優先級排序,著重關注核心的、規模大的用戶。但是,依靠數據這種偏定量的方式建立的用戶畫像依然是粗線條的,難以描述典型用戶的生活情景、使用場景,難以挖掘用戶情感傾向和行為操作背后的原因和深層次動機。因此,如果有足夠精力和時間,后續可以對每類用戶進行深入的訪談,將定量和定性的方法結合起來,建立的用戶畫像會更為精準和生動。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25在當今數字化時代,數據分析師的重要性與日俱增。但許多人在踏上這條職業道路時,往往充滿疑惑: 如何成為一名數據分析師?成為 ...
2025-04-24