
數據科學關注查找噪聲中隱藏的信號。這一點說起來容易做起來難,但無需依靠眾多數據專家即可實現。本文介紹的定量分析技術是非常實用的入門方法(鏈接中提供額外信息),適用于想親自使用基礎統計技術的人員。從本質上來講,其流程可以總結為以下四步:
1.觀察:移動用戶數據趨勢可能會帶來一些不可預料的見解,幫助更好地理解用戶使用應用程序的方式、時間、地點和原因。這些見解具有潛在價值,可以據此制定后續決策,優化用戶體驗。
2.形成假設框架:無法獲取全部信息時,需要進行歸納推理。對于移動應用程序來說,這一點顯然正確,因為目標用戶不可能聚在一起等著你去采訪。
3.數據采集:對假設進行判斷需要面對的挑戰是確定對相關任務有幫助的可用證據。在我看來,這得先做好才考慮機器學習算法的細節。
4.評估假設:生成模型的出發點是希望進一步解釋數據。接下來,根據模型對目前所觀察到數據的解釋情況,對模型可信度進行評估。
制定高質量并且切實可行的決策
數據科學可以描述為業務假設實際運行情況之間的競爭。與 Countly 合作將獲取完整的移動用戶行為數據集以及數據可視化所需的整套工具。定量分析需要使用完整的移動用戶行為數據集,而非抽樣技術分析所采集的數據,后者可能會在分析中引入不確定性的偏差。只需單擊幾次,就能夠以可視化方式查看關于用戶的各種詳細信息。例如,可以使用 Countly 在多種語言環境下快速可視化應用程序用戶的原始數據和百分比數據(請參見下方屏幕截圖)。此方法比 Excel 更加形象生動,無需額外導出原始數據進行日常數據分析,為團隊節省時間。
此外,Countly 可以靈活整合其他來源的移動數據和人口統計數據,例如銀行可能需要從后端整合數據(年齡、估計收入、婚姻狀況、最近大宗交易記錄和近期地址變更),以便 Countly 更好地了解用戶在應用程序內的行為并通過特定推送通知促進微目標定位。這樣數據分析就能夠更具有針對性,更加適應業務需要。
為了幫助您在令人興奮的數據驅動領域中不斷發展,您需要擴展成功的定義:對您來說,“成功”意味著什么?這個問題其實并不像看起來那樣簡單。您優先考慮什么問題?如果您重點關注應用程序內購買,那么您的目標是收入和用戶生命周期價值 (LTV)。對于其他大部分不以貨幣化為中心的應用程序來說,主要關注點可能在于留存用戶。
那么,現在我們開始觀察數據。利用 Countly 您能夠訪問 100% 應用程序用戶數據,還可以詳細查看高參與度用戶(假設您運營一款健身應用程序,并選擇留存率作為成功標準)以及這些用戶注冊時執行的操作。觀察高參與度用戶行為模式,然后進行定量訪問確定應用程序最令人興奮的特點。隨后,您的團隊可以獲取下載應用的初 10 天內完成對提高留存率有幫助操作的主要假設:
1.完成 3 項推薦鍛煉
2.在社區發布 5 件信息
3.關注5 份健康飲食
我們為每項操作定義隊列,然后在采樣數據上使用二分類測試比較注冊 2 個月后每組用戶留存表現。之后我們可以觀察每項測試的正負預測值(定義如下),確定我們正在尋找的關鍵閾值。
測試 1:用戶在初 10 天內是否完成 ≥ 3項推薦鍛煉?
測試 2:用戶在初 10 天內在社區發布 ≥ 5 件信息?
測試 3:用戶在初 10 天內關注 ≥ 5 份健康飲食?
顯然完成 3 項推薦鍛煉勝出。因此,這項操作有較高的 2 個月留存正預測值;相反地,完成少于 3 項鍛煉有較高的負預測值。這項測試可以很好地預測 2 個月留存情況:達到標準,有 99% 機率留存應用程序;未達到標準,有 95% 機率會丟失用戶。
發布 5 件信息和關注 5 份健康飲食與留存情況有很大關聯(因此有較高的正預測值),但未達到關鍵條件標準。未執行這些操作的用戶仍有很高機率在 2 個月后仍留存應用程序。
到目前為止,完成推薦鍛煉似乎成為關鍵性閾值。另一項評估要點在于讓用戶完成行動的價值。換言之,讓用戶完成 3 項推薦鍛煉進而提高 2 個月后留存應用程序所需付出的代價。分析數字時,完成 3 項推薦鍛煉可使 2 個月后留存機率提高大約 20 倍,而發布 5 次更新和關注 5 份健康飲食甚至無法讓留存率翻倍(分別提高 1.3 倍和 1.1 倍)。你可以通過回歸分析得出這一結論,但所需時間過長。如要了解更多信息,我建議閱讀該URL。數據分析結果表明,值得投入時間和精力鼓勵用戶完成 3 項推薦鍛煉。發布 5 件信息和關注 5 份健康飲食與留存情況有很大關聯(因此有較高的正預測值),但未達到關鍵條件標準。未執行這些操作的用戶仍有很高機率在 2 個月后仍留存應用程序。
如果對機器學習和更復雜的模型感興趣,我建議針對非結構化數據使用 K 均值聚類(K-Means Clustering),使用 R 語言實現。該技術提供另一種識別與 3 個月后留存率等業務目標相關特定聚類的方法。觀察結果按指定標準分為 K 組并重新分組,形成關聯最為緊密的聚類(請參見以下示例)。
與分層聚類相比,K 均值聚類可以處理更大規模的數據集。此外,觀察結果不會永遠固定在一個聚類中。分析時,觀察結果會移動,從而改善整體結果。要了解更多關于 K 均值聚類的信息,我建議閱讀《R 語言實戰》作者 Rob Kabacoff 發表的文章。
保持簡潔
誤差最小的通用模型最有可能準確預測未來觀察結果——奧卡姆剃刀原理。確定關鍵性閾值時的兩個重要注意事項:保持穩定簡潔。如果涉及過多不同行動,將難以衡量并且可能會隨時間發生變化。同時也會分散團隊的注意力 — 這引出我們的下一步驟。
采取行動
既然已經確定關鍵指標,即必須加以克服以便提高用戶滿意度和參與度的閾值,那么就應該采取相應行動。Sokrati,印度領先的網絡廣告績效管理公司,已成功在開節日期間展開2-3天的Facebook 活動為珠寶品牌贏了超過300%的銷售增長。他們的策略包括三個步驟:
關鍵在于利用節日期間有針對性地鼓勵更多用戶盡快行動。深入挖掘不同的受眾群以擴大受眾群體,你會看到參與和保留度上升。我希望這些概念與結構可以幫你。歡迎你聯系Countly繼續討論與分享自己的故事!
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25