熱線電話:13121318867

登錄
首頁職業發展數據分析面試被問了N遍的10個高頻問題
數據分析面試被問了N遍的10個高頻問題
2024-08-09
收藏

很多小伙伴都計劃年后換工作,為了幫助各位學習數據分析的小伙伴們成功拿到offer!本期給大家整理了一些數據分析面試時的高頻問題,希望大家積極點贊收藏加關注,一起沖鴨~

1、APP近期上線了一個拉新活動,并在各個渠道進行了推廣投放,如何評估活動效果?

【參考答案】

如果要對一個活動效果進行分析,無非是要回答以下3個問題:

(1)活動效果怎么樣?要不要繼續做?

(2)如果可以繼續做,活動的做的好的方面是哪些?問題或者瓶頸環節在哪?

(3)針對問題環節的改進方案是什么?

具體展開來講,可以從以下幾個方面:

(1)活動關鍵指標達成分析

活動關鍵核心指標達成情況,比如拉新多少用戶,達成多少GMV?ROI如何?

(2)活動關鍵流程漏斗分析

活動的關鍵流程是什么?以及各個流程的漏斗分析,定位問題發生的環節。

(3)活動的渠道、用戶分析

活動在哪些渠道推送?活動推送給哪些用戶?用戶畫像是啥樣的?各渠道用戶的質量/ROI如何?

(4)活動策略、節奏分析

活動玩法的裂變效果如何?利益點是否有吸引力?活動整個過程節奏把控如何,前期預熱、中期爆發和尾期是否過短/過長,運營應該在何時進行適當干預。


2、業務場景題,如何分析次日留存率下降的問題

【參考答案】

業務問題關鍵是問對問題,然后才是拆解問題去解決。

(1)兩層模型

用戶畫像、渠道、產品、行為環節等角度細分,明確到底是哪里的次日留存率下降了

(2)指標拆解

次日留存率 = Σ 次日留存數 / 今日獲客人數

(3)原因分析

內部:運營活動、產品變動、技術故障、設計漏洞(如產生可以擼羊毛的設計)

外部:競品、用戶偏好、節假日、社會事件(如產生輿論)


3、談談RFM用戶模型

【參考答案】

RFM模型客戶關系管理(CRM)中一種被廣泛使用的營銷模型,它是衡量客戶價值和客戶創利能力的重要工具和手段。

RFM模型主要通過3個指標來描述一個客戶的價值:

? 最近一次消費時間(Recency),縮寫為R

? 消費頻次(Frequency),縮寫為F

? 消費金額(Monetary),縮寫為M

在具體的應用中,一般是通過R、F、M這3項值將買家進行分層,賣家可以對不同層級的用戶采取不同的營銷方式~

利用RFM模型劃分用戶層級,可以進行客戶細分、尋找目標客戶:

?重要價值客戶,RFM都很大,優質客戶,需要保持

?重要發展客戶,低活高購高價值,交易金額和交易次數大,但最近無交易。需要發展

?重要保持客戶,高活低購高價值,交易金額大貢獻度高,且最近有交易。需要重點識別

?重要挽留客戶,低活低購高價值:交易金額大,潛在的有價值客戶,需要挽留、促活。

這一模型的【優點】:

?能夠快速對某段時間內的付費用戶做用戶分類,響應快速的業務需求;

?能直觀了解用戶消費的質量,短時間監控大客戶的流失情況,及時做出挽回應對措施;

?能及時發現新的大客戶,比如頻次低但額度大的用戶。


4、什么是假設檢驗?

【參考答案】

參數估計和假設檢驗統計推斷的兩個組成部分,它們都是利用樣本對總體進行某種推斷,但推斷的角度不同。

(1)參數估計討論的是用樣本估計總體參數的方法,總體參數μ在估計前是未知的。

(2)而在假設檢驗中,則是先對μ的值提出一個假設,然后利用樣本信息去檢驗這個假設是否成立。



5、 置信度、置信區間

【參考答案】

置信區間是我們所計算出的變量存在的范圍,水平就是我們對于這個數值存在于我們計算出的這個范圍的可信程度。

(1)舉例來講,有95%的把握,真正的數值在我們所計算的范圍里。在這里,95%是置信水平,而計算出的范圍,就是置信區間。

(2)如果置信度為95%, 則抽取100個樣本來估計總體的均值,由100個樣本所構造的100個區間中,約有95個區間包含總體均值。


6、 撲克牌54張,平均分成2份,求這2份都有2張A的概率

【參考答案】

這個問題可以通過計算概率來解決:

有2張A的概率可以通過組合來計算,即從4張A中選取2張A的組合數除以從54張牌中選取2張的組合數:P(2張A) = C(4, 2) / C(54, 2) 其中,C(n, m)表示從n個元素中選取m個元素的組合數。

 我們需要將剩下的52張牌平均分成2份,每份26張。其中,有2張A的概率可以表示為:P(2張A) = P(1份有2張A,另1份沒有A) + P(1份沒有A,另1份有2張A) 假設第一份有2張A,第二份沒有A,那么從剩下的50張牌中選出24張牌來組成第一份,剩下的26張牌自然組成第二份。這種情況的概率為:P(1份有2張A,另1份沒有A) = C(4, 2) * C(50, 24) / C(54, 26)

(3)同樣的道理,當第一份沒有A,第二份有2張A時,這種情況的概率也是:P(1份沒有A,另1份有2張A) = C(4, 0) * C(50, 26) / C(54, 26)

(4)最后,將兩種情況的概率相加即可得到答案:P(兩份都有2張A) = P(1份有2張A,另1份沒有A) + P(1份沒有A,另1份有2張A)代入計算,即可得到最終的概率。 


7、做過AB test嗎,談談原理?

【參考答案】

ABtest的本質其實是兩個總體的假設檢驗問題。這個測試很多教育機構作業幫、學而思等經常用,用來測試哪些課程組合比較受歡迎等。當我們現在有兩種方案,方案A和方案B,我們想要知道哪種方案更好,那我們就要做ABtest,也就是要做假設檢驗。

?假設檢驗的步驟如下: 

(1) 根據檢驗目的,構造原假設和備擇假設

(2) 構造檢驗統計量

(3)給出顯著性水平,根據樣本數據,計算檢驗統計量的值.

(4)得出檢驗的結果,拒絕原假設還是沒有充分的理由拒絕原假設

?AB test具體場景問題:

AB test效果不顯著,你該怎么判斷這個實驗的收益?

AB test中實驗組核心指標明顯優于對照組,那么這個優化就一定能夠上線嘛?

AB test時效果顯著,但是全量上線時,效果平平,問題在哪里?

AB test效果不顯著時,那么是否可以判斷這個實驗失敗了,沒有意義?

一般的AB test場景問題都可以從以下幾個理由中得到解釋:辛普森悖論、新奇效應、以偏蓋全、以全蓋偏、正交互斥實驗。


8、APP激活量的來源渠道很多,怎樣對來源渠道變化大的進行預警?

【參考答案】

(1)如果渠道使用時間較長,認為渠道的app激活量滿足一個分布,比較可能是正態分布。求平均值和標準差,對 于今日數值與均值差大于3/2/1個標準差的渠道進行預警。

(2)對于短期的新渠道,直接與均值進行對比。

9、用戶剛進來APP的時候會選擇屬性,怎樣在保證有完整用戶信息的同時讓用戶流失減少?

【參考答案】

可以采用技術接受模型(TAM)來分析,影響用戶接受選擇屬性這件事的主要因素有: 

(1)感知的有用性(perceived usefulness),反映一個人認為使用一個具體的系統對他工作業績提高的程度; 感知有用性:文案告知用戶選擇屬性能給用戶帶來的好處 

(2)感知的易用性(perceived ease of use),反映一個人認為容易使用一個具體的系統的程度。

感知易用性: a. 關聯用戶第三方賬號 (如微博),可以冷啟動階段匹配用戶更有可能選擇的屬性,推薦用戶選擇。b. 交互性做好。 

(3)使用者態度:用戶對填寫信息的態度 a. 這里需要允許用戶跳過,后續再提醒用戶填寫 b. 告知用戶填寫的信息會受到很好的保護 

(4)行為意圖:用戶使用APP的目的性,難以控制 

(5)外部變量:如操作時間、操作環境等,這里難以控制 


10、賣玉米如何提高收益?價格提高多少才能獲取最大收益?

【參考答案】

根據公式收益 = 單價*銷售量,那么我們的策略是提高單位溢價或者提高銷量。 

(1) 提高單位溢價的方法: 

品牌打造獲得長期溢價,但缺陷是需要大量前期營銷投入; 

加工商品占據價值鏈更多環節,如熟玉米、玉米汁、玉米蛋白粉; 

(2)重定位商品,如禮品化等; 

價格歧視,根據價格敏感度對不同用戶采用不同定價。 

銷售量=流量x轉化率,上述提高單位溢價的方法可能對流量產生影響,也可能對轉化率產生影響。

收益 = 單價x流量x轉化率,短期內能規?;捎玫膽撌沁M行價格歧視,如不同時間、不同商圈的玉米價格不同,采取高定價,然后對價格敏感的用戶提供優惠券等。

推薦學習書籍
《CDA一級教材》適合CDA一級考生備考,也適合業務及數據分析崗位的從業者提升自我。完整電子版已上線CDA網校,累計已有10萬+在讀~

免費加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢