熱線電話:13121318867

登錄
首頁精彩閱讀【數據挖掘工程師——王真達】從文科生到數據挖掘工程師 |?CDA八點大咖匯
【數據挖掘工程師——王真達】從文科生到數據挖掘工程師 |?CDA八點大咖匯
2021-12-20
收藏

目前數據分析和機器學習的應用如火如荼,許多人都希望能夠參與到這股熱潮里。但是令人苦惱的是,學習資料有限,常常無從下手。

特別是一些文科生,會很糾結自己是不是能夠轉型到數據分析行業,之所以這么糾結。是因為數據分析是一門綜合學科,會涉及到編程語言、概率統計、時間序列分析、機器學習算法等等,這是一條不算輕松的道路。

今天我們邀請到了數據挖掘工程師王真達老師為大家分享:《文科生是如何轉型數據挖掘工程師》

一、“文科生” 轉行數據挖掘歷程

二、“技能需求” 數據挖掘工程師(業務)

三、“項目實操流程” 企業產品營銷模型

3. 1.天翼看家產品辦理預測模型

3.2 模型背景與目標

模型背景

目前省內辦理天翼看家用戶規模已經達到50余萬戶,占全省公眾寬帶用戶市場規模達到7%以上,目前日增1200余戶,且多數辦理用戶為農村 市場需求,如何精準預測潛在辦理用戶,最大程度提高天翼看家產品辦理率是目前天翼看家推廣的重要任務。

模型目標

針對2020年2月份天翼看家模型2.0進行模型提升優化,構建適合目前產品現狀的模型規則,最大程度的預測到農村市場潛在用戶,同時擴大套 餐類別,爭取覆蓋多個套餐類別潛在用戶。

3.3 天翼看家已辦理用戶分布情況

目前全量已辦理用戶主要分布在暢享自主版,其余套餐雖然數量不及,但是占單類比例還有很大挖掘空間。

3.4 樣本選擇

樣本數據來源:

正樣本數據:提取2021.2-4月月辦理天翼看家產品的,且剔除寬帶、手機、天翼看家均為新辦理的用戶(新辦理用戶沒有往期消費信息), 剩余用戶作為正樣本;

負樣本數據:提取2021.2-4月對天翼看家產品進行過派單、接觸的用戶記錄,且剔除截止2021.5.12前辦理天翼看家的用戶,剩余用戶作為 負樣本;

因果關系取數

? 解釋變量(X)取t-1期

? 預測變量(y)取t期

? 訓練數據與測試數據

3.5 模型特征

基于前期項目調研,結合天翼看家2.0模型項目經驗,共梳理出5大維度,共43個特征,重要特征如下(后面將對每個維度進行特征分析):

3.6 建模過程

使用隨機森林作為基分類器,使用Adaboost等進行對比,最終在收斂速度模型準確性上選擇RF模型。

3.7 模型評估

3.8 模型應用-營銷活動轉化率

5.01~5.17日數據,根據實際辦理天翼看家情況,增至13個套餐(暢享自主版、其他C+寬帶、暢享融合、大流量套餐+ 寬帶等),模型輸出規模共計664萬,其中高概率規模120萬,有效支持營銷推廣。共計轉化用戶11270戶。

3.9 模型關鍵特征

3.10 特征分析-地域特點(1/4)

城鄉屬性:

超過70%的加裝用戶集中在農村,農村用戶產品加裝概率為9.82%,顯著高于城市用戶的2.58%。說明天翼看家產品較匹配農村市場,隨著城鎮化 的發展,農村有大量的留守老人和兒童,這較大程度地催生了農村市場的需求。

3.10 特征分析-地域特點(2/4)

網格單元天翼看家占比:

從趨勢圖可以看出,隨著網格內天翼看家產品占比提高,用戶加裝天翼看家產品的概率有較為明顯的提升趨勢。網格單元內占比超過50%的用戶中, 平均加裝概率超過30%,說明用戶的消費具有從眾心理,可針對對應區域增加推廣力度。

掃描二維碼

觀看直播


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢