熱線電話:13121318867

登錄
首頁精彩閱讀數據挖掘案例:建立客戶流失模型
數據挖掘案例:建立客戶流失模型
2016-08-04
收藏

數據挖掘案例:建立客戶流失模型

隨著市場競爭的加劇,中國電信面臨的壓力越來越大,客戶流失也日益增大。從統計數據看,今年固話小靈通的銷戶數已經超過了開戶數。面對如此嚴峻的市場形式,當務之急就是要盡全力減少客戶的流失。因此,利用數據挖掘方法,建立一套可以及時預測客戶流失率的模型就相當有必要。

    (一)確定客戶流失模型的目標:預測可能流失的客戶名單。經過對市場的分析,我們發現固話小靈通流失率比較大,而寬帶等數據業務還處于增長期,流失率比較小。因此,我們把預測的產品范圍限定在固話和小靈通上。另外,我們也不考慮那些因為欠費被強制銷戶的客戶,因為這些客戶沒有什么價值。還有,對已經加入了某一類有銷戶時間限制套餐且未到期的客戶也可以不考慮。這樣,我們建模的目標范圍變得更加明確。
    (二)獲取用于建模的數據。建模的數據可以從各個營運系統中提取??梢詮腎BSS系統提取客戶數據、服務數據、產品數據、套餐數據、業務數據:從計費賬務系統提取市話計費數據、長途計費數據、智能網計費數據、省數據業務計費數據;從CMMS系統提取渠道數據;從資源系統提取地址數據、資源數據;從交換系統提取通話數據等等。另外有一些數據需要通過市場調查獲取,比如調查哪些地區是其他運營商有布線的固話競爭區域??梢栽趨^域范圍內的交接箱資料加上“競爭區域”的標識。
    (三)對數據進行清洗、格式化,轉換成建模數據集。一個客戶可能有多個固話和小靈通,銷戶指的是固話小靈通拆機,而不是指客戶不再使用所有的電信產品。因此真正的客戶預測流失上并不具有價值。經過分析,我們確定建模的對象為服務實體,即固話和小靈通。模型集的行代表一個固話或小靈通,計費等數據則對應到各個列。另外。為了使預測結果更接近于現實情況,我們取最近12個月的計費數據。接下來,我們要剔除一些無效的變量,如身份證號、電話號碼、絕對日期、地址數據等。這些交量對建模沒有用處。最后就是加入衍生變量。這個過程需要我們對電信業務進行深入的分析并充分發揮創造性,這樣才能生成一組對建模很有意義的衍生變量。如根據固話對應的交接箱,我們提取出“是否處于競爭區域”的變量;從通話日期可以提取出“星期幾”、“是否節假日”等變量,另外,還可以通過組合生成全部月份的變量總和及其方差,各月變量占總和的比等變量。經過這些清洗和轉換工作,我們便生成了用于建模的數據集。
    (四)建立模型。我們選用SAS EM軟件包作為建模工具,在挖掘算法方面選用決策樹算法。決策樹算法可以處理上百個字段,具有探索功能,且高度自動化??紤]到固話和小靈通這兩類產品有很大的區別,因此需要分別建立預測模型。接下來,我們對客戶進行分類。按月平均消費額分成高價值客戶和低價值客戶。另外再分出兩類特殊客戶,近期開戶的客戶和有申請套餐的客戶,對這四類客戶分別建立模型,再將模型進行合并。
    (五)模型評估。對模型的評估同樣分成四類客戶分別評分。即生成四類客戶的評分數據集,分別輸入模型中,得出預測結果。把結果和實際情況進行比較來評價模型的有效性。
    (六)模型預測結果用于支持決策??蛻袅魇暑A測模型建立后,我們就及時預測某個客戶流失的可能性大小。當其流失可能性高于某一分值,我們就認為他是將可能流失的客戶,就可以及時的推出針對性的營銷套餐來留下該客戶

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢