
數據挖掘有三大步驟
第一數據籌備,第二數據挖掘,第三結果表達和解釋。數據籌備包含數據集成,數據選擇,目標數據預處理。數據挖掘主要是對預處理后的數據進行挖掘。結果表達和解釋即我們所說的結果可視化。
航空客戶信息,包含會員檔案信息和其他乘坐航班記錄信息等。識別客戶價值的最廣泛的模型是通過RFM模型來識別出高價值的客戶:
Recency: 最近消費時間間隔
Frequency: 消費頻率
Monetary: 消費金額
然而,同樣的消費金額的不同旅客對航空公司的價值不同,例如買長航線、低等倉的旅客和買短航線、高等倉的旅客消費金額相同 ,但是價值卻是不同的。顯然后者更有價值。因此這個指標可能不合適,故選擇客戶在一定時間內的飛行里程M和乘坐艙位所對應的折扣系數C。同時,因為航空公司會員的加入時間一定程度上可以影響客戶價值,所以我們在航空公司客戶價值分析模型中添加客戶關系長度 L,當做區分客戶價值的另一個指標,所以我們構建出LRFMC 模型。
L:會員入會時間距觀測窗口結束的時間
R:客戶最近一次乘坐公司分級距觀測窗口結束的時間(月數)
F:客戶在觀測窗口內乘坐公司飛機的次數
M:客戶在觀測窗口內累計的飛行里程
C:客戶在觀測窗口內乘坐艙位所對應的折扣系數的平均值
使用聚類分析的方法把客戶進行分類,并且分析客戶群的特征,分析客戶價值。
>>>>
第一步:數據抽取
(1)以 2014年3月31日為結束日期,選取寬度為兩年的時間段作為分析觀測窗口,抽取觀測窗口內有乘機記錄的所有顧客的詳細資料形成歷史數據。對于后來新增客戶信息利用數據中最大的某個時間作為結束時間,采用同樣的方法進行抽取,形成增量數據。
(2)根據末次飛行日期從航空公司系統內抽取 2012年4月1日至 2014年3月31 日內所有所有乘客的詳細數據,共 62988 條記錄。
>>>>
第二步:數據探索分析
在原始數據中存在票價為空的情況,票價為空值的數據有可能是航空客戶未有乘機記錄造成的。票價最小值為 0,折扣率最小值為 0,總飛行里程不為 0 的數據有可能是顧客使用 0 折機票或者是使用積分兌換的機票造成的。
>>>>
第三步:數據預處理
(1)數據清洗:從航空公司業務和數據挖掘建模需要考慮篩選出需要的數據。
A)不需要票價為空的數據。B)不需要票價為 0,平均折扣率不為 0,總飛行里程不為 0 的數據。
(2)屬性規約。在原始數據中數據屬性太多,我們只需要與LRFMC 模型相關的 6 個數據屬性,所以我們需要刪除不相關,弱相關和冗余的數據屬性。
>>>>
第四步:建構模型
構建航空公司客戶價值分析 LRFMC 模型
A:客戶 K-Means 聚類分析
采用 K-Means 辦法對所有客戶數據進行聚類分析,將客戶數據聚為 5 類。(具體情況具體分析,必須依據實際狀況決定分幾類)
B:客戶價值分析
對聚類結果進行屬性分析:顧客群 1 在 L、M 屬性上最??;顧客群 2 在 R 屬性上最大,在 F、M 上最??;客戶群 3 在屬性 F、M 上最大,在 R 上最??;客戶群 4 在屬性 L 上最大;客戶群 5 在屬性 C 上最大。
根據航空公司業務定義為五個等級的客戶類別:重要保持客戶,重要發展客戶,重要挽留客戶,普通價值客戶,低價值客戶。根據每種客戶群類型的特征對客戶群進行客戶價值排名,以便獲得高價值客戶的信息。
C:模型應用
根據每種客戶群的特征,可以采取更多個性化服務和營銷策略。
隨著數據量爆炸式的激增,數據挖掘技術與工具將得到更廣泛的使用和發展。航空業的下一個大動作就在大數據和大數據挖掘分析領域。航空企業將通過數據分析了解旅客細分、旅客趨勢,找到將信息變成吸引旅客、增強旅客忠誠度的產品和服務。
今天,航空業在大數據捕捉和分析領域還不是走在前面的行業,但十年后,航空業也許成為這一領域的領頭羊。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25在當今數字化時代,數據分析師的重要性與日俱增。但許多人在踏上這條職業道路時,往往充滿疑惑: 如何成為一名數據分析師?成為 ...
2025-04-24以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《劉靜:10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda ...
2025-04-23