熱線電話:13121318867

登錄
首頁精彩閱讀數據挖掘能做點什么?
數據挖掘能做點什么?
2016-07-01
收藏

數據挖掘能做點什么?

大數據是目前最時髦的詞匯,正受到越來越多人的關注和談論,大數據時代,數據挖掘是最關鍵的工作。 

什么是數據挖掘? 

簡單地說,數據挖掘是從大量數據中提取或“挖掘”知識——《數據挖掘:概念與技術》。

IDMer認為,數據挖掘就是從數據里找規律。對于規律沒有嚴格的界限,只要這個規律對于公司業務的理解和未來業務規劃預測有幫助,這都可以算作數據挖掘。以電信公司為例,客戶流失是運營商經常面臨的問題,需要了解哪些客戶容易流失,原因是什么,能不能在流失之前就找到他們,建立預警系統,分析流失客戶和忠誠客戶的差別是什么,我們稱之為流失特征。通過數據挖掘找出這些特征后,就可以選出可能會流失的客戶,爭取挽留。那么規律,作為一種復雜的模式,在這個案例中就體現為流失特征。再比如企業通過分析銷售數據,得出銷售高峰出現在春節等節假日,這也算一種規律,可以幫助企業決定何時進行資源儲備,人員配備以及營銷活動等。但是這種規律不需要通過復雜的數據挖掘,通過看銷售數字就可以得出來。

數據挖掘能做點什么? 

數據挖掘的任務和功能一般可以分為兩大類:描述和預測,描述類挖掘主要是展現數據集中數據的一般特征,預測類挖掘是在當前數據上進行推斷,以進行預測。 





1、數據描述、特征和區分

是對數據的基本特征進行概括和總結,能夠實現對數據多維度、多層次的匯總,得到數據分布特征的精確概括。數據特征化的輸出可以用多種形式提供,例如餅圖、條形圖、線圖、多維數據立方體OLAP、含交叉表的多維表。結果描述也可以用概化關系或規則形式提供。 

2、分類

主要目的是通過向數據“學習”,分析數據不同屬性之間的聯系,得到一種能夠正確區分數據所屬類別的規律。它可以應用到客戶的分類、客戶的屬性和特征分析、客戶滿意度分析、客戶的購買趨勢預測等,如一個汽車零售商將客戶按照對汽車的喜好劃分成不同的類,這樣營銷人員就可以將新型汽車的廣告手冊直接郵寄到有這種喜好的客戶手中,從而大大增加了商業機會。 

3、回歸

反映的是事務數據庫中屬性值在時間上的特征,產生一個將數據項映射到一個實值預測變量的函數,發現變量或屬性間的依賴關系,其主要研究問題包括數據序列的趨勢特征、數據序列的預測以及數據間的相關關系等。它可以應用到市場營銷的各個方面,如客戶尋求、保持和預防客戶流失活動、產品生命周期分析、銷售趨勢預測及有針對性的促銷活動等。 

4、聚類分析

聚類是一種在沒有先驗知識條件下,根據某種相近程度的度量指標,對數據自動進行類劃分的技術。所形成的類別內部數據的結構特征相近,不同類之間的數據結構特征有較大差異。其目的是使得屬于同一類別的數據間的相似性盡可能大,不同類別中的數據間的相似性盡可能小。它可以應用到客戶群體的分類、客戶背景分析、客戶購買趨勢預測、市場的細分等。 

5、關聯分析

是指通過數據分析,找到事物之間的關聯規則。包括簡單關聯規則和時序關聯規則。即根據一個事務中某些項的出現可導出另一些項在同一事務中也出現,即隱藏在數據間的關聯或相互關系。例如“90%的顧客在購買面包和黃油的同時也會購買牛奶”。在客戶關系管理中,通過對企業的客戶數據庫里的大量數據進行挖掘,可以從大量的記錄中發現有趣的關聯關系,找出影響市場營銷效果的關鍵因素,為產品定位、定價與定制客戶群,客戶尋求、細分與保持,市場營銷與推銷,營銷風險評估和詐騙預測等決策支持提供參考依據。 

6、噪聲、異常值分析

用于分析的數據中可能包括一些另類的對象,它們與數據集的一般特征不一致,經常稱之為噪聲、孤立點、異常值。大部分數據挖掘方法將這些數據直接丟棄,然而,在某些應用中,如欺詐研究中,罕見的事件可能比正常出現的事件更有趣,需要對這些對象進行單獨的分析。 




數據挖掘不是萬能的 


數據挖掘只是解決商業問題的一種手段,在解決實際問題中,需要與其他方法相結合,將業務問題轉為數據挖掘問題,這需要業務部門的配合。數據挖掘只是提供了一個良好工具,并不是萬能的。它仍然需要數據分析人員了解系統的業務,理解系統的數據和弄清分析方法,數據挖掘得到的模型必須要在現實生活中進行驗證。數據挖掘永遠不會替代有經驗的商業分析師或管理人員所起的作用,它只是提供一個強大的工具。數據挖掘不會在缺乏指導的情況下自動發現模型,數據分析師必須為數據挖掘工具提供指導。雖然數據挖掘工具使用戶不必再掌握艱深的統計分析方法,但需要用戶清楚工具是如何工作的。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢