熱線電話:13121318867

登錄
首頁精彩閱讀數據挖掘的六大主要功能
數據挖掘的六大主要功能
2018-06-25
收藏

數據挖掘的六大主要功能

數據挖掘的歷史雖然較短,但從20世紀90年代以來,它的發展速度很快,加之它是多學科綜合的產物,目前還沒有一個完整的定義,人們提出了多種數據挖掘的定義,例如:SAS研究所(1997):“在大量相關數據基礎之上進行數據探索和建立相關模型的先進方法”。Hand et al(2000):“數據挖掘就是在大型數據庫中尋找有意義、有價值信息的過程”確切地說,數據挖掘(Data Mining),又稱數據庫中的知識發現(Knowledge Discovery in Database,KDD),是指從大型數據庫或數據倉庫中提取隱含的、未知的、非平凡的及有潛在應用價值的信息或模式,它是數據庫研究中的一個很有應用價值的新領域,融合了數據庫、人工智能、機器學習、統計學等多個領域的理論和技術。
 

  數據挖掘的主要功能
   數據挖掘綜合了各個學科技術,有很多的功能,當前的主要功能如下:
    1、數據總結:繼承于數據分析中的統計分析。數據總結目的是對數據進行濃縮,給出它的緊湊描述。傳統統計方法如求和值、平均值、方差值等都是有效方法。另外還可以用直方圖、餅狀圖等圖形方式表示這些值。廣義上講,多維分析也可以歸入這一類。
    2、分類:目的是構造一個分類函數或分類模型(也常常稱作分類器),該模型能把數據庫中的數據項映射到給定類別中的某一個。要構造分類器,需要有一個訓練樣本數據集作為輸入。訓練集由一組數據庫記錄或元組構成,每個元組是一個由有關字段(又稱屬性或特征)值組成的特征向量,此外,訓練樣本還有一個類別標記。一個具體樣本的形式可表示為:(v1,v2,…,vn;c),其中vi表示字段值,c表示類別。
    例如:銀行部門根據以前的數據將客戶分成了不同的類別,現在就可以根據這些來區分新申請貸款的客戶,以采取相應的貸款方案。
    3、聚類:是把整個數據庫分成不同的群組。它的目的是使群與群之間差別很明顯,而同一個群之間的數據盡量相似。這種方法通常用于客戶細分。在開始細分之前不知道要把用戶分成幾類,因此通過聚類分析可以找出客戶特性相似的群體,如客戶消費特性相似或年齡特性相似等。在此基礎上可以制定一些針對不同客戶群體的營銷方案。
    例如:將申請人分為高度風險申請者,中度風險申請者,低度風險申請者。
    4、關聯分析:是尋找數據庫中值的相關性。兩種常用的技術是關聯規則和序列模式。關聯規則是尋找在同一個事件中出現的不同項的相關性;序列模式與此類似,尋找的是事件之間時間上的相關性,例如:今天銀行利率的調整,明天股市的變化。
    5、預測:把握分析對象發展的規律,對未來的趨勢做出預見。例如:對未來經濟發展的判斷。
    6、偏差的檢測:對分析對象的少數的、極端的特例的描述,揭示內在的原因。例如:在銀行的100萬筆交易中有500例的欺詐行為,銀行為了穩健經營,就要發現這500例的內在因素,減小以后經營的風險。
    以上數據挖掘的各項功能不是獨立存在的,它們在數據挖掘中互相聯系,發揮作用。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢