熱線電話:13121318867

登錄
首頁精彩閱讀商務智能體系介紹—數據挖掘相關理論
商務智能體系介紹—數據挖掘相關理論
2018-07-01
收藏

商務智能體系介紹—數據挖掘相關理論

信息時代的到來,使得人們在實踐中積累的數據越來越多。大量信息給人們帶來方便的同時也帶來一大堆問題,如信息過載,難以消化;信息形式不一致,難以統一處理;信息真偽難辨等等,導致了“信息爆炸而知識缺乏”、“信息孤島”等現象。激增的數據背后隱藏著許多重要的信息,人們希望能夠對其進行更高層次的分析,發現數據中存在的關系和規則,根據現有數據預測未來的發展趨勢,獲得更準確全面的信息幫助管理層決策。面臨著這些新問題和挑戰,人們開始考慮和解決如何舍棄那些不必要的信息,從大量的數據中提取有用的信息,提高信息的利用率,數據挖掘技術此時應運而生。
    數據挖掘(Data Mining)是從大量的、不完全的、有噪聲的、模糊的和隨機的數據中,提取隱含在其中的、人們事先不知道的,但又是潛在有用的信息和知識的過程。數據挖掘是一門廣義的交叉學科,它匯聚了不同領域尤其是數據庫、人工智能、數理統計、可視化、并行計算等方面的知識。數據挖掘技術從一開始就是面向應用領域,它不僅是面向特定數據庫的簡單檢索查詢調用,而且,要對數據進行微觀、中觀乃至宏觀的統計、分析、綜合和推理,以指定實際問題的求解,企圖發現事件間的相互關聯,甚至利用已有的數據對未來的活動進行預測。

圖1 數據挖掘的流程
    數據挖掘的任務是從大量數據中發現知識,可分為描述性挖掘,隱藏性挖掘和預測性挖掘三類,如圖2所示。描述性挖掘是刻畫出數據倉庫中數據的某一特性,解釋發現了什么;隱藏性挖掘找出以前無法探知,隱藏于業務數據中的信息,解釋為什么;預測性挖掘則是在但前數據上進行推理,做出預測,解釋將會發生什么。
    數據挖掘與傳統的數據分析(如查詢、報表、聯機應用分析)的本質區別是數據挖掘是在沒有明確假設的前提下去挖掘信息、發現知識數據挖掘所得到的信息應具有事先未知,有效和可實用三個特征。先前未知的信息是指該信息是預先未曾預料到的,即數據挖掘是要發現那些不能靠直覺發現的信息或知識,甚至是違背直覺的信息或知識。

圖2 數據挖掘類型
    數據挖掘方法有很多種,其中比較典型的有分類、關聯、序列模式、聚類等,本文在后面將詳細介紹其分析模式及算法。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢