熱線電話:13121318867

登錄
首頁精彩閱讀NO.4完整的DataMining包含哪些步驟?
NO.4完整的DataMining包含哪些步驟?
2014-12-10
收藏

1、數據挖掘環境

數據挖掘是指一個完整的過程,該過程從大型數據庫中挖掘先前未知的,有效的,可實用的信息,并使用這些信息做出決策或豐富知識. 數據挖掘環境可示意如下圖:

2、數據挖掘過程圖

下圖描述了數據挖掘的基本過程和主要步驟

數據挖掘的基本過程和主要步驟

3、數據挖掘過程工作量

數據挖掘中被研究的業務對象是整個過程的基礎,它驅動了整個數據挖掘過程,也是檢驗最后結果和指引分析人員完成數據挖掘的依據和顧問.圖2各步驟是按一定順序完成的,當然整個過程中還會存在步驟間的反饋.數據挖掘的過程并不是自動的,絕大多數的工作需要人工完成.圖3給出了各步驟在整個過程中的工作量之比.可以看到,60%的時間用在數據準備上,這說明了數據挖掘對數據的嚴格要求,而后挖掘工作僅占總工作量的10%.

圖3數據挖掘過程工作量比例

4、數據挖掘過程簡介

過程中各步驟的大體內容如下:

(1). 確定業務對象

清晰地定義出業務問題,認清數據挖掘的目的是數據挖掘的重要一步.挖掘的最后結構是不可預測的,但要探索的問題應是有預見的,為了數據挖掘數據挖掘則帶有盲目性,是不會成功的.

(2). 數據準備

1)、數據的選擇

搜索所有與業務對象有關的內部和外部數據信息,并從中選擇出適用于數據挖掘應用的數據.

2)、數據的預處理

研究數據的質量,為進一步的分析作準備.并確定將要進行的挖掘操作的類型.

3)、數據的轉換

將數據轉換成一個分析模型.這個分析模型是針對挖掘算法建立的.建立一個真正適合挖掘算法的分析模型是數據挖掘成功的關鍵.

(3). 數據挖掘

對所得到的經過轉換的數據進行挖掘.除了完善從選擇合適的挖掘算法外,其余一切工作都能自動地完成.

(4). 結果分析

解釋并評估結果.其使用的分析方法一般應作數據挖掘操作而定,通常會用到可視化技術.

(5). 知識的同化

將分析所得到的知識集成到業務信息系統的組織結構中去.

5、數據挖掘需要的人員

數據挖掘過程的分步實現,不同的步會需要是有不同專長的人員,他們大體可以分為三類.

業務分析人員:要求精通業務,能夠解釋業務對象,并根據各業務對象確定出用于數據定義和挖掘算法的業務需求.

數據分析人員:精通數據分析技術,并對統計學有較熟練的掌握,有能力把業務需求轉化為數據挖掘的各步操作,并為每步操作選擇合適的技術.

數據管理人員:精通數據管理技術,并從數據庫或數據倉庫中收集數據.

從上可見,數據挖掘是一個多種專家合作的過程,也是一個在資金上和技術上高投入的過程.這一過程要反復進行牞在反復過程中,不斷地趨近事物的本質,不斷地優先問題的解決方案。數據重組和細分添加和拆分記錄選取數據樣本可視化數據探索聚類分析神經網絡、決策樹數理統計、時間序列結論綜合解釋評價數據知識數據取樣數據探索數據調整模型化評價。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢