熱線電話:13121318867

登錄
首頁精彩閱讀數據挖掘中決策樹算法的研究及探討
數據挖掘中決策樹算法的研究及探討
2016-02-15
收藏

數據挖掘決策樹算法的研究及探討

隨著計算機硬件和軟件的飛速發展,尤其是數據庫技術應用的日益普及,人們面臨著快速擴張的數據海洋,如何有效的運用,成為我們信息工作者所關注的焦點,數據挖掘就是從大型數據庫或數據倉庫中挖掘出數據潛在的關聯性。

數據挖掘分類法是指從大量的數據庫中自動地、智能地抽取一些行之 有效的、可以相信的和理解的以及有用模式的過程。作為數據挖掘的重要內容之一的分類法,日前,分類已經被廣泛運用于天氣預測、顧客區分、醫療診斷、欺詐甄 別、信用證實當中。在數據挖掘的眾多分類方法中,決策樹算法在大量數據環境中應用的最為廣泛。

數據庫技術的迅速發展以及數據庫管理系統的廣泛應用,導致人們積累了越來越多的數據。巨增的數據背后蘊藏著豐富的知識,而目前的數據庫技術雖可以高效地實現數據的查詢、統計等功能,但卻無法發現數據中存在的關系和規則,無法根據現有的數據預測未來的發展趨勢。數據庫中存在著大量的數據,卻缺乏挖掘數據背后隱藏的知識的手段,出現了"數據爆炸而知識貧乏"的現象。
     在此背景下,數據庫知識發現(KDD) 及其核心技術-數據挖掘(DM) 便應運而生了。KDD 的研究內容是,能自動地去處理數據庫中大量的原始數據,從中挖掘搜索出具有規律、富有意義的模式。它的發現過程主要有三個步驟:定義要發現的問題;根據問題進行數據搜索、模式抽取; 評價所發現的知識的好壞。三者之中,核心技術是第二步,即數據搜索及模式抽取方法。KDD = 問題處理+ DM+ 解釋評價。由于問題處理和解釋評價的研究較成熟,所以目前KDD的研究和實現難點重點都集中在核心的DM上。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢