熱線電話:13121318867

登錄
首頁精彩閱讀關聯規則挖掘在數據錄入、校對系統中的應用
關聯規則挖掘在數據錄入、校對系統中的應用
2016-01-12
收藏


關聯規則挖掘在數據錄入、校對系統中的應用

數據的準確錄入和高效的校對是各行業的產品數據分析的基礎,提高數據錄入的精確性對各行業的產品數據分析有著重要的支撐作用,是后期數據分析的科學基礎。在傳統的數據校驗方法的基礎上,數據分析師在采用數據挖掘知識中的關聯規則能更有效地提高數據錄入的精確性以及校對的高效性。

數據分析師在數據挖掘的知識模式中,關聯規則模式是比較重要的一種。關聯規則的概念由Agrawal、Imielinski等人提出,是數據挖掘技術中一種相對簡單但很實用的規則??梢圆捎?a href='/map/guanlianguize/' style='color:#000;font-size:inherit;'>關聯規則挖掘技術對各行業的數據錄入、校對、處理提供支持,從而提高數據處理的準確性。
數據挖掘關聯規則的基本概念
1.1 數據挖掘
數據挖掘是一個從大量的數據中發現潛在的、新穎的、有價值的信息和知識(模型或規則)的過程;它是根據目標對數據進行探索和分析,揭示其中隱含的規律,并進一步將其模型化的先進有效的技術過程。數據挖掘是一門交叉學科,它集成了許多學科中成熟的工具和技術,包括數據庫技術、統計學、機器學習、模型識別、人工智能、神經網絡等等。
數據挖掘包括:分類 (Classification) 、估值(Estimation)、 預測(Prediction) 、相關性分組或關聯規則(Affinity grouping or association rules) 、聚類(Clustering)、描述和可視化(Description and Visualization)。 
1.2 關聯規則
    關聯規則是在交易數據、關系數據或其他信息載體中,查找存在于項目集合或對象集合之間的頻繁模式、關聯、相關性、或因果結構,通過分析數據或記錄間的關系,決定哪些事情將一起發生。
設I={i1, i2,…, in}是項的集合,其中的元素稱為項,S為T的集合,這里T是項的集合,并且T I 。如果X T,那么稱T包含X。
一個關聯規則是形如X==>Y的蘊涵式,這里X I, Y I,并且X Y= 。規則X==>Y在集合S中的支持度(support)是S集中包含X和Y的數與所有項數之比,記為support(X==>Y),即:support(X==>Y)= {T : X Y T,T S} / S 
規則X==>Y的可信度是指包含X和Y的數與包含X的數之比,記為confidence(X==>Y),即:confidence(X==>Y)={T: X Y T,T S} / {T:X T,T S}
關聯規則挖掘的任務是:給定一個集S,求出所有滿足最小支持度和最小可信度的關聯規則。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢