熱線電話:13121318867

登錄
首頁精彩閱讀對于數據倉庫你知道多少
對于數據倉庫你知道多少
2018-03-23
收藏

對于數據倉庫你知道多少

數據倉庫商業智能系統的基礎,以往的數據庫系統主要用于事務處理,很難或無法實現分析處理。近年來,越來越多的數據分析與決策信息支持在被企業所重視,數據倉庫技術應運而生。

   數據倉庫的定義
    目前對于數據倉庫還沒有統一的定義,被稱為數據倉庫之父的BillInmon在其著作《(Building the Data Warehouse))一書中給出的定義被廣泛接受:數據倉庫(Data Warehouse)是一個面向主題的(Subject Oriented)、集成的(Integrated)、相對穩定的(Non.Volatile)、反映歷史變化(Time Variant)的數據集合,用于支持管理決策。
    可以從兩個層面對數據倉庫的概念進行理解,首先數據倉庫是面向分析處理的,主要用來支持決策制定;再者數據倉庫包含歷史數據,是對多個異構的數據源數據按照主題的集成,它的數據相對固定,不會經常改動。
   數據倉庫的特點
    面向主題、集成、相對穩定、反映歷史變化是對數據倉庫的定義,也是對數據倉庫特點的描述,下面分別解釋它們的含義。
    (1)面向主題的:數據倉庫的數據都是按照一定的業務主題進行組織的,面向主題體現在數據倉庫的建設中,而且還包含在業務數據分析和存儲上。
    (2)集成的:數據倉庫中的數據來自各個不同的分散數據庫中,它并不是對源數據庫數據的簡單拷貝,而是按照劃分好的主題和數據分析要求,經過數據抽取、清理、匯總和整理等步驟,消除源數據中的錯誤和不一致數據,保證數據倉庫中數據的正確性和可用性,所以它是整合集成的。
    (3)相對穩定的:數據倉庫的穩定性體現在它的非易失性上,由于數據倉庫是面向分析的,其中的數據是從業務數據中加載過來的歷史數據,所進行的主要操作是查詢和分析,供決策分析使用,所以其修改和刪除操作很少,只需要定期的增量加載,所以具有相對穩定特征。
    (4)反映歷史變化:數據倉庫必須能夠不斷地捕捉業務系統中的變化數據,記錄企業生產過程的各個階段的信息,以滿足決策分析的需要,所以必須實時地把新變化的業務數據追加到數據倉庫中去,通過數據隨時問變化的研究和分析,可以對企業的發展歷程和未來趨勢做出定量分析和預測。
    可見數據倉庫與業務數據庫的不同之處體現在:數據庫是面向事務的設計,數倉庫是面向主題設計的;數據庫一般存儲在線交易數據,數據倉庫存儲的一般是歷史數據; 數據庫設計是盡量避免冗余,一般采用符合范式的規則來設計,數據倉庫在設計是有意引入冗余,采用反范式的方式來設計; 數據庫是為捕獲數據而設計,數據倉庫是為分析數據而設計,它的兩個基本的元素是維表和事實表。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢