熱線電話:13121318867

登錄
首頁大數據時代數據倉庫中元數據的概念及作用
數據倉庫中元數據的概念及作用
2020-06-28
收藏

不知道大家有沒有接觸過“元數據”一詞,元數據貫穿了數據倉庫的整個生命周期,使用元數據驅動數據倉庫的開發,使數據倉庫自動化,可視化。 下面,就讓我們來看一下什么是“元數據”。

按照傳統的定義,元數據(Metadata)是關于數據的數據。在數據倉庫系統中,元數據可以幫助數據倉庫管理員和數據倉庫的開發人員非常方便地找到他們所關心的數據;元數據是描述數據倉庫內數據的結構和建立方法的數據,可將其按用途的不同分為兩類:技術元數據(Technical Metadata)和業務元數據(Business Metadata)。技術元數據是存儲關于數據倉庫系統技術細節的數據,是用于開發和管理數據倉庫使用的數據,包括業務術語和業務規則等信息。業務元數據從業務角度描述了數據倉庫中的數據,它提供了介于使用者和實際系統之間的語義層,使得不懂計算機技術的業務人員也能夠“讀懂”數據倉庫中的數據。

元數據作用具體體現在以下幾個方面:

1.元數據是進行數據集成所必需的

數據倉庫最大的特點就是它的集成性,一個數據倉庫是由外部數據、業務數據以及文檔資料通過某些抽取工具而得到的,數據集市就是數據倉庫經過元數據的定義,約定它的結構等信息所產生。元數據做到了對數據倉庫有效的數據存儲與管理,如果在建立數據集市的過程中,注意了元數據管理,在集成到數據倉庫中時就會比較順利。

2.元數據定義的語義層可以幫助用戶理解數據倉庫中的數據

最終用戶不可能象數據倉庫系統管理員或開發人員那樣熟悉數據庫技術,因此迫切需要有一個“翻譯”,能夠使他們清晰地理解數據倉庫中數據的含意。元數據為運行時的系統提供了統一的可讀的系統模型,系統運行時可以使得實體對象通過運行時的元數據模型來得知自身的結構、自身的特征。元數據可以實現業務模型與數據模型之間的映射,因而可以把數據以用戶需要的方式“翻譯”出來,從而幫助最終用戶理解和使用數據。

3.元數據是保證數據質量的關鍵

元數據做到了對數據倉庫結構的描述,倉庫模式試圖,維,度量,層次結構,到處數據庫的定義,以及數據集市的位置和內容。借助元數據管理系統,最終的使用者對各個數據的來龍去脈以及數據抽取和轉換的規則都會很方便地得到,這樣他們自然會對數據具有信心;當然也可便捷地發現數據所存在的質量問題。

4.元數據可以支持需求變化

元數據獨立于平臺,無論使用什么技術平臺,元數據本身不受影響,因此元數據可以支持需求的變化。成功的元數據管理系統可以把整個業務的工作流、數據流和信息流有效地管理起來,使得系統不依賴特定的開發人員,從而提高系統的可擴展性。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢