熱線電話:13121318867

登錄
首頁精彩閱讀數據倉庫的數據抽取
數據倉庫的數據抽取
2018-09-10
收藏


與關系數據庫不同,數據倉庫并沒有嚴格的數學理論基礎,它更偏向于工程。由于數據倉庫的這種工程性,因而在技術上可以根據它的工作過程分為:數據的抽取、存儲和管理、數據的表現及數據倉庫設計的技術咨詢4個方面。下面將分別討論每一個環節。

數據抽取

數據的抽取是數據進入倉庫的入口。由于數據倉庫是一個獨立的數據環境,它需要通過抽取過程將數據從聯機事務處理系統、外部數據源、脫機的數據存儲介質中導入到數據倉庫。數據抽取在技術上主要涉及互連、復制、增量、轉換、調度和監控等幾個方面。數據倉庫的數據并不要求與聯機事務處理系統保持實時的同步,因此數據抽取可以定時進行,但多個抽取操作執行的時間、相互的順序、成敗對數據倉庫中信息的有效性至關重要。

在技術發展上,數據抽取所涉及的單個技術環節都已相對成熟,其中有一些是躲不開編程的,但整體的集成度還很不夠。目前市場上所提供的大多是數據抽取工具,這些工具通過用戶選定源數據和目標數據的對應關系,會自動生成數據抽取的代碼。但數據抽取工具支持的數據種類是有限的;同時數據抽取過程涉及數據的轉換,它是一個與實際應用密切相關的部分,其復雜性使得不可嵌入用戶編程的抽取工具往往不能滿足要求。

因此,實際的數據倉庫實施過程中往往不一定使用抽取工具,整個抽取過程能否因工具的使用而納入有效的管理、調度和維護則更為重要。從市場發展來看,以數據抽取、異構互連產品為主項的數據倉庫廠商一般都很有可能被其他擁有數據庫產品的公司吞并。在數據倉庫的世界里,它們只能成為輔助的角色。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢