熱線電話:13121318867

登錄
首頁精彩閱讀數據倉庫粒度與分割
數據倉庫粒度與分割
2018-09-10
收藏



粒度與分割

1)粒度

粒度是數據倉庫的重要概念。粒度可以分為兩種形式。第一種粒度是對數據倉庫中的數據的綜合程度高低的一個度量,它既影響數據倉庫中的數據量的多少,也影響數據倉庫所能回答詢問的種類。在數據倉庫中,多維粒度是必不可少的。由于數據倉庫的主要作用是DSS分析,因而絕大多數查詢都基于一定程度的綜合數據之上,只有極少數查詢涉及細節。所以應該將大粒度數據存儲在快速設備如磁盤上,小粒度數據存儲在低速設備如磁帶上。

第二種粒度是樣本數據庫.它根據給定的采樣率從細節數據庫中抽取出一個子集,這樣樣本數據庫中的粒度就不是根據綜合程度的不同來劃分,而是由采樣率的高低來劃分,采樣粒度不同的樣本數據庫可以具有相同的數據綜合程度。

2)分割

分割是數據倉庫中的另一個重要概念,它的目的同樣在于提高效率。它是將數據分散到各自的物理單元中去,以便能分別獨立處理。有許多數據分割的標準可供參考,如日期、地域、業務領域等,也可以是其組合。一般而言,分割標準總應包括日期項,因為它十分自然而且分割均勻。



數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢