熱線電話:13121318867

登錄
首頁精彩閱讀大數據的三重內涵
大數據的三重內涵
2018-04-18
收藏

大數據的三重內涵

大數據在業內并沒有統一的定義。不同廠商、不同用戶,站的角度不同,對大數據的理解也不一樣。麥肯錫報告中對大數據的基本定義是:大數據是指其大小超出了典型數據庫軟件的采集、儲存、管理和分析等能力的數據集合。賽迪智庫指出,大數據是一個相對的概念,并沒有一個嚴格的標準限定多大規模的數據集合才稱得上是大數據。事實上,隨著時間推移和數據管理與處理技術的進步,符合大數據標準的數據集合的規模也在并將繼續增長。同時,對于不同行業領域和不同應用而言,“大數據”的規模也不統一。
    雖然“大數據”直接代表的是數據集合這一靜態對象,但賽迪智庫經過深入研究認為,目前所提到的“大數據”,并不僅僅是大規模數據集合本身,而應當是數據對象、技術與應用三者的統一:
   1.從對象角度看,大數據是大小超出典型數據庫軟件采集、儲存、管理和分析等能力的數據集合。需要注意的是,大數據并非大量數據簡單、無意義的堆積,數據量大并不意味著一定具有可觀的利用前景。由于最終目標是從大數據中獲取更多有價值的“新”信息,所以必然要求這些大量的數據之間存在著或遠或近、或直接或間接的關聯性,才具有相當的分析挖掘價值。數據間是否具有結構性和關聯性,是 “大數據”與“大規模數據”的重要差別。
   2.從技術角度看,大數據技術是從各種各樣類型的大數據中,快速獲得有價值信息的技術及其集成?!按髷祿迸c“大規模數據”、“海量數據”等類似概念間的最大區別,就在于“大數據”這一概念中包含著對數據對象的處理行為。為了能夠完成這一行為,從大數據對象中快速挖掘更多有價值的信息,使大數據“活起來”,就需要綜合運用靈活的、多學科的方法,包括數據聚類、數據挖掘、分布式處理等,而這就需要擁有對各類技術、各類軟硬件的集成應用能力??梢?,大數據技術是使大數據中所蘊含的價值得以發掘和展現的重要工具。
   3.從應用角度看,大數據是對特定的大數據集合、集成應用大數據技術、獲得有價值信息的行為。正由于與具體應用緊密聯系,甚至是一對一的聯系,才使得“應用”成為大數據不可或缺的內涵之一。
    需要明確的是,大數據分析處理的最終目標,是從復雜的數據集合中發現新的關聯規則,繼而進行深度挖掘,得到有效用的新信息。如果數據量不小,但數據結構簡單,重復性高,分析處理需求也僅僅是根據已有規則進行數據分組歸類,未與具體業務緊密結合,依靠已有基本數據分析處理技術已足夠,則不能算作是完全的“大數據”,只是“大數據”的初級發展階段。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢