熱線電話:13121318867

登錄
首頁精彩閱讀大數據的存儲和搜索面臨很大挑戰
大數據的存儲和搜索面臨很大挑戰
2018-04-10
收藏

大數據的存儲和搜索面臨很大挑戰

大數據并非是一個全新的概念,早在1980年,阿爾文托夫勒就在《第三次浪潮》一書中預言了由數據構成的“碎片化未來”,并將海量數據贊頌為“第三次浪潮的華彩樂章”。然而,大數據真正流行起來是在2011年之后,數據量呈幾何指數上升,物聯網、云計算等技術的日漸成熟使得數據的獲取、存儲和處理的成本急劇下降,促使大數據一時間成為了各方視線的焦點。
    首先,伴隨著移動終端、傳感器的迅速普及以及社會化媒體等互聯網應用的日益多樣化,數據量呈現出爆發式的增長,數據集的規模已經達到了TB甚至是PB的級別。這些海量的、碎片化的數據不僅能夠較為完整地刻畫出人們在線行為,還可以通過各類傳感設備的數據來記錄實體經濟的運行狀況。
    其次,數據的種類也愈發豐富,不僅包含文本內容,還包括圖片、音頻、視頻等非結構化數據,為數據的存儲和搜索帶來了很大挑戰,這意味著傳統意義上適用于文本內容存儲和分析的數據庫關聯算法、語義分析等手段已經漸漸失效。
    第三,大數據蘊含著巨大的價值,但相比于龐大的數據規模,其價值密度卻是非常稀疏的,可謂是“浪里淘沙、彌足珍貴”。例如,公安視頻監控系統需要7×24小時的記錄,但用于犯罪證據獲取的也許只是短短數秒;對于零售產業的推薦系統,也只有通過海量數據的分析,才能進行較為精準的預測。
    第四,大數據需要實時的記錄與響應,如動態的股價、路況信息以及電子商務的交易數據等,都需要實時的調用和處理,才能夠充分體現出數據的價值所在。此外,社會化媒體、社交網站中的關系數據成為了大數據的價值倍增器,這是因為人們已經不可避免地鑲嵌于人際關系網絡中,個體的影響力會經由社交網絡快速蔓延。
    不久前,作為全球最大零售商的沃爾瑪也充分意識到了關系數據的重要性,在其社交基因組(Social Genome)計劃中整合了用戶在Facebook、Twitter中的關系數據,用以更精準地推測消費者的偏好。 綜上所述,大數據的基本特征可以概括為規?;╒olume)、多樣性(Variety)、高價值(Value)、速度快(Velocity)以及社會化(Social)等五個特點,即“4V 1S”的特點。這樣的大數據浪潮,也深刻的影響了各個傳統行業的發展軌跡,變革一觸即發。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢