熱線電話:13121318867

登錄
首頁精彩閱讀存儲之于大數據分析
存儲之于大數據分析
2018-01-23
收藏

存儲之于大數據分析

目前市場上有兩種類型的大數據分析方式--同步的和異步的,兩種都有各自在存儲容量和特性上的要求。
    近來大數據分析這個詞正逐漸成為IT界流行的一個術語,以代指有關大數據本身的猜想,通俗說來即成堆數據背后問題的答案。然而,如果我們能夠從足夠的數據點入手比對及交叉分析,或許能幫助我們找到一些有用的數據,甚至可能幫助避免災難。
    問題是顯而易見的,所有的分析都需要大量甚至海量的數據,這便給當今的IT管理人員帶來了更新的挑戰,即如何捕獲、存取、以及分析這些數據并將從中得到的分析用于后續任務的執行?

   大數據分析應用通常會使用例如網絡流量、金融交易記錄以及敏感數據來替代傳統形式的內容。數據本身的價值在于數據間的比對、關聯或者引用。對大數據的分析通常會意味著與大量的小數據對象打交道,而這些小數據對象往往對響應延時要求非常之高。
    當前業界主要有兩種大數據分析場景,而它們通常是根據數據處理的形式而區分:
    在實時使用場景下,響應效率是最為關鍵的 ,因此大數據存儲架構本身的設計需要滿足最小延時的功能。
    同步,即實時的或者近乎于實時的;另外一種就是異步的方式,這種方式下,數據首先會被獲取,記錄下來然后再用批處理進程進行分析。
   同步分析
    可以想到的近乎于實時的大數據分析的最早的例子就是超級市場里的工作人員是如何統計消費者行為習慣以便于提供相應的優惠促銷券的。事實上是,消費者購買行為計算很可能在用戶收銀前就已經完成,但是概念本身是非常類似的。另外一個相關的例子是在線社交網站可以通過訪問用戶的行為建立屬于他們的行為數據庫,這樣就可以根據各自不同的消費習慣提供不同的點對點廣告植入。
    在零售行業,一些大型商鋪正開始在停車場對前來購物的消費者使用面部識別技術,這樣一旦他們路過或者經過對應的商鋪與之相應的促銷信息便隨之而來。因此,在這樣一類的實時大數據分析場景中,速度是第一要素,故而大數據存儲架構需要建設成為低延時的場景。

大數據分析逐漸在IT行業成為了一個熱門的話題,越來越多的企業相信它將引領企業走向成功。然而任何事情都有兩個方面。這件事情上來看,就是現有存儲技術本身。傳統存儲系統不管是在需要極低延時響應、實時大數據應用或者還是面對海量數據倉儲的數據挖掘應用的時候都會遇到瓶頸。為了保證大數據分析業務能正常運行,相應的存儲系統需要足夠快,可擴展并且性價比有優勢。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢