熱線電話:13121318867

登錄
首頁精彩閱讀大數據分析范圍正變得更寬廣
大數據分析范圍正變得更寬廣
2018-05-01
收藏

大數據分析范圍正變得更寬廣

越來越多的企業都早已超越了開始與大數據和傳統分析打交道的第一階段。他們開始需要形成銳化的見解,企業的營銷人員已經不再滿足于僅僅獲得一線消費者的一般性的統計數據(例如,消費者的住址、年齡分段、性別比例)。他們想要進一步的了解更多能夠誘發消費者的購買行為的復雜的元素——哪怕這些消費行為是他們在觀看球賽轉播時發生的。

    如果IT部門是為了支持這些深層次的分析,那么更多相互關聯的因素的存在便是為了市場上的相關工具,這些工具可以在大數據積累的基礎上在其數據庫中進行定位,所以可以以新的創新方法質疑這些數據。
    到目前為止,ApacheHadoop已經成為一種事實上的非結構化大數據整理排序的標準。Hadoop善于分析多服務器并行處理器大數據的線程,并快速處理這個數據。不過,Hadoop不擅長的是記錄正在處理的數據塊之間的連接關系。換句話說,如果你企業的系統只使用了Hadoop,要得出英國球迷的妻子們往往在她們的丈夫玩游戲時去網上購物的結論則可能需要花費一些時間了。
    針對這種類型的分析,社會化媒體已經開始使用新的工具了。一個典型的例子便是Facebook。某一天,當我登錄到我Facebook的主頁時,我立刻收到了該網站的新的數據庫工具圖片介紹。圖形工具為廣大用戶推出了新的大數據情報,如“點擊此鏈接,尋找同樣在西雅圖喜歡騎自行車的人”、或“點擊此鏈接查看您的朋友最近訪問過的倫敦的餐廳”。事實上,這些非常精準而又高度復雜的大數據似乎發掘出了類似于上文所提到的球迷的妻子在球賽期間瘋狂網上購物之間的聯系。
    為了更好的分析這種大數據間的關系,Facebook使用了HBase,HBase是Apache的另一款產品。HBase使用他們自己獨特定義主鍵的一組設置好的表格。每個表都是一個系列,包含表的主鍵的屬性。例如,如果表的主要關鍵是一個人(例如,“約翰·史密斯”),表列中的關鍵屬性就可能包含興趣愛好(例如,“喜歡騎自行車”)或居住地(例如,“在西雅圖生活”)。HBase可以像Hadoop一樣執行大數據處理產品的能力,以更快、更精細的方式分析不同數據之間的連接類型(以及這可能意味著什么)。
    那么,企業的IT部門要注意什么?
    很簡單,隨著您的企業的大數據分析日趨成熟,你也應該開始尋找新的軟件和數據庫,以便可以解決更復雜的需求。Hadoop是大數據部署的一個很好的開端,但這個過程絕沒有結束。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢