熱線電話:13121318867

登錄
首頁精彩閱讀大數據分析整體技術流程及架構
大數據分析整體技術流程及架構
2018-03-02
收藏

大數據分析整體技術流程及架構

本文對項目中所用到的大數據分析整體流程技術及其架構進行簡要的總結,以供大家在大數據分析平臺對數據處理流程更加明確

1.1數據處理流程

該項目是一個純粹的數據分析項目,其整體流程基本上就是依據數據的處理流程進行,依此有以下幾個大的步驟:

1) 數據采集

首先,通過頁面嵌入JS代碼的方式獲取用戶訪問行為,并發送到web服務的后臺記錄日志

然后,將各服務器上生成的點擊流日志通過實時或批量的方式匯聚到HDFS文件系統中

當然,一個綜合分析系統,數據源可能不僅包含點擊流數據,還有數據庫中的業務數據(如用戶信息、商品信息、訂單信息等)及對分析有益的外部數據。

2) 數據預處理

通過mapreduce程序對采集到的點擊流數據進行預處理,比如清洗,格式整理,濾除臟數據等

3) 數據入庫

將預處理之后的數據導入到HIVE倉庫中相應的庫和表中

4) 數據分析

項目的核心內容,即根據需求開發ETL分析語句,得出各種統計結果

5) 數據展現

將分析所得數據進行可視化

1.2項目結構

由于本項目是一個純粹數據分析項目,其整體結構亦跟分析流程匹配,并沒有特別復雜的結構,如下圖:

其中,需要強調的是:

系統的數據分析不是一次性的,而是按照一定的時間頻率反復計算,因而整個處理鏈條中的各個環節需要按照一定的先后依賴關系緊密銜接,即涉及到大量任務單元的管理調度,所以,項目中需要添加一個任務調度模塊

1.3數據展現

數據展現的目的是將分析所得的數據進行可視化,以便運營決策人員能更方便地獲取數據,更快更簡單地理解數據

下面是對獨立訪客的數據分析展現示例

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢