熱線電話:13121318867

登錄
首頁大數據時代大數據分析師培訓學什么
大數據分析師培訓學什么
2024-09-29
收藏

大數據分析師培訓學什么

課程簡介

大數據分析師課程以大數據分析技術為主線,以大數據分析師為培養目標,從數據分析基礎、linux操作系統入門知識學起,系統介紹Hadoop、HDFS、MapReduce、HiveHbase等理論知識和基于Spark平臺的大數據分析機器學習應用,詳細演示Hadoop三種模式的安裝配置,以案例的形式,講解基于PySpark技術的回歸、分類和聚類分析等大數據分析場景和案例。

課程的重點是培養學員基于Hadoop架構的大數據分析實操能力,從零開始學習hadoop搭建,掌握Spark,手把手帶練,8周成為行業急需的大數據分析人才,學完即可滿足CDA LEVEL II大數據分析師考試知識考核需求。講解案例包括但不限于金融大數據分析、氣象大數據分析、Web海量日志大數據分析、智慧高速大數據分析等。

學習目標

學習大綱

01章預習課程

02章大數據前沿應用與開源框架Hadoop

  • 01-01大數據時代前沿與技術
  • 01-02Hadoop生態系統和技術棧
  • 01-03Hadoop單機環境搭建
  • 01-04Hadoop偽分布式集群搭建
  • 01-05Hadoop完全分布式集群搭建
  • 01-06安裝和使用Ubuntu系統
  • 01-07HDFS分布式文件系統介紹
  • 01-08HFDS進行文件讀寫操作
  • 01-09MapReduce編程概念、框架和流程
  • 01-10Hadoop & Yarn知識介紹

03章分布式數據倉庫技術-Hbase/Hive

04章關系型數據庫技術-Mysql理論及實戰

  • 01-01數據庫的概念與技術、創建數據庫
  • 01-02數據表操作、數據類型與約束條件
  • 01-03數據表插入數據與導入外部數據方法
  • 01-04檢查與修改數據表
  • 01-05SQL常用函數介紹
  • 01-06SQL單表查詢與多表查詢
  • 01-07查詢操作符與子查詢
  • 01-07SQL實戰:使用SQL語句處理及查詢電商業務數據

05章分布式計算引擎-Spark入門

  • 01-01Scala語法知識介紹
  • 01-02Scala函數
  • 01-03Scala對象操作
  • 01-04Spark簡介
  • 01-05Spark運行架構
  • 01-06RDD的創建和操作
  • 01-07Spark SQL簡介
  • 01-07臨時表和SQL查詢

06章分布式計算引擎-Spark進階

  • 01-01日志采集系統Flume和分布式消息隊列Kafka入門
  • 01-02流式計算框架Spark Streaming基本原理及使用方法
  • 01-03流式計算框架Structured Streaming基本原理及使用方法
  • 01-04Spark GraphX入門及基本使用方法
  • 01-05分布式算法庫Spark MlLib入門介紹
  • 01-06Spark ML與Spark MLLib
  • 01-07機器學習工作流
  • 01-08機器學習項目-房價預測

07章大數據可視化

08章大數據與Python結合-Pyspark機器學習

09章大數據企業項目案例實做

  • 01-01基于大數據平臺的互聯網金融監管實戰
  • 01-02大數據交通案例
  • 01-03大數據金融案例

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码