熱線電話:13121318867

登錄
首頁大數據時代Hadoop是什么意思,有哪些作用?
Hadoop是什么意思,有哪些作用?
2020-07-07
收藏

Hadoop是一種分析和處理大數據的軟件平臺,是Appach的一個用Java語言所實現的開源軟件的加框,可編寫和運行分布式應用處理大規模數據,是專為離線和大規模數據分析而設計的,對那種對幾個記錄隨機讀寫的在線事務處理模式并不適合。

Hadoop的框架最核心的設計就是:HDFS和MapReduce.HDFS為海量的數據提供了存儲,則MapReduce為海量的數據提供了計算.大數據在Hadoop處理的流程是:數據是通過了Hadoop的集群處理后得到的結果。

HDFS(Hadoop Distributed File System,Hadoop分布式文件系統),它是一個高度容錯性的系統,適合部署在廉價的機器上。HDFS能提供高吞吐量的數據訪問,適合那些有著超大數據集(large data set)的應用程序。

MapReduce是一套從海量源數據提取分析元素最后返回結果集的編程模型,將文件分布式存儲到硬盤是第一步,而從海量數據中提取分析我們需要的內容就是MapReduce做的事了。

在現實的應用中Hadoop非常適合應用于大數據存儲和大數據分析的應用,適合于服務器幾千臺到幾萬臺的集群運行,支持PB級的存儲容量。這是傳統數據庫不能超越的一點也是最有優勢的一點。

Hadoop作用

大數據存儲:分布式存儲

日志處理:擅長日志分析

ETL:數據抽取到oracle、mysql、DB2、mongdb及主流數據庫

機器學習: 比如Apache Mahout項目

搜索引擎:Hadoop + lucene實現

數據挖掘:目前比較流行的廣告推薦,個性化廣告推薦

Hadoop是專為離線和大規模數據分析而設計的,并不適合那種對幾個記錄隨機讀寫的在線事務處理模式。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢