熱線電話:13121318867

登錄
首頁職業發展Hadoop之父Doug Cutting:Lucene到Hadoop的開源之路
Hadoop之父Doug Cutting:Lucene到Hadoop的開源之路
2014-11-25
收藏

Hadoop之父Doug Cutting:Lucene到Hadoop的開源之路

Doug Cutting,憑借自己對工作的熱情和腳踏實地的態度,開創了Lucene和Nutch兩個成功的開源搜索引擎項目,同時也是當下人氣大數據計算框架Hadoop的創立者。Doug于1985年畢業于美國斯坦福大學,首個在Xerox的實習工作奠定了他日后研究搜索引擎項目以及成功的基礎。1997年底,Doug通過Lucene這個首個提供了全文文本搜索的開源函數庫實現了理論到實踐的巨大突破。在此基礎上,Doug相繼實現了Nutch 、Hadoop。為了自身夢想的實現,Doug先后就職于Architext和Yahoo!等企業,直至2009年出任Cloudera的首席架構師。

Lucene&Nutch

Lucene是第一個提供全文文本搜索的函數庫,提供了一個簡單而強大的應用程序接口,是一個高性能、可伸縮的信息搜索庫。作為一個成熟免費的開源項目,Lucene在Java信息檢索程序庫中得到了廣泛的歡迎。開發者不僅能利用它構建具體的全文檢索應用,同時還能將其集成到各種系統軟件中,它提供的很多API函數都能運用到各種實際應用程序中。

Nutch則是Doug在Lucene基礎上將開源思想繼續深化的成果,是一個真正的應用程序,它是建立在Lucene核心之上的Web搜索的實現,其目的旨在減少人們使用過程中的復雜度,并在花費很少的情況下配置世界一流的Web搜索引擎,實現開箱即用的特性。 站內索引和搜索推廣到全球網絡的搜索上,就像Google和雅虎一樣。

Hadoop

Hadoop是Doug基于谷歌MapReduce system開發的一個開源版本,是一種開源的適合大數據的分布式存儲和處理平臺,是當下新時代應用程序開發必備技能之一。Hadoop作為一個能夠讓用戶輕松架構和使用的分布式平臺,具有以下幾個優點:

  • 高可靠性
  • 高擴展性
  • 高效性
  • 高容錯性
  • 低成本

Hadoop從最初應用的那一刻起就表現的異常出眾,大大提高了網頁搜索的速度。Doug的目標是將Hadoop發展成云計算領域的RedHat??v觀當下該計算框架所受到的關注度,Hadoop的成功已完全超脫了Doug的想象。

Doug可以說是云計算和大數據領域的傳奇人物,他將高深莫測的搜索技術神奇般的變成了產品。然而,他的成功秘訣卻并不神秘——對工作的熱情和工作時的認真踏實。然而,正是這眾所周知的品質成就了他的成功,也讓幾乎所有的人都直接或間接的使用過他作品。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢