熱線電話:13121318867

登錄
首頁精彩閱讀大數據系統與關系型數據的共存
大數據系統與關系型數據的共存
2014-11-18
收藏

大數據系統與關系型數據的共存 


      大數據在2011年嶄露頭角,2012年一飛沖天,它可能會以一種戲劇性的方式改變數據管理的很多方面。大數據系統給管理和操縱計算機數據、連續提取、轉換和加載功能、運作商業智能、動態大數據以及基于云的數據倉庫等等都帶來了變化。

  不過,隨著大數據進入2013年,已經沒有什么系統技術能比NoSQL數據庫和Hadoop框架更活躍了,看起來這兩款產品還有更大的發展空間。根據MarketAnalysis.com 2012年的一份報告看,單單是Hadoop-MapReduce市場,預計復合年增長率將達到58%,在2018年將達到22億美元。

  NoSQLHadoop的出現主要是為應對非結構化數據的,比如文本數據或者web日志。就像Apache Hadoop一樣,這些技術通常是從開源起步,逐漸成為新的商業產品。

  Judith Hurwitz是Hurwitz and Associates公司的總裁兼CEO,該公司位于美國馬薩諸塞州,她認為大數據架構和大規模并行處理大大改變了數據景象。她說:在此之前,即便數據真的對公司很重要,人們也沒有能力獲取巨大數據量并進行實時分析。

  她認為:現在,不現實的東西正變得實用。這種情況已經把數據帶出了舒適區。

  SQL受創,即將回擊

  我們可以在網站上看到,2012年伊始,對主流關系型數據庫陷入困境的預測就出現了。部分預言已成為現實。SQL關系型數據庫在與未來幾年可能成為其替代品的產品經過一系列斗爭之后,現在(或者很快)似乎面臨著關于處理整個企業大數據量過濾的最為劇烈的競爭。

  這一趨勢背后的推動力是企業對以更快的速率獲取更多非結構化數據的渴望,這樣企業才能更加依靠數據驅動做出決策。慣用的處理方式正在改變,以適應最好的新技術。

  這些來自2012年特定數據管理供應商的舉動展現出大數據和Hadoop對關系型數據沖擊的現狀:

  IBM公司還在繼續創立小型數據和分析公司,盡管比2011年少了些。藍色巨人的努力方向從小的改進(比如,針對DB2 10的NoSQL圖形庫和InfoSphere Warehouse 10)到非常巨大的PureData系統裝置,目的都是為了給企業搞定大數據。

  甲骨文公司在年初推出了大數據設備。這一發布是緊跟著Oracle NoSQL數據庫2.0之后發布的,Oracle NoSQL數據庫2.0已經自動實現重新平衡,新的應用編程接口可以處理大型對象,與Oracle數據庫有更緊密的集成,支持直接用SQL查詢Oracle NoSQL數據庫記錄。

  微軟公司展示了Hadoop對Windows Azure和Windows Server支持的預覽;Teradata公司發布了其Aster大數據分析產品;而Informatica公司發布了PowerCenter套件的大數據版,據說消除了Hadoop手工編碼的需求,并把編程任務帶入了Informatica開發環境。

  SQL在2012年可能只有一兩次回擊,但是它積極應對市場挑戰的舉動有重要意義。在非主流NoSQLHadoop方面比較專業的公司更新了他們去年的SQL認證。一個典型的例子是Hadoop創立了Cloudera公司,該公司期望增強SQL與Impala的協作程度(Impala是一款Hadoop軟件產品,支持標準SQL做交互式查詢)。

  大數據的變動

  這樣的舉動可能代表了一定的勢頭人們看到SQL和NoSQL一起被提及的機會更多了。在某種程度上,SQL在早期大數據喧鬧的討論中有點被淡化了。

  Ronnie Beggs是美國舊金山SQLstream公司的副總裁,該公司是一家流媒體數據庫制造商。他說:在過去的幾年里,由于大數據運動,SQL已經不再掛在每個人的嘴邊了。同時,他還說:大數據和NoSQL雙劍合璧,已經沖擊到了主流。

  他還表示,在2013年,我們應該會看到明顯的變化,并提到近幾年在使NoSQL數據庫更好地適應SQL風格的開發方面所作出的各種努力。

  Beggs說:它是不斷變化的。我們接下來這一年會看到SQL的回歸,它將成為所有大數據平臺的接口。

  這種發展走向了Hadoop框架、NoSQLSQL方法的共存,這標志著在大數據的成熟度方面邁出了新的一步。2013年,大數據有可能從一個熱門話題變為切實的實踐。

  Colin White是美國俄勒岡州Ashland BI研究機構的總裁和創始人,他說:我認為人們正努力通過大數據的炒作,來真正理解業務價值。在2013年,我認為我們將看到人們從大數據中獲得業務價值的優秀案例。問題不在于大數據本身,而在于你的運用。

  雖然企業對新技術有著廣泛的興趣,但不是所有公司都會以同樣的程度全面部署大數據系統。關于這一點,在最近TechTarget舉辦的一次重點銀行會議上,一位集成服務經理也有所提及。

  他認為銀行業只有部分涉足了基本的大數據,而不是全部。銀行和其它領域只看到了大數據的數量,而沒有留意到它的非結構性。至少目前還是這樣。

  他談到:大數據的含義有兩部分。第一部分是它們的量很大,第二部分是數據為非結構化。銀行明顯屬于第一部分。但是我們不會去收集tweets,至少目前還沒有。我們還在觀望,等待金融數據服務市場的應對。(文章來自:CDA數據分析師)

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢