
大數據系統與關系型數據的共存
大數據在2011年嶄露頭角,2012年一飛沖天,它可能會以一種戲劇性的方式改變數據管理的很多方面。大數據系統給管理和操縱計算機數據、連續提取、轉換和加載功能、運作商業智能、動態大數據以及基于云的數據倉庫等等都帶來了變化。
不過,隨著大數據進入2013年,已經沒有什么系統技術能比NoSQL數據庫和Hadoop框架更活躍了,看起來這兩款產品還有更大的發展空間。根據MarketAnalysis.com 2012年的一份報告看,單單是Hadoop-MapReduce市場,預計復合年增長率將達到58%,在2018年將達到22億美元。
NoSQL和Hadoop的出現主要是為應對非結構化數據的,比如文本數據或者web日志。就像Apache Hadoop一樣,這些技術通常是從開源起步,逐漸成為新的商業產品。
Judith Hurwitz是Hurwitz and Associates公司的總裁兼CEO,該公司位于美國馬薩諸塞州,她認為大數據架構和大規模并行處理大大改變了數據景象。她說:在此之前,即便數據真的對公司很重要,人們也沒有能力獲取巨大數據量并進行實時分析。
她認為:現在,不現實的東西正變得實用。這種情況已經把數據帶出了舒適區。
SQL受創,即將回擊
我們可以在網站上看到,2012年伊始,對主流關系型數據庫陷入困境的預測就出現了。部分預言已成為現實。SQL關系型數據庫在與未來幾年可能成為其替代品的產品經過一系列斗爭之后,現在(或者很快)似乎面臨著關于處理整個企業大數據量過濾的最為劇烈的競爭。
這一趨勢背后的推動力是企業對以更快的速率獲取更多非結構化數據的渴望,這樣企業才能更加依靠數據驅動做出決策。慣用的處理方式正在改變,以適應最好的新技術。
這些來自2012年特定數據管理供應商的舉動展現出大數據和Hadoop對關系型數據沖擊的現狀:
IBM公司還在繼續創立小型數據和分析公司,盡管比2011年少了些。藍色巨人的努力方向從小的改進(比如,針對DB2 10的NoSQL圖形庫和InfoSphere Warehouse 10)到非常巨大的PureData系統裝置,目的都是為了給企業搞定大數據。
甲骨文公司在年初推出了大數據設備。這一發布是緊跟著Oracle NoSQL數據庫2.0之后發布的,Oracle NoSQL數據庫2.0已經自動實現重新平衡,新的應用編程接口可以處理大型對象,與Oracle數據庫有更緊密的集成,支持直接用SQL查詢Oracle NoSQL數據庫記錄。
微軟公司展示了Hadoop對Windows Azure和Windows Server支持的預覽;Teradata公司發布了其Aster大數據分析產品;而Informatica公司發布了PowerCenter套件的大數據版,據說消除了Hadoop手工編碼的需求,并把編程任務帶入了Informatica開發環境。
SQL在2012年可能只有一兩次回擊,但是它積極應對市場挑戰的舉動有重要意義。在非主流NoSQL和Hadoop方面比較專業的公司更新了他們去年的SQL認證。一個典型的例子是Hadoop創立了Cloudera公司,該公司期望增強SQL與Impala的協作程度(Impala是一款Hadoop軟件產品,支持標準SQL做交互式查詢)。
大數據的變動
這樣的舉動可能代表了一定的勢頭人們看到SQL和NoSQL一起被提及的機會更多了。在某種程度上,SQL在早期大數據喧鬧的討論中有點被淡化了。
Ronnie Beggs是美國舊金山SQLstream公司的副總裁,該公司是一家流媒體數據庫制造商。他說:在過去的幾年里,由于大數據運動,SQL已經不再掛在每個人的嘴邊了。同時,他還說:大數據和NoSQL雙劍合璧,已經沖擊到了主流。
他還表示,在2013年,我們應該會看到明顯的變化,并提到近幾年在使NoSQL數據庫更好地適應SQL風格的開發方面所作出的各種努力。
Beggs說:它是不斷變化的。我們接下來這一年會看到SQL的回歸,它將成為所有大數據平臺的接口。
這種發展走向了Hadoop框架、NoSQL和SQL方法的共存,這標志著在大數據的成熟度方面邁出了新的一步。2013年,大數據有可能從一個熱門話題變為切實的實踐。
Colin White是美國俄勒岡州Ashland BI研究機構的總裁和創始人,他說:我認為人們正努力通過大數據的炒作,來真正理解業務價值。在2013年,我認為我們將看到人們從大數據中獲得業務價值的優秀案例。問題不在于大數據本身,而在于你的運用。
雖然企業對新技術有著廣泛的興趣,但不是所有公司都會以同樣的程度全面部署大數據系統。關于這一點,在最近TechTarget舉辦的一次重點銀行會議上,一位集成服務經理也有所提及。
他認為銀行業只有部分涉足了基本的大數據,而不是全部。銀行和其它領域只看到了大數據的數量,而沒有留意到它的非結構性。至少目前還是這樣。
他談到:大數據的含義有兩部分。第一部分是它們的量很大,第二部分是數據為非結構化。銀行明顯屬于第一部分。但是我們不會去收集tweets,至少目前還沒有。我們還在觀望,等待金融數據服務市場的應對。(文章來自:CDA數據分析師)
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25