
Michael Stonebraker,數據庫領域的布道者,著名的數據庫科學家,美國工程院院士,馮諾依曼獎的獲得者,第一屆SIGMOD Edgar F. Codd創新獎的得主,曾擔任Informix CTO。他在1992年提出對象關系數據庫模型,在加州伯克利分校任計算機教授達25年,更是眾多數據庫公司的創始人之一,其中包括Ingres、Illustra、Cohera、StreamBase Systems和Vertica等,目前是麻省理工學院教授,所參與的項目包括:Aurora,C-Store,H-Store,Morpheus,以及SciDB系統等。
Stonebraker是SQL Server/Sysbase奠基人,87年左右,Sybase聯合了微軟,共同開發SQL Server。原始代碼的來源與Ingres有些淵源。后來1994年,兩家公司合作終止。此時,兩家公司都擁有一套完全相同的SQLServer代碼。也可以認為,Stonebraker教授是目前主流數據庫的奠基人。
2014年12月12-14日北京召開的2014中國大數據技術大會(暨第二屆CCF大數據學術會議)正在邀請數據庫領域的布道者Michael Stonebraker,希望能有機會帶大家領略大數據時代數據庫領域的最前沿思想。
數據庫領域的布道者Michael Stonebraker
2012年,他發現一個有趣的現象:相當一部分計算機學團體已重新制定了其研究課題,并加盟到了“大數據”大旗麾下,發覺大數據已然成為最時髦的術語。他結合自己在數據庫(根據定義,數據庫就是處理大數據的)領域侵淫多年,特撰寫了四篇博文來解釋他對“大數據”的理解。
他對大數據有如下四種含義:
大數據量、“小分析學”。此處的目標是對極大量的數據集使用SQL。對大數據集,沒有人會用“Select *”來查詢因為其返回太子節(terabyte)的數據使接收者無法應付。替代方案,則是對海量數據把注意力放在SQL的分析功能上,如count、sum、max、min、avg等,可輔之以group_by。我將此稱作“小分析學”,以便把這個用例(use case)區別于下面的場合。
對大量數據使用大分析學?!按蠓治鰧W”在此的含義是:對海量數據施用數據聚類(clustering)、回歸分析、機器學習、以及其他更為復雜的分析手段。目前,用戶傾向于采用統計學軟件包如R、SPSS、SAS等來實現。其他方案是使用線性代數軟件包,例如:ScalaPack或Arpack。最后,也有大量自行開發的代碼在使用中。
大速度。其含義是:對電子交易、實時網頁廣告投放、實時客戶針對營銷、移動社交網絡等應用,能夠吸收并處理“滅火水龍帶”式的數據涌入。此用例在大型網站公司和華爾街盛行,二者都傾向于自行開發。
大多樣性。許多企業面臨整合日益擴大的多種數據源,而數據格式千差萬別,例如:電子表格、網頁、XML、傳統的關系型數據庫等。許多企業認為這是最頭疼的問題。從歷史上來說,萃取、轉置、加載(ETL)供應商在此市場上對有限的數據源曾提供服務。
他第一篇博文中專門討論了大量數據的小分析學,爾后的三篇博文將運用實例論及其他三點,感興趣的可以到Stonebraker的博客查看。(原文鏈接: 一、 二、 三、 四)
去年底,Stonebraker還參加了一期 Structure Show,談論自己對數據庫市場的觀點,包括NoSQL和Oracle的未來,當然還有Facebook的MySQL問題。若使用或研究數據庫技術的人想聽整個訪談,請點擊 這里。以下是一些精華摘要:
1. 單一模式不能包打天下:“任何我可以想到的垂直市場,相比傳統的關系型數據庫系統,總會有一些更合適的解決方案?!盨tonebraker 如是說。事實上,這是他一貫的主張。但今時今日這一主張看起來更有說服力了?,F在有用于數據分析的列存儲架構,用于交易的內存架構,當然也有用于簡單的鍵值操作及新數據類型的NoSQL架構。甚至圖形數據庫都開始步入商用。
2. 數據庫領域可以有很多贏家:“將有3到5個,甚至6個非常不同的數據庫系統架構成為贏家,而在每一類下都會有2到3個成功的供應商?!盨tonebraker預測:“我的核心觀點是,傳統的關系型數據庫系統將慢慢收縮,這一切轉變也許需要十年?!?nbsp;
3. NoSQL會被廣泛接受:“我的預測是NoSQL將意味著不止SQL?!盨tonebraker說,“Cassandra和MongoDB已經宣布了類似這樣的東西,如果你放下你的偏見,那么這種高級語言基本上就是SQL?!比藗円呀洸荒敲纯春脝渭兊牡讓诱Z言的價值。Stonebraker認為NoSQL系統將來也要擁抱ACID。而這一切可能正在發生。
4. Oracle將感受到來自SAP的壓力:“我覺得另一個非常有趣的事是SAP在數據庫領域還沒有得到很多關注,現在SAP的客戶同時也是Oracle最大的客戶?!盨tonebraker說:“在這些巨頭中,Oracle和SAP會好好地干上一架?!?
現在說這個可能有點早了,我們也不知道SAP的客戶將如何回應切換數據庫的游說。不過Stonebraker補充說:“我的預期是,SAP會給客戶一個信服的理由,讓他們從Oracle遷移到HANA?!?
5. Facebook會繼續尋找MySQL的替代品,不過可能勞而無功:“Facebook面對的是這個星球上最難的數據管理問題之一?!盨tonebraker說?!八麄兓藬的甑臅r間嘗試從MySQL遷移到別的系統,但是到目前為止還沒有發現可以匹配他們規模的替代品?!?nbsp;
相比幾年前的觀點,Stonebraker現在的主張已經有所緩和??赡苓@是因為Facebook分享了他們在MySQL上做的一些努力,包括為了維持MySQL系統的運行所作的精妙的配置。然而這一緩和,與其說是對MySQL的支持,不如說是對Facebook的數據庫改造的認同。
最后,Stonebraker的總結一如既往的幽默:“傳統的數據庫銷售商提供的產品,它們的代碼基礎和25年前一樣,現在正讓它們退休的時候了。(文章來自:CDA數據分析師)
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25