熱線電話:13121318867

登錄
首頁職業發展數據庫技術大牛Michael Stonebraker談新時代應用底層
數據庫技術大牛Michael Stonebraker談新時代應用底層
2014-11-18
收藏

數據庫技術大牛Michael Stonebraker談新時代應用底層

Michael Stonebraker,數據庫領域的布道者,著名的數據庫科學家,美國工程院院士,馮諾依曼獎的獲得者,第一屆SIGMOD Edgar F. Codd創新獎的得主,曾擔任Informix CTO。他在1992年提出對象關系數據庫模型,在加州伯克利分校任計算機教授達25年,更是眾多數據庫公司的創始人之一,其中包括Ingres、Illustra、Cohera、StreamBase Systems和Vertica等,目前是麻省理工學院教授,所參與的項目包括:Aurora,C-Store,H-Store,Morpheus,以及SciDB系統等。

Stonebraker是SQL Server/Sysbase奠基人,87年左右,Sybase聯合了微軟,共同開發SQL Server。原始代碼的來源與Ingres有些淵源。后來1994年,兩家公司合作終止。此時,兩家公司都擁有一套完全相同的SQLServer代碼。也可以認為,Stonebraker教授是目前主流數據庫的奠基人。

2014年12月12-14日北京召開的2014中國大數據技術大會(暨第二屆CCF大數據學術會議)正在邀請數據庫領域的布道者Michael Stonebraker,希望能有機會帶大家領略大數據時代數據庫領域的最前沿思想。

數據庫領域的布道者Michael Stonebraker 

2012年,他發現一個有趣的現象:相當一部分計算機學團體已重新制定了其研究課題,并加盟到了“大數據”大旗麾下,發覺大數據已然成為最時髦的術語。他結合自己在數據庫(根據定義,數據庫就是處理大數據的)領域侵淫多年,特撰寫了四篇博文來解釋他對“大數據”的理解。

他對大數據有如下四種含義:

大數據量、“小分析學”。此處的目標是對極大量的數據集使用SQL。對大數據集,沒有人會用“Select *”來查詢因為其返回太子節(terabyte)的數據使接收者無法應付。替代方案,則是對海量數據把注意力放在SQL的分析功能上,如count、sum、max、min、avg等,可輔之以group_by。我將此稱作“小分析學”,以便把這個用例(use case)區別于下面的場合。

對大量數據使用大分析學?!按蠓治鰧W”在此的含義是:對海量數據施用數據聚類(clustering)、回歸分析、機器學習、以及其他更為復雜的分析手段。目前,用戶傾向于采用統計學軟件包如R、SPSS、SAS等來實現。其他方案是使用線性代數軟件包,例如:ScalaPack或Arpack。最后,也有大量自行開發的代碼在使用中。

大速度。其含義是:對電子交易、實時網頁廣告投放、實時客戶針對營銷、移動社交網絡等應用,能夠吸收并處理“滅火水龍帶”式的數據涌入。此用例在大型網站公司和華爾街盛行,二者都傾向于自行開發。

大多樣性。許多企業面臨整合日益擴大的多種數據源,而數據格式千差萬別,例如:電子表格、網頁、XML、傳統的關系型數據庫等。許多企業認為這是最頭疼的問題。從歷史上來說,萃取、轉置、加載(ETL)供應商在此市場上對有限的數據源曾提供服務。

他第一篇博文中專門討論了大量數據的小分析學,爾后的三篇博文將運用實例論及其他三點,感興趣的可以到Stonebraker的博客查看。(原文鏈接: 一、 二、 三、 四) 

去年底,Stonebraker還參加了一期 Structure Show,談論自己對數據庫市場的觀點,包括NoSQL和Oracle的未來,當然還有Facebook的MySQL問題。若使用或研究數據庫技術的人想聽整個訪談,請點擊 這里。以下是一些精華摘要: 

1. 單一模式不能包打天下:“任何我可以想到的垂直市場,相比傳統的關系型數據庫系統,總會有一些更合適的解決方案?!盨tonebraker 如是說。事實上,這是他一貫的主張。但今時今日這一主張看起來更有說服力了?,F在有用于數據分析的列存儲架構,用于交易的內存架構,當然也有用于簡單的鍵值操作及新數據類型的NoSQL架構。甚至圖形數據庫都開始步入商用。 

2. 數據庫領域可以有很多贏家:“將有3到5個,甚至6個非常不同的數據庫系統架構成為贏家,而在每一類下都會有2到3個成功的供應商?!盨tonebraker預測:“我的核心觀點是,傳統的關系型數據庫系統將慢慢收縮,這一切轉變也許需要十年?!?nbsp;

3. NoSQL會被廣泛接受:“我的預測是NoSQL將意味著不止SQL?!盨tonebraker說,“Cassandra和MongoDB已經宣布了類似這樣的東西,如果你放下你的偏見,那么這種高級語言基本上就是SQL?!比藗円呀洸荒敲纯春脝渭兊牡讓诱Z言的價值。Stonebraker認為NoSQL系統將來也要擁抱ACID。而這一切可能正在發生。 

4. Oracle將感受到來自SAP的壓力:“我覺得另一個非常有趣的事是SAP在數據庫領域還沒有得到很多關注,現在SAP的客戶同時也是Oracle最大的客戶?!盨tonebraker說:“在這些巨頭中,Oracle和SAP會好好地干上一架?!?

現在說這個可能有點早了,我們也不知道SAP的客戶將如何回應切換數據庫的游說。不過Stonebraker補充說:“我的預期是,SAP會給客戶一個信服的理由,讓他們從Oracle遷移到HANA?!?

5. Facebook會繼續尋找MySQL的替代品,不過可能勞而無功:“Facebook面對的是這個星球上最難的數據管理問題之一?!盨tonebraker說?!八麄兓藬的甑臅r間嘗試從MySQL遷移到別的系統,但是到目前為止還沒有發現可以匹配他們規模的替代品?!?nbsp; 

相比幾年前的觀點,Stonebraker現在的主張已經有所緩和??赡苓@是因為Facebook分享了他們在MySQL上做的一些努力,包括為了維持MySQL系統的運行所作的精妙的配置。然而這一緩和,與其說是對MySQL的支持,不如說是對Facebook的數據庫改造的認同。 

最后,Stonebraker的總結一如既往的幽默:“傳統的數據庫銷售商提供的產品,它們的代碼基礎和25年前一樣,現在正讓它們退休的時候了。(文章來自:CDA數據分析師)

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢