熱線電話:13121318867

登錄
首頁精彩閱讀大數據從科幻變成現實
大數據從科幻變成現實
2016-09-09
收藏

大數據從科幻變成現實

美國當代著名小說家艾薩克·阿西莫夫(Isaac Asimov)曾憑借系列科幻小說《基地》(Foundation)獲得雨果獎,在書中,主人公哈里·謝頓(Hari Seldon)是一位數學和統計學天才,開辟了一個跨領域的學科——把統計學、社會學和心理學結合在一起創立了“心理歷史學”(psychohistory)。利用心理歷史學,哈里·謝頓能夠用宇宙級的“大數據”分析預知世界文明的未來。

《基地》的最后一部——第14冊《基地與地球》——出版于1986年,在27年后的今天,“心理歷史學”不再是科學幻想,而這都是拜“大數據”所賜。
大公司的大數據轉變
就在最后一部《基地》小說出版的九年之后,世界上有了“雅虎”這個域名,十年之后,拉里·佩奇和謝爾蓋·布林在斯坦福大學開始了他們的研究項目——后來在此基礎上成立了谷歌。雅虎和谷歌的初衷都是想為索引和搜索大量的數據找到快速的解決方案,正因為如此,直到今日,它們仍然是、也將繼續是,大數據領域的巨擘。而它們在大數據領域的貢獻大多通過Hadoop平臺實現,該平臺是由道格·卡?。―oug Cutting)和他的團隊開發,毫不夸張地說,他們就是“哈里·謝頓”??ㄍ啄昵?,作為軟件顧問,在雅虎組織開發了Hadoop平臺(Hadoop就是以他兒子的一只大象絨毛玩具命名的)。而Hadoop的靈感則是來自于2004-2006年谷歌研發的文件系統MapReduce,谷歌未曾公開該系統的源代碼,只是就MapReduce發表了幾篇論文,但這就足以讓卡汀開發出解決大規模搜索和索引的軟件平臺。
卡汀現在已經離開雅虎創立了著名的大數據公司Cloudera,并成為其架構師。和卡汀一樣,現在大數據公司的創始人和執行官都是來自于雅虎和谷歌,這兩家公司在大數據領域仍然是最活躍的參與者,雅虎的Hadoop以及谷歌的Big Query和Dremel就是最好的例子。
現在大數據的業務已經從索引和搜索發展到了分析階段,通過Apache(世界最流行的Web服務器端軟件)來運行,這樣大數據就可以從需要專業人員操作的特殊工作轉換成一般性的操作,并可以用于商業目的。
那么是不是要放棄現行的商業智能系統(BI)和數據庫?答案是否定的。仍然可以把現在的數據庫、策略分析、報告和管理控制臺整合進入大數據分析。
事實上,商業智能領域和數據倉庫的老牌供應商,比如IBM、甲骨文(Oracle)、賽仕(SAS)和天睿資訊(Teradata)不僅因大數據開始了大量的業務轉變,提供一系列的新產品、新合作方式,也正在招募大數據方面的專家,包括商業分析師、工商管理學博士、存儲方面的專家和數據科學家。同時,收購分析平臺和專業數據庫也是一個不錯的選擇,就像惠普收購了Vertica(該公司的軟件能夠幫助企業分析海量數據),EMC收購了Greenplum(該公司為全球大型企業用戶提供新型企業級數據倉庫和企業級數據云),SAP收購了Hana(Hana是軟硬件結合體,用戶可以直接對大量實時業務數據進行查詢和分析,而不需要對數據進行建模、聚合)。
大數據的新創公司
現在已經有一些新創的大數據公司被風投所看好,Cloudera、MapR和HortonWorks是Hadoop 分布式文件系統管理與服務提供商。原來,只有比較強的軟件開發、數據管理、服務與存儲分析背景的專業人士可以免費下載Hadoop,這些技術的綜合要求和協調性要求都非常高?,F在,一些基于Hadoop的新創公司則將這些技術打包成了一個簡單操作的平臺。
事實上,現在很多老牌的商業智能、數據分析公司都與Cloudera、或者MapT、或者HortonWorks有合作。IBM、戴爾和惠普作為系統提供商也同樣有商業智能、業務分析類產品,所以可以與分布式系統的提供商形成合作關系為用戶提供單一的大數據整體解決方案。
我們認為,大數據領域的新創公司肯定不會止步于基于分布式系統提供的業務。大數據的新創公司未來會在兩個方面有新的突破,一個是數據庫,另外一個是分析的圖像化。在數據庫方面,很多基于開源項目的新型數據庫會為大數據市場提供硬件支持,并提供相關的應用。比如DataStax就提供了一個商業化版本的非關系性的數據庫。CouchBase則提供了另外一個商業版本的交互式軟件記錄系統。也有一些已經開發的很完善的數據庫供應商,比如Versant、Objectivity和InterSystems,能為大數據提供圖像化的分析。也有建立在開源技術基礎上的自主研發產品,VoltDB就利用其內存價格低廉的優勢,為大數據分析提供卓越的表現。
在分析的圖像化方面,我們看到一些新創公司提供端對端的分析方案,利用高精尖的圖形化工具幫助數據分析師和企業用戶找到重要的新觀點、新視角,類似的公司有 Tableau Software、Datameet和Pentaho,雖然還在發展初期,但已在大數據分析的圖像化方面嶄露頭角。這些商業智能公司提供新類型的服務,將大數據分析的技術整體簡化、提供專業的知識,以幫助公司和行業利用大數據來實現公司的價值。
為什么需要大數據
為什么現在要提出“大數據”的概念?如果我是公司的CEO,為什么要關心“大數據”?
回首過去,我們已經經歷了幾輪技術革命帶來的商業轉型:企業資源計劃(ERP)和電腦徹底改變了商業競爭的環境;1990年代,繼互聯網之后,電子商務的興起顛覆了很多行業;Email和社交網絡改變了傳統的營銷渠道……
大數據預示著一場新的革命,將改變現在很多行業相對平衡的競爭關系。那些能夠挖掘、利用大數據,擁有大數據視野的公司將會在下一輪競爭中占據優勢。那些能夠率先揭開大數據謎團的公司,將會依據數據而不是依靠感覺,做出更好的宏觀決策。正如《基地》的主人公哈里·謝頓所說:“‘直覺’這個神奇的詞匯,是無知最好的偽裝?!笨偠灾?,“知識就是力量”這句曠古名言將會因大數據的出現而被遺忘


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢