
IT時代:看大數據潛力如何
大數據不僅僅是一個營銷詞匯,在這篇干貨滿滿的文章里,作者用數據告訴我們,究竟什么是大數據,大數據行業的創業機會如何,未來的創業方向又有哪些。
接觸大數據,了解這個行業已經有兩年多了,每天都在閱讀大量的關于大數據的文獻資料和技術文章。如果你要問我什么是大數據?以前可能我會和你說,大數據是一種思維,一種技術,標志的是大數據的4V特點:
Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。大數據帶來的是一種變革,打破了原有的隨機分析(抽樣調查)方法,采用所有全量的數據來進行分析,分析的數據更加復雜,有結構化數據、半結構化數據和非結構化數據,分析結構更加注重相關性而不是因果。
可是,普通人和大眾用戶他們聽得懂嗎?現在我會舉例子告訴你。
比如說,采野蘑菇/野山參這樣的事情,野蘑菇和野山參的分布地點都是隨機的,經驗告訴我,它們會分布在哪片山林,但是我們不知道具體位置,得一個一個的找。大數據可以解決這個難題。
我們可以把山林用數據可視化表現出來,然后讓采野蘑菇的人根據自己的實戰經驗標出蘑菇分布的地點,并且把這些地點數據常年積累起來。然后結合野蘑菇的習性,收集每片山林的降雨量、灌木叢分布數據、土壤數據、溫度數據以及山林里采蘑菇的人流量數據等等,來準確的預測出野蘑菇的分布地點。
這就是大數據力量。
一言以蔽之,大數據最直接的意義就是讓“隨機性”的事情變得可提前預測,從而提高效率和行動價值。
同樣的思路,森林防火防賊、環境保護、旅游景點客流預測等等,都可以引入大數據思維。大數據同時也可以為我們工作、學習和生活中一些重大決策作為依據。
今天主要說的是大數據領域的創業思考,大數據只有和生活、學習、工作以及商業等場景結合才能產生價值。推動技術發展的從來都不是技術本身,而是消費者(用戶)的需求。用戶不需要知道也沒興趣知道你處理大數據是用Hadoop還是Spark、原理是什么、架構是什么,用戶最關心的是大數據到底怎么用,用了能為自己帶來什么好處。
今天我們將從“外部大環境”、“行業內部環境”、“創業風險”和“大數據創業機會和方向”四個點來闡述主題,聰明的朋友也許已經知道了,我們的思路就是大數據領域創業的SWOT分析。
大數據市場現狀(外部環境)
根據貴陽大數據交易所5月28日發布的《2015年中國大數據交易白皮書》顯示:2014年中國大數據市場規模達到767億元,同比增長27.83%。預計到2020年,中國大數據產業市場規模將達到8228.81億元。
一、大數據市場規模巨大
首先,中國大數據市場環比增長率較大。根據易觀智庫7月30號發布的中國大數據應用行業的報告顯示,2015-2018年中國大數據市場營銷規模達到258.6億人民幣。環比增長率為37.2%。
其次,大數據在全球范圍內的市場規模同樣巨大,根據IDC發布最新研究結果,預測到2018年全球大數據技術和服務市場的2018年的復合年增長率將達到26.4%,規模達到415億美元,是整個IT市場增幅的6倍。
無論是從國內還全球的市場規模和增長率來看,我們都可以得出這樣一個結論,無論你是什么樣的公司,或者說你未來創業要做什么樣的服務,大數據都是兵家必爭之地。大數據本身就是一種無形的資產,如果你的公司還沒有部署大數據,那么在未來的市場上會失去核心競爭力。就好比你走在中關村創業大街上,你能收到的100份融資BP里,可能有99份都是APP和O2O項目,但99家里90%以上會重視大數據。
二、政策好,政府支持力度大
根據gov.cn 9月6日消息,國務院公開發布《國務院關于印發促進大數據發展行動綱要的通知》,綱要里明確的說明,中國將在2018年會建成政府的大數據平臺。相比之下,我們敬愛的習大大和李克強總理也經常為大數據站臺,為中國的大數據發展點贊??凑畬Υ髷祿闹匾?,你抬頭看看前兩天的北京的藍天,就會對政府有信心了。政府真正要干一件事,執行力大的超出你的預期。
據我們的觀察,大數據領域的創業環境只會越來越好。目前,很多一線城市乃至二三線城市的科技園區,都出臺了相關的扶持大數據產業的政策。如果你真的想在這個行業創業,可選擇扶持力度大、人才較多的城市作為大本營,當然了,北京肯定是首選。
三、資本關注熱
上圖是我們對大數據垂直領域2015年資本投資事件的不完全統計。其實你仔細來看圖會發現,大數據行業的資本關注熱度是遠遠高于其他行業的。這個可以從投資金額可以看出來。今年上半年O2O項目非常熱,也是投資重點關注的行業,但是投資的資本里,普遍都是人民幣幾百萬和幾千萬這樣的量級。而大數據行業的投資,更多的資本量級都是上億的,而且資本多源于頂級投資機構。
大數據行業現狀(內部環境)
“大數據就像十幾歲少年眼中的性行為,每個人都在談論它,但沒人真正知道怎么做。每個人都以為除了自己之外的每個人都在使用它,所以每個人都裝作自己很了解它?!?
TED的創始人Dan Ariely是這樣調侃大數據的。雖然是句玩笑話,但也確實說出了大數據的行業現狀。
現狀一、市場尚未飽和,競爭并不激烈
1、尚未出現壟斷性行業巨頭
前面我們分析了大數據整個大環境的狀況,我們知道大數據行業市場潛力巨大,未來的增長率將達37%左右。但是在中國,目前尚未出現一家如Palantir、FICO這樣的壟斷性質的大數據企業。也許百分點和Talkingdata都在布局上市,但是距離掛牌還有一段時間和距離。新創的大數據企業中,還沒有一家在美股、港股和深交所上市。
這是一個機會。創業你做電子商務也好,做游戲也好,都有好幾家有錢有用戶的巨頭公司和你爭搶市場份額,但是大數據行業不一樣,大數據行業沒有那么大的競爭壓力,而且真正的戰爭尚未開始。
2、現有大數據企業扎推北京
根據數據堂統計的數據來看,新創的大數據企業中,57%的公司都在北京,上海占了15%的份額。大數據需要和實際的業務場景結合才能產生價值,工業、農業、制造、交通和能源等傳統行業仍然擁有巨大的潛力,北上廣深和二三線城市的大數據力量還沒有完全被挖掘出來,這同樣也是一個優勢。
3、大數據在生活、商業滲透性較弱
筆者做大數據兩年了,天天都聽到或看到大數據的各種消息,但是生活并沒有因為大數據的到來變得更智能一些。它沒有讓大齡光棍女青年更快更精準的找到結婚對象,也沒用讓隔壁老王炒股賺到更多的錢,更沒有讓北京的交通不再擁堵……大數據有用是不假,但是和生活場景結合得還是較弱。并沒有看到可以稱之為“變革”的現象。
4、沒有直接的變現模式
互聯網上最賺錢的兩大行業分別是電子商務和網絡游戲,這兩個行業的變現模式都是非常清晰和直接的,但是大數據的變現模式需要繞一個彎子,需要和實際業務場景結合起來才能產生價值,不直接的路定然不好走。
有人曾經把大數據比作石油,可是,目前的情況看來,大數據行業還需要像發動機一樣可以將數據轉化成動力的載體。一如2010年以前一樣,大家都知道手機游戲是未來的一個趨勢,可是沒有iPhone等智能移動設備的出現,手機游戲的市場份額就非常小,用戶體量也很有限。
現狀二、大數據行業人才緊缺
根據中國商業聯合會數據分析專業委員會統計,未來中國基礎性數據分析人才缺口將達到1400萬,而在BAT企業招聘的職位里,60%以上都在招大數據人才。2015年-2016年是大數據人才最為匱乏的兩年,因為已開了大數據專業的高等院校,第一批大數據人才還為畢業;已有的人才里,復合型的人才較少,都是術有專攻。
全球的大數據人才情況也不容樂觀,據Gartner預測,到2016年,25%的全球大型企業將部署大數據分析系統;到2015年,圈球大數據人才需求將達到440萬人;調查結果表明,全球64%的企業已經開始向大數據項目注資,或者打算在2015年6月之前將計劃付諸實踐。
大數據創業,人才就是核心,所有的公司都在搶大數據人才,創業公司想要招到相應的大數據人才非常困難。
現狀三、數據量增長超快
這里和大家分享三個數字。49億、250億和39ZB。
49億物聯網設備:咨詢公司Gartner預測今明兩年互聯物品的漲幅將達30%。分析師在指出,截止到2015年,全球物聯網設備數量將從38億飆升至49億。
250億智能裝置傳感器:分析師預測,傳感器的普及將大大加速智能設備的開發、生產進度。到2020年,將會有大約250億部智能裝置出現在全球市場。
39ZB數據存儲量:在2014年年底,國內網絡上集中存儲的數據已經達到1ZB,到2020年時,當年的新增數據量將會達到15.45ZB,整體的網絡上數據存儲量將會達到39ZB,未來6年的年復合增長率達到了84%。
預測到2020年,平均每個中國人每年產生的數據約為4.1GB。
現狀四:行業目前存在問題
1、炒作過剩,實際落地產品較少;很多產品都是打擦邊球;把大數據玩壞了?,F在你和大家說大數據,很多人都認為你在騙人。行業想要持續穩定的發展,企業必須有自律。
2、群眾基礎差,關注的人群多為三高人才,高學歷高收入和高技術。從百度指數可以看出,關注大數據的人群中,53%比例的人群年齡分布為30-39歲,而20-29歲人群占的比例為28%;另外,關注大數據的男女比例里,男性占到了80%以上。這樣的數字直接告訴我們的問題就是,“大數據”的話題傳播性其實并不好。預計超過90%的大眾用戶不知道大數據是個什么東西。
3、大數據只解決了部分2B的問題,2C產品較少?,F在大家都覺得大數據的方向就是2B,我們不這么認為。打個比方說,你做2B的產品,每家企業平均給你200萬,新創大數據企業你撐死了一年做上20家企業,那么營收預計在4000萬左右。但是如果你做2C的大數據產品,一個用戶給你200塊,當你做到20萬付費用戶的時候,你的營收就會超過4000萬。為什么呢,因為用戶的數據本身就是錢。從深遠的角度來說,未來的創業,你必須學會討好大眾,服務好90后,這才是種子用戶。
4、懂技術的人不懂業務,懂業務的人不懂商業。這一點不想做詳細的說明,打擊面太廣了。筆者參加了眾多大數據行業內的峰會大會小會,人人都在說大數據,可是問到你的業務如何賺錢的時候,很多人都是三緘其口。純技術是無法賺錢的,必須和實際的業務結合起來產生商業價值,才能獲益。
5、市面上存在的大數據工具上手門檻較高。又一個槽點出來了。前面也說了,任何的新技術,都是需求推動其發展。需求來自用戶。任何的新技術,只有擁抱大眾用戶才能得到更好的發展,接地氣非常重要?,F有的大數據處理工具非常復雜,需要你懂這個那個會這個那個才能使用,大眾根本接觸不到?,F有的大數據工具也不夠親民,無論是2B也好,2C也好,你需要給別人的是一個簡單動動手就能用的工具,里面有功能按鈕,而不是一堆代碼,最起碼應該滿足目前Office工作人員使用。上手門檻較高意味著很大一部分用戶被你擋在了門外。將大數據處理工具產品化勢在必行。
大數據行業創業的風險預警
一、大數據的創業門檻
1、人才成本較高;在美國,在R、NoSQL和MapReduce方面需求的專業人才薪水達到了每年約11萬5千美元,在中國,大數據人才一將難求,創業公司不容易招大數據技術人才,即使招到,人才方面支出也較高。包括高薪、期權和股票等等;
2、存儲硬件成本高;考慮到數據歸屬和安全性。大數據公司一般不會數據存在云上。自建機房比云存儲成本高很多倍。
3、項目啟動資金高;不是30-50十萬就可以玩起來的,比移動互聯網APP創業項目啟動資金要求高。
4、用戶少、獲取成本高。這一點的門檻主要是群眾基礎差帶來的。
沒有明確的商業變現模式,這是目前大數據創業的最大門檻。拼數據,你拼不過阿里百度騰訊,拼錢,還是算了……
二、數據安全問題
據Verizon發布的《2015年數據泄露調查報告》顯示,79790個安全事件中已有2122個確認的數據泄露。值得關注的是在2015年的報告中新增了一個統計模型,用以幫助企業評估到底每筆數據泄露,要損失多少錢。如果泄露1000條記錄時,有95%的可能會損失5.2萬-8.7萬。泄露1千萬數據記錄的花費介于210萬到520萬之間,但最多可能到7390萬。
讓我們來回顧一下近年來數據泄漏的事件:2014年5月,800萬小米用戶數據或被泄露;2014年12月,12306大量用戶信息遭泄露;2015年4月,超30省市曝管理漏洞數千萬社保用戶信息或泄露;2015年5月,攜程網全面癱瘓疑似數據庫物理刪除;2015年6月,美國人事管理局(OPM)被指出大量工作人員信息泄露;2015年8月,婚外情網站AshleyMadison數據遭泄露……
對于大數據新創企業來說,數據的安全性就是“命”,如何保命事關生存。大數據的安全性,是部署大數據架構和大數據創業最大的挑戰之一!
三、大數據隱私
關于大數據隱私,在美國有隱私法案,而且美國與歐盟之間還簽署了安全港、隱私聲明等等。而在中國,目前的立法是非常模糊的,屬于灰色地帶。手機號碼被惡意第三方收集了,然后給用戶發了很多垃圾短信,或者我的姓名,我的電話,我的郵箱,他們收集我的信息是不是合法的,目前這一點在在立法上都不清晰。不知道未來國家會不會出臺相關的法律法規來規范這個領域?大數據隱私目前具有不確定因素,也是創業存在的風險之一。
說完了風險,下面我們可以來說說大數據行業的創業方向和機會。
大數據行業創業機會與方向
一、資本層面關注點
對于大數據項目,投資人到底看什么?在寫這篇文章之前,我們與多家投行的投資人曾經做過訪談,下面是我們根據訪談內容整理出來的內容。
大數據沒有直截了當的變現模式,那么一個新創大數據企業想要獲得成功,拿什么去拼?當然是人才。這也是投資人最關注的東西。
投資人告訴筆者,對于一個大數據項目,他們最看重的是團隊。那怎么看團隊呢?一般從團隊技術能力、背景、過往項目經驗和創始人四個方面來看。大數據對技術的要求非常高,投資人看項目的時候,首先看的就是創始人的技術能力。一般情況下,投資者會更加青睞擁有技術背景的創始人和他的項目。
還有就是看項目的商業模式和變現能力??错椖糠矫?,投資人會去看你的項目對應的國外成熟企業,或者說你的項目對應的競爭者是誰。由競爭者經營的情況來預估你在其領域的市場份額和變現能力。商業模式方面,投資者會看你的客戶(用戶)體量和數據源。你的客戶群體有多大?你手里有哪些具體業務上的數據?這些數據如何產生價值,應用到你的客戶身上?解決好這3個問題就成功了一半。
大數據項目變現方向,投資人關注的是你的項目是否能夠快速直接的產生價值,而且有持續的創收能力。
解決好以上幾個問題,新創大數據公司想要拿到融資就非常容易了。
二、大數據垂直領域熱門的投資方向
第一個是Hadoop商業化,簡單來說就是做Hadoop的收費版本。Hadoop本來是開源的,但是在具體業務場景中,還缺乏很多功能,那么Hadoop商業化就是去完善這些功能,使其更好的應用于企業的業務場景。Hadoop商業化最典型的公司就是Hadoop的三駕馬車,Hortonworks,Cloudera和MapR,Hortonworks目前已經在納斯達克上市。中國相應的做Hadoop商業化的公司是星環科技。
第二個是SQLonHadoop,用大白話來說就是基于應用場景下的數據框架。比如說大數據架構里的查詢引擎、存儲引擎、計算模型等等,這個主要是基于大數據技術方向的,比如說WibiData,它提供了對Hadoop的封裝,連接前端應用到Hadoop基礎設施。
第三個是NoSQL數據庫,非關系型數據庫和云數據庫服務。典型的國外企業有MongoDB和Datastax。目前,創業公司MongoDB的估值已超過16億美元,而在中國,基礎云服務商青云QingCloud已經推出了基于MongoDB的集群服務,名字叫做青云QingCloudMongoDB。
第四個是分析和可視化。對應的國外企業有Tableau、Datameer。國內新創的大數據企業中,也有很多大數據企業在做可視化服務,比如說國云數據的大數據魔鏡。
第五個是行業大數據應用。為社交媒體、廣告公司、企業客戶、電子商務等行業客戶提供數據分析,幫助這些行業提升數據分析的水平,如DataSift、RelateIQ、RocketFuel等創業公司。
三、大數據行業現有的商業模式
談到商業模式,肯定就要說到2B還2C的問題。
2B是目前大數據行業主要的商業模式,將大數據變為一種服務,服務的對象是企業或機構。比如現有的大數據企業里,星圖數據,Hortonworks,Cloudera,星環科技、Talkingdata都是2B的商業模式。從他們的運營狀況,不難看出,2B的商業模式,要么是做解決方案(類似外包),要么就是做工具。
預計未來所有的互聯網企業也好,傳統企業也好,都會在企業內部成立大數據部門,那么到那個時候,解決方案的市場份額還會多么?不肯到也不否定。對于一家企業來說,大數據就是自己的資產,相信企業更傾向于自己管理自己的內部資產。所以我們大膽的預測,解決方案只是目前大數據行業的權宜之計,未來企業會用自己的人才管理自己的大數據,用自己的人才使用自己的大數據。做工具是目前較為主流的模式。Palantir其實也是做工具。
2C方面,在整理這份內容的時候,我們發現2C的產品非常少。女性經期助手、百度指數這樣勉強算是2C的大數據產品。而大數據2C方面的產品,更多的是傾向于應用??纱┐髟O備其實也算是大數據應用產品之一。
說了這么多,你肯定會問我了,那么騰訊、百度和阿里巴巴這樣的企業,他們的大數據又是什么樣的模式呢?在筆者看來,BAT企業的大數據商業模式都是2C+2B的模式,我們可以簡稱為復合型的商業模式,因為他們服務的用戶有企業用戶也有個人用戶。
總結一下,現有的商業模式里,哪個最好?筆者個人認為是2B+2C模式。這樣的模式是最健康的模式,形成了一個商業閉環。
用一句話來說就是:你收集用戶的數據,分析出報告,然后給到的對應的企業,對應的企業根據數據反饋,從而開發或制造出更好的產品,讓用戶享受更智能更美好的生活。這整個過程中,大數據是貫穿始終的。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25