
創建大數據公司之前你需知曉5件事
大數據現如今如火如荼的在開展,但是成立一個大數據公司也是困難重重。Infochimps的收購讓我想起那些因第二輪融資未實現而關閉的公司。Drawn to Scale,Ravel Data和Nodeable只是被關注的重點而已,但是我堅信還存在更多沒有走進我們視野倒閉的公司。
取代為這些創業失敗的公司惋惜,我更傾向于從那些成功或者倒閉的大數據公司上提取經驗并提供給那些準備開始自己旅程的創始人。下面有很多的解釋,但是簡而言之:明智的選擇好你的戰場,明智的選擇你的客戶,并圍繞你的技術建設一個社區。
1. 基礎設施的困難性
不僅基礎建設工具困難,而且出售它們也同樣的困難。當你在討論諸如Hadoop、NoSQL數據庫和流處理系統等大數據基礎架構工具時可能同樣也是困難重重??蛻艨赡軙枰芏嗟慕逃笇?,而那些付費用戶期望可能得到更多的技術支持和產品開發的細節,從而能及時的解決他們的問題。
通常情況下,這需要很多的資金,同樣也需要在部署和支持這種系統和系統集成方面有經驗的人才。如果你擁有這些資源,那么這將是非常完美。
作為參考,在2010年時,Greenplum在這些基礎設施方面投資了近1億美元,但是它仍然不夠,因此Greenpium被EMC收購。如今最具知名度的大數據公司在初創時都投入了與cloudrea相同或者更多的資金?;A設施初創公司只有幾百萬的種子基金,這使得它們在第一輪融資前會有一個艱難的道路。
但是你仍要去說服許多公司去部署你的產品而忽略它們已經熟知或已具有相當人力和物力的公司產品,諸如Cloudera, Hortonworks, 10gen, Amazon Web Services, IBM, Oracle等公司。
應用程序——無論他們專注于特定工作負載或行業,或像數據可視化一樣適用于廣泛的任務——是很容易的。精心打造它們或許比較困難,但是潛在的客戶可能會馬上 看到它的使用價值,以及對比當下使用工具的優劣。你也可以直接把它銷售到業務線,這樣避免了中間層從而減少更多的摩擦和風險。一旦你開始談論添加或替換關鍵系統,或將敏感數據放到一個新地方,事情可以才能夠真正的快速運轉起來。
2. 云計算是你的朋友
重要的是,無論你是銷售基礎設施還是應用程序,云僅僅是一個更有效的方式來經營你的企業。這并不意味著需要將它交于一個云供應商來托管,但你要把它作為一種云服務來提供給你的客戶。最終,你將對你的產品擁有更多的控制權和更深入的了解,因為它針對了一組特定的資源進行優化。
這意味著沒有進入客戶賬戶并針對現有類型的服務器和系統進行設置??赡苋匀挥幸恍┒ㄖ朴靡赃B接服務與用戶其它類型數據源。然而這樣做并沒有太大的優勢。這也意味著,公司需要將大部分的精力投入到產品開發上。
云計算同樣易于潛在客戶去建立伴生產品,這從New Relic與AWS的關系上不難看出。越容易上手、操作及變現,就越容易證明以后它可以作為一個單獨的項目存在并擴展到更多的場景中使用。
顯然,這不可能在所有的情況下都能行得通,尤其是當你在討論企業所不希望或不能送入云中的軟件和大容量數據。事實上,較大的企業把提供云服務作為一般的傳統軟件給了許多的大數據初創公司很大的壓力。如果有利可圖,這或許是一個明智的決定,但不管怎樣,這絕不能輕視。
3. 開發者是你的伙伴
因此,為開發人員服務。如果你就像 ClearStory , Platfora , CRM的任何一員和市場應用做分析業務,那么分析師是你的朋友。無論以哪種方式,對目標客戶而進行的針對性的研發努力和營銷努力或許都會是一個好的主意。CIO看起來并不是一個很好的目標受眾。
我認為有件事Infochimps可以做的更好,如:它推動Wukong和Ironfan技術面向普通的開發用戶。 前者讓你可以像寫Ruby腳本一樣的去編寫Mapreduce和streaming作業。后者是一個Chef工具,可以讓你輕松地配置,部署和管理大數據。
我認為Infochimps和Continuuity所從事的的業務之間不只有一點的共同之處。 但是 Continuuity完全從開發者角度出發,他們在宣傳語中喊出了這一點并且聲稱有更簡單的方法來使用產品。這意味著他們可以在做大交易的同時可以在后臺積累下大量堅實的用戶群。
4. 不要吝嗇去展示你的數據科學家
我認為展示你的數據科學家這是一場營銷運動更是一種銷售手段,但是確實至關重要。數據科學家是一些向人們展示他們數據和他們的平臺有什么可能性的人,同樣數據科學家也是人們在會議上想聽的人。 幾乎所有人都熱衷于Hadoop和NoSQL。也沒有什么必要再去討論Hadoop和NoSQL它們的優點,同樣沒有需要去重復數量、種類等的定義談論配置和系統集成是重要的,但是感興趣的是少數的觀眾,除非你們在談大規模的運作。談論配置和系統集成是重要的,但是感興趣的是少數的觀眾,除非你們在談大規模的運作。Cloudera比它競爭對手獲得更多關注和發言的原因有很多,而其中一個就是Jeff Hammerbacher。不要只是空談去儲存或處理數據和基礎設施—— 能告訴我什么樣的產品,我可以去構建它,什么類型的分析,我可以在其上運行。最起碼,證明你正在更廣的范圍內去思考數據而不是僅僅用最新的方式來賣我東西。
5. 開源不是關鍵,而要把開源變成關鍵
幾乎每一個大數據初創公司都依賴與開源軟件。其中一些初創公司借用像Hadoop、Storm和其它各種類型的數據庫,另外一些則已經創建開源軟件。在很多情況下這兩種情況是相互結合的。比如,為HBase添加一些功能,這些項目之所以會如此人氣,一部分的原因就是因為社區。
我從未試圖去開展一個開源運動,我認為這是一個艱難的工作。但我知道,在Github上放置一段未完成的代碼并置之不顧并不能解決問題。Facebook和谷歌可能會根據喜好隨便發布代碼,但大多數創業公司不應該傲慢的認為他們的開發團隊是最棒的,已經沒有任何東西值得他們學習。
畢竟,開源的目標是讓人們在相同的代碼上致力研究從而去改良它??雌饋砟阌斜匾叱鋈?,發揚這項技術并且解釋它為什么如此的重要,以至于吸引越來越多的人想要去破解它。這一點可能會吸引許多的開發者,但是走免費增值的路線可能會讓更多的人去嘗試使用這個產品,這樣他們就可以看到這種產品是否值得他們去投資。
我無法計算擁有自己開源產品的公司數量,但是那些一直致力于開源和社區建設的公司的確很杰出。我們所說的供應商創業公司如 Neo Technology 、 Concurrent 、10gen甚至是終端用戶公司,如Twitter的養成計劃Storm和Mesos。它們在周圍已經建立了一個開源社區,并且因此它們獲得了豐厚的回報。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25