熱線電話:13121318867

登錄
首頁職業發展創建大數據公司之前你需知曉5件事
創建大數據公司之前你需知曉5件事
2015-10-23
收藏

創建大數據公司之前你需知曉5件事


大數據現如今如火如荼的在開展,但是成立一個大數據公司也是困難重重。Infochimps的收購讓我想起那些因第二輪融資未實現而關閉的公司。Drawn to Scale,Ravel Data和Nodeable只是被關注的重點而已,但是我堅信還存在更多沒有走進我們視野倒閉的公司。

取代為這些創業失敗的公司惋惜,我更傾向于從那些成功或者倒閉的大數據公司上提取經驗并提供給那些準備開始自己旅程的創始人。下面有很多的解釋,但是簡而言之:明智的選擇好你的戰場,明智的選擇你的客戶,并圍繞你的技術建設一個社區。

1. 基礎設施的困難性

不僅基礎建設工具困難,而且出售它們也同樣的困難。當你在討論諸如Hadoop、NoSQL數據庫和流處理系統等大數據基礎架構工具時可能同樣也是困難重重??蛻艨赡軙枰芏嗟慕逃笇?,而那些付費用戶期望可能得到更多的技術支持和產品開發的細節,從而能及時的解決他們的問題。

通常情況下,這需要很多的資金,同樣也需要在部署和支持這種系統和系統集成方面有經驗的人才。如果你擁有這些資源,那么這將是非常完美。

作為參考,在2010年時,Greenplum在這些基礎設施方面投資了近1億美元,但是它仍然不夠,因此Greenpium被EMC收購。如今最具知名度的大數據公司在初創時都投入了與cloudrea相同或者更多的資金?;A設施初創公司只有幾百萬的種子基金,這使得它們在第一輪融資前會有一個艱難的道路。

但是你仍要去說服許多公司去部署你的產品而忽略它們已經熟知或已具有相當人力和物力的公司產品,諸如Cloudera, Hortonworks, 10gen, Amazon Web Services, IBM, Oracle等公司。

應用程序——無論他們專注于特定工作負載或行業,或像數據可視化一樣適用于廣泛的任務——是很容易的。精心打造它們或許比較困難,但是潛在的客戶可能會馬上 看到它的使用價值,以及對比當下使用工具的優劣。你也可以直接把它銷售到業務線,這樣避免了中間層從而減少更多的摩擦和風險。一旦你開始談論添加或替換關鍵系統,或將敏感數據放到一個新地方,事情可以才能夠真正的快速運轉起來。

2. 云計算是你的朋友

重要的是,無論你是銷售基礎設施還是應用程序,云僅僅是一個更有效的方式來經營你的企業。這并不意味著需要將它交于一個云供應商來托管,但你要把它作為一種云服務來提供給你的客戶。最終,你將對你的產品擁有更多的控制權和更深入的了解,因為它針對了一組特定的資源進行優化。

這意味著沒有進入客戶賬戶并針對現有類型的服務器和系統進行設置??赡苋匀挥幸恍┒ㄖ朴靡赃B接服務與用戶其它類型數據源。然而這樣做并沒有太大的優勢。這也意味著,公司需要將大部分的精力投入到產品開發上。

云計算同樣易于潛在客戶去建立伴生產品,這從New Relic與AWS的關系上不難看出。越容易上手、操作及變現,就越容易證明以后它可以作為一個單獨的項目存在并擴展到更多的場景中使用。

顯然,這不可能在所有的情況下都能行得通,尤其是當你在討論企業所不希望或不能送入云中的軟件和大容量數據。事實上,較大的企業把提供云服務作為一般的傳統軟件給了許多的大數據初創公司很大的壓力。如果有利可圖,這或許是一個明智的決定,但不管怎樣,這絕不能輕視。

3. 開發者是你的伙伴

因此,為開發人員服務。如果你就像 ClearStory Platfora , CRM的任何一員和市場應用做分析業務,那么分析師是你的朋友。無論以哪種方式,對目標客戶而進行的針對性的研發努力和營銷努力或許都會是一個好的主意。CIO看起來并不是一個很好的目標受眾。

我認為有件事Infochimps可以做的更好,如:它推動Wukong和Ironfan技術面向普通的開發用戶。 前者讓你可以像寫Ruby腳本一樣的去編寫Mapreduce和streaming作業。后者是一個Chef工具,可以讓你輕松地配置,部署和管理大數據。

我認為Infochimps和Continuuity所從事的的業務之間不只有一點的共同之處。 但是 Continuuity完全從開發者角度出發,他們在宣傳語中喊出了這一點并且聲稱有更簡單的方法來使用產品。這意味著他們可以在做大交易的同時可以在后臺積累下大量堅實的用戶群。

4. 不要吝嗇去展示你的數據科學家

我認為展示你的數據科學家這是一場營銷運動更是一種銷售手段,但是確實至關重要。數據科學家是一些向人們展示他們數據和他們的平臺有什么可能性的人,同樣數據科學家也是人們在會議上想聽的人。 幾乎所有人都熱衷于Hadoop和NoSQL。也沒有什么必要再去討論Hadoop和NoSQL它們的優點,同樣沒有需要去重復數量、種類等的定義談論配置和系統集成是重要的,但是感興趣的是少數的觀眾,除非你們在談大規模的運作。談論配置和系統集成是重要的,但是感興趣的是少數的觀眾,除非你們在談大規模的運作。Cloudera比它競爭對手獲得更多關注和發言的原因有很多,而其中一個就是Jeff Hammerbacher。不要只是空談去儲存或處理數據和基礎設施—— 能告訴我什么樣的產品,我可以去構建它,什么類型的分析,我可以在其上運行。最起碼,證明你正在更廣的范圍內去思考數據而不是僅僅用最新的方式來賣我東西。

5. 開源不是關鍵,而要把開源變成關鍵

幾乎每一個大數據初創公司都依賴與開源軟件。其中一些初創公司借用像Hadoop、Storm和其它各種類型的數據庫,另外一些則已經創建開源軟件。在很多情況下這兩種情況是相互結合的。比如,為HBase添加一些功能,這些項目之所以會如此人氣,一部分的原因就是因為社區。

我從未試圖去開展一個開源運動,我認為這是一個艱難的工作。但我知道,在Github上放置一段未完成的代碼并置之不顧并不能解決問題。Facebook和谷歌可能會根據喜好隨便發布代碼,但大多數創業公司不應該傲慢的認為他們的開發團隊是最棒的,已經沒有任何東西值得他們學習。

畢竟,開源的目標是讓人們在相同的代碼上致力研究從而去改良它??雌饋砟阌斜匾叱鋈?,發揚這項技術并且解釋它為什么如此的重要,以至于吸引越來越多的人想要去破解它。這一點可能會吸引許多的開發者,但是走免費增值的路線可能會讓更多的人去嘗試使用這個產品,這樣他們就可以看到這種產品是否值得他們去投資。

我無法計算擁有自己開源產品的公司數量,但是那些一直致力于開源和社區建設的公司的確很杰出。我們所說的供應商創業公司如 Neo Technology 、 Concurrent 、10gen甚至是終端用戶公司,如Twitter的養成計劃Storm和Mesos。它們在周圍已經建立了一個開源社區,并且因此它們獲得了豐厚的回報。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢