熱線電話:13121318867

登錄
首頁職業發展數據準備是大數據分析的無名英雄 _數據分析師?
數據準備是大數據分析的無名英雄 _數據分析師?
2015-03-10
收藏

數據準備是大數據分析的無名英雄 _數據分析師


隨著企業花越來越多的時間來分析數據,清理和準備數據的解決方案將會變得更有價值

   現在大數據[注]是熱門話題,你在任何地方與任何人交談很難不提到大數據。事實上,大數據的術語有點被過度使用,它對不同的人意味著不同的東西,但所有這些定義都有一個共同點,那就是數據!

   上面我們說大數據依賴于商業智能數據,這似乎很明顯,但大數據分析的成功需要的不僅僅是原始數據,還需要好的高質量數據。所以,更準確的說法應該是,大數據的成功需要準備好的數據。對于分析,有句古老的格言,“進來是垃圾,出去也是垃圾”,這意味著如果你把大量參差不齊的數據放到分析解決方案,你將會得到不好的結果。

   數據的清理和準備歷來都是漫長的艱巨的耗時的過程。當筆者還在Yankee Group公司時,他們遷移CRM系統,在遷移工作之前,該公司花了一年時間來清理現有系統中的記錄數據,以確保不會遷移不好的數據。雖然他們做了這么多工作,仍然有很多不良信息被遷移過去。

   最近,筆者看到一家被稱為Paxata的公司,該公司提供的解決方案可以進行所謂的“自助服務自適應數據準備”。在分析或運營報告工作之前,該技術可以整合、清理和形成數據。市面上很多現有的商業智能產品聲稱可以簡化分析過程,但事實是,大多數數據科學家和數據分析師花費大量時間來為分析準備數據。鑒于此,筆者認為,大多數企業寧愿聘請高薪人才找出數據的含義(+微信關注網絡世界),而不是清理數據。

   Paxata提供數據整個生命周期的準備,包括探索、清理、更換、形成和發布數據以進行分析。該產品還允許不同的數據團隊共享相同的數據集,讓不同的團隊可以同時編輯和訪問多個設備的信息。該產品還是一個管理解決方案,它會追蹤項目內的每個步驟,并有完全的重放功能來審查已經完成的更改。

   Paxata的用戶可以提高對大型數據集的分析生產率,同時最小化數據蔓延的危險。該數據分析軟件既可作為云服務—確保數據準備的靈活性,也可以作為內部部署的解決方案,它可以整合到Hadoop以更快獲取價值。

   正如上文所述,大數據分析現在是一個熱門話題,但企業和IT領導者需要明白,分析糟糕的數據意味著糟糕的分析結果,可能會造成錯誤的商業決策。正因為如此,筆者希望看到數據準備技術會開始像大數據一樣熱門。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢