熱線電話:13121318867

登錄
首頁精彩閱讀大數據分析最佳實踐案例分享
大數據分析最佳實踐案例分享
2016-02-08
收藏

大數據分析最佳實踐案例分享

以前,人們對于數據的認識不夠深,不懂得如何運用大數據技術,隨著互聯網飛速的發展,人們對于大量大數據分析有著深刻的認知,各行各業對數據分析師人才更加重視。

TDWI九月中旬發布的最佳實踐報告正是調查大數據的分析狀況。

今 年年初翻譯了TDWI關于操作型數據倉庫的最佳實踐報告,對他們這種最佳實踐報告的套路已經比較熟悉。一般來說是:一下 定義;二看現狀;三分長短;四談趨勢;最后還有個廠商介紹。這種報告多少還是有點商業利益的影子在里面,所以,后來覺得做此類翻譯沒什么意思。還是自己看 原文吧。

同樣,這份報告一開始也是定義了big data這個術語。顧名思義,大數據就是數據量很大吧!不僅僅是,報告總結了3V,翻譯過來,可以說是“量類時”,volume、variety、 velocity。不光是有大數據量,TB級以上甚至PB級,還有講究數據類型的多樣性,不光是結構化數據,非結構化數據文本語音,皆出大數據。不光是量 大、類型多樣,還有時效,已經不光是批量倒入,還有準實時、實時甚至是數據流了。
 
要知道,big data其實只是一個概念,是新環境下,新人群對舊事物的一種稱呼。咱們BI人其實也就是扯大旗,拉虎皮。內涵,還是那些東西,ETL、專題分析、可視化、數據挖掘。只不過,這個詞的出現意味著BI的理念稍稍普及了而已。

在調查中,很多企業其實或多或少在這個名頭下做分析的事情,專題分析,這是我們通常的叫法,或者叫advanced analytics。這是最常見的分析——給定一個業務問題(比如學生市場如何細分),用數據給出回答。不過要注意,其實專題分析(或advanced analytics)并非一個嚴格的術語,不像OLAP那樣,有維度啊,度量啊之類的概念限制,專題分析似乎只是遵循一種模式而已,問題-數據分析-解 答。而至于如何分析,并沒有要求,所以,只要符合這種模式的分析,不論是使用何種分析方法,幾乎都可以說是專題分析,你無法去跟一個分析師說,你只是用了 excel的旋轉透視表做分析,就不能叫專題分析。

所以,大概也是因為這個術語的模糊性,導 致對分析師能力要求不夠具體。從報告來看,可以看到目前大數據分析的最 大短板就在于人員的分析技能。這點在我們身邊確實比比皆是。比如我們客戶那兒,早先我們了解到每個地市公司都有自己的分析團隊,每個團隊大概也就是一兩個 人吧。我們曾經問省公司,他們是否要進行日常的專題分析?回答說當然會做,而且做得快得很。后來去了解,確實也在做,大概一星期一個,主要就是接領導的需 要,分析一下這個,分析一下那個,主要工具用excel,透視一下,作圖,貼到ppt里面完成。至于分析的深度,確實,在如此的時間內,對深度也不好意思 要求了吧,大體上是用數據呈現一下現狀而已。那時我們才知道,雖然我們大家都在說專題分析,可對這個東西的要求并不完全一致,我們的分析團隊對此有更嚴格 的要求。這種要求可能是“必須有業務發現”。

不過這種要求顯然也難以衡量,什么叫業務發現?這是對結論的要求,可對過程的要求呢?問題以何種形式定義;分析邏輯如何編排;采用什么樣的分析方法,配備什么形式什么周期的數據。這些可能都需要做要求。

當我們仍然使用專題分析、高級分析這類術語時,就必定仍然在模糊分析工作。未來,也許會有一天,會有一個新的術語,新的具備更清晰概念內涵的術語,來替代它們。

在四談趨勢環節,列舉了很多跟大數據分析相關的技術,報告用一個二位矩陣來表示這些技術的應用度和潛力。橫軸是應用潛力,縱軸是應用度(越大當然就是指現在實際用得多的)?;痉殖闪怂膫€群體。
1、應用但沒啥潛力的:如olap、手寫sql、統計分析、數據分析集市;
2、應用不少,有點潛力的:如數據挖掘、數據庫內分析、分析數據庫、DWA、私云、分析沙盒;
3、應用不多,但很有潛力的:如MapReduce、Hadoop、No-SQL數據庫、SaaS…
4、極具潛力應用也不錯的:如專題分析(高級分析)、高級分析可視化、預測分析、實時儀表盤、文本挖掘、內存內分析、可視化分析
 
看,基本上只有第3群對BI來說是新東西,嗯,其實也沒多新。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢