熱線電話:13121318867

登錄
首頁精彩閱讀大數據分析的10個實用竅門!
大數據分析的10個實用竅門!
2016-08-24
收藏

大數據分析的10個實用竅門!

如果你的公司正著手開啟你的大數據分析之旅,不要煩惱:你不是一個人,這條船上大有人在。但是你需要加倍努力才能趕上數據分析的領頭羊們。這篇文章是從行業大會的討論中總結出來的十個小竅門。


1避免華而不實

現在企業可以從傳感器、智能手機中獲取比以前多得多的數據,但相應的做出成果的壓力也就更大了。陷入熱潮特別是一些閃亮的新技術宣傳熱潮是很容易的。但是靠大數據技術真正獲得成功卻不是易事,僅僅掌握某項技能是不足以讓成功一蹴而就的。今天的大數據領導者們已經在數據分析行業工作長達十年甚至更久,他們有成功的基礎。

2不要盲目崇拜數據

據說數據已成為一種新“貨幣”并展現了自身價值。這樣說可能有點夸大其詞。數據公司應該只收集其需要的數據來解決業務問題即可,而不是像一頭貪婪嗜財的巨龍一樣大量囤積數據。

麥肯錫消費市場分析中心的首席營運官Matt Ariker說“數據本身能夠成為一種競爭優勢,當然你也可能讓分析毫無意義。我已經老了,我在寶潔公司開始分析師生涯。那時我們會花費12周來分析兩周的促銷活動。你真的很需要思考這樣幾個問題:那些高質量的問題究竟是什么意思,你該如何來整合結構化和非結構化數據以及整理總結你的流程化分析問題的方法。否則你將一無所獲。

3首先考慮商業案例

一些公司在數據分析之初,會收集所有能到手的數據,然后全部放入自己的數據池中,妄想可以有一種有魔力的算法讓自己一鍵獲得業務解決方案。但是他們往往難以有所收獲。

Bodkin說“人們往往有這樣的誤解:數據科學家們的工作就是在周一到辦公室之后說‘我又可以無所限制地做些什么有趣的事呢?’而據我所知,沒有什么公司會拿出巨額預算進行無限制的數據探索。(他們會參考一些已有商業案例)”

4形成數據分析文化

你可以在最純凈的數據集上用最優秀的算法來創造出驚艷的結論,但那毫無意義,除非你的業務伙伴相信你所做的數據分析具有價值,并且相信那些數據和結論。這需要你建立一種數據分析文化。

Teradata實驗室主席Oliver Ratzenberger說:“如果你分析那些領先的數據分析競爭者們就會發現,他們花費了過去的10到15年時間來形成自己的數據分析文化。有些公司曾說過自己將在接下來的90年里完成在數據分析項目上從‘爬行’到‘疾跑’的蛻變。這和技術無關,這是在說他們數據分析文化的形成?!?/span>

5快速失敗積累出最終的成功

數據科學是一個往復循環的過程。在你成功把數據變成有價值的結論并實施他們之前,你總會經歷各種各樣的失敗。最近的許多大數據領域的突破性進展,例如Apache Spark都是專注于加速這個過程。

但是大數據從業者不應該為了失敗而失敗,故意陷入這個失敗嘗試的循環過程。麥肯錫的Ariker說:“你可以進行多項測試,失敗的現實僅僅預示著你會更快的失敗。你所有的靈活的數據分析過程都是基于公司支持和假設驅動的。你的失敗是為了改進數據分析過程并獲得更好的結論,而不是不顧結果地去享受數據分析的過程。

6保證最高管理層在數據分析的一環

和管理層分享你的數據分析的成果是必要的,不僅是為了確保他們不會插手你以后的數據分析項目,也是為了保證你在分析管理層關注的問題 。

寶潔公司領導人,商業智能和數據分析領導者David Dittmann在最近的CAO峰會上說:“我們學到的一點是,你必須一直給管理層展現數據價值。而如果你一直缺席管理層的業務討論會,我想你的工作會出現方向性的根本錯誤?!?/span>

7管理很無聊卻是必要的

沒有什么比一場有關數據分析進程和改變管理方式的討論更讓人犯困了。但是在這樣一個快節奏的大數據時代,處理好所有部分不僅僅是細節問題,它更是長期成功的基石。

能夠在30天里對一件事保持敏銳是很重要的。Teradata的Ratzenberger說:“但是你需要有能夠這么做的基礎。包括產品系列,錯誤處理和版本控制的集成管理是必要的。有些部分在開始的30或90天里是起作用的,但是你還需要保持其在隨后依然有效。你有一副好牌在手,就需要你好好把握,一旦你出錯一張,隨之而來的可能就是滿盤皆輸?!?/span>

8保持全程思考

你可能有一個最好的預測模型。但是,除非它可以在現實世界中有效并且有較好的效益,否則它將毫無價值,只是對公司時間和資源的浪費。

麥肯錫的Ariker說:“如果你跑去對經理說‘好消息,我們的大數據平臺可以生產很多數據產品,但是我需要再雇1500個人’,那估計你第二天得找份新工作了。你必須一直思考流程化數據處理和效益的平衡,并確保你在研究一個高質量問題的同時考慮好答案?!?/span>

9積少成多

在大數據領域,一氣呵成地處理所有問題聽上去是異常誘人的。你想要依據眾多變量來建模解決業務問題,所以你去收集了有關各個業務的眾多數據,然而你的算法卻在剔除合適的結論。想法是美好的,結果卻不盡如人意。

肯尼索州立大學的應用統計和數據科學教授Jennifer Lewis Priestley講了一個故事:有個數學專業的學生建立了一個極好而又極差的模型,這個模型有非常高的準確率,但是產生了2500個預測器?!斑@毫無意義。你不可能去操作2500個預測器。所以我讓那個學生去篩選出四個我可以實際使用的預測器”她在2015SAS數據分析大會上說。

10不要去獵取“獨角獸”

精通統計學、科技和商業的數據科學家們被稱作“獨角獸”,因為他們是如此的稀有(事實上并不存在獨角獸,因為他們是神話生物,但那是另外的故事了)。

盡管這樣的數據科學家確實存在,但這不值得你浪費時間去挖他們來你的公司。ThinkBig的Bodkin說:“我所有的客戶都在嘗試著挖人。但是你無法從一個人身上就得到想要的價值,你只能從一個團隊——一個高效的數據科學團隊得到你想要的數據分析結果?!?/span>


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢