熱線電話:13121318867

登錄
首頁職業發展大數據時代下是數據思維重要,還是相應技術重要
大數據時代下是數據思維重要,還是相應技術重要
2017-10-20
收藏

大數據時代下是數據思維重要,還是相應技術重要

技術做到一定程度,逐步發現自己的瓶頸。不由得開始思考這一方面的問題!到底大數據時代下,是相應的數據分析技術重要,還是相應數據思維重要?

先來說數據思維吧!什么是大數據思維,個人感覺應該是互聯網思維的一種。是考慮到全面,而不是局部。是考慮到多維,而不是單一維度。不是靠拍腦門做決定,而是讓數據說話,用數據做決策。

先說第一點,考慮全面,而不是局部。眾所周知,移動互聯網催生了大數據的產生。每一個人每一天通過手機能夠的數據總和會是一個巨大的量。而通過這些非結構化的數據,我們首先面對的是如何處理這些數據,這里就涉及到數據的存儲,讀取的問題。由于數據的非結構化。傳統的處理技術將不能夠很好的起到作用。不是我們單一抽取幾個用戶的數據加以統計就可以預測出大量用戶的行為。這里需要的全局的數據。首先,這一點是大數據相對于其他技術的第一點不同。

再來說第二點,考慮多維,而不是單一維度。大家都有目共睹,現在的廣告已經開始基于我們的瀏覽時長而進行二次推薦。而在進行多維分析后,將不再只關注用戶的瀏覽數據,而相應的會有用戶的文本信息,好友評論,已購買產品信息,用卡頻次.....當將用戶數據進行多個維度的整合分析后,就可以做到精準營銷。從而打破傳統一維營銷的被動宣傳不叫好的特點。

最后再看第三點,讓數據說話,用數據做決策。在這里不得不提一個軟件R,傳統行業的業務統計大部分是靠它完成,但他的數據呈現有一點的局限。當我們將一些數據以圖表的形式展現在領導面前時,我們就可以根據這些數據做新一年的年度規劃。而不至于拍腦門做決定。而且現在數據可視化的應用也是非常的多,現實的應用也展現了相應的價值。

說完了上面三點,再來說一說大數據技術。

首先必提的是Hadoop,這樣一個分布式的存儲現在已經在大部分企業應用,而它的分布式存儲又將用戶的讀取時間縮短。而下一代技術Spark,也就相當于從Hadoop的硬盤存放,轉而到了內存存放。眾所周知,內存的讀取速度會比硬盤快許多倍。

其次再要說的就是SAS與R,這兩個軟件都有各自的優勢,SAS做為專業數據統計的軟件,可以說在大數據量時處理起來有顯著的優點。但在超過1T數據量的情況下,它的優勢就不再那么明顯。而R軟件在繪圖上有很大的優勢,在數據可視化上有很重要的地位。但無奈,R軟件在統計上略遜色SAS一籌。而與SAS的同類軟件中,SPSS個人感覺在數據量小時會有很大的用途。

還有就是數據獲取,RCurl與相應的爬蟲技術,而在大數據時期,各網站在反爬蟲方面勢必會做要應的措施從而保護自身已有的數據。

還有就是ETL,這一點,個人感覺以后會在大數據落在時起到非常重要的地位。因為國內的數據大部分都需要清洗,就像我導師說過的一句話,在中國做大數據,最大的困難就是如何識別出假數據。用真實的數據才能分析出我們所要得到的結果。

好了,到此為止,以上就是自己學習到的大數據知識,分別在思維跟技術方面的認識。但問題又回來了,對于企業來講,盈利是最基本的選擇,到底是選一個具備大數據思維的人還是一個會很多大數據技術的人?而對于自己來說,下一步的方向是繼續學習技術,還是掌握相應的思維。

思維OR技術,或左或右?或都兩都需要融合,但話題又回來了,工作是很現實的問題,售前,咨詢,研發,架構,實施,工程.......到底該如何選擇,抑或就不要選擇,先靜下心來學習,等到在職的學習畢業后再去選擇工作。

面對轉行,從通信培訓行業向互聯網行業大數據的轉變,雖然不知前方道路如何,仍有些迷茫,但既然選擇前方,便只顧風雨兼程,加油!


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢