熱線電話:13121318867

登錄
首頁精彩閱讀想要成為數據分析師,需要學什么
想要成為數據分析師,需要學什么
2016-10-09
收藏

想要成為數據分析師,需要學什么

我想要成為一名數據分析師,可是數據分析師需要學些什么東西?

數據分析師分布在不同行業中,專門從事行業數據搜集、整理、分析,并依據數據做出行業研究、評估和預測。數據分析師需要敏銳的數字洞察力,因此,統計、會計、保險、工程經濟、金融、數學、計算機等專業的同學對這個行業有明顯優勢,但其他行業的同學如果對這個職業感興趣,通過日常學習,掌握一些統計必備技能,亦可以從事此類工作.

數據分析師主要工作領域:

1、從事投資項目審核審批和招商引資、項目評估、投資決策等工作的政府機構、企業的相關領導以及從業人員。

2、在銀行或非銀行金融機構、投資管理公司、投資管理顧問公司從事風險投資、產業投資、信貸和投資管理等方面工作的專業從業人員。

3、會計師事務所、資產評估事務所及稅務師事務所、律師相關專業人員。

4、學習財務、統計、投資、金融和企業管理等相關專業的在校應屆學生。

5、在企事業單位從事市場調查與宣傳工作的人士以及具有策劃與決策工作職能要求的人士。

6、在不同領域嘗試創業以及在投資、金融、資本運營、房地產和企業管理領域發展的各界人士。

數據分析師的工作內容分為四個層面:

1、處理臨時需求:解決業務一次性,臨時性的數據需求

2、報表開發:根據業務需要,與開發工程師討論進行相關報表開發。

3、數據分析與挖掘:與業務同事一起溝通,分析業務問題,提供建議;根據業務需要建立各類挖掘模型。

4、數據產品化:通過數據產品化方式解決結構化業務問題。

數據分析師的基本要求:

1、懂得建立目標

數據分析是為了解決問題而去分析,不是單純為分析而分析。數據分析是有目的性的。比如:一季度ABC產品的銷售情況,是按月份為橫坐標建立各部門的圖表;各產品線ABC在一季度的銷售情況,是按部門為橫坐標建立對應的圖表。

2、針對不同人群提供不同的結論報告

數據分析要有結論報告,不同的人群報告的側重點不同。比如管理層,看的是趨勢和異常點;營銷人員看的是ROI((Return On Investment)產出比率和高用戶質量的導入情況;業務人員看的是產品對用戶的活躍度等。

3、掌握數據分析工具

如果是互聯網數據分析,可以從google GA入門,EXCEL輔助,了解數據分析的基本算法。至于SAS,SPSS這些高級工具不一定需要。

4、不同時期要有不同的KPI(Key Performance Indicator,關鍵績效指標)

不斷的調整目標和發現問題是數據分析精細化的必經過程。

例如:騰訊的數據分析關鍵指標集不斷調整,從2007年的關注會員基數,到現在的會員活躍度、用戶體驗度、性能度等等。建立對應的模型,幫助產品和項目的同事更好的了解用戶

Q&A如何迅速成長成為一名數據分析師?

如從編程零基礎,知道一些簡單的統計知識的情況下

回答 Terry Meng,Data Scientist

牧心、朱孝軒、春天已經不遠了 等人贊同

從業多年,跨行業,跨專業,跨公司文化,跨地域,覺得有些東西可以分享。

我認為數據分析/數據科學/商業智能(或是其它類似名字)的職業,最核心的部分在于兩點:業和術。

“業”更偏向于你的soft skills,你的理解能力,分析能力,溝通能力,mind-set。其中當然包括最重要的一個能力:

將復雜的商業問題轉化為數學模型,并利用編程能力進行分析,預測和評估,再轉化為合適的Business Plan,執行。

你可以看到,這是一個生態圈,其中并不是只是包含了其它答案所描述的數學模型,統計理論,也不只是包含用什么工具sas,r,excel??偨Y來說是一種完全設身處地去為商業模型思考的mind-set。這是我很多國內數據從業者身上很少看到的。很多同事更喜歡強調自己的統計模型多好,算法多牛,當然,別理解錯,這些優化都是好事,但從一個Business function (我把analytic當作一種服務我們的商業目標的商業職能) 的角度來說,這只是一個從過程中的小部分。這可能是因為很多大型企業,比如銀行,電商,IT,智能太細分導致,很少有人能真正退一步去思考我們做分析的意義何在,如何落地,能賺多少錢。

“術”更偏向于你的技術,包括你的數學,統計,編程,硬件的技術。這個技術對很多技術愛好者來說是數據分析最有意思的一部分,但對很多更喜歡business的朋友來說,很乏味。當然,沒有好與壞,高級和低級的區別。術業有專攻就是這道理,譬如我們公司,Data science for infrastructure engineering負責數據倉庫的朋友工資反而最高。 而抽象一點去說:

為了解決商業問題所需要的技術,能力。

看到這里你應該明白了,很多時候我們說的數據分析師實則是這個層面的。而再細分,這個技術其實分為三層:

1 統計理論,模型

2 數據庫查詢類編程SQL

3 底層數據存儲技術hadoop, hive, spark, etc.

成為一個合格的數據科學家,你需要上面1,2的本事。有能力利用統計模型解決問題,也有能力通過編程將這些模型實現,并且自動化。這里很多人爭論SAS,R,Python,SPSS,在我看來,無非只是工具,都是相同的,只要能用就好。而數理統計,則是要同時結合Q quant和P quant(具體請參照數說工作室,具體名字我忘了,一個微信號)。區別在于一個強調隨機概率,一個強調根據歷史數據的統計。所以,基本理論要知道,比如如何判別模型顯著,如何優化模型?;灸P鸵惨獣?,回歸,Clustering, sequence analysis等等。只有精通這些模型,才能知道怎么從統計角度去解決商業文體。analytic里面經常有個說法:

report 告訴你過去發生什么

BI告訴你現在發生什么

modeling 告訴你將來發生什么

其中的意義可以好好體會一下。

再到數據庫查詢,那基本SAS,SQL,python的指令要會,這些花不了太多時間去學,但是用得好就很關鍵。俗話說80%的時間data cleansing, 20%作模型。大家體會下。因為CS出身,所以編程好些,處理數據確實幫我省了不少時間。

這里再強調一個mind set很重要:作模型,是要在結論,結果符合商業邏輯的前提下進行詮釋。我看到很多剛畢業的stats的人,很喜歡用復雜的stats變量用在模型,結果當然模型很fit,但是卻很難解釋。這一點一直都很有爭議,不是因為用了不好,而是用的話你要知道用這個變量的好與壞是什么。比如很多人喜歡用interaction變量放在回歸模型,2維,3維,請自行體會下。

最后,底層數據存儲技術。這塊我涉足不深,不敢亂說。但基本體會是,有個高效的,高容錯,高吞吐量,兼容性強的數據庫是做數據分析的基礎。

恩,差不多到這。至于先學什么后學什么可以自己根據實際需求安排下。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢