熱線電話:13121318867

登錄
首頁精彩閱讀數據分析師的自我修養丨如何進階為數據科學家
數據分析師的自我修養丨如何進階為數據科學家
2018-07-27
收藏

數據分析師的自我修養丨如何進階為數據科學家

有人問我,應該如何從數據分析師進階為數據科學家呢?很簡單,分三步:

1. 打開LinkedIn,登錄。

2. 點擊“編輯我的個人資料”。

3. 找到“數據分析師”,并用“數據科學家”替代。

完成!非常容易吧。

不幸的是,現實并不那么簡單。

掌握必備的技能,從或多或少的數據中得出分析見解,這些都并非易事。

關于如何進入數據科學領域的文章有很多,但是關于從數據分析師轉變為數據科學家的文章卻很少。

在此之前,我們有必要分別給出這兩個職業的定義。

數據分析師

對結構化數據進行收集、處理并應用統計算法,從而產生效益和改進決策。

數據科學家

數據科學家有類似的目標,但需要更強的能力,從而能處理大量的非結構化數據,很多情況下需要實時處理。

數據科學家需要發現重要信息,能夠對不同來源的數據進行數據清理、處理并運行高級算法。同時,需要很強的溝通描述能力,以及可視化技能。

我經常會遇到許多優秀的數據分析師,他們非常想進階為數據科學家,但苦于沒有機會,或不知道該如何開始。這也是促使我寫本文的原因之一。

為什么要成為數據科學家?

原因有很多,主要分為以下幾點:

影響力

可能帶來巨大的商業利益。更有機會得到領導層青睞,能夠更好地提升發展方向。

技能

在快速發展的數據科學領域中,有許多問題需要被解決。例如,構建圖像識別器或文本分類器識別社交媒體上的發布的違規言論。

競爭力

有人預測人工智能最終將取代人類的工作。為了保證自己工作,應該不斷創新并提高競爭力,而不是等待被自動化取代。

發展機會

會有更多的發展機會,薪水提升空間也更大。目前優秀的數據科學家很少,市場需求量很大。

如何成為數據科學家?

大多數數據分析師都有很好的基礎,但是應用先進的方法處理大型數據集需要多年的學習和經驗積累。

那么,數據科學家需要哪些技能?

這個問題并沒有正確的答案,復雜的數據科學項目涉及到許多專業技能。在投入數據科學領域的最初幾年,最好掌握以下技能:

數據科學語言:Python / R

關系數據庫:MySQL、Postgress

非關系數據庫:MongoDB

機器學習模型:回歸、提升樹支持向量機(Boosted Trees SVM), 神經網絡

繪圖:Neo4J、GraphX

分布式計算Hadoop、Spark

云:GCP / AWS / Azure

API 交互:OAuth、Rest

數據可視化和網頁應用:D3、RShiny

專業領域:自然語言處理、OCR和計算機視覺

提升樹模型在數據科學競賽中很受歡迎

RShiny儀表板是不錯的探索數據交互方式

掌握這些技能需要大量的時間(可能比獲得專業學位更久)。但每個人都不能滿足現狀,必須不斷學習。如果我們每天能進步一點,那么在未來某天就能達到自己的預期目標。

決心和堅韌有時比聰明才智能有用。

行動計劃

首先我們需要一些基本技能:

1. 從正確的理念開始

十年前,等待數據課程的資料可能需要數周的時間,但那些日子已經一去不回。如今到處都有很棒的學習資源,我們需要不斷學習,不斷提升技能。

2. 學習一門語言并培養數學技能

可以選擇學習Python或R語言。Coursera和Udemy等網站上有大量免費課程。吳恩達的機器學習課程和斯坦福大學的神經網絡課程都非常棒,而且很有趣。

許多Python用戶喜歡使用Anaconda和Jupyter Notebook。許多R用戶喜歡用R Studio。

3. 解決實際問題

嘗試解決工作中的實際問題,與商業專家和數據工程師一起工作。

4. 參加Kaggle比賽

Kaggle任務有一定范圍,而且數據比較干凈,但能很好的提高建立模型技能,同時能與幾千人一起解決挑戰性的數據問題。不要擔心排名,從零開始。

5. 了解行業大神的動向

可以關注Geoffrey Hinton、吳恩達、Yann LeCun、Rachel Thomas、Jeremy Howard等人。

6. 使用高效的工作方式

積累一定基礎后,使用GitHub等版本控制系統改進自己的工作流程,以便進行部署和代碼維護,還可以使用Docker。

7. 有效地溝通

我們需要展現自己的工作成果,在跟領導層匯報工作時,需要有效地利用演示文稿等中。

良好的工作環境

即使你掌握了許多技能,但如果所在的公司沒有合適的工具和環境,那么開展工作也是很困難的。工作環境中總會存在些不可控的因素,因此我們要考慮哪些因素可以改善和利用。

1. 轉到合適的團隊

大多數大中型企業至少有一個小型數據科學團隊,因此要選擇合適的企業。

2. 與合適的人合作

如果換工作不太現實,那么設法與出色的數據科學家合作。例如,發現相關問題,與專業人員合作解決,而不是委托他們解決。

3. 適當的工具和環境

企業有時不太明確該如何數據科學工具進行投入。有些企業制定計劃和投入過程比較繁瑣,因此只會優先考慮收益明顯的商業案例。抓住機會,倡導對分析環境、工具、相關培訓的投入。

4. 制定明確的用例

了解公司的業務以及能如何應用數據科學,將這兩者聯系起來,制定明確的用例。

5. 與更優秀的人合作

努力成為優秀團隊中的一員,你不僅會收獲地更多,還能學到很多自己為掌握的知識。

結語

如果你也想進階為數據科學家,那么現在就是開始的最佳機會,立即開始學習,盡快解決實際問題。在學習的過程中,你會不斷提升自己,最終讓自己大吃一驚,要珍惜每個機會。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢