熱線電話:13121318867

登錄
首頁大數據時代沒有學位如何進入數據科學
沒有學位如何進入數據科學
2022-03-14
收藏

這篇文章是為那些屬于下列類別之一的人準備的:

  1. 你沒有大專學位,但你對數據科學感興趣。
  2. 你沒有STEM相關的學位,但你對數據科學感興趣。
  3. 你在一個與數據科學完全無關的領域工作,但你對數據科學感興趣。
  4. 您只是對數據科學感興趣,并想了解更多關于它的知識。

你可能在想,“我有機會嗎?”

答案是:“是的,有可能?!?/em>

好消息是,您已經通過了第一步,這就是您對數據科學感興趣。現在這將不是一個容易的旅程,因為您是一個失敗者,但要把它作為每天激勵自己的燃料。

最重要的是,我要給你我的建議,我希望我在開始的時候有。

首先,介紹一下我自己…

我有商科學位,但從大學二年級開始,我就對機器學習感興趣。因此,我自學了我今天所知道的大部分知識,我很幸運地在幾個數據分析師/數據科學工作中工作。

我為什么要告訴你這些?我想說清楚,我曾經和你處于類似的位置!

請記住,這是一個長期目標,因此您應該期待長期的結果。如果你愿意付出100%的努力,我會給你至少一年的時間來決定是否繼續下去。

說到這里,讓我們潛入其中:

進入數據科學可以歸結為兩件事,增長展示您的技能。

1)提高數據科學技能

不久前,我寫了一篇文章,“如果我可以重新開始,我將如何學習數據科學?!痹谶@篇文章中,我將學習的內容按學科劃分,即統計與數學、編程基礎和機器學習。

在這篇文章中,我將根據你的理解水平來劃分你應該學習的內容。

級別0:基本原理

你必須從基礎開始,構建塊,無論你想怎么稱呼它。但是相信我,當我說這些的時候,你的基礎越好,你的數據科學之旅就會越順利。

特別是,我建議您在以下主題中建立基礎知識:統計與概率、數學和編程。

統計和概率:如果你讀過我以前的文章,那么你可能已經聽過第一百萬次了,但是數據科學家實際上只是一個現代統計學家。

  • 如果你對統計和數學幾乎沒有接觸,我推薦可汗學院的統計和概率課程。
  • 然而,如果你有一些微積分和積分的知識,我強烈建議你讀讀佐治亞理工學院的課程,名為“統計方法”。這是一個稍微困難的過程,因為它需要更多的證明,但它將幫助你理解每個想法的復雜性。

數學:取決于你在高中時的注意力,這將決定你需要花多少時間學習基礎數學。您應該學習以下三個方面:微積分、積分和線性代數:

  • 當涉及到任何與優化相關的事情(這在數據科學中非常相關)時,微積分是必不可少的。為此我推薦了可汗學院的微積分課程。
  • 當談到概率分布假設檢驗時,積分是必不可少的。我推薦了汗學院的積分課程。
  • 如果你想進入深度學習,線性代數尤其重要,但即使這樣,了解其他基本的機器學習概念也是很好的,比如主成分分析和推薦系統。驚喜驚喜,你可以猜到我推薦什么課程。這里提供了鏈接。

編程:就像對數學和統計數據有一個基本的理解是很重要的一樣,了解編程中的核心基礎知識會使您的生活變得容易得多,尤其是在實現方面。因此,我建議您在深入研究機器學習算法之前,先花時間學習基本的SQLPython。

  • 如果您對SQL是完全陌生的,我建議您閱讀Mode的SQL教程,因為它非常簡潔和全面。
  • 同樣,如果您是Python的新手,Codecademy是熟悉Python的好資源。

級別1:專門化

一旦你學會了基礎知識,你就準備好專門化了。在這一點上,你是否想專注于機器學習算法、深度學習、自然語言處理、計算機視覺等就取決于你了…

  • 如果你想了解更多關于機器學習算法和實現的知識,我會去看看Kaggle的機器學習介紹,斯坦福的機器學習課程,或者Udemy上的機器學習A-Z??纯此麄?,看看什么最適合你的喜好!
  • 如果你想了解更多關于深度學習的信息,在這里查看歐泰的專業化。物有所值!
  • 如果你想學習更多關于NLP的知識,這里有5個免費的自然語言處理課程,來自斯坦福和牛津等頂尖大學。

你可以專攻的東西還有那么多,所以在你做決定之前,請多探索一下!

第2級:練習

像其他任何事情一樣,你必須練習你學到的東西,因為你失去了你不用的東西!以下是我推薦的3個資源,可以用來練習和改進你的技能。

  1. Leetcode是一個偉大的資源,它幫助我學習技能和整潔的技巧,我從來沒有想過是可能的。這是我在找工作時充分利用的東西,也是我永遠會回去的資源。最好的部分是,他們通常有推薦的解決方案和討論板,因此您可以了解更有效的解決方案和技術。
  2. 熊貓練習問題:這個資源是一個專門針對熊貓的練習問題的存儲庫。通過完成這些練習問題,您將知道如何:篩選和排序數據、聚合數據、使用.apply()操作數據,等等。
  3. Kaggle是世界上最大的數據科學社區之一,有數百個數據集可供選擇。使用Kaggle,您可以參加比賽,或者簡單地利用可用的數據集創建自己的機器學習模型。

2)展示你的數據科學技能

學習數據科學是一回事,但人們通常忘記的是營銷自己--你最終會想展示你學到的東西。如果您沒有與數據科學相關的學位,這對您來說尤其重要。

一旦你完成了幾個個人數據科學項目,下面是你展示它們和推銷自己的幾種方法:

您的簡歷

首先,利用你的簡歷展示你的數據科學項目。我建議創建一個名為“個人項目”的部分,在那里你可以列出你已經完成的兩到三個項目。

同樣,您也可以在LinkedIn上的“projects”部分添加這些項目。

GitHub存儲庫

如果您還沒有創建Github存儲庫,我強烈建議您創建一個Github存儲庫。當我們討論Github的主題時,學習Git將是一個好主意。在這里,您可以包含所有的數據科學項目,更重要的是,您可以與其他人共享您的代碼以供查看。

如果你有一個Kaggle帳戶,并在Kaggle上創建筆記本,這也是一個很好的選擇。

一旦你有了一個活躍的Kaggle或Github賬戶,確保你的賬戶URL在你的簡歷、領英和網站上都有。

個人網站

說到網站,我強烈建議以網站的形式建立一個數據科學投資組合。HTML和CSS是非常簡單的學習,這將是一個有趣的項目!如果你沒有時間,像Squarespace這樣的東西也會很好地工作。

中型博客

我有偏見,因為這對我來說很有效,但這并不意味著我不能推薦寫博客!使用像Medium這樣的平臺,您可以編寫項目演練,就像我的onWine Quality Prediction一樣。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢