熱線電話:13121318867

登錄
首頁大數據時代我如何在18個月內把數據科學的收入增加了兩倍
我如何在18個月內把數據科學的收入增加了兩倍
2022-02-21
收藏

大約18個月前,由于新冠肺炎疫情,我失去了工作。我在大學里做兼職家教。我從家教中得到的錢被用來支付食物、汽油和汽車等費用。

在政府對全國實施封鎖限制后,我無法繼續教學。我也上不了大學,只能在家學習。

雖然一開始這看起來很糟糕,但我意識到不上大學和工作騰出了我的很多時間。

在這段時間里,我開始考慮擴大我的技能集。在做了一些研究后,我發現了一個機器學習在線課程,看起來很有趣。

那是我完成的第一門在線課程。

在那之后,我把大部分時間都花在了構建項目、學習編碼和獲得在線認證上。

現在--18個月來,我已經用我在數據科學和分析領域的知識建立了多種收入流。

1.全職工作


我最初作為數據科學實習生加入一家公司一段時間,現在在那里全職工作。

起初,我希望我的工作主要包括建模。

然而,一旦我加入,我意識到我的工作只有大約10%的模型建立。其余的時間,我和我的團隊都在尋找新的解決方案,我們可以創建來解決業務問題。

通常,這些問題甚至不需要機器學習來解決。數據解決方案可以只包含轉換為簡單SQL查詢的業務邏輯。

我每天做的工作包括回答以下問題:

  • 我們如何使用數據來查找關于A公司競爭對手的信息?
  • 我們建立了客戶客流量預測模型。我們可以識別哪些業務用例來測試這個模型?它在生產環境中是否和在測試環境中一樣有效?
  • 我們如何為客戶持續改進細分和業績?我們能從現有的數據推斷出現實生活中的場景嗎?

這是對我每天所做工作的一個非常抽象的描述,但我想強調的是,創建數據科學解決方案并不是從模型構建開始和結束的。

如果你是一個有抱負的數據科學家,我建議在你想工作的行業獲得一些領域知識。

2.數據科學博客


我寫我在數據科學領域的經驗。

如果我在工作中構建一個項目,我會在Kaggle上找到一個類似的數據集并復制分析,并圍繞它創建一個教程。

我最初開始編寫和發布數據科學教程,以增強我的投資組合。

寫關于我工作的文章是我與其他有抱負的數據科學家聯系的一種方式。這也是我展示自己編寫和構建ML模型能力的一種方式。

最初,我從沒想過我的寫作會得到報酬。我只是認為這是一個很好的方式來增強我的數據科學投資組合。

然而,在過去的一年里,一開始是業余愛好的事情開始產生收入。

我現在可以通過簡單地創建與數據相關的教程、項目和寫我的經歷來獲得被動收入。

3.自由職業


當我開始在數據科學界建立一個在線存在時,我開始得到多個自由職業的邀請。我為客戶建立了一次性的機器學習模型,創建了競爭對手分析報告,并撰寫了數據科學文章。

當我最初想到自由職業時,我想象著必須在在線平臺上競爭和投標項目。

然而,我所有的自由職業客戶在閱讀了我的文章或看了我的投資組合項目后,都聯系了我。

幾個月前,我構建了一個聚類算法,并在網上發布了一個關于它的教程。第二天,有人聯系我,問我是否有興趣為他們的客戶構建一個集群模型。

自由職業使我具備了許多我通常工作領域之外的技能。

在我的公司里,我處理的數據通常是以某種預先處理的格式出現的,我用SQL和Python查詢數據來利用它。

然而,當自由職業者時,客戶數據的格式非常不同。其中大部分都沒有經過處理或結構化,我花了很多時間來弄清楚數據集之間的關系并理解它。

我還需要收集外部數據來進行分析,這通常涉及到搜索第三方網站和使用開源工具。

我覺得自由職業讓我接觸到了我目前在日常工作中沒有的知識,我能夠通過我從事的每一個項目學到新的東西。

我怎么到這兒來的?


我上面提到我上了一門數據科學在線課程,事情從那里發生了變化。你可能想知道怎么做。

老實說,在上了我的第一門數據科學在線課程后,我感到很失落。我花了大約一個月的時間用SCIKIT-Learn學習不同的算法和訓練模型。

我根本不知道從那里去哪里。

我開始閱讀關于那些沒有碩士學位或任何專業資格就設法找到數據科學工作的人的文章。我意識到領域知識的重要性,以及借助可用數據解決問題的重要性。

我沒有必要建立最精確的模型或理解模型背后的底層算法。

我意識到對我來說最重要的技能是利用數據解決問題的能力。這意味著我必須超越機器學習算法。

我選修了商業分析和ML工程課程。我花在學習代碼上的時間比花在理論上的時間還要多。我花時間學習SQL和數據操作。

然后,我在網頁刮擦的幫助下從在線站點收集了自己的數據。我用這些數據解決了一個問題,并用它構建了一個簡單的機器學習web應用程序。

通過這種方式,我慢慢獲得了成為端到端數據科學家所需的技能。

即使在我工作的數據分析團隊中,如果有任何項目超出了我們日常工作的范圍(需要外部數據收集或新算法的項目),我通常會被分配去做。

結論


作為一個有抱負的數據科學家,有這么多的資源提供給你在網上。事實上,太多了,你不知道該從中選擇什么。

然而,大部分的重點都放在模型構建上。

雖然了解建立和訓練模型的基本原理是很重要的,但大多數可用的工作都要求你超越這一點。

真正的需求是對能夠借助可用數據解決問題的人的需求。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢