熱線電話:13121318867

登錄
首頁大數據時代數據科學頂級職位的薪酬細分
數據科學頂級職位的薪酬細分
2022-02-21
收藏


目錄表


  1. 介紹
  2. 機器學習工程師
  3. 自然語言處理工程師
  4. 數據工程師
  5. 數據科學家
  6. 摘要
  7. 參考文獻

介紹

When looking at data scientist salaries and data science roles, it became obvious that there are different, more specific facets within data science. These facets relate to unique job positions, specifically, machine learning operations, NLP, data engineering, and data science itself. Of course, there are even more specific positions than these, but these can give you a general summary of what to expect if you land a job in one of these positions. I wanted to pick these four roles, too, because they can be separated well, almost as if it was there was a clustering algorithm that found jobs that were the most different between one another but that were also in the same population. Below, I will be discussing the average base pay with a low and high range, as well as respective seniority levels, the number of estimates used to determine these numbers, and expected skills and experiences for each role.

機器學習工程師



機器學習工程師傾向于將已經研究和構建的數據科學模型應用到生產環境中,通常包括軟件工程和機器學習算法知識。話雖如此,你可以想象得到相當不錯的薪水。這個特別的估計來自于GlassDoor[3]。


根據大約1900提交的工資,有以下廣泛的范圍:


  • -~86000美元
  • 平均-~$12.8,000
  • -~190000美元

正如你所看到的,這是一個范圍,就像任何職位一樣,你的經驗越多,工資越高也就不足為奇了。除了多年的經驗,你工作的州,你雇用的技能,公司也會努力創造最終的工資數額--所有這些職位都是如此。為了獲得更多的粒度,我們可以查看不同的資歷級別,以便了解級別的增加與工資數額的關系:


以下是一些來自個人經驗的技能,您可以期望在機器學習職位上使用:


  • SQL/Python/Java(有時)
  • 算法知識-無監督有監督分類、時間序列、回歸以及封裝它們的流行庫之間的區別
  • 部署平臺和工具-AWS、Google Cloud、Azure、Docker、Flask、MLFlow和Airflow-部署模型并與數據科學家合作組成自動化流程

自然語言處理工程師



通常被稱為NLP工程師,這個角色通常專注于將數據科學模型或機器學習算法應用于文本數據。NLP工作的一些例子是主題建模、大量文本、語義分析和chatbot代理。話雖如此,你也可以想象出相當不錯的工資--然而,這個工資細目將低于機器學習工程師,很可能是因為這個角色不太包容,更專注于數據科學中的特定主題。這個特別的估計也來自于Glassdoor[5]。


根據大約20提交的工資,有以下廣泛的范圍:


值得注意的是,報告的工資數額相當低,所以對這個范圍持懷疑態度,但盡管如此,對這個工資仍然有很高的信心。

  • -~$80,000
  • 平均-~$11.5,000
  • -~166,000美元

所有這些數量都低于機器學習,然而,與大多數其他角色相比,它們仍然相當高。


以下是一些來自個人經驗的技能,你可以期望在自然語言處理工程師的職位上使用:


  • NLTK-自然語言工具箱庫
  • TextBlob
  • 斯帕西
  • 文本清理和處理(R情緒化標點符號、刪除停用詞、分離單詞的詞根、詞根和引理化)
  • 語義分析-一個例子是分析來自客戶的正面和負面評論
  • 主題建模-一個例子是在大量文本中發現共同的主題,就像客戶評論一樣,但不僅僅是好的或壞的評論,而是可以分析產品改進的評論主題:“質量差”與90%的負面評論有關。
  • 分類-使用像隨機森林這樣的算法將傳統的數字特征和像描述這樣的文本特征結合起來,創建一個將數據分組在一起的模型--像客戶分割一樣

數據工程師



也許一個更常見的角色是數據工程,它與數據科學比在數據科學之下更相關。然而,這個角色對數據科學工作來說仍然至關重要,有時,數據科學家可以期望知道數據工程師所知道的大部分內容,所以我將在本文分析中包括它。數據工程的一些示例包括創建存儲最終用于數據科學模型的數據的ETL作業,以及自動存儲模型結果和執行查詢優化。這個特別的估計也來自于Glassdoor[7]。


根據大約~6,800提交的工資,有以下廣泛的范圍:


  • -~76000美元
  • 平均-~$11,000
  • -~164,000美元

這個范圍更類似于自然語言處理工程師的角色,然而,它可能與日常工作中的實際工作角色相距最遠。同樣重要的是要注意,這個職位涉及到相當多的估計。


以下是一些來自個人經驗的技能,您可以期望在數據工程師職位上使用:


  • etl-提取、轉換和加載
  • elt-提取、加載和轉換
  • 獲取將存儲在數據庫或數據湖中的數據,這些數據可以被查詢用于數據分析,查詢用于機器學習算法訓練,并用于存儲數據科學模型結果
  • 優化SQL查詢-節省公司的時間和金錢

數據科學家



最后,但并非最不重要的,是數據科學家的角色。雖然這個角色看起來是最一般的,但實際上也可以是具體的,通常主要由模型構建過程組成--有時需要數據工程和機器學習工程師操作,但可能性較小--但仍然可能涉及自然語言處理方面的專業(通常如果重點是NLP,那么數據科學家將以此為標題--但不是一直)。這個角色還可以有更多的可變性,所以我們也可以期待一個廣泛的范圍。這個特別的估計也來自于Glassdoor[9]。


根據大約~16,200提交的工資,有以下廣泛的范圍:


  • -~81,000美元
  • 平均-~$11.5,000
  • -~164,000美元

出人意料地低于預期,這一角色在本分析中的大多數其他角色附近。話雖如此,它可能是對離群值最真實和穩健的,因為它是迄今為止提交來組成這些工資數額的最多的工資數額。


以下是一些來自個人經驗的技能,您可以期望在數據科學職位上使用:


  • SQL,Python,R
  • Jupyter筆記本
  • 可視化-Tableau、庫和包、Google Data Studio、Looker等
  • 定義問題陳述、獲取數據集、特征工程、模型比較、模型部署和結果討論
  • 示例項目-創建一個分類器,根據幾個特性對公司產品進行分組,并使用SQL和Python從各種來源獲取數據,以及部署模型和解釋結果及其對公司的影響

摘要

While these roles can have several similarities and differences, the same can be said about their salary ranges. Nearly three of the four salaries were similar, with one standing out. That role was machine learning engineer —why is that?My understanding is that this role requires a knowledge of most data science concepts, and especially their output, as well the software engineering involved around deployment — that is a lot to know and employ, so it makes sense why a role that composes both software engineering and data science pays so well. In addition to the salary breakdown of each data science role — or similar to data science in some way, were the skills that you can expect to employ, so that you can have a better idea of the role and how that relates to the salary amount.


總結一下,以下是我們分析的四個職位,以及你可以期望使用的技能:


* 機器學習工程師
* 自然語言處理工程師
* 數據工程師
* 數據科學家

我希望你覺得我的文章既有趣又有用。如果你同意這些數字和范圍,請隨時在下面發表評論--為什么或為什么不?你認為有一個角色,尤其是,離現實如此之遠嗎?你還能想到哪些數據科學角色會有不同的工資細分嗎?一個角色的其他因素會影響薪水嗎?

這些薪金是在美國報告的,因此它們是以美元數額計算的。我與這些公司中的任何一家都沒有關聯。

請隨時查看我的個人資料和其他文章,并在LinkedIn上聯系我。

參考文獻

[1] Photo byThought CatalogonUnsplash, (2018)

[2]Photo Byassed PhotographyonUnsplash,(2018)

[3]Glassdoor,Inc.,機器學習工程師工資,(2008-2021)

[4]Photo Bybatrick TomassoonUnsplash,(2016)

[5]Glassdoor,Inc.自然語言處理工程師工資,(2008-2021)

[6]Caspar Camille RubinonUnsplash的照片,(2017)

[7]Glassdoor,Inc.,數據工程師工資,(2008-2021)

[8]照片byDaria NepriakhinaonUnsplash,(2017)

[9]Glassdoor,Inc.,數據科學家工資,(2008-2021)


Bio: Matthew Przybyla is Senior 數據科學家 at Favor Delivery, and a freelance technical writer, especially in data science.

原創。經允許轉發。

相關:

  • 數據科學家 vs 數據工程師 Salary
  • 數據科學家 vs 機器學習工程師 – what are their skills?
  • The Most In-Demand Skills for 數據科學家s in 2021

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢