熱線電話:13121318867

登錄
首頁大數據時代數據科學家與ML工程師的區別
數據科學家與ML工程師的區別
2022-02-28
收藏


數據科學家和機器學習工程師的角色之間經常存在混淆。盡管他們確實友好地合作,在專門知識和經驗方面有一些重疊,但這兩種作用的目的完全不同。

從本質上說,我們是在區分科學家和工程師,前者尋求理解他們工作背后的科學知識,后者尋求構建他人可以訪問的東西。這兩種角色都非常重要,而且在一些公司可以互換--例如,某些組織中的數據科學家可以執行機器學習工程師的工作,反之亦然。

為了使區別變得清晰,我將把區別分為3類;1)職責2)專長3)工資期望。

責任

數據科學家遵循數據科學過程,這也可以稱為Blitzstein&Pfister工作流。Blitzstein和Pfister最初創建了這個框架來教哈佛CS109課程的學生如何處理數據科學問題。

數據科學過程包括5個關鍵階段

  • 階段1:了解業務問題
  • 階段2:數據收集
  • 階段3:數據清理和探索
  • 階段4:模型構建
  • 階段5:溝通和可視化洞察力

數據科學家完成的大部分工作都是在研究環境中進行的。在這種環境中,數據科學家執行任務來更好地理解數據,以便他們能夠構建能夠最好地捕捉數據固有模式的模型。一旦他們建立了一個模型,下一步是評估它是否符合項目的預期結果。如果沒有,他們將迭代地重復這個過程,直到模型滿足期望的結果,然后將其交給機器學習工程師。

機器學習工程師負責創建和維護機器學習基礎設施,允許他們將數據科學家構建的模型部署到生產環境中。因此,機器學習工程師通常在開發環境中工作,在開發環境中,他們關心的是復制由數據科學家在研究環境中構建的機器學習管道。并且,它們在生產環境中工作,在生產環境中,模型可以被其他軟件系統和/或客戶機訪問。

本質上,機器學習工程師負責維護ML基礎設施,允許他們部署和擴展數據科學家建立的模型。而且,數據科學家是機器學習工程師構建的機器學習基礎設施的用戶。

專業知識

人們對這兩個角色之間的差異感到困惑的原因是,他們的技能有許多重疊的地方。例如,數據科學家和機器學習工程師都應該具備以下知識;

這些角色之間的主要重疊導致一些組織,特別是較小的組織和初創企業,將這些角色合并為一個角色。因此,有些組織讓數據科學家做機器學習工程師的工作,有些組織讓機器學習工程師做數據科學家的工作。只會導致更多從業者的困惑。

然而,每個角色所需的專門知識之間存在一些關鍵差異。

數據科學家通常是非常好的數據故事講述者。有些人會爭辯說,這種特質使他們比機器學習工程師更有創造力。另一個區別是,數據科學家可能會使用PowerBI和Tableau等工具來分享對業務的洞察力,他們不一定需要使用機器學習。

彌補伴侶不足的夫婦通常更強大。當你這樣想的時候,前面提到的專業知識可能是機器學習工程師的弱點,他被期望在計算機科學和軟件工程方面有很強的基礎。機器學習工程師應該了解數據結構和算法,并理解創建可交付軟件的基本組件。

話雖如此,對于機器學習工程師來說,很好地掌握另一種編程語言如Java、C++或Julia并不罕見。

  • 2021年學習數據科學的課程
  • 如何成為機器學習工程師

薪金期望

確定確切的工資期望是困難的。這兩個職位的薪水會因各種因素而異,比如你的經驗、你所擁有的資格、你所在的地方和你工作的部門。

各組織也有望提供不同的福利。無論什么角色,你都可以收到加入公司養老金計劃、靈活或遠程工作、績效獎金和私人醫療保險的邀請。

聯合王國(英國)

  • 一個初級數據科學家可以期待在25000-30000范圍內開始(根據經驗,可能會上升到40000)。[來源:前景]。畢業生入門級機器學習工程師可以期望起薪35,000-40,000。[來源:前景]
  • 根據Glassdoor的數據,英國數據科學家的平均工資為46,818英鎊。招股書指出,英國機器學習工程師的平均工資為52,000英鎊
  • 根據Prospects的說法,首席和首席數據科學家的收入可以超過60,000英鎊(在某些情況下超過10萬英鎊)。相比之下,更有經驗的機器學習工程師可以期望掙到17萬英鎊(特別是如果他們為谷歌或臉書這樣的跨國公司工作)[來源:prospects]

美利堅合眾國(USA)

  • 在美國,數據科學家的平均基本工資為120,089美元[來源:確實]。相比之下,美國機器學習工程師的平均基本工資150,660美元[來源:確實]。

總的來說,公平地說,機器學習工程師的平均工資通常高于數據科學家。

最后的想法



盡管數據科學家和機器學習工程師的角色有相似之處,但他們在職責、專業知識和收入方面有很大不同。從我聽過的大多數關于這個話題的采訪中,許多人說從數據科學家到機器學習工程師的轉變比從機器學習工程師到數據科學家的轉變要困難得多。這是因為數據科學家通常不精通軟件工程和計算機科學基礎,這是一個很大的學習曲線。

感謝閱讀!


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢