熱線電話:13121318867

登錄
首頁大數據時代數據科學是一個垂死的職業嗎?
數據科學是一個垂死的職業嗎?
2022-02-20
收藏

介紹


我最近讀到一篇文章,將數據科學描述為一個過飽和的領域。文章預測ML工程師將在未來幾年取代數據科學家。

根據這篇文章的作者,大多數公司致力于用數據科學解決非常相似的業務問題。因此,數據科學家沒有必要提出解決問題的新方法。

作者接著說,在大多數數據驅動的組織中,為了解決問題,只需要基本的數據科學技能。這個角色很容易被機器學習工程師取代--一個擁有數據科學算法基礎知識的人,他也擁有部署ML模型的知識。

在過去的一年里,我讀過許多類似的文章。

其中一些人表示,數據科學家的角色將被AutoML之類的工具所取代,而另一些人則將數據科學稱為“垂死的領域”,很快將被數據工程和ML操作之類的角色所超越。

作為一個與數據行業不同支柱密切合作的人,我想就這個主題提供我的觀點,并回答以下問題:

  • 數據科學是一個垂死的職業嗎,未來幾年還會有需求嗎?
  • 自動化工具會讓數據科學家失業嗎?
  • 數據科學是否已經過度飽和,在不久的將來該領域會被更新的角色所取代嗎?
  • 數據科學家對組織有利可圖嗎?它們如何為企業增值?

需要數據科學家嗎?


大多數組織中的數據科學工作流程非常相似。許多公司雇傭數據科學家來解決類似的商業問題。大多數建立的模型都不需要你想出新穎的解決方案。

在這些組織中,您將采用的解決數據驅動問題的大多數方法很可能以前已經使用過,您可以從網上可用的大量資源中獲得靈感。

此外,AutoML和DataRobot等自動化工具的興起使預測建模變得更加容易。

我在一些業務用例中使用DataRobot,它是一個很好的工具。它迭代許多值,并為您的模型選擇最佳參數,以確保最終得到盡可能高精度的模型。

因此,如果預測模型隨著時間的推移變得更加容易,為什么公司仍然需要數據科學家?為什么他們不直接使用自動化工具和ML工程師的組合來管理他們的整個數據科學工作流呢?

答案很簡單:

首先,數據科學從來不是關于重新發明輪子或構建高度復雜的算法。

數據科學家的角色是用數據為組織增加價值。在大多數公司中,只有很小一部分涉及到構建ML算法。

其次,總會有自動化工具無法解決的問題。這些工具有一組固定的算法,您可以從中選擇,如果您確實發現了一個需要結合使用多種方法來解決的問題,您將需要手動完成。

雖然這種情況并不經常發生,但仍然會發生--作為一個組織,你需要雇傭足夠熟練的人來做到這一點。此外,像DataRobot這樣的工具不能進行數據預處理,也不能進行建模之前的任何繁重工作。

人情味


作為一個為初創企業和大公司創建數據驅動解決方案的人,這種情況與處理Kaggle數據集的情況非常不同。

沒有固定的問題。通常,您有一個數據集,然后給您一個業務問題。如何利用客戶數據來最大限度地提高公司的銷售額取決于您。

這意味著數據科學家需要的不僅僅是技術或建模技能。您將需要將數據與手頭的問題連接起來。您需要決定可以優化解決方案的外部數據源。

數據預處理是漫長而艱苦的,不僅因為它需要很強的編程技能,還因為您需要試驗不同的變量及其與手頭問題的相關性。

您需要將模型精確度與轉換率之類的指標聯系起來。

模型構建并不總是這個過程的一部分。有時,一個簡單的計算可能足以執行像客戶排名這樣的任務。只有一些問題需要你做出預測。

歸根結底,數據科學家為組織提供的價值在于他們將數據應用于現實世界用例的能力。無論是建立細分模型、推薦系統,還是評估客戶潛力,除非結果是可解釋的,否則對組織沒有真正的好處。

只要一個數據科學家能夠在數據的幫助下解決問題,并彌合技術和業務技能之間的差距,這個角色就會繼續存在。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢