熱線電話:13121318867

登錄
首頁大數據時代數據科學家將在10年內滅絕
數據科學家將在10年內滅絕
2022-02-28
收藏

以下是受此博客啟發的KDnuggets民意調查結果:
放松!數據科學家不會在10年內滅絕,但角色會改變


隨著人工智能的進步繼續突飛猛進,在基線上獲得數據科學已經變得越來越民主化。該領域的傳統進入壁壘,如缺乏數據和計算能力,已經被掃除,不斷涌現的新數據初創公司(有些公司每天只需一杯咖啡就能訪問數據),所有強大的云計算都消除了對昂貴的現場硬件的需求。除了三位一體的先決條件之外,實現的技能和訣竅可以說已經成為數據科學中最普遍的方面。人們不需要看很遠就能找到兜售口號的在線教程,如“在幾秒鐘內實現X模型”,“在幾行代碼內將Z方法應用于數據”。在一個數字世界里,即時滿足已經成為游戲的名稱。雖然提高可訪問性在表面上并不有害,但在令人眼花繚亂的軟件庫和閃亮的新模型之下,數據科學的真正目的已經變得模糊,有時甚至被遺忘。因為它不是為了這樣做而運行復雜的模型,也不是為了優化任意的性能度量,而是用作解決現實世界問題的工具。

一個簡單但相關的例子是Iris數據集。有多少人用它來演示一個算法,而不留心思考萼片是什么,更不用說為什么我們要測量它的長度了?雖然對于可能更有興趣在他們的曲目中添加一種新模式的初露頭角的從業者來說,這些似乎是微不足道的考慮,但對于植物學家埃德加·安德森來說,這并不是微不足道的,他編目了所討論的屬性來理解鳶尾花的變異。盡管這是一個人為的例子,但它展示了一個簡單的觀點;主流變得更加專注于“做”數據科學,而不是“應用”數據科學。然而,這種失調并不是數據科學家衰落的原因,而是一種癥狀。為了了解問題的根源,我們必須后退一步,鳥瞰一下。

數據科學有一個奇怪的區別,它是少數幾個讓實踐者沒有領域的研究領域之一。藥學專業的學生成為藥劑師,法律專業的學生成為律師,會計專業的學生成為會計師。數據科學專業的學生因此必須成為數據科學家?但是什么的數據科學家?數據科學的廣泛應用是一把雙刃劍。一方面,它是一個強大的工具箱,可以應用于任何生成和捕獲數據的行業。另一方面,這些工具的普遍適用性意味著用戶很少會在此之前對所述行業有真正的領域知識。然而,在數據科學興起的時候,這個問題并不重要,因為雇主們在沒有完全理解它是什么以及如何將它完全集成到他們的公司中的情況下,就急于利用這項新生的技術。

然而,近十年后,企業和它們所處的環境都發生了變化。他們現在努力與以既定行業標準為基準的大型根深蒂固的團隊一起實現數據科學的成熟度。迫切的招聘需求已經轉向問題解決者和批判性思維者,他們了解業務、各自的行業及其利益相關者。導航幾個軟件包或反流幾行代碼的能力不再足夠,數據科學從業者也不再被編碼的能力所定義。no code、AutoML解決方案(如DataRobot、RapidMiner和Alteryx)的日益流行就證明了這一點。

這是什么意思?


數據科學家將在10年內滅絕(要么放棄),或者至少角色頭銜將是。展望未來,被統稱為數據科學的技能集將由新一代精通數據的業務專家和主題專家承擔,他們能夠用自己深刻的領域知識進行分析,無論他們是否會編碼。他們的頭銜將反映他們的專業知識,而不是他們展示專業知識的手段,無論是合規專家、產品經理還是投資分析師。我們不需要回頭看很遠就能找到歷史性的先例。在電子表格出現的時候,數據輸入專家是非常令人垂涎的,但現在,正如Cole Nussbaumer Knaflic(“用數據講故事”的作者)恰當地觀察到的那樣,熟練使用Microsoft Office suite是最低限度的。在此之前,用打字機觸摸打字的能力被認為是一項專業技能,然而隨著個人計算機的可訪問性,它也被認為是一項專業技能。

最后,對于那些考慮從事數據科學工作或開始學習的人來說,經?;仡櫼幌履銦o疑會遇到的維恩圖可能會對你有很好的幫助。它將數據科學描述為統計學、編程和領域知識的匯合。盡管每一個都占有相等份額的相交面積,但有些可能會保證比其他的更高的權重。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢