熱線電話:13121318867

登錄
首頁大數據時代我是一個數據科學家,不僅僅是處理數據的小手
我是一個數據科學家,不僅僅是處理數據的小手
2022-03-30
收藏

艾哈邁德·貝斯貝斯,AI工程師//博客作者//跑步者。

這是個人的觀察,但我相信你們中的許多人在閱讀這篇文章時會有同樣的感受。

我是一名數據科學家,我喜歡我的工作,因為我認為它涵蓋了各種相互依賴的領域,使它豐富和刺激。然而,我有時不得不與那些不完全理解組織或領域中這個角色的人打交道。坦率地說,這讓我和我認識的許多人都有點沮喪。

在你繼續閱讀之前,我應該提到,我的目的不是阻止任何人對這個角色的渴望。我只是在陳述行業中普遍出現的一些負面方面,以及避免這些負面方面的可能解決方案。

有些人不完全理解你做什么…甚至懶得解釋!

原則上,這沒問題。我也不明白其他人是怎么做的。然而,我不明白的是,一些當事人對了解你在幫助他們時做了什么完全缺乏興趣和好奇心。我不是說他們應該了解神經網絡的每一個小算法細節,但至少,他們應該了解你的方法,你解決問題的方法。有時,就好像你被委托做一項沒有人關心的痛苦而骯臟的任務。
有些項目經理對你正在做的事情不感興趣,除非你做完了。我想這些家伙把管理提升到了一個全新的水平。

哦!你是數據科學家?你一定對數字很在行。你為什么不看看我的文件,把數據處理一下呢?我聽說你的“蟒蛇”能很快釋放出魔力。在這里,去玩我的文件,完成后來看我。

-怎么辦?
為了使每個人都在同一頁上,一個解決方案是向沒有技術背景的團隊提供培訓和意識。這需要通過內部研討會、認證或MOOC訂閱廣泛的技術主題,如機器學習、深度學習NLP的介紹性講座。當建立這些領域的知識時,隊友會變得積極主動,更多地參與到建立過程中。項目經理也意識到了挑戰。

數據科學家仍然被認為是拉皮條的營銷工具

嗯,十年前,當這個領域開始出現時,這個方法非常有效,Hadoop和Spark這個詞到處都是。你可以把你知道的所有流行語都堆在一起,希望得到一個大支票(它奏效了?。?。

這已經不是2010年了。公司現在密切關注你愿意出售的東西。他們了解市場、競爭對手和挑戰。他們幾乎徹底掃描了所有東西。他們也知道什么是可行的,什么是不可行的。如果你沒有脫穎而出,對你的價值主張和你的數據科學團隊能帶來的技術專長不夠清楚,你最有可能失去這筆交易。

當然,盡管如此,總有一些穿西裝的膽子很大的家伙發表這種鼓舞人心的聲明:

讓我們在這里和那里投入一點數據科學來加強我們的宣傳,并讓客戶支付一大筆錢!

那不是很美嗎?

— What to do?
不要表現得好像數據科學家會徹底改變和破壞您的組織。市場開始知道限制是什么。與市場接軌。

你不應該是一只小手,它的工作沒有得到足夠的榮譽。

我們都知道這種感覺,而且很爛。你在努力工作中失敗了,而另一個人展示了你的結果,并拿走了所有的功勞。這在任何地方都很常見,當您在數據科學團隊中與業務伙伴協作時,這種情況會發生得更多。

如果你對團隊很有價值,你的同事自然應該讓你在利益相關者面前發光發熱。然后你的聲音被聽到并參與決策過程。

然而,如果你覺得你被當作一種可互換的資源,或者被放在一邊,在陰影下工作,為那些說話的人制作數字,也許是時候重新考慮你的立場了。

— What to do?
構建數據產品時,每個人都很重要。這不應該僅僅是我們告訴自己的一個說法。它必須體現在我們的會議、演示和日常關系中。

數據科學家不能根據要求產生洞察力

嗯,雖然聽起來很誘人,但這并不像我們想象的那么容易。僅僅因為我們配備了這些工具并不一定意味著你可以期待立即的可操作的結果。這需要建立關于業務的知識,建立正確的直覺和假設。這需要時間,而且是一個學習的過程。

讓我們處理數據并讓它說話。

— What to do?
接受這樣一個事實,即數據科學家必須花費大量時間了解業務并建立自己的直覺。這需要采訪組織中的不同參與者,對數據進行各種分析,進行試驗,失敗,并獲得持續的建設性反饋。
如果您還想為您的數據科學團隊提供最好的條件,請確保至少有干凈的數據管道,并有清晰的描述。

數據科學家不可能是每一個數據相關問題的負責人

對于數據科學家的角色仍然存在著強烈的誤解。不僅非技術高管,技術領域的其他同事也認為,數據科學家對Spark、Hadoop、SQL、TensorFlow、NLP、AWS、生產級應用程序、docker等都了如指掌。掌握這些工具是很棒的,但是這個過程需要幾年的時間和大量的經驗。

如果你是一名數據科學家,你申請的公司在一份申請中提到了所有這些技術詞匯,請仔細檢查該公司。它有可能對自己的數據戰略沒有明確的愿景,也沒有對招聘的角色有明確的定義。

我們需要修復我們的數據問題。讓我們雇傭一名數據科學家。

— What to do?
數據科學家并不總是您數據問題的最終解決方案-雇用前要仔細檢查。也許你需要的是一個數據分析師或者一個后端開發人員。數據科學家不是精通一切的忍者。

給那些想要建立強大數據團隊的人的親貼士

如果你希望你的團隊成功地構建你想要構建的任何東西,確保你周圍有互補的技能。

在交付一級:

  • 數據科學家構建復雜的機器學習模型,繪制復雜的分析,并根據度量制定業務需求。
  • data Engineers構建健壯的數據管道,以便數據科學團隊在任何時候都可以訪問和清潔數據
  • ML/AI工程師:這是該領域出現的一個新角色。我把它看作是數據科學家和數據工程師之間的混合配置文件。在實踐中,它是一個超越建模并考慮部署方面的數據科學家。例如,他解決的問題是:如何使模型可伸縮?如何正確處理我的申請?如何確保推斷時的低延遲?等
  • 前端和后端開發人員構建集成和打包機器學習邏輯的web應用程序。它們涉及代碼質量、健壯性、安全性、設計、穩定性、構建API等。
    數據科學家可以找到構建小型web應用程序的方法,但請記住這不是他的專長。如果您想要一個專業的移動或web應用程序,請雇傭一個開發團隊。

在管理層面:

  • 數據科學經理:這些是管理團隊中技術含量最高的配置文件。他們監督數據科學團隊,并確保他們做出正確的(建模)決策。
  • 項目經理:他們確保事情在最后期限內如期進行。他們發現阻塞問題,并直接與業務或客戶機交互。
  • Chier數據官員(CDO):這是最高管理角色。他的目標是在組織內部注入文化,尋找項目,建立業務。

這是基于來自朋友和同事的討論和幾個反饋的匯編。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢