熱線電話:13121318867

登錄
首頁大數據時代5數據科學職業生涯中應避免的錯誤
5數據科學職業生涯中應避免的錯誤
2022-02-28
收藏

當我第一次從金融學過渡到數據科學時,我覺得自己就像站在了世界之巔--我在我夢想的領域找到了一份工作,我的職業軌跡已經確定,我只會低著頭努力工作,哪里會出錯?嗯,有幾件事……在接下來的一年里,作為一名數據科學家,我很高興我發現自己在職業生涯早期犯了幾個錯誤。這樣,我就有時間在為時已晚之前進行反思和糾正。過了一會兒,我意識到這些錯誤是相當普遍的。事實上,我已經觀察到我周圍的很多DS仍然在犯這些錯誤,而沒有意識到從長遠來看,這些錯誤可能會損害他們的數據生涯。

如果我的5條麥肯錫教給我的讓你成為更好的數據科學家的經驗教訓是我從最好的方面學到的,那么本文中的經驗教訓是我辛苦學到的,我希望我能幫助你避免犯同樣的錯誤。

錯誤1:把自己當成步兵而不是思想伙伴

在成長過程中,人們總是根據我們如何遵守規則和秩序來評價我們,尤其是在學校里。如果你遵循課本,練習考試,只要投入艱苦的學習,你就會成為優等生。許多人似乎把這種“步兵”的心態帶到了他們的工作環境中。在我看來,正是這種心態阻礙了許多數據科學家最大限度地發揮他們的影響,并從同行中脫穎而出。我觀察到很多DS,尤其是低年級的DS,認為他們對決策過程沒有什么貢獻,寧愿退居二線,被動地執行為他們做出的決策。這引發了一個惡性循環--你對這些討論的貢獻越少,利益相關者就越不可能讓你參與未來的會議,你在未來做出貢獻的機會也就越少。

讓我給你一個具體的例子,在模型開發的情況下,一個步兵和一個思想伙伴之間的區別。在數據收集和功能集思廣益會議中,以前的我總是被動地記錄涉眾的建議,這樣我就可以在以后“完美”地實現它們。當有人提出一個特性,我知道我們沒有數據,我不會說任何基于假設,他們更資深,他們一定知道一些我忽略了。但你猜怎么著,他們沒有。我后來會面臨這樣的情況,即我們集思廣益的50%的特性將需要額外的數據收集,這將危及我們的項目截止日期。結果,我經常發現自己最終處于壞消息傳遞者的不受歡迎的位置。如今,我努力成為一個思想伙伴,我在談話的早期就參與進來,并利用我作為最接近數據的人的獨特地位。通過這種方式,我可以在早期管理涉眾的期望,并提出建議來幫助團隊前進。

如何避免這種情況:

  • 確保在可以從數據角度做出貢獻的會議上不要退縮:涉眾對度量標準的定義是否足以滿足他們想要度量的內容?是否有數據可用于測量這組指標?如果沒有,我們能為我們所擁有的數據找到代理嗎?
  • 冒名頂替綜合癥是真實的,尤其是在青少年DS中。確保你意識到這一點,當你質疑是否應該說一些“別人可能已經想到”的事情,或者問一個“愚蠢的澄清問題”時,你應該說。
  • 對其他人在做什么保持一定程度的好奇心。在很多情況下,我發現我可以通過注意其他人由于缺乏對公司數據的了解而忽略的差距來增加價值。

錯誤2:把自己歸入數據科學的特定領域

我想成為一名數據工程師還是數據科學家?我想處理市場和銷售數據還是地理空間分析?您可能已經注意到,到目前為止,我在本文中一直使用術語DS作為許多與數據相關的職業道路(例如,數據工程師、數據科學家、數據分析師等)的通用術語。這是因為在當今的數據世界中,這些標題之間的界限是如此模糊,尤其是在較小的公司中。我觀察到許多數據科學家認為自己只是構建模型的數據科學家,而不關注任何業務方面,或者數據工程師只關注數據管道,而不想知道公司正在進行的任何建模。

最好的數據人才是那些能夠身兼數職或至少能夠理解其他數據角色的流程的人。如果您想在早期階段或成長階段的初創企業工作,這尤其方便,因為那里的功能可能還沒有那么專業化,而且您需要靈活并涵蓋各種與數據相關的職責。即使你在一個明確定義的工作概要中,隨著時間的推移,你獲得了更多的經驗,你可能會發現你有興趣過渡到一個不同類型的數據角色。如果你不把自己和你的技能歸類于一個特定角色的狹隘焦點,這個支點會容易得多。

如何避免這種情況:

  • 同樣,對其他數據角色正在處理的項目感到好奇。安排與同事的定期會議,相互討論感興趣的項目,或者讓不同的數據團隊定期相互分享他們的工作/項目。
  • 如果你不能在工作中接觸到其他數據角色,試著保持/練習你在空閑時間不使用的數據技能。例如,如果您是一名數據分析師,并且有一段時間沒有接觸建模,可以考慮通過像Kaggle競賽這樣的外部項目來練習這些技能。

誤區三:跟不上領域發展


自滿扼殺生命

每個士兵都知道這一點,每個DS也應該知道。對自己的數據技能沾沾自喜,而不花時間學習新的技能是一個常見的錯誤。在數據領域這樣做比在其他一些領域更危險,因為數據科學是一個相對較新的領域,仍在經歷劇烈的變化和發展。不斷有新的算法、新的工具,甚至新的編程語言被引入。

如果你不想成為那個在2021年仍然只知道如何使用STATA的數據科學家(他存在,我和他一起工作過),那么你需要跟上該領域的發展。

如何避免這種情況:

  • 注冊在線課程,學習新的概念和算法,或者重溫你已經知道但在工作中很久沒有使用的概念和算法。學習能力是每個人都應該不斷練習的肌肉,成為一個終身學習者可能是你能給自己的最好禮物。
  • 注冊DS時事通訊或關注媒體上的DS博客/出版物,并養成關注DS“新聞”的習慣。

錯誤4:過度展示你的分析能力


如果你只有一把錘子,一切看起來都像釘子。不要成為那個什么都想用ML的DS。當我第一次進入數據科學的世界時,我對我在學校學到的所有花哨的模型感到非常興奮,迫不及待地想在現實世界的問題上嘗試所有這些模型。但現實世界與學術研究不同,80/20規則總是在發揮作用。

在我之前的一篇關于“麥肯錫教給我的5堂課”的文章中,我寫到了商業影響和可解釋性有時比你的模型的準確性多出幾個百分點更重要。有時,假設驅動的Excel模型可能比多層神經網絡更有意義。在這種情況下,不要過度彎曲你的分析肌肉,使你的方法矯枉過正。相反,發揮你的商業實力,做一個同樣具有商業頭腦的DS。

如何避免這種情況:

  • 在你的軍械庫中擁有全方位的分析技能/工具,從簡單的Excel到高級的ML建模技能,這樣你就可以隨時評估在這種情況下使用哪種工具是最好的,而不是帶著槍去打架。
  • 在深入分析之前了解業務需求。有時涉眾會請求ML模型,因為它是一個流行的概念,他們對ML模型能做什么有不切實際的期望。作為DS你的工作是管理期望,幫助他們找到更好更簡單的方法來實現他們的目標。記得嗎?做思想伙伴,而不是步兵。

錯誤五:認為構建數據文化是別人的工作

在我的文章 "建立偉大的數據文化的6個基本步驟 "中,我寫到如果公司沒有偉大的數據文化,數據科學家的生活可能是可怕的和無益的。事實上,我已經聽到很多DS抱怨那些沒有生產力的臨時數據請求,這些請求應該很容易被利益相關者以自給自足的方式處理(例如,在Looker中把一個匯總從每月改為每天,這簡直包括兩次點擊)。不要認為改變這種文化是別人的工作。如果你想看到改變,就去做吧。畢竟,誰比數據科學家自己更有能力建立數據文化和教育利益相關者了解數據?幫助建立公司的數據文化將使你和你的利益相關者的生活更容易。

如何避免這種情況:

  • 為非分析性涉眾進行培訓并開發自我服務資源是你的責任。
  • 確保你開始實踐你所宣揚的,開始將查詢鏈接到幻燈片,將真理的數據源鏈接到文檔,并開始記錄你的代碼和數據庫。你不可能在一夜之間建立起數據文化,所以這肯定需要耐心。

我確實想指出,在你的職業生涯中犯錯是可以的。最重要的是從這些錯誤中吸取教訓,并在將來避免它們?;蛘吒玫氖?,把它們寫下來幫助別人避免犯同樣的錯誤。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢