熱線電話:13121318867

登錄
首頁大數據時代如何戰勝機器學習工程師冒名頂替綜合癥
如何戰勝機器學習工程師冒名頂替綜合癥
2022-02-21
收藏

語境

當我第一次申請l時,我想同時成為一名自由職業者和一名“真正的ML工程師”。

在此之前,我在Nordeus擔任機器學習工程師,Nordeus是一家頂級移動游戲公司,以其旗艦游戲TopEleven上有穆里尼奧的臉而聞名。我在Nordeus的機器學習經歷包括設計和實現一個智能系統,以幫助客戶支持團隊更快地解決玩家問題。它的本質是從大量的歷史球員門票和代理決議中構建一個文本分類器。

我考慮了整個系統,數據(至少我是這么想的),以及對GPU的訪問。從紙面上看,一切似乎都對我來說剛剛好,可以展示一個偉大的模型和一個更好的解決方案。

但這從未發生過。令我絕望的是,我花了一個多月的時間才意識到,我試圖用來訓練我的監督模型的數據集已經非常糟糕了。在意識到這一點之前,我花了數不清的時間和Jupyter筆記本試圖讓整個事情運轉起來。我工作太忙了,抽不出時間看資料。我們可以說我缺乏經驗沒有幫助。

在這個失敗的項目三個月后,我決定辭去工作,在Toptal開始我的自由職業之路。經過幾輪面試和技術篩選,我進入了最后一輪。猜猜看?我得解決一個機器學習作業。幾乎和我以前失敗的那個一模一樣。我有一周的時間來完成它。

很難描述那一周我不得不與之作斗爭的消極自我談話的數量。冒名頂替綜合癥的長長的陰影迷惑了我的頭腦。

這一章有一個圓滿的結局。我很好地解決了這個問題,我進入了托普塔爾。三年10個項目后,我可以說我處理冒名頂替綜合癥好多了。

提示1。勇敢嘗試自由職業

勇敢是對你幫助最大的事情。自由職業者是勇敢的。如果你想了解更多,請查看我以前關于如何成為自由數據科學家的文章。

當你作為自由職業者/承包商工作時,來自你工作的反饋不會出現在季度或年度審查中。它每天都來。沒有辦法破解??蛻羝谕峁┵|量和快速。順便說一句,這就是為什么你會比在目前的工作中得到更好的報酬的主要原因。

一旦你覺得你已經掌握了ML的基本原理,就把自己放在拳擊臺上??简災阕约?。你很聰明,你能做到。參加更多的在線課程并不能讓冒名頂替綜合癥消失。相信我.

IMHO排名前2的自由職業平臺是

  • 托普塔爾。全球排名第一的頂尖人才自由職業平臺。他們有一個相當苛刻的申請過程,但這是非常值得經歷的。這些天,偉大的企業和新興的初創企業都在使用Toptal來實現ML解決方案。到達那里會給你很多發光的機會。
  • 腦力信任。一個新興的人才網絡,受到新鮮的新經濟模式的啟發(聽說過以太坊嗎?)。他們長得很快,我希望他們很快就能趕上托普塔爾。

提示2。永遠不要忘記數據。從不

由于數據(大寫字母,是的),ML工程比傳統軟件工程更難。

很少有機會給你一套完整的特性和標簽來構建你的ML模型。相反,您通常需要自己生成訓練數據。在這個意義上,我遇到的最常見的問題是:

  • 訓練數據有缺陷。通常,您從SQL查詢和某種Python腳本生成這些數據,以自動提取原始特征和標簽。編寫SQL查詢很簡單,但調試它們可能相當困難。提高你的SQL技能是成為一個更好的ML工程師所能做的最好的事情之一。
  • 訓練數據不完整。在生成訓練數據的第一個版本之后,您將跳轉到ML開發的下一個階段,并構建一個快速的基線模型。通常情況下,這個基線模型不足以解決業務問題,因此您需要迭代。沒有經驗的ML開發人員往往過多地關注于改進模型,而忘記了他們創建的數據集。這是一個典型的錯誤,會導致挫敗感和冒名頂替綜合癥的感覺?;氐綌祿先?。擴展SQL查詢以添加更多相關功能。與您環境中的領域專家(數據工程師、商業智能人員……)交談,這些專家可以幫助您獲取數據,從而移動針并解除阻塞。

數據是推動所有模型的神奇成分,從簡單的線性回歸到巨大的變壓器模型。如果燃料不好,你開哪輛車都無關緊要。你不打算搬家。

這聽起來如此瑣碎和愚蠢,以至于我們(我包括我自己)ML工程師有一種令人驚訝的忘記的傾向。當您獲得更多構建ML解決方案的經驗時,您會更好地記住這一點,并在遇到問題時返回數據。

不能使用Stackoverflow調試數據集。你一個人在那里。你需要改變你的心態。你必須表現得像個解決問題的人。您需要了解數據集,最好的方法是將其可視化。我個人喜歡Tableau Desktop,但也有其他選擇,如Power BI、Apache Superset等。如果您愿意,甚至還有Python庫,如SweetViz。

無論您喜歡哪種工具,每次卡住時都要返回數據。

提示3:不要期望知道所有的事情(尤其是在開始的時候)。

機器學習是一個涵蓋廣泛技術復雜性的領域:軟件開發、操作化(MLOps)、經典ML、深度學習的前沿研究、硬件優化…

如果你試圖掩蓋一切,你會失去焦點,在表面上游蕩太多。了解ML中的某些內容意味著您已經自己實現了它。句號。

例如,跟上DL的最新進展是非常棒的。但要有原則地去做。為自己設定一個明確的目標(例如,我想成為變壓器模型的專家),并為自己建立一條通往該目標的道路,選擇相關的論文、圖書館、網絡研討會,甚至會議。

從一個話題跳到另一個話題讓你很忙但注意力不集中。保持謙遜。從小處著手,集中精力。一旦你到達那里,邁出下一步,征服另一個領域。

結論

克服你的恐懼是每天(全職)的工作。不僅僅是在機器學習中,而是在你生活的每個方面,在這些方面你希望明天成長和變得更好。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢