熱線電話:13121318867

登錄
首頁大數據時代停止學習數據科學尋找目的,找到目的學習數據科學
停止學習數據科學尋找目的,找到目的學習數據科學
2022-02-21
收藏

作者布蘭登·科斯利,FastDataScience.ai

數據科學家需求不足,沒有兩種方法。工作崗位嗯,有很多空缺,這個行業似乎只是在這個后疫情時代的數字世界里才有所增長。因此,數據科學專業的學生也是世界勞動力中日益增長的一部分,這就不足為奇了。但是學習數據科學并不容易。事實上,它是錯誤的,而且很難有幾個好的原因:

1.數據科學作為一個專業融合了許多不同的子專業,這些子專業本身就是專業,如數據工程、編程、統計學和數據可視化。

2.該行業及相關工具和技術正在迅速發展,使人很難知道將研究重點放在哪里。

3.教育機構(大學、數字教程)教授的數據科學與企業使用的數據科學之間存在差距。

4.由于所需知識的廣泛性,很容易對一個人向未來雇主有效地傳達自己所受教育的價值的能力失去信心。

我記得我自己試圖從一個精通數據的學術研究員變成一個行業數據科學專業人士的經歷。我把自己暴露在所有的教程、博客和MOOC中,我可以。我沉浸在行業新聞和趨勢中。我把我的桶裝滿了,發現我學得越多,我就越意識到我不知道。我壓力很大,對自己擁有的技能缺乏信心,感覺自己就像一個冒名頂替的人,去參加數據科學面試,希望自己不會被“抓住”,因為我沒有花足夠的時間在損失函數上。

我全神貫注于數據科學教育,希望我的廣泛接觸能引導我實現我的目標,并獲得更好的薪水。我當時沒有意識到的是,我已經本末倒置了。我是如此渴望學習,以至于我把所有的時間都花在學習很多“東西”上,從來沒有停下來問自己;所有這些“東西”如何結合起來解決真正的問題?

請允許我告訴你一個明顯的秘密,大多數企業不關心數據科學“東西”,大多數企業只關心這些東西是否能解決業務問題。因此,問題就在這里,試圖學習數據科學的所有工具,這樣你的簡歷就可以充滿一個不斷擴大的“東西”列表(Python、R、回歸、隨機森林、幼稚貝葉斯、馬爾可夫鏈、支持向量機、k-means聚類、XGBoost、卷積神經網絡、自然語言處理,等等)是徒勞的。

這些“事情”不會把你引向你的目標,因為你的目標只是由你覺得自己被重視的地方來定義的。您將感到有價值的地方是允許您不斷發展的數據科學知識應用于解決問題的地方。能夠交流如何利用一些數據科學工具來解決問題,將比簡單地列出您在一個或另一個類中接觸過的所有算法在業務上走得更遠。

那么,我應該如何學習數據科學呢?

總之,先找個目的。你關心什么?你的激情在哪里?你想解決什么問題?一旦你有了一個列表,選擇一些東西,并考慮如何應用你的數據科學知識來解決與該興趣相關的問題。

有目的的數據科學的好處

通過首先找到你的目的,你將結合上下文來學習你的數據科學教育,你將尋求學習的工具將感覺不那么壓倒性,因為有任何意義的應用工具必然會更少。

知識、激情和對問題的理解也會開啟你的創造力。創造性的問題解決是看到我們對兩個或更多不同領域的理解如何以新穎的方式結合在一起。如果我們只在我們的“罐頭”數據集和冷靜分配的問題的背景下學習數據科學,我們就不再能夠從多個領域跨越我們的知識深度。

通過首先找到您的目的,您將很快了解到解決相同問題有許多不同的數據科學解決方案。換句話說,在數據科學中很少有對錯之分,更常見的是業務問題可以用無數種方法來解決。有些解決方案比其他的好嗎?當然可以。但這并不意味著那些不是最優的就是錯的,相反,它們只是沒有那么好。有了足夠的錢和時間,總有一個“更好”的解決方案,所以最好不要太過陷入這種螺旋。相反,關注你所擁有的知識如何能帶來比以前更多的價值,或者通過揭示在其他人身上不明顯的新見解來增加現有的解決方案。

通過首先找到你的目的,你將解決大多數數據科學課程中經常沒有教的問題,但它們是企業數據科學家每天都要面對的問題。以尋找正確數據的簡單問題為例。大多數數據科學課程不會教你數據發現的價值,但在企業中,數據科學家通常負責發現并與新的數據集混合,以進一步實現收集的數據和雇傭的數據科學家對其進行評估的價值。先有目的地學習數據科學將迫使您尋找獲取與您的問題最相關的數據的方法,它將要求您訪問、爭論和設計這些數據,以便它能夠用機器學習模型進行訓練。

最后,通過首先找到您的目的,您將知道如何傳達您構建的解決方案的價值。

我的目的是什么?它如何改變了我的教育?

我的目的是社會公正。我想使用數據科學的工具和技能來提供信息,以產生揭露不公正的洞察力,為積極的社會變革提供解決方案,并幫助我們認識到人類偏見的含義。

在我的第一個項目中,我想幫助三班工人識別車輛犯罪的口袋,以支持更安全的停車決定。我必須找到當地公共警察報告數據,并將其與人口普查數據等其他數據源混合。利用我所擁有的數據科學知識,我可以建立一個預測模型,根據周圍位置的特征來預測汽車經歷車輛犯罪(例如盜竊、破壞)的可能性。這個項目讓我學會了基本的數據爭論,如何導出一些地理空間特征,測試不同分類模型的準確性,如隨機森林、邏輯回歸樸素貝葉斯,使用Tableau Public進行基本的可視化,以及如何設置管道在每次刷新警方數據時刷新儀表板。

還有其他問題我可以解決嗎?當然了.我可以用其他工具來解決這個特定的問題嗎?最肯定的是。我想出了最好的解決方案,甚至是市場上唯一的解決方案嗎?不是一個機會,但我的解決方案比那里的更好,這沒什么。

我不僅學習了上面提到的具體工具,而且對數據科學的過程獲得了更多的直覺。我能夠更清楚地闡明為什么我希望使用特定數據類型的特定分類模型而不是其他分類模型。最重要的是,我能夠充滿激情地談論這些工具是如何讓我通過結合數百個數據點來做出明智的決定的。

現在,當面對新的目的,并詢問是否有數據科學解決方案來克服與該目的相關的問題時,我不再對我不知道的事情感到缺乏信心。我利用這個目的來應用我所知道的,解釋我的方法,并確定一些新的東西要學習,并相信我可以。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢