
作者布蘭登·科斯利,FastDataScience.ai
數據科學家需求不足,沒有兩種方法。工作崗位嗯,有很多空缺,這個行業似乎只是在這個后疫情時代的數字世界里才有所增長。因此,數據科學專業的學生也是世界勞動力中日益增長的一部分,這就不足為奇了。但是學習數據科學并不容易。事實上,它是錯誤的,而且很難有幾個好的原因:
1.數據科學作為一個專業融合了許多不同的子專業,這些子專業本身就是專業,如數據工程、編程、統計學和數據可視化。
2.該行業及相關工具和技術正在迅速發展,使人很難知道將研究重點放在哪里。
3.教育機構(大學、數字教程)教授的數據科學與企業使用的數據科學之間存在差距。
4.由于所需知識的廣泛性,很容易對一個人向未來雇主有效地傳達自己所受教育的價值的能力失去信心。
我記得我自己試圖從一個精通數據的學術研究員變成一個行業數據科學專業人士的經歷。我把自己暴露在所有的教程、博客和MOOC中,我可以。我沉浸在行業新聞和趨勢中。我把我的桶裝滿了,發現我學得越多,我就越意識到我不知道。我壓力很大,對自己擁有的技能缺乏信心,感覺自己就像一個冒名頂替的人,去參加數據科學面試,希望自己不會被“抓住”,因為我沒有花足夠的時間在損失函數上。
我全神貫注于數據科學教育,希望我的廣泛接觸能引導我實現我的目標,并獲得更好的薪水。我當時沒有意識到的是,我已經本末倒置了。我是如此渴望學習,以至于我把所有的時間都花在學習很多“東西”上,從來沒有停下來問自己;所有這些“東西”如何結合起來解決真正的問題?
請允許我告訴你一個明顯的秘密,大多數企業不關心數據科學“東西”,大多數企業只關心這些東西是否能解決業務問題。因此,問題就在這里,試圖學習數據科學的所有工具,這樣你的簡歷就可以充滿一個不斷擴大的“東西”列表(Python、R、回歸、隨機森林、幼稚貝葉斯、馬爾可夫鏈、支持向量機、k-means聚類、XGBoost、卷積神經網絡、自然語言處理,等等)是徒勞的。
這些“事情”不會把你引向你的目標,因為你的目標只是由你覺得自己被重視的地方來定義的。您將感到有價值的地方是允許您不斷發展的數據科學知識應用于解決問題的地方。能夠交流如何利用一些數據科學工具來解決問題,將比簡單地列出您在一個或另一個類中接觸過的所有算法在業務上走得更遠。
總之,先找個目的。你關心什么?你的激情在哪里?你想解決什么問題?一旦你有了一個列表,選擇一些東西,并考慮如何應用你的數據科學知識來解決與該興趣相關的問題。
通過首先找到你的目的,你將結合上下文來學習你的數據科學教育,你將尋求學習的工具將感覺不那么壓倒性,因為有任何意義的應用工具必然會更少。
知識、激情和對問題的理解也會開啟你的創造力。創造性的問題解決是看到我們對兩個或更多不同領域的理解如何以新穎的方式結合在一起。如果我們只在我們的“罐頭”數據集和冷靜分配的問題的背景下學習數據科學,我們就不再能夠從多個領域跨越我們的知識深度。
通過首先找到您的目的,您將很快了解到解決相同問題有許多不同的數據科學解決方案。換句話說,在數據科學中很少有對錯之分,更常見的是業務問題可以用無數種方法來解決。有些解決方案比其他的好嗎?當然可以。但這并不意味著那些不是最優的就是錯的,相反,它們只是沒有那么好。有了足夠的錢和時間,總有一個“更好”的解決方案,所以最好不要太過陷入這種螺旋。相反,關注你所擁有的知識如何能帶來比以前更多的價值,或者通過揭示在其他人身上不明顯的新見解來增加現有的解決方案。
通過首先找到你的目的,你將解決大多數數據科學課程中經常沒有教的問題,但它們是企業數據科學家每天都要面對的問題。以尋找正確數據的簡單問題為例。大多數數據科學課程不會教你數據發現的價值,但在企業中,數據科學家通常負責發現并與新的數據集混合,以進一步實現收集的數據和雇傭的數據科學家對其進行評估的價值。先有目的地學習數據科學將迫使您尋找獲取與您的問題最相關的數據的方法,它將要求您訪問、爭論和設計這些數據,以便它能夠用機器學習模型進行訓練。
最后,通過首先找到您的目的,您將知道如何傳達您構建的解決方案的價值。
我的目的是社會公正。我想使用數據科學的工具和技能來提供信息,以產生揭露不公正的洞察力,為積極的社會變革提供解決方案,并幫助我們認識到人類偏見的含義。
在我的第一個項目中,我想幫助三班工人識別車輛犯罪的口袋,以支持更安全的停車決定。我必須找到當地公共警察報告數據,并將其與人口普查數據等其他數據源混合。利用我所擁有的數據科學知識,我可以建立一個預測模型,根據周圍位置的特征來預測汽車經歷車輛犯罪(例如盜竊、破壞)的可能性。這個項目讓我學會了基本的數據爭論,如何導出一些地理空間特征,測試不同分類模型的準確性,如隨機森林、邏輯回歸和樸素貝葉斯,使用Tableau Public進行基本的可視化,以及如何設置管道在每次刷新警方數據時刷新儀表板。
還有其他問題我可以解決嗎?當然了.我可以用其他工具來解決這個特定的問題嗎?最肯定的是。我想出了最好的解決方案,甚至是市場上唯一的解決方案嗎?不是一個機會,但我的解決方案比那里的更好,這沒什么。
我不僅學習了上面提到的具體工具,而且對數據科學的過程獲得了更多的直覺。我能夠更清楚地闡明為什么我希望使用特定數據類型的特定分類模型而不是其他分類模型。最重要的是,我能夠充滿激情地談論這些工具是如何讓我通過結合數百個數據點來做出明智的決定的。
現在,當面對新的目的,并詢問是否有數據科學解決方案來克服與該目的相關的問題時,我不再對我不知道的事情感到缺乏信心。我利用這個目的來應用我所知道的,解釋我的方法,并確定一些新的東西要學習,并相信我可以。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25在當今數字化時代,數據分析師的重要性與日俱增。但許多人在踏上這條職業道路時,往往充滿疑惑: 如何成為一名數據分析師?成為 ...
2025-04-24