
分享
數據科學有志之士最常見的問題之一是 "對于機器學習,我需要知道多少數學?" 希望進入機器學習領域的學生往往將數學視為一個巨大的入門障礙。
行業中的守門人對這種擔憂沒有幫助,他們給學生貼上了不合格的標簽,除非他們擁有該學科的碩士或博士學位。
那么,為了在數據科學行業工作,你需要知道多少數學?
答案是。沒有你想象的那么多。
大多數公司在數據的幫助下解決非常類似的用例。他們要求數據科學家建立機器學習模型,可以預測客戶流失,進行細分,并預測銷售。
用于解決這些問題的方法是相似的,而且任務變得相當重復。沒有必要重新發明輪子,他們使用開箱即用的ML算法。
即使出現了需要建立自定義機器學習模型的情況,對特定主題的直觀理解也是足夠的。你不需要去深究,也絕對不需要成為數學專家來成為數據科學家。
例如,我們知道梯度下降是用來尋找線性回歸中的最佳擬合線的。你不需要開始學習如何解決微分方程,你只需要了解微積分的原理,就可以了解到這是如何做到的。
同樣,如果你要用Tensorflow構建一個神經網絡--你需要進行大量的矩陣操作,但你將在計算機程序的幫助下進行。由于這個原因,你不需要回去練習解代數方程。你只需要了解它們是如何工作的。
在這篇文章中,我將為你指出一些資源,幫助你開始學習數據科學的數學。我將專注于三個領域--線性代數、微積分和統計。
線性代數
線性代數--從基礎到前沿。edX上的這門課程將在本科水平上教你線性代數。它從一個緩慢的空間開始,只要你有高中水平的數學知識,你就可以學習這個課程。
這門課程最好的地方是,它用Matlab中的實際例子教你線性代數,這讓你通過算法和編程的視角來看待這個學科。如果你的目標是學習機器學習的線性代數,這種學習方法特別有用。
這個課程可以免費試聽。如果你想獲得結業證書,你可以申請財政援助。
3Blue1Brown--《線性代數精華》:我以前沒有上過這門課,但在我自己尋找數學學習資源的過程中,曾多次遇到它。
許多有志于機器學習的人對這門課程深信不疑,因為它為學習者提供了對線性代數的概念性理解。與其學習任意的公式或機械地推導它們,你將獲得對線性代數如何工作的直覺。如果你的最終目標是將這些概念應用于機器學習模型,這將是非常有幫助的。
微積分
我推薦兩門為機器學習學習微積分的課程。微積分的本質》是3Blue1Brown開設的一門偉大的微積分入門課程。同樣,這將為你提供對微積分概念的直觀理解,并深入解釋公式背后的意義,而不僅僅是讓你記住它們。
接下來,你可以學習3Blue1Brown的神經網絡系列。如果你知道如何使用Keras等庫實現神經網絡,但并不真正了解這些模型背后的工作原理,你應該學習這門課程。它為你提供了梯度下降算法的全面解釋,以及其背后的微積分概念。
統計數字
概率與統計:To p or not to p???-庫塞拉
這是我所學過的最好的統計學入門課程之一,由倫敦大學提供。這門課程是針對主修非數學專業的學生,如商業和金融。
正因為如此,統計學概念的解釋方式簡單易懂,并有許多真實世界的例子。
學習本課程后,你將對描述性和推斷性統計、不同的抽樣分布、抽樣技術、置信區間以及P值的計算方法有所了解。
所有這些概念都可以直接應用于現實世界的數據分析。
統計學習-edX
這是另一個學習機器學習模型背后的直覺的優秀課程。
與本列表中的其他資源一樣,本課程不太注重數學公式,而是以概念的方式解釋機器學習模型。
然而,要學習這門課程,建議有一些微積分知識,因為導師傾向于使用符號,否則可能會使你感到困惑。
你將學習線性和邏輯回歸等概念,以及正則化技術,如脊和套索回歸,以及何時使用它們。有一整堂課專門討論用于減輕過擬合的技術,并解釋了這些技術背后的基本數學直覺。
這是我上過的最有幫助的課程之一,因為它幫助我不再把機器學習模型當作黑盒子。我對不同類型的模型應該用在什么地方,什么時候應該應用降維,以及什么時候執行不同種類的特征選擇技術有了了解。
我花了很多時間試圖回到過去,學習本科階段的微積分和線性代數。然而,盡管花了很多時間學習公式和解微分方程,我的知識還是有脫節,因為我從來沒有完全理解這些概念與機器學習算法的關系。
上述資源是突破這一障礙的好方法,因為它們讓你對機器學習背后的數學有一個概念性的理解,而不是把你帶入復雜公式和定理的兔子洞。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25在當今數字化時代,數據分析師的重要性與日俱增。但許多人在踏上這條職業道路時,往往充滿疑惑: 如何成為一名數據分析師?成為 ...
2025-04-24以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《劉靜:10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda ...
2025-04-23