
對于數據科學來說,現在是發展的黃金時期。這是個新領域,但增長迅速,同時數據科學家的缺口也很大。最好的學習方法是通過實踐,知道自己真的需要學習什么,最重要的是,當你通過這種方式學習,你可以獲得立刻就可以用到的技能。
1、學會愛數據
數據科學是一個廣泛而模糊的領域,這使得它很難學習。 沒有動力,你最終會中途停止對自己失去信心。你需要些東西來激勵你不斷學習,即使是在半夜公式已經開始變的模糊,你還是想探究關于神經網絡的意義。你需要些動力來讓你發現統計、線性代數和神經網絡之間的聯系,當你在困惑“下一步我該學習什么?”的時候。我學習的入口是用數據來預測股市,盡管當時我完全不熟悉。我編碼的第一批項目用于預測股票幾乎沒有統計,但是我知道它們表現的并不好,所以我日以繼夜的工作讓它們變的更好。我癡迷于改善程序的性能,我癡迷于股票市場,我學習去愛數據。我去學習一切能讓這個項目結果更好的技能。并不是每個人都會癡迷于股市預測,但重要的是要發現你想學習的東西。數據可以計算出關于你的城市很多新鮮有趣的事情,比如所有設備在互聯網上的映射、找到真正的NBA球員的位置,今年又哪些地方有難民,或者是其他事情。數據科學的偉大之處是有無限有趣的東西可以發現——那就是問問題然后找到一個方法來得到答案。
2、在實踐中學習
學習神經網絡、圖像識別和其他尖端技術是很重要的,但大多數數據科學工作不涉及這些:90%的工作將是數據清理。精通幾個算法比知道一點許多算法要好。如果你知道線性回歸、k – means聚類和邏輯回歸可以解釋和詮釋他們的研究結果,并可以用這些完成一個項目,你將比如果你知道每一個演算法,但不使用它們更優秀。大多數時候,當你使用一種算法,它將是庫中的一個版本(你很少會自己編碼支持向量機實現——這需要太長時間)。所有這些意味著最好的學習方法是在項目工作中學習,通過項目,你可以獲得有用的技能。
一種方法是在一個項目中先找到一個你喜歡的數據集,回答一個有趣的問題。這里有一些好的地方。
另一種方法是找到一個深層次的問題,例如預測股票市場,然后分解成小步驟。 我第一次連接到雅虎財經的API,并爬下每日價格數據。然后我創建了一些指標,比如在過去的幾天里的平均價格,并用它們來預測未來(這里沒有真正的算法,只是技術分析)。這個效果不太好,所以我學會了一些統計知識,然后用線性回歸。 然后連接到另一個API,清理每一分鐘的數據,并存儲在一個SQL數據庫。 等等,直到算法效果很好。
這樣做的好處是我在一個學習環境中學習。不僅僅學習了SQL語法,用它來儲存價格數據,還比僅僅學習語法多學習了十倍的東西。學習而不應用的知識很難被保留,當你做實際的工作的時候也不會準備好。
3、學會溝通
數據科學家需要不斷展示他們的分析結果。這個過程可以區別數據科學家的水平。交流的一部分是對主題的理解和理論, 另一個是理解如何組織你的結果。最后一部分是能夠清楚地解釋您的分析。 展示你的數據分析的結果。試著教那些對數據科學技術知識并沒有什么概念的人,比如你的朋友和家人這可以可以幫助您理解概念。試著在聚會上演講。使用github管理你所有的分析。在一些社區中活躍,比如Quora , DataTau , machine learningsubreddit。
4、向同行學習
你根本想不到你會從同行身上學到多少東西,在數據工作中,團隊合作非常重要。在聚會中找一些同伴。開源軟件包。給哪些寫有趣的數據分析博客發消息看有沒有合作的可能。
5、不斷增加學習的難度
你完全熟悉這個項目的工作了? 你最后一次使用一個新概念是在一周前? 那么是時候做些更加困難的挑戰了。如果你停止攀登,那么不進則退。如果你發現自己太舒適,這里有一些建議:處理更大的數據集。 學習使用spark??纯茨隳懿荒茏屇愕乃惴ǜ?。你將如何將算法擴展到多個處理器? 你能做到嗎?理解更多的理論算法并使用。這會改變你的假設嗎?試圖教一個新手去做你現在正在做同樣的事情。上面這些這至少是一個思路告訴你在開始學習數據科學的時候到底要做什么。如果你完成了這些,你將發現你的能力自然而然就提升了。我不喜歡那些“一個清單”這樣的建議,因為這讓我很難按部就班去做。我發現很多人在跟著書單或者課程學習中半途而廢。我個人相信如果你有正確的目標任何人都可以學習數據科學。這是一個幫助你學習大數據的網站,其中包括了很多優秀的學習經驗和討論。你可以分析一些有趣的數據集,比如美國中央情報局的文件和球員統計。還可以完成一些項目,比如建立一個投資組合。如果你不知道如何分析,這也不是問題,我們會教你python。我們教Python因為它是最初級的友好語言,用于大量生產數據的科學工作,可用于各種各樣的應用。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25