
CDA數據分析師 出品
作者:Amanda West
編譯:Mika
【導讀】
對于剛入行數據分析師來說,在工作中總會遇到各種問題。本文作者就分享了她的感受。
數據分析很酷,然而我不認為在2000年代或更早的時候,會有小孩夢想長大后成為一名數據科分析師。
對我來說,我在小時候有很多夢想,我首先想成為一名獸醫,然后是公園管理員、訓狗員、作家、最后是經濟學家。就像當時許多小孩子想在長大后成為律師、醫生或宇航員一樣。
當然,目標會隨著時間而改變,在今年5月份,我獲得了弗吉尼亞大學的數據科學碩士學位。畢業幾個月后,我找到了我的第一份工作,正式成為一名數據分析師。剛找到工作的我欣喜若狂,因為我可以把用上我所學的技能,并向我的新同行們證明自己。但現實很骨感,在我入職這半年來,我也常常感到不知所措。
下面我就跟大家分享一下,工作以來我在數據分析行業所學到的技術層面和非技術層面的教訓。當然這只是我個人的經驗體會,畢竟每個人的感受都會有些不同。
不到20%
我非常喜歡用R語言進行編程。當我有選擇的時候,我在這份工作的編程面試中我都使用了R語言。
盡管如此,在我的日常工作中,有95%的時間我都使用了Python和終端(在VS Code中),5%的時間我會用會SQL,而R語言基本用不到了??梢哉f在讀書期間,比起學的Python課程,我花了大半時間學習的R語言課程的實際作用要小得多。其中我學習的很多例如網絡爬取、NLP、Apache Spark或Tableau等工具基本沒派上用場。
這也是正常的,因為很難預料到你在實際工作中到底要做什么。
如果你是致力于用特定語言編程的人,我的建議是,盡早詢問招聘人員,公司的團隊主要使用什么語言。即使你 原則上可以用你選擇的編程語言,如果團隊使用其他語言,這將加大代碼審查和整合的難度。對我來說,提升Python方面的技能讓我很受用,但對于使用Scala等語言的人來說,可能就不是這種情況了。
在我剛開始使用AWS時,我還不太熟練,但如今我每天都要跟它打交道。但AWS也是出了名的產品繁多,讓人很難知道針對特定的任務需要什么服務。更糟糕的是,當你搜索如何在AWS中做某事時,往往會得到好幾種不同的答案。為了解決這個問題,我一直在不斷學習AWS相關知識。
像谷歌云和Azure這樣的服務也很受歡迎,但如果你不知道你可能會使用哪一個,說實話,我還是推薦AWS。根據數據顯示,AWS在2020年新企業云應用中占76%。盡管如此,大多數公司都在一定程度上使用云服務,了解云服務的基本工作原理和基本情況是很不錯的。
特別是在排除軟件故障時
在學校里,我們經常會得到干凈、清洗后的數據樣本,以便深入研究某些具體的深層問題。但當你實際工作后,特別是公司的數據團隊較小,那么你往往需要面對真實、混亂且無序的數據。
這是不妨了解一下計算機背后在做些什么,這會有很大的改觀。在處理有問題的數據時,我會使用如下命令 watch -d -n 0.5 nvidia-smi 和 htop 用來追蹤諸如GPU/CPU的使用和內存的使用情況。我還會用 df -h 來監控特定目錄中的文件大小,以防空間超限。
我還使用tmux會話,以便同時打開多個終端窗口,并使我的工作在進入遠程機器時不會斷開。最后,當我找到有效的解決方案時,我仍然會在網上尋找更好的替代方案,在處理大數據集時,這可以節省幾分鐘到幾天的處理時間。
這些只是我測試機器上限數據的幾種方法,歡迎在留言區分享你的方法。
作為一個剛入行的數據科學新手,是需要持續進行學習的。你將被要求做的任務,在很多時候會會讓你不知所云,這意味著你要爭分奪秒地找出解決方案,解決你甚至不知道存在的錯誤。你需要不停的搜索,看看其他人是怎么解決的,不斷學習提升自己,慢慢的你編程方面變得更好,代碼庫將開始在每次迭代中變得更加合理。
至少對我來說,我覺得我在第一份工作中所學到的東西和我在大學期間所學到的一樣多,這出乎我的意料。
如果你所在的公司使用主流編程語言,這是有一定優勢的,因為你可以多瀏覽下Stack Overflow等平臺,這無數次幫了我的大忙。
這并不是針對數據分析方面。在我讀書時,我給自己很大的壓力,不像我的同齡人那樣經常放松。期中考試前,我會高強度的學習整整一周,除了打印更多的練習題或補充咖啡外,我幾乎不離開我的房間。在非期中考試的幾周里,我會強迫自己學習到深夜,然后一大早強迫自己醒來匆匆趕去上課。
一直以來,我都認為一旦我拿到學位,我就會養成正常健康的作息。每天保證8小時的睡眠,并且閱讀、鍛煉、健康飲食。工作也不會覺得讓人感到枯燥,因為我喜歡編程,因此我生活中的一切都會變得美好。
但是,這并沒有發生。
雖然工作確實增加了我的一些生活習慣,但是如果你在大學里也會加班加點搞學習,那么在工作中你也可能是個工作狂。反過來如果你在讀書時就有些懶散,那么工作后也可能會拖延??傊?,要善待自己,精疲力竭是不好的,平衡是關鍵,這一點我還在學習中。
顯然,我的一些觀點有些片面。但我很高興成為一名數據分析師,我仍然相信從更大的角度來看,我的不足和自我懷疑是值得的。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25