
阿隆·梅-拉茲,副總裁數據與洞察,銀行Hapoalim
幾個星期前,我帶著我的狗出去散步時,偶然發現了我的鄰居。她來自統計學背景,她問我在數據世界中的不同角色,試圖找出她下一步的職業發展方向。在我概述了每一個工作角色的各種責任后,我看到她相當困惑?!拔也恢肋@個領域如此分散”,她說。她不是唯一一個。
在過去的幾年里,與數據相關的職位被認為是就業市場上最熱門的職位。需求一直在快速增長,預計短期內不會改變。當每個人都想加入黨并進入這個迷人的領域時,首先了解各種R&R(角色和責任)是至關重要的。在這個快速指南中,我將盡我最大的努力,通過結晶不同位置的本質來消除混亂。
所以我們開始吧。
數據分析師的主要職責是識別重要的業務問題,然后處理和使用數據,使組織能夠做出更明智的數據驅動決策。
這個角色需要一套廣泛的技能,從收集大量數據到組織數據以獲得洞察力。數據分析師必須同時具備分析和技術能力,并應熟悉ETL工具、數據可視化和語言/技術,如:R、Python、SQL、SAS等。
雖然這個角色不像列表中的其他角色那樣具有技術性,但業務分析師在數據世界中扮演著重要的角色,作為技術角色和業務方/管理層之間的紐帶。他們必須對其特定行業(例如:醫療保健、保險、金融)和業務流程有深刻的理解。
由于業務分析師是業務方和管理層的中間人,他們需要能夠生成報告,具有良好的數據可視化技能,并且顯然是一流的溝通者。
數據工程師是群里的“建設者”。一些人將它們稱為數據領域的DevOps。我見過不同的公司對這個角色的定義非常不同,,但在我看來,數據工程師為其他角色(如數據科學家和數據分析師)的成功工作奠定了基礎。為了實現這一目標,數據工程師肩負著為組織構建和維護大數據生態系統的重要責任,同時確保它的健壯性和平穩運行。
數據工程師需要非常了解數據系統,如:Hadoop、Hive、MongoDB、MySQL等。他們還應該有數據流工具、ETL工具和數據建模的實踐經驗。
嗯,我最初想把這個職位留到最后,因為它顯然是最受歡迎的職位--不僅在數據世界,而且在技術社區。然而,我確實相信這個列表中所有角色之間的協作對一個組織的成功有很大的貢獻。也就是說,我認為它吸引這么多專業人士的原因在于,數據科學,顧名思義,是三個關鍵領域的結合點:編程、統計和商業知識。它還涉及大量的創造力,因為數據科學家從一個商業問題開始,需要使用各種先進的技術,如預測分析,找到回答它的最佳路徑。他們致力于為觀察進行研究,如果不對數據進行深入分析,就無法達到認識到數據的模式、聯系和行為的地步,然后能夠認識到如何利用這些來為他們工作的組織造福。
數據科學家應該是統計學和數學方面的專家,當然還有編程語言方面的專家,比如:Python、R、Scala。
另一個需要的角色,它與數據工程/數據科學有一些重疊。
機器學習工程師負責彌合數據科學家和技術之間的差距,這將有助于將數據科學家的成果交付給生產或為組織服務。他們通過構建數據管道、將模型轉移到生產中、公開API、訓練模型和執行A/B測試來實現這一目標。
ML工程師需要對各種機器學習庫(例如:Tensorflow,NLTK)有深入的了解,有編碼經驗,在SQL、Rest API和其他互補技術方面有很強的知識。
雖然在過去的幾年里,大部分的焦點都轉移到了人工智能上,但我們不能忘記商業智能的重要性。人工智能和BI都是現代組織成功和決策的關鍵。
BI開發人員通常負責開發和維護BI接口:數據可視化和儀表板、報告和查詢工具。就所需技能而言,這里有一些對BI開發人員有用的技能:SQL、對OLAP和ETL的深刻理解,以及BI系統的經驗:Power BI、Qlik Sense或其他。
這個角色是名單上的老兵。DBA在建立和維護數據庫方面起著關鍵作用。通過負責組織數據庫的健康,DBA基本上負責公司最有價值的資產之一。DBA的活動包括:管理對數據庫的訪問(授權/撤銷等)、計劃和歸檔備份例程(和恢復)、計劃和執行安裝和升級、監視數據庫并優化其性能。
DBA顯然需要掌握他們所負責的數據庫。
簡而言之,ETL開發人員負責將數據從源數據庫傳輸到目標數據庫的過程,包括監視和測試過程的性能,并在需要時修復它。在大規模系統中,這一過程發生得非常頻繁,因此至關重要。
ETL開發人員必須有以下經驗:ETL工具(流行的有:Talend、Informatica、Datastage)、SQL、腳本語言和建模工具。
我認為這個角色和接下來的角色是團隊的粘合劑。數據架構師基本上是技術粘合劑,領導所有的架構活動。這包括創建藍圖和設計文檔,以指定數據庫流程和集成點,評估和批準合適的工具,供工程師部署和使用。數據架構師還應該充當“守門人”,確保組織的數據愿景得到執行,顯然需要采取安全措施。
在我看來,數據架構師一定是個無所不能的人。這意味著在數據技術和最佳實踐方面有深入的知識,并跟上最新的進展。
數據產品負責人負責領導組織的數據戰略,并在利用數據和與愿景一致方面監督產品組合。
首先,數據產品所有者就是產品所有者。一般來說,產品所有者定義路線圖,與內部和外部利益相關者合作,以確保它向前推進,并作為“項目的粘合劑”發揮作用。在所有這些活動之上,數據產品所有者負責確保組織最大化數據的價值,以實現最佳的業務結果。在某些情況下,這意味著通過展示利用數據的好處來影響高級管理層,并確保它在整個公司得到廣泛執行和接受。
數據人才不再只被科技公司獵殺。如今,大多數公司已經理解了數據的力量及其對組織發展的重要性。請記住,公司對上述不同角色的定義和范圍可能有所不同。
如前所述,雖然每個人可能都聽說過數據科學家的角色,但還有更多的角色組成了數據世界。每一個都有其特定的挑戰和所需的技能。如果您想在數據領域找到一份工作,請確保您非常熟悉各種角色以及它們之間的差異,這些差異有時可能很微妙,甚至可能重疊。
那么,你還在等什么?
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25