
細數數據科學團隊中的十大關鍵角色
應用數據科學是一項高度跨學科的團隊工作,需要用多樣性的角度看問題。事實上,比起專業知識和經驗,觀點和態度的重要性也不容小覷。以下是我對數據科學團隊構成的看法。
1. 數據工程師
首先在進行數據分析之前,我們需要獲取數據。如果是處理小型數據集,數據工程則有點類似在電子表格中輸入數字;如果是處理更復雜的數據時,那么數據工程本身就構成了一門復雜的學科。首先你的團隊中需要數據工程師獲取數據,從而其他人員能夠在此基礎上進行分析和處理。
2. 決策者
在聘請數據科學家之前,請確保團隊中有充分了解數據驅動決策的角色。決策者需要分辨哪些決策需要數據支持,并根據對業務的潛在影響確定分析程度。同時決策者需要深思熟慮,在做決定前進行全方位的思考,考慮到問題的方方面面。
3. 數據分析師
每個人都能查看數據,并從中得出見解,唯一可能缺少的是相關軟件的使用技能。
學習使用R和Python等工具是對數據可視化的升級,這些工具功能更豐富,從而能夠查看更多種類數據集。
1934年,"尼斯湖水怪"圖
要記住,你不應該得出數據之外的結論,這需要專業培訓。就像根據上面的圖片,你只能說“這就是我的數據集中的內容”,而不能輕率的得出結論,尼斯湖水怪是真實存在的。
4. 專家分析師
專家分析師需要更快地查看分析數據。這里注重的是分析數據、探索和發現等技能,而不是嚴謹地得出結論。專家分析師能夠幫助團隊注意更多的數據,從而決策者能夠更清晰地做出判斷。
但最好不要讓能編寫強大代碼的工程師擔任這個角色,因為在這方面速度就是一切,需要盡快得出更多分析結論。因此對代碼要求過高的人很難勝任這個角色。
5. 統計學家
到這個階段,團隊中已經有人對數據進行大膽探索了,下面需要有人能在探索中加入理性分析,避免團隊得出無根據的結論。
例如,如果你的機器學習系統能應用于某個數據集,那么你能得出結論,在該數據集中這個系統是奏效的。那么能順利用于生產中嗎?能夠進行發行嗎?這時就需要其他技能來處理這些問題,即統計技能。
如果我們想在可觀事實不夠的情況下做出決定,那么就需要放慢速度并采取謹慎的態度,這部分就需要統計學家。
6. 機器學習工程師
應用人工智能/機器學習工程師的價值不是在于理解算法的運行原理,而是能運用這些算法而不是構建它們(那是研究人員要做的)。他們需要整理代碼,從而讓其運行在現有的算法和數據集中。
除此之外,機器學習工程師要能夠應對失敗。大多數時候你不知道自己在做什么,你通過大量的算法運行數據,在得到預期結果前會經歷多次的失敗,因此需要能積極地應對失敗。
完美主義者很難成為機器學習工程師,因為要處理的業務問題不像課堂中那樣,你無法事先把握情況,而無法馬上得出預期的結果。你所做的只能反復迭代,嘗試各種解決方案。
數據是機器學習工程師工作的先決條件,因此在打造數據分析團隊早期,聘請數據分析師是很有必要的。
機器學習工程師在分析過程中還需要進行評估,比如解決方案是否真的適用于新的數據。同時出色的機器學習工程師要明確采用不同方法分別需要多少時間。
7. 數據科學家
數據科學家在前三個角色都能達到專家級別,具有比較全面的能力。因此在數據科學團隊中數據科學家的薪資比較高。對于企業而言,如果在預算內,雇傭數據科學家是不錯的選擇。但如果預算不夠,那么可以培養現有團隊中擔任單一角色的人員。
8. 數據分析經理/數據科學負責人
數據分析經理兼備了數據科學家和決策者的作用,在團隊中擔任領導型作用,能夠保持團隊不會迷失方向。
數據分析經理對團隊有很大的促進作用,但是這方面的人才很少。他們經常思考的問題有“如何設計正確的問題;如何做出決定;如何最好地分配人員;什么值得做;技能和數據是否符合要求;如何確保良好的輸入數據”等。如果你有幸雇用到了數據分析經理,請留住他。
9. 定性專家/社會科學家
團隊中的決策者會是杰出領導者、影響者或導航者......但在決策的藝術性和科學性方面并不夠。這時可以讓定性專家促進決策者的工作,并補充他們的技能。
定性專家通常具有社會科學和數據背景,能夠幫助決策者理清想法,多角度進行分析,并將模棱兩可的直覺轉化為經過深思熟慮的指令,以便團隊的其他成員輕松執行。比起數據科學家,他們通常更有能力將決策者意圖轉化為具體的指標。
10. 研究人員
許多招聘者認為,在打造數據科學團隊一開始就應該聘用研究人員,但并非如此。在團隊沒有成型時,即使雇傭研究人員也可能并沒有合適的環境來發揮其價值。最好等到團隊發展到一定程度,有合適的設備資源時再加入研究人員打造新的工具。
其他角色
除了以上提到的角色,數據科學團隊中還可以加入以下角色:
· 領域專家
· 倫理學家
· 軟件工程師
· 可靠性測試工程師
· UX設計師
· 交互式可視化/圖形設計師
· 數據收集專家
· 數據產品經理
· 項目經理
除了前面提到的十大角色,許多數據科學項目還需要以上人員的參與。他們都有自己主攻的專業領域,在團隊中是很好的補充。
大團隊還是小團隊?
看到這里你可能會感到壓力,但在具體構建數據科學團隊時,可以根據企業的自身情況而定。
這里可以把應用機器學習類比為開餐廳,如果你想開一家制作創新披薩的大型披薩店,那么就需要大型團隊。你要決定做什么菜(角色2),使用哪些食材(角色3和4),在哪里獲得食材(角色1),如何定制菜單(角色6),以及如何對菜品進行測試(角色5)。但如果你的目標只是制作普通的披薩,則不需要這么復雜,采用已測試過的菜單,加上食材就可以開始了。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25