熱線電話:13121318867

登錄
首頁精彩閱讀細數數據科學團隊中的十大關鍵角色
細數數據科學團隊中的十大關鍵角色
2018-08-01
收藏

細數數據科學團隊中的十大關鍵角色

應用數據科學是一項高度跨學科的團隊工作,需要用多樣性的角度看問題。事實上,比起專業知識和經驗,觀點和態度的重要性也不容小覷。以下是我對數據科學團隊構成的看法。

1. 數據工程師

首先在進行數據分析之前,我們需要獲取數據。如果是處理小型數據集,數據工程則有點類似在電子表格中輸入數字;如果是處理更復雜的數據時,那么數據工程本身就構成了一門復雜的學科。首先你的團隊中需要數據工程師獲取數據,從而其他人員能夠在此基礎上進行分析和處理。

2. 決策者

在聘請數據科學家之前,請確保團隊中有充分了解數據驅動決策的角色。決策者需要分辨哪些決策需要數據支持,并根據對業務的潛在影響確定分析程度。同時決策者需要深思熟慮,在做決定前進行全方位的思考,考慮到問題的方方面面。

3. 數據分析師

每個人都能查看數據,并從中得出見解,唯一可能缺少的是相關軟件的使用技能。

學習使用R和Python等工具是對數據可視化的升級,這些工具功能更豐富,從而能夠查看更多種類數據集。

1934年,"尼斯湖水怪"圖

要記住,你不應該得出數據之外的結論,這需要專業培訓。就像根據上面的圖片,你只能說“這就是我的數據集中的內容”,而不能輕率的得出結論,尼斯湖水怪是真實存在的。

4. 專家分析師

專家分析師需要更快地查看分析數據。這里注重的是分析數據、探索和發現等技能,而不是嚴謹地得出結論。專家分析師能夠幫助團隊注意更多的數據,從而決策者能夠更清晰地做出判斷。

但最好不要讓能編寫強大代碼的工程師擔任這個角色,因為在這方面速度就是一切,需要盡快得出更多分析結論。因此對代碼要求過高的人很難勝任這個角色。

5. 統計學家

到這個階段,團隊中已經有人對數據進行大膽探索了,下面需要有人能在探索中加入理性分析,避免團隊得出無根據的結論。

例如,如果你的機器學習系統能應用于某個數據集,那么你能得出結論,在該數據集中這個系統是奏效的。那么能順利用于生產中嗎?能夠進行發行嗎?這時就需要其他技能來處理這些問題,即統計技能。

如果我們想在可觀事實不夠的情況下做出決定,那么就需要放慢速度并采取謹慎的態度,這部分就需要統計學家。

6. 機器學習工程師

應用人工智能/機器學習工程師的價值不是在于理解算法的運行原理,而是能運用這些算法而不是構建它們(那是研究人員要做的)。他們需要整理代碼,從而讓其運行在現有的算法和數據集中。

除此之外,機器學習工程師要能夠應對失敗。大多數時候你不知道自己在做什么,你通過大量的算法運行數據,在得到預期結果前會經歷多次的失敗,因此需要能積極地應對失敗。

完美主義者很難成為機器學習工程師,因為要處理的業務問題不像課堂中那樣,你無法事先把握情況,而無法馬上得出預期的結果。你所做的只能反復迭代,嘗試各種解決方案。

數據是機器學習工程師工作的先決條件,因此在打造數據分析團隊早期,聘請數據分析師是很有必要的。

機器學習工程師在分析過程中還需要進行評估,比如解決方案是否真的適用于新的數據。同時出色的機器學習工程師要明確采用不同方法分別需要多少時間。

7. 數據科學家

數據科學家在前三個角色都能達到專家級別,具有比較全面的能力。因此在數據科學團隊中數據科學家的薪資比較高。對于企業而言,如果在預算內,雇傭數據科學家是不錯的選擇。但如果預算不夠,那么可以培養現有團隊中擔任單一角色的人員。

8. 數據分析經理/數據科學負責人

數據分析經理兼備了數據科學家和決策者的作用,在團隊中擔任領導型作用,能夠保持團隊不會迷失方向。

數據分析經理對團隊有很大的促進作用,但是這方面的人才很少。他們經常思考的問題有“如何設計正確的問題;如何做出決定;如何最好地分配人員;什么值得做;技能和數據是否符合要求;如何確保良好的輸入數據”等。如果你有幸雇用到了數據分析經理,請留住他。

9.  定性專家/社會科學家

團隊中的決策者會是杰出領導者、影響者或導航者......但在決策的藝術性和科學性方面并不夠。這時可以讓定性專家促進決策者的工作,并補充他們的技能。

定性專家通常具有社會科學和數據背景,能夠幫助決策者理清想法,多角度進行分析,并將模棱兩可的直覺轉化為經過深思熟慮的指令,以便團隊的其他成員輕松執行。比起數據科學家,他們通常更有能力將決策者意圖轉化為具體的指標。

10. 研究人員

許多招聘者認為,在打造數據科學團隊一開始就應該聘用研究人員,但并非如此。在團隊沒有成型時,即使雇傭研究人員也可能并沒有合適的環境來發揮其價值。最好等到團隊發展到一定程度,有合適的設備資源時再加入研究人員打造新的工具。

其他角色

除了以上提到的角色,數據科學團隊中還可以加入以下角色:

· 領域專家

· 倫理學家

· 軟件工程師

· 可靠性測試工程師

· UX設計師

· 交互式可視化/圖形設計師

· 數據收集專家

· 數據產品經理

· 項目經理


除了前面提到的十大角色,許多數據科學項目還需要以上人員的參與。他們都有自己主攻的專業領域,在團隊中是很好的補充。

大團隊還是小團隊?

看到這里你可能會感到壓力,但在具體構建數據科學團隊時,可以根據企業的自身情況而定。

這里可以把應用機器學習類比為開餐廳,如果你想開一家制作創新披薩的大型披薩店,那么就需要大型團隊。你要決定做什么菜(角色2),使用哪些食材(角色3和4),在哪里獲得食材(角色1),如何定制菜單(角色6),以及如何對菜品進行測試(角色5)。但如果你的目標只是制作普通的披薩,則不需要這么復雜,采用已測試過的菜單,加上食材就可以開始了。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢