cda

數字化人才認證

您的位置:首頁 > 活動列表 > 業界深訪 | 初創公司CDO眼中的數據科學家

業界深訪 | 初創公司CDO眼中的數據科學家

2018-11-02


在大數據和機器學習的時代,有一種職業脫穎而出——數據科學家。數據科學家在近年來備受追捧,也有越來越多的人想投身入數據科學領域。

最近,CDA 采訪了幾位來自不同行業的數據科學團隊負責人,聊聊他們眼中的數據科學家是什么樣的,以及對于初入數據科學行業的人群有些什么建議。

今天請到的是來自星窗科技的首席數據科學家——薛松,讓我們看看研發總裁眼中的數據科學家是什么樣的吧。

點擊播放采訪視頻,建議wifi下播放
http://edu.cda.cn/course/946/task/16003/show

以下是采訪的文字整理部分。

薛松 星窗科技 首席數據科學家

大家好,我叫薛松。在美國畢業之后,我先是在美國華盛頓的一家大數據公司做數據科學家,后來回到中國加入了一個初創公司,現在在初創公司里擔任首席數據科學家。

Q1:請您介紹一下,目前您從事的數據科學相關的工作內容?

我們的主要工作是幫助企業客戶,尤其是中小型企業客戶搭建數據平臺,在挖掘他們的數據核心價值。

我們團隊的核心工作可以歸納為是數據的產品化。像我們之前幫助一些金融領域的客戶,他們會有一些個人客戶的信貸需求。那么他們掌握了這些個人用戶的信貸資料,我們會幫他們在這些信貸資料的基礎上面進行一些數據挖掘。獲取這個人的信用記錄,并且去構建這些人與人之間的關系網絡,從這個關系網絡中去了解一個人的信用程度。利用大數據分析利用數據科學,去幫他們準確的判斷每個人的信用程度,并且提供相應的授信額度,那么這是我們應用的一個案例。

Q2:您覺得當下企業需要的數據科學家應該具備哪些技能?

硬技能這些專業性的技能其實都不用說了,大家也都知道。

首先編程的核心技能對于數據科學家是非常重要的,這方面可能不需要你像程序員樣那么精通,但是最基本的這些編程的技能是肯定要有的。

其次我想強調的是這也可能是很多人忽視的一點,就是在統計基礎,也就是統計的基本思想,以及對于這些機器學習算法、人工智能算法的統計精神的理解。我想這就是將數據科學家和程序員區分開的一個重要標志。

數據科學家他們會對底層的統計思想掌握的更清晰,他們很明白地了解到算法的適用場景適用的數據類型適用的問題,那么他們在實際工作中常常是為程序員提供了相當于守門員的作用。他們會知道什么樣的算法適用于什么樣的場景,而不是簡單地去調包去使用算法,那么這是硬技能的部分。

在軟技能方面,首席數據科學家更需要具有良好的溝通能力。

因為在實際工作中,數據科學家往往是需要和不同團隊不同部門不同層級的人員去溝通,去協調去獲取各方面的資源去獲取各方面的支持。因此數據科學家的溝通能力是要比在企業的其他部門,其他的這些技術人員要更強的要求更高。

其次是邏輯思維的能力。因為數據科學家相比于更基層一點的數據分析師,或者是其他的數據工程師這些人員來講,他需要能夠把握問題的核心關鍵所在,能夠將資源集中于這些最關鍵最核心的問題。因此數據科學家需要能夠條理很清楚地去分析問題,去找到問題的核心關鍵所在。因此
邏輯思維能力和分析問題的能力,是數據科學家的一個重要的軟能力。

Q3:結合您在國外的經歷,您覺得中外數據科學家的區別在哪?

我覺得這個問題是非常好的一個問題。在國內和國外的一個非常大的區別在于,在美國專業性的壁壘會比中國更沒有這么明顯。

在美國會看到很多來自不同背景的人去做數據分析師,像我之前的同事有學經濟的,有學生物的,有學物理的,那么他們去做數據分析師去做數據科學家其實是各有各的長處。有的更擅長分析商業問題,有的更擅長數學公式的推導,有的更擅長寫代碼,這樣的團隊中集聚了各方面人才的能力,并且大家能夠沒有障礙沒有隔閡的交流,形成的戰斗力是遠遠比大家來自同一背景的人要強得多的。

在國內,大家可能背景會趨同,很多數據分析師和數據科學家都是來自于理工科,甚至全部都是計算機背景的人士。大家的技術水平都很高,但是實際上我們可能缺乏了這種互補性,而且往往對于實際問題來講是需要能夠從不同的角度來看這個問題,需要來自各方面的智慧。

這一點我是覺得國內和國外的一個很大的區別。而且我也希望能夠有越來越多來自不同背景的人能夠加入到數據分析師數據科學家的行列,為我們帶來不同角度的視角,更多的視野。所以這也是我覺得CDA培訓對于這些非理工科,尤其是非計算機專業同學的一個很大的價值。能夠讓他們跨越專業壁壘,能夠投入到數據科學這一個充滿激情的行業中來。

Q4:您認為數據科學家需要具備的一個核心能力是什么?

我覺得在實踐工作中既然到數據科學家這個層次,那么他和我們說數據分析師或者再基層一點的商業分析師之間有所不同,重要區別在于我們通常會對數據科學家有領導才能的期待。而在實踐中這種領導力,往往不是通過一個具體的職位反映出來的,就是我們說這種leadership without leader role。

就是說在實際工作中,數據科學家扮演的角色往往是一個領導性的角色,但是他常常并不具有領導的頭銜。所以他很多時候是需要跨團隊協作,跨團隊調動資源帶領一個團隊,但事實上他又沒有強有力的手段,能夠去推動事情的進展和落地。

所以我覺得數據科學家一個很重要的能力,就是說在沒有正式的頭銜的時候,去推動項目往前走。

推動項目的實施和落地的能力,那么就需要他有強大的溝通技巧。一方面,和其他團隊間的溝通能力。另一方面,向上管理的能力。就是和自己的領導和這些公司企業的高層和外部的客戶去溝通,推動自己的想法,推動自己項目的進展。

這部分能力我認為是對于數據科學家來講,是在職業道路上進一步上升的一個很重要的能力,可以說是最關鍵的能力。
 
Q5:請您給一些正在職場打拼的數據分析師、數據工程師們一些職業發展建議!

我的建議首先是繼續實踐,就是像英語里面說get your hands dirt,任何能夠去動手做一些事情的時候,就去動手做一件事情,實踐是最好的導師。

第二點,盡量的能夠成為一個全棧的人才。就是說作為數據科學家而言,你不僅僅是說要掌握機器學習,要掌握數據分析的能力。同時你要能夠將整個項目推動往前走,必須了解項目的方方面面,而且能在有必要的時候,自己能夠去做項目中其他的事情。所以成為全棧的數據科學家,成為全棧的人才,這是成長為數據科學家的一個必經之路。

此外,要去了解敏捷開發,去實踐敏捷開發。因為數據科學家和單純的開發人員一個很大不同是,我們往往要面對著非常不確定的環境去工作。那么這個不確定性表現在目標往往是不確定,含糊不明確的團隊往往是不明確的,你所能夠調動所擁有的資源也是不明確的,你需要將項目推進。

只有通過快速的迭代,快速的敏捷開發能夠一步一步的把項目逐漸實現,所以敏捷性開發的流程工作是數據科學家工作中一個重要的一環。

Q6:您對CDA LEVEL 3數據科學家人才標準有何建議和期待?

我認為,既然能夠參加level 3的數據科學家,應該是CDA這個體系里邊最高水準的人才。那么對于這個層次的人才,我有三點期望。

第一,有非常強的實踐能力。就像前面說的這是一個數據,科學家是全棧的人才,作為一名數據科學家,他能夠擔當項目的方方面面,并且能夠在其中扮演領導性的角色。所以實踐性我認為是level 3數據科學家的首要考核標準。

第二,有扎實的理論基礎。這與level 1 level 2的人不一樣,不僅僅是說我要能夠去應用這些算法,能夠去應用這些現成的工具解決問題,并且還需要知道這些算法的局限性在哪里,這些算法的應用場景它背后的統計原理在哪里。所以這些對于數據科學家來講,他的理論基礎一定要扎實。

第三,數據科學家應當是一個T型人才。一方面要有廣度,另一方面又需要有自己的深度。因此對于數據科學家而言,他應當在作為全棧型人才的基礎上,同時有自己所擅長所精通的地方。這個可以是某一種具體的算法,某一項業務,在某一個業務場景,某一個行業里邊成為專家。以上這三點是我對于Level 3數據科學家的一個期望。

現在我已經做了7、8年的數據科學家,也經常自己在市場上招人,碰到的一個很大的問題就是,我們很難有一個客觀的標準去判斷什么樣是優秀的人才,什么樣是符合我們要求的數據科學家。我期待CDA level 3的數據科學家認證能夠為我們提供選擇人才的黃金標準,能夠選拔出來真正符合企業需要,能夠成為一個優秀的數據科學家這樣的人才。

如何進階為數據科學家

CDA LEVEL 3數據科學家精英培訓已正式發布,旨在面向從業多年的、有技術基礎的大數據及數據分析專業人士、數據工程師等,為他們提供一個成為數據領袖的跳板。了解更多詳情:http://www.ruiqisteel.com/kecheng/53.html

完 謝謝觀看

分享
收藏

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码