
你真的無法避免,是嗎?你看哪里就提到哪里。你的LinkedIn訂閱、就業市場、新聞訂閱、試圖吸引你注意力的教育項目(還有你的入學費)。但數據科學到底是什么?它通常被描述得很模糊,留下了許多不盡如人意的地方。本指南將試圖避免所有這些,并為您提供關于“什么是數據科學?”的最佳、最直接和明確的答案。以及“數據科學家是做什么的?”。
那么,數據科學家是做什么的呢?為了回答這個問題,我們將帶領您了解數據科學工作的各個方面。
數據科學的作用是利用每個公司現在收集的深不可測的大量數據,并將其轉化為可理解和有用的信息。將數據轉換為信息是通過使用諸如機器學習(ML)、人工智能(AI)和統計分析等技術來完成的。所有這些都是為了解決現實世界的問題?,F實世界通常被轉化為業務問題。這意味著公司使用數據科學來做出更合理的商業決策,并獲得更多利潤。
既然我們已經討論了數據科學家的角色,現在是時候問一下這在實踐中意味著什么了。數據科學家是做什么的?一個直接的問題應該得到直接的回答。
數據科學家:
數據科學中最通用的職位頭銜是數據科學家,它涵蓋了數據科學領域中使用的所有技能。作為一名數據科學家包括了上述所有的責任。然而,如果你在數據科學領域工作,這并不是你能擁有的唯一職位。
還有許多其他職位頭銜取決于資歷、公司組織、規模等。最重要的是,這些職位頭銜取決于他們所關注的數據科學領域。你可以把它看作是數據科學家是數據科學的原始湯,所有其他的職位頭銜都源于它。
一般來說,數據科學領域的職位可以分為以下兩類:
在我們的博客帖子中有關于每一個數據科學工作的非常詳細的信息,我們將在這里提到。使用該職位可以找到每個職位所需的詳細職務描述和技能。
當我們談論數據提供者時,我們談論的是專注于原始數據、數據基礎設施、數據加載和數據庫的工作。
例如,這一類別中的數據科學職位有:數據建模師、數據工程師、數據庫管理員、數據架構師和軟件工程師。以這樣或那樣的方式,它們都確保數據科學中的另一類工作(數據用戶)可以不間斷地訪問數據,這為數據用戶建立基礎奠定了基礎。
當然,所有這些數據提供者作業在它們之間有不同的目的。
數據建模器
例如,數據建模師創建概念、邏輯和物理數據庫模型,并參與數據庫實現。
數據工程師
數據工程師更關心的是數據基礎設施及其開發和維護,包括數據倉庫和提取、轉換和加載數據(ETL/ELT)。
查看我們關于數據工程師vs數據科學家的帖子,該帖子可以解釋數據科學家和數據工程師的共同點和不同點。
數據庫管理員
根據數據基礎結構,數據庫管理員確保數據和數據庫的完整性和安全性。這包括授予和撤銷對數據的訪問權、備份數據庫、還原數據等。
軟件工程師
在上述職位所提供的數據基礎設施之上,坐著軟件工程師。他們設計、開發、測試和維護作為接口數據的軟件,用戶將使用這些接口數據來充分利用底層數據和數據基礎設施。
數據架構師
數據架構師提供全局并協調所有這些數據提供者。他們的工作是理解公司的流程,這樣他們就可以計劃、實施和改進公司數據處理基礎設施的體系結構。這意味著為數據如何在不同的入口點進入公司提供解決方案。數據以哪種格式輸入,使用哪種軟件處理(如果有的話),以及如何將數據轉換并加載到數據庫或數據倉庫中。如何被公司使用直到點數據成為公司的輸出。
數據用戶利用現有數據和數據基礎設施向各類股東提供信息。它們是數據提供者和決策者之間相當“工程”工作的紐帶,決策者通常不太在技術方面。
數據科學中的數據用戶,除了數據科學家之外,還包括數據分析師、統計學家、BI開發人員、業務分析師、數量分析師、營銷科學家、機器學習工程師、研究科學家等。同樣,他們在公司中都有不同的目的。
數據分析師
例如,數據分析員側重于報告、定期和特別分析。他們使用數據并將其匯總成報告格式。這使得不太懂技術的用戶有可能使用這些數據并了解公司業務的各個方面。數據分析員主要使用歷史數據。
統計學家
統計學家在分析數據的方式上也與數據分析家相似。然而,他們更關心的是預測未來,而不是解釋過去。他們用數據來觀察將要發生的事情,而不是已經發生的事情。為了做到這一點,他們將統計方法應用于數據,如假設檢驗和概率。那樣的話,統計學家也類似于數據科學家。不同的是,與數據科學家不同,他們不建立模型,只專注于數據科學的統計部分。
BI開發人員
BI開發人員是在BI工具中開發(設計、構建和維護)儀表板的人員,其目的是實現數據可視化和報告。他們做報告的方式類似于數據分析師。然而,他們也有一些工程技能,他們使用這些技能來ETL數據和構建用戶界面,就像數據工程師和軟件工程師分別做的那樣。
業務分析師
業務分析師專注于報告,就像數據分析師一樣。然而,他們通常專注于內部報告,以發現公司業務流程中的弱點并加以改進,數據分析師并不總是這樣。
量化分析師
定量分析師通常是專注于金融數據的數據科學家。他們將分析它并建立各種金融市場的模型,如貸款、股票、債券、外匯等。他們的分析將用于決定交易策略、可行的投資和風險管理。
營銷科學家
市場營銷科學家同樣是數據科學家,他們只處理一種類型的數據。在這種情況下,是營銷數據。像任何數據科學家一樣,他們會分析這些數據,并試圖找到模式和趨勢來解釋和預測客戶行為,這有助于解決營銷和銷售問題。
機器學習科學家
機器學習科學家是數據科學家的某種延伸。當數據科學家更關心建立模型的理論部分時,數據工程師將這些模型付諸實踐。他們獲取原型模型并將其部署到生產中。這涉及到工程人工智能軟件和算法,這些軟件和算法將使機器學習模型在實踐中發揮作用。
研究科學家
雖然機器學習工程師是這類數據科學家中的實踐者,但研究科學家是理論家。研究科學家的工作是理解計算原理和由此產生的問題。為了解決這些問題,他們改進或創建了全新的算法和編程語言。
在下面的圖片中,有一個例子說明了你的數據科學家職業道路可能是什么樣子的。這并不意味著這是一個單向的旅程(根本不必是一個旅程?。┗蛘哌@些職位頭銜不能互換,不能以不同的方式在之間移動。這只是一個概述,看一看,然后我們會跟著做一些解釋。
數據科學發現自己處于統計學、數學和計算機科學的十字路口。還有其他一些學科。因此,至少在這些領域接受教育是一個很好的起點。
然而,我們不能寫出適用于每個應聘者和招聘廣告的指南。一般的經驗法則是:至少獲得學士學位,才能在數據科學就業市場上有一個良好的起點。然后結合工作經驗。兩者的良好平衡總是一個你不會出錯的食譜。當然,接受更多的教育和更多的經驗總是會讓你處于更好的位置;這并不奇怪。讓我們來看看學歷/學位要求是什么:
學士學位/碩士學位
如果你想在數據科學領域建立一個職業生涯,至少擁有學士學位是個好主意。擁有學士學位或碩士學位對獲得數據科學方面的任何工作都有好處,大多數招聘廣告都要求這種教育水平。你的學位應該是相關的量化領域,如統計學、數學、計算機科學、工程、IT、經濟學、編程等。當然,這取決于職位頭銜和資歷水平。
此外,根據工作的不同,你可能會從一些不同領域的學位中獲得好處。也許人文學科,如哲學、社會學、心理學。它們可能很有用(有時甚至是必需的?。┤绻阆氤蔀橐幻噲D理解和預測人類行為的營銷科學家。研究科學家有時可以研究與倫理和人類行為有很深聯系的計算原理。
根據職位描述和資歷,如果你有金融、商業或類似的學位,這也是有益的。也許你在處理財務數據,而你是高層,所以除了你的技術技能之外,擁有一些領導力、商業常識和教育也變得很重要。
雖然學士學位通常是招聘廣告中要求的最低教育水平,但有時并不是唯一的教育水平。
博士學位
有博士學位。不會影響你得到上面任何工作的機會。多受教育總是更好。
然而,有時這一級別不僅很好,而是必需的。例如,獲得博士學位將是一個好主意。如果你想做一個ML工程師或任何其他數學密集型的工作。
此外,研究科學家需要在計算機科學理論、原理和研究方法方面有很強的能力。這就是為什么博士。是這個職位經常需要的。
訓練營
雖然正規教育在招聘廣告中經常被要求,但這并不意味著它總是必要的。如果你在數據科學的某些方面經驗豐富,但沒有在這一領域接受過正規教育,這并不意味著你不能從事數據科學家的工作。一般來說,職位越高,你的教育就越不重要。重要的是你在以前的工作中做了什么,你是怎么做的,你能給新的工作帶來什么技能。
這里有一個第22條軍規。你需要一份工作來獲得經驗和提高技能。如果你沒有經驗,沒有技術技能,你就找不到工作。幸運的是,有一個解決辦法:新兵訓練營。
它們是獲得數據科學適當技能的良好起點。他們不需要技術學士學位或碩士學位。這是偉大的任何人誰沒有受過正規教育,并想開始在數據科學的職業生涯。它們也適用于通過實踐漫步進入數據科學的人。這樣,他們就可以對他們已經在實踐中做的事情有一個更結構化和理論上的背景,或者提高他們已經存在的技能。
說到工作經驗,開始獲得工作經驗總是最難的。一旦你開始工作并在工作中學習,跳槽和拓寬專業領域就變得更容易了。筑牢基礎很重要。當開始從事數據科學時,人們通常是從數據分析師開始的。
從那時起,他們可以選擇進入我們前面討論過的兩個方向:作為數據提供者工作或作為數據用戶工作。上圖中重要的一點是,當你從左到右時,職位的資歷會上升,你的薪水也會上升。我們一會兒再談工資問題。讓我們先來看看一兩個例子,看看你的職業生涯會是什么樣子。
假設你從數據分析師開始。經過幾年的數據工作,并找到了自己的數據庫解決方案,您理解了數據庫原理,因此決定成為一名數據建模師或數據庫管理員。在其中一個職位上工作可以獲得更多的經驗,并且可以參與幾個關于數據基礎設施的項目。然后你得到提升,成為一個數據架構師,例如。
或者你從統計學家開始。在一家公司呆了幾年后,你決定是時候改變了。但你真的很喜歡你所在的公司。而且你真的很喜歡你去年參與的幾個營銷項目。你搬到一個營銷部門,只處理營銷數據,然后成為一名營銷科學家。話說回來,是時候改變了;你對機器學習產生了興趣,成為了一名數據科學家。幾年后,你想回到學校獲得博士學位。你辭掉了這份工作,全身心地投入到獲得博士學位的工作中。這一點,結合您豐富的工作經驗,使您意識到您希望以一種不同的,也許是理論的方式為數據科學做出貢獻。然后你就成了研究科學家。
這些只是你職業生涯的例子。任何與實際的人和他們的職業相似都純屬巧合。你的職業生涯將取決于你的背景、你的能力、你的興趣、你在你(或其他)公司的機會、公司的規模、組織、靈活性,是的,還有一點點運氣。
從長遠來看,你選擇的任何方式都能讓你受益。請記住,所有這些工作都是數據科學的一部分,所以只有當您想要在數據科學領域中做一些新的事情時,在數據科學的一個領域中擁有更多的經驗才是有益的。
當然,要獲得經驗,你首先需要一份工作。為了得到一份工作,你必須經歷通常繁瑣的求職面試過程。為了讓這種經歷盡可能地無痛,你需要做好準備。雖然沒有什么比面試經驗更好的了,但通過自己的codingandnoncoding面試問題會讓你有一個很好的起跑點。
在數據科學中,以下技能是必須具備的:
查看我們關于最受歡迎的數據科學技能的帖子,了解作為一名數據科學家,您必須具備哪些數據科學技術技能和業務技能。
在選擇職業時,除了你的興趣和環境之外,薪水也是一個因素。
Jobted援引美國勞工統計局(BLS)的數據稱,美國的平均年薪約為53.5K。
那么數據科學的工作與此相比如何呢?例如,Glassdoor datashows數據分析師的平均年薪為7000萬美元。即使是這份(平均)收入最低的數據科學工作,你的收入也會比美國平均水平高出15k美元以上。這多了30%!
作為數據科學領域收入最高的工作之一,數據科學家的平均收入可以達到13.9萬美元,比平均水平高出1.5倍以上。即使是報告的最低工資也是美國平均工資的兩倍,而工資可以高達17.1萬美元。這甚至不是數據科學中收入最高的工作。
教育、知識和技能確實會有回報,如果你想知道你應該投資于職業發展或改變的話。以下是以美元計算的工作職位和平均工資概述。
Data analyst | $70k |
Database administrator | $84k |
Data modeler | $94k |
Software engineer | $108k |
Data engineer | $113k |
Data architect | $119k |
Statistician | $89k |
Business intelligence (BI) developer | $92k |
Marketing scientist | $94k |
Business analyst | $77k |
Quantitative analyst | $112k |
Data scientist | $139k |
Research scientist | $142k |
Machine learning engineer | $189k |
根據你工作的公司,你可以期望這些基本工資通過不同的福利來增加,如現金和股票獎金、健康和人壽保險等。
您可以在我們的一篇博客文章中找到關于數據科學薪酬的更詳細信息--數據科學家賺多少錢?。
通常,高需求和獲得相當豐厚的報酬是有代價的。不,在數據科學中并不都是樂觀的。雖然數據科學家通常每周工作40小時,但偶爾需要投入很長時間。同樣,這取決于公司、組織、行業和其他眾多因素。但最常見的情況是,它與工作描述和它的周期性有關,這意味著你將在完全放松和輕松的時期和每周必須投入50-60個工作小時的高峰期之間取得平衡。
這是因為數據科學任務通常涉及項目,這意味著在嚴格的最后期限內解決問題。隨著最后期限的臨近,工作量通常會增加,這時數據科學家不得不投入額外的時間。
擁有相關的教育和技術技能,當然是成為數據科學家的先決條件。要完成第一步,請遵循我們在討論如何從頭開始成為一名數據科學家時提供的有用建議。但這會讓你成為一個偉大的數據科學家嗎?不一定。
數據科學的重點是解決現實生活中的問題。你可以擁有世界上所有的技術技能,但如果你不能利用那些輝煌的技能來想出一個解決方案,那又有什么意義呢?或者你想出了一個解決方案,但沒有人理解它并使用它。你真的解決問題了嗎?不,你沒有。
技術技能是用來解決問題的,磨練它們的最好方法之一是創建一個你自己的數據分析項目。然而,你也需要軟技能。想出一個解決方案有點夾在數據科學家工作的另外兩個重要階段之間。
要成為一名偉大的數據科學家,您需要:
幼稚
我們不是在說成為一個被寵壞的孩子。孩子氣意味著好奇,問問題,想學,愛玩。
你需要有好奇心,接受自己并不是什么都懂,并且愿意學習。要做到這一點,你必須像孩子一樣:問問題,直到他們得到他們滿意的答案。你需要成為“為什么”的人。只有這樣,你才能理解業務問題,不同的人,部門和客戶的需求。一旦你理解了它們,使用你的技術技能就變成了,嗯,技術性。
當你想出一個解決方案時,你需要對如何展示你可能非常復雜的解決方案表現得有趣和富有想象力,以便其他人能夠理解并使用它。
溝通
溝通是第一技能的自然延伸。你需要有效地溝通,提出正確的問題,以可理解的方式提出你的想法和解決方案。當人們覺得你愿意接受建議,你在傾聽他們,并尊重他們時,他們會更多地參與項目。他們愿意更詳細地解釋他們的(業務)需求和問題,使你更容易正確地理解對你的要求。
當然,如果您不能解釋數據科學解決方案是如何工作的,它如何使用戶受益,以及他們如何使用它,那么就沒有必要提出一個出色的數據科學解決方案。因此,當你提出你的解決方案時,溝通是必要的。
團隊合作
不管幸運與否,你將和真正的人一起工作,試圖解決他們真正的問題。你不會一個人在你的部門工作。你不會只和你部門的人一起工作。你將與來自各行各業的不同人士一起工作,他們擁有不同的技術技能、專業知識和經驗。要成為一個成功的數據科學家,你必須了解人們,對他們有耐心,靈活,適應不同的情況和方法。
創造一個良好的工作氛圍對公司、你的團隊和你自己都有好處??煽?、負責任、樂于幫助同事是我們一直感激的事情。
跨段性
在(不同的)團隊中與人一起工作意味著你將與不同的水平和專業領域一起工作。這是你學習的機會。這時跨部門性就出現了。
一個在數據科學的嚴格界限之外一無所知的數據科學家不可能是一個偉大的數據科學家??绮块T將使您更快地理解和解決問題。您將更清楚地呈現解決方案。了解商業、營銷、報告、法律或你所工作的行業的任何其他方面,很容易讓你成為一個非常理想的雇主。能夠在技術部門和非技術部門之間架起橋梁的專家是罕見的,非常有價值的花朵。
數據科學是當今就業市場上最熱門的領域之一。對數據科學家的需求很高,但競爭也很激烈。
這意味著成為一名數據科學家并不容易。不過,這也不是不可能。這本指南是一個東西,應該使它更容易決定數據科學是否適合你??偠灾?,以下是在數據科學領域獲得一份工作并取得成功的步驟:
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25