熱線電話:13121318867

登錄
首頁大數據時代數據科學適合我嗎?需要考慮的14道自考題
數據科學適合我嗎?需要考慮的14道自考題
2022-03-14
收藏

數據現在被認為是增長最快、價值數十億美元的行業之一。因此,公司和組織正試圖最大限度地利用他們已經擁有的數據,并確定他們仍然需要捕獲和存儲哪些數據。此外,對數據科學家來說,理解這些數字的意義并為混亂的商業問題揭示隱藏的解決方案仍然是一個令人難以置信的需求。最近使用LinkedIn求職工具進行的一項研究顯示,2020年的大多數頂級科技職位都需要數據科學技能。

在數據科學領域有許多令人興奮的機會,對自己進行數據科學方面的教育是獲得在這個競爭領域脫穎而出所需的技能和經驗的一個很好的方法,也是讓你的雇主在競爭中占據優勢的一個很好的途徑。在進入數據科學領域之前,檢查以下問題以評估數據科學是否真的適合您是很重要的。

1.什么是數據科學?

數據科學是一個如此廣泛的領域,包括數據準備和探索、數據表示和轉換、數據可視化和表示、預測分析、機器學習、深度學習、人工智能等幾個細分領域??梢钥紤]數據科學能力的三個級別(3個級別是根據現有最好的機器學習教科書之一所涉及的主題定義的:Sebastien Raschka的Python machine learning,3RdEdition),即:Level1(基本級別);Level2(中級級別);和Level 3(高級)。能力從級別1增加到級別3,如下面的圖1所示。

2.數據科學家是做什么的?

數據科學家利用數據得出意義和有洞察力的結論,這些結論可以推動機構或組織的決策。他們的工作職責包括數據收集、數據轉換、數據可視化和分析、建立預測模型、根據數據發現提供實施行動的建議。數據科學家在不同的部門工作,如醫療保健、政府、工業、能源、學術界、技術、娛樂等。雇傭數據科學家的一些頂級公司是亞馬遜、谷歌、微軟、臉書、領英、推特、網飛、IBM等。

3.數據科學家的工作前景如何?

數據科學家的工作前景非常樂觀,IBM預測到2020年對數據科學家的需求將飆升28%。最近使用LinkedIn求職工具進行的一項研究顯示,2020年的大多數頂級科技職位都需要數據科學、商業分析、機器學習云計算方面的技能(參見下面的圖2)。

4.數據科學家賺多少錢?

作為一名數據科學家,你的收入取決于你所工作的組織或公司、你的教育背景、你的經驗年限和你的具體工作角色。數據科學家的收入在5萬至25萬美元之間,工資中位數約為12萬美元。這篇文章更多地討論了數據科學家的工資。

5.我如何為數據科學的職業生涯做準備?

大多數數據科學或業務分析程序都需要以下內容:

  1. a)高水平的定量能力
  2. b)解決問題的心態
  3. c)編程熟練程度
  4. d)有效溝通的能力
  5. e)團隊合作能力

因此,為了準備數據科學領域的職業生涯,您可以從攻讀定量學科的學士學位開始,例如科學、技術、工程、數學、商業經濟學。

6.我應該關注哪些編程語言?

如果您對學習數據科學的基礎感興趣,您需要從某個地方開始。不要被數據科學家招聘廣告中提到的編程語言列表所淹沒。雖然學習盡可能多的數據科學工具是很重要的,但建議從一兩種編程語言開始。然后,一旦您在數據科學方面建立了堅實的背景,您就可以挑戰自己,學習不同的編程語言或不同的平臺和生產率工具,這些工具可以增強您的技能。根據這篇文章,Python和R仍然是數據科學中使用的兩種頂級編程語言。我建議從Python開始,因為越來越多的學術培訓項目和行業正在使用Python作為數據科學的默認語言。

7.成為一名數據科學家需要多長時間?

如果您在分析學科方面有扎實的背景,例如物理學、數學、工程學、計算機科學、經濟學統計學,那么您基本上可以自學數據科學的基礎知識。您可以從諸如X、Coursera、Ordatacamp等平臺上的免費在線課程開始。第1級能力(參見圖1)可在6至12個月內實現。第2級能力可在7至18個月內實現。第3級能力可在18至48個月內實現。獲得一定水平的能力所需的時間取決于你的背景和你愿意在數據科學研究上投入多少時間。通常,具有分析學科(如物理、數學、科學、工程、會計或計算機科學)背景的個人比具有數據科學不互補背景的個人需要更少的時間。

8.即使一個項目似乎遇到了障礙,我是否有足夠的耐心繼續工作?

數據科學項目可能很長,要求很高。從問題框架到模型構建和應用,這個過程可能需要幾周甚至幾個月的時間,這取決于問題的規模。作為一名實踐中的數據科學家,在一個項目中遇到障礙是不可避免的。耐心、堅韌和毅力是成功的數據科學職業生涯所必需的關鍵品質。

9.我是否具備商業頭腦,能夠從一個模型中得出有意義的結論,從而為我的組織做出重要的數據驅動決策?

數據科學是一個非常實用的領域。請記住,你可能非常擅長處理數據,并構建良好的機器學習算法,但作為一名數據科學家,現實世界的應用程序才是最重要的。每一個預測模型都必須在現實環境中產生有意義和可解釋的結果。預測模型必須根據現實進行評估,才能被認為有意義和有用。作為一名數據科學家,你的角色是從數據中提取有意義的見解,這些見解可以用于數據驅動的決策,這些決策可以提高公司的效率或改進業務進行的方式,或者幫助增加利潤。

10.我有良好的溝通能力嗎?

數據科學家需要能夠與團隊中的其他成員或組織中的業務管理員交流他們的想法。良好的溝通技巧將在這里發揮關鍵作用,以便能夠向對數據科學中的技術概念了解甚少或根本不了解的人傳達和呈現非常技術性的信息。良好的溝通技巧將有助于與其他團隊成員如數據分析師、數據工程師、現場工程師等建立團結和團結的氛圍。

11.我是終身學習者嗎?

數據科學是一個不斷發展的領域,所以要準備好擁抱和學習新技術。與該領域的發展保持聯系的一種方法是與其他數據科學家建立網絡。一些促進聯網的平臺是LinkedIn、GitHub和medium(面向數據科學和面向AI出版物)。這些平臺對于了解該領域最近發展的最新信息非常有用。

12.我有團隊精神嗎?

作為一名數據科學家,您將在一個由數據分析師、工程師、管理員組成的團隊中工作,因此您需要良好的溝通技巧。您還需要成為一個好的傾聽者,尤其是在項目開發的早期階段,您需要依賴工程師或其他人員來設計和構建一個好的數據科學項目。成為一個優秀的團隊成員可以幫助你在商業環境中茁壯成長,并與團隊其他成員以及組織的管理員或董事保持良好的關系。

13.我有道德嗎?

在數據科學中,倫理和隱私考慮是必須的。你需要理解你的項目的含義。對自己誠實。避免操縱數據或使用會故意在結果中產生偏見的方法。從數據收集和分析到模型建立、分析、測試和應用的所有階段都要符合道德規范。避免為了誤導或操縱觀眾而捏造結果。在解釋數據科學項目發現的方式上要合乎道德。

14.學習數據科學有哪些資源?

如果你的情況允許,你可以攻讀數據科學或商業分析的碩士學位。如果你負擔不起碩士學位課程,你可以尋求自學路線來學習數據科學。通常,如果您在分析學科(如物理、數學、經濟學、工程或計算機科學)方面有asolid背景,并且您對探索數據科學領域感興趣,最好的方法是從大規模開放在線課程(massive open online courses,MOOCs)開始。然后,在建立了堅實的基礎之后,您可能會尋求其他方法來增加您的知識和專長,例如從教科書中學習,參與項目,以及與其他數據科學抱負者建立聯系。

下面是推薦的MOOCs和教科書,可以幫助您掌握數據科學的基礎知識。

推薦的MOOC:

數據科學專業證書(HarvardX,通過edX)

分析:基本工具和方法(Georgia TechX,通過edX)

應用數據科學與Python專門化(密歇根大學,通過Coursera)

推薦書籍:

從教科書中學習提供了比從在線課程中獲得的更精細和深入的知識。這本書提供了數據科學和機器學習的偉大介紹,包括代碼:塞巴斯蒂安·拉什卡的“Python機器學習”。https://github.com/rasbt/python-machine-learning-book-3dition

作者以一種很容易理解的方式解釋了機器學習中的基本概念。此外,還包括代碼,因此您可以實際使用提供的代碼來實踐和構建自己的模型。我個人發現這本書在我作為一名數據科學家的旅程中非常有用。我會把這本書推薦給任何有數據科學抱負的人。所有你需要的是基本的線性代數和編程技能,以便能夠理解這本書。

還有許多其他優秀的數據科學教科書,如Wes McKinney的“Python for data Analysis”,Kuhn和Johnson的“應用預測建模”,以及Ian H.Witten,Eibe Frank和Mark A.Hall的“數據挖掘:實用機器學習工具和技術”。

摘要

總之,我們討論了14個重要的數據科學領域的常見問題。對于不同的個人來說,基于他們的背景,數據科學的旅程可能是不同的,但本文提供的答案可以為考慮數據科學領域的個人提供一些指導。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢