熱線電話:13121318867

登錄
首頁精彩閱讀常見的數據分析工具
常見的數據分析工具
2022-09-19
收藏
Step1:Excel學習掌握


所用的工具正是職場中最常用的Excel!

①重點函數學習

重點是了解各種函數:Vlookup、sum,count,sumif,countif,find,if,left/right,時間日期函數、文本函數

數據透視表學習

我曾說過,如果Excel只能學習一個功能,那唯一能入選的就是數據透視表。

掌握vlookup和數據透視表是最具性價比的兩個技巧。學會vlookup,SQL中的join,Python中的merge很容易理解。學會數據透視表,SQL中的group,Python中的pivot_table也是同理。

這兩個搞定,基本10萬條以內的數據統計沒啥難度,80%的辦公室白領都能秒殺。


Step2:數據可視化

所用工具:PowerBi、Excel

數據分析界有一句經典名言,字不如表,表不如圖。

數據可視化是數據分析的主要方向之一。首先要了解常用的圖表:


Excel的圖表可以100%完成上面的圖形要求,但這只是基礎。后續的進階可視化,勢必要用到編程繪制。為什么?比如常見的多元分析,你能用Excel很輕松的完成?但是在IPython只需要一行代碼。


其次掌握BI,下圖是微軟的BI。


BI(商業智能)和圖表的區別在于BI擅長交互和報表,更擅長解釋已經發生和正在發生的數據。將要發生的數據是數據挖掘的方向。

BI的好處在于很大程度解放數據分析師的工作,推動全部門的數據意識,另外降低其他部門的數據需求(萬惡的導數據)。

BI市面上的產品很多,基本都是建立儀表盤Dashboard,通過維度的聯動和鉆取,獲得可視化的分析。最后需要學習可視化和信息圖的制作。


Step3:數據庫學習

所用工具:SQL

Excel對十萬條以內的數據處理起來沒有問題,但是互聯網行業就是不缺數據。但凡產品有一點規模,數據都是百萬起。這時候就需要學習數據庫。

越來越多的產品和運營崗位,會在招聘條件中,將會SQL作為優先的加分項。

SQL是數據分析的核心技能之一,從Excel到SQL絕對是數據處理效率的一大進步。

學習圍繞Select展開。增刪改、約束、索引、數據庫范式均可以跳過。主要了解where,group by,order by,having,like,count,sum,min,max,distinct,if,join,left join,limit,and和or的邏輯,時間轉換函數等。如果想要跟進一步,可以學習row_number,substr,convert,contact等。另外不同數據平臺的函數會有差異,例如Presto和phpMyAdmin。再有點追求,就去了解Explain優化,了解SQL的工作原理,了解數據類型,了解IO。以后就可以和技術研發們談笑風生,畢竟將“這里有bug”的說話,換成“這塊的數據死鎖了”,逼格大大的不同。SQL的學習主要是多練,網上尋找相關的練習題,刷一遍就差不多了。

好了,經過這三步之后,你已經具備數據分析基本功力,剩下的需要訓練的就是你的思維和實際的業務分析能力了。

鑒于你是傳統會計專業出身,那就需要考慮目前你是需要往哪方面發展,一般數據分析師職業規劃有單純的數據分析崗、數據建模崗。

下面我們就說說一般數據分析師常用的工具有哪些?

1、數據處理工具:Excel

數據分析師,在有些公司也會有數據產品經理、數據挖掘工程師等等。他們最初級最主要的工具就是Excel。有些公司也會涉及到像Visio,Xmind、PPT等設計圖標數據分析方面的高級技巧。數據分析師是一個需要擁有較強綜合能力的崗位,因此,在有些互聯網公司仍然需要數據透視表演練、Vision跨職能流程圖演練、Xmind項目計劃導圖演練、PPT高級動畫技巧等。

在Excel,需要重點了解數據處理的重要技巧及函數的應用,特別是數據清理技術的應用。這項運用能對數據去偽存真,掌握數據主動權,全面掌控數據;Excel數據透視表的應用重在挖掘隱藏的數據價值,輕松整合海量數據:各種圖表類型的制作技巧及Power Query、Power Pivot的應用可展現數據可視化效果,讓數據說話。因此想從事數據分析崗位的,需要快速掌握快各種Excel數據處理與分析技巧。


2、數據庫:MySQL

Excel如果能夠玩的很轉,能勝任一部分數據量不是很大的公司。但是基于Excel處理數據能力有限,如果想勝任中型的互聯網公司中數據分析崗位還是比較困難。因此需要學會數據庫技術,一般Mysql。你需要了解MySQL管理工具的使用以及數據庫的基本操作;數據表的基本操作、MySQL數據類型和運算符、MySQL函數、查詢語句、存儲過程與函數、觸發程序以及視圖等。比較高階的需要學習MySQL的備份和恢復;熟悉完整的MySQL數據系統開發流程。


3、數據可視化:Tableau & Echarts

如果說前面2條是數據處理的技術,那么在如今“顏值為王”的現在,如何將數據展現得更好看,讓別人更愿意看,這也是一個技術活。好比公司領導讓你對某一個項目得研究成果做匯報,那么你不可能給他看單純的數據一樣,你需要讓數據更直觀,甚至更美觀

如何理解數據可視化?像我們以前上學的時候學過的柱狀圖,餅狀圖,也是數據可視化的一種。只是在現在,簡單的柱狀圖已經不能滿足工作所需。目前比較流行的商業數據可視化工具是Tableau & Echarts。

Echarts是開源的,代碼可以自己改,種類也非常豐富,這里不多做介紹,可以去創建一個工作區了解下。


4、大數據分析:SPSS & Python& HiveSQL

如果說Excel是“輕數據處理工具”,Mysql是“中型數據處理工具”那么,大數據分析,涉及的面就非常廣泛,技術點涉及的也比較多。這也就是為什么目前互聯網公司年薪百萬重金難求大數據分析師的原因

大數據分析需要處理海量的數據,這對于數據分析師的工作能力要求就比較高,一般來說,大數據分析師需要會

(1)會使用HiveSQL方法HiveQL來匯總、查詢和分析存儲在Hadoop分布式文件系統上的大數據集合。知道Hive如何在Hadoop生態系統進行數據分析工作。

(2)會一些SPSS modeler基礎應用,這部分技能對應數據建模分析師

(3)何使用R語言進行數據集的創建和數據的管理等工作;會使用R語言數據可視化操作,讓學員學會如何用R語言作圖,如條形圖、折線圖和組合圖等等;是R語言數據挖掘,本部分數據挖掘工程師

(4)用Python來編寫網絡爬蟲程序,從頁面中抓取數據的多種方法,提取緩存中的數據,使用多個線程和進程來進行并發抓取等

總結一下:

寫在最后

1、自身定位很重要

以上所有介紹的這些技能,都是根據你的自身定位而言,如果你定位只是小企業的數據分析崗位,那你也許只要把Excel玩的很6就可以了。但是從長遠來看,這部分工作崗位,終將會被大數據分析所取代。這也就是為什么之前所說互聯網公司重金難求大數據分析師了。

2、終身學習很重要

為什么這么說,你會發現這個是時代的腳步越來越快了,你一不學習就很容易被時代淘汰,暫時把自己定位小型企業數據分析師的人,別忘了還是要去學習現在更流行的更有趨勢的技術。自己的工作領域能跟互聯網掛鉤的盡量往上靠,畢竟這是大勢所趨。

最最后

善用數據分析師常用工具,祝愿大家早日成為一名優秀的數據分析師!

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢