熱線電話:13121318867

登錄
首頁大數據時代python數據分析常用的庫有哪幾種?
python數據分析常用的庫有哪幾種?
2020-07-09
收藏

1、Numpy

NumPy 是一個 Python 包。 它代表 “Numeric Python”。 它是一個由多維數組對象和用于處理數組的例程集合組成的庫。它是Python創建的所有更高層工具的基礎。以下是它提供的一些功能:

a、N維數組,一種快速、高效使用內存的多維數組,它提供矢量化數學運算 。

b、你可以不需要使用循環,就對整個數組內的數據進行標準數學運算。

c、非常便于傳送數據到用低級語言(如C或C++)編寫的外部庫,也便于外部庫以Numpy數組形式返回數據。

NumPy不提供高級數據分析功能,但有了對NumPy數組和面向數組的計算的理解,能幫助你更有效地使用像Pandas之類的工具。

2、Pandas

Pandas是一個開放源碼的Python庫,它使用強大的數據結構提供高性能的數據操作和分析工具。Pandas包含高級數據結構,以及和讓數據分析變得快速、簡單的工具。它建立在NumPy之上,使以NumPy為中心的應用變得簡單。Pandas用于廣泛的領域,包括金融,經濟,統計,分析等學術和商業領域。

優點:

a、帶有坐標軸的數據結構,支持自動或明確的數據對齊。這能防止由于數據沒有對齊,以及處理不同來源的、采用不同索引的數據而產生的常見錯誤。

b、使用Pandas更容易處理缺失數據。

c、合并流行數據庫(如:基于SQL的數據庫)中能找到 的關系操作。

Pandas是進行數據清洗/整理(data munging)的最好工具。

3、Matplotlib

Matlplotlib是Python的一個可視化模塊,是一個Python 2D繪圖庫,可以生成各種硬拷貝格式和跨平臺交互式環境的出版物質量數據。它讓你方便地制作線條圖、餅圖、柱狀圖以及其它專業圖形。使用Matplotlib,我們可以定制所做圖表的任一方面。它支持所有的操作系統下不同的GUI后端(back ends),并且可以將圖形輸出為常見地矢量圖和圖形格式,如:PDF、SVG、JPG、PNG、BMP和GIF等。而且Matplotlib可用于Python腳本,Python和IPython shell,Jupyter筆記本,Web應用程序服務器和四個圖形用戶界面工具包。

4、Scipy

Scipy庫依賴于NumPy,是一個開放源碼的BSD許可的數學,科學和工程庫。它提供便捷和快速的N維向量數組操作。SciPy庫的建立就是和NumPy數組一起工作,并提供許多對用戶友好的和有效的數值例程,如:數值積分和優化。SciPy模塊用于優化、線性代數、積分以及其它數據科學中的通用任務。

5、Scikit-learn

Scikit-learn是一個用于機器學習的Python模塊。它建立在Scipy之上,提供了一套常用機器學習算法,讓使用者通過一個統一的接口來使用。Scikit-learn有助于你迅速地在你的數據集上實現流行的算法。它包含了許多用于標準機器學習任務的工具,如:聚類、分類和回歸等。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢