熱線電話:13121318867

登錄
首頁大數據時代python數據清洗時,經常用到的工具有哪幾種?
python數據清洗時,經常用到的工具有哪幾種?
2020-07-06
收藏

數據清洗是整個數據分析過程的第一步,也是整個數據分析項目中最耗費時間的一步,下面小編整理了幾種常用的python數據清洗工具,希望對大家有所幫助。

目前在python中, numpypandas是最主流的數據清洗工具,Numpy中的向量化運算使得數據處理變得高效,Pandas提供了大量數據清洗的高效方法,在python數據清洗中,盡可能多的使用numpypandas這兩種工具,提高數據清洗的效率。

一、Numpy

1 Numpy常用數據結構

Numpy中常用的數據結構是ndarray格式

使用array函數創建,語法格式為array(列表或元組)

可以使用其他函數例如arange、linspace、zeros等創建

2.Numpy常用數據清洗函數

排序函數

數據的搜索

sort函數: 從小到大進行排序

argsort函數: 返回的是數據中, 從小到大的索引值

二、Pandas

1.Pandas常用數據結構series和方法

?通過pandas.Series來創建Series數據結構

?pandas.Series(data,index,dtype,name)

?上述參數中,data可以為列表,array或者dict

?上述參數中, index表示索引,必須與數據同長度,name代表對象的名稱

2.series和dataframe常用方法

values:返回對象所有元素的值

index:返回行索引

dtypes:返回元素的數據類型

shape:返回對象數據形狀

ndim:返回對象的維度

size:返回對象的個數

columns:返回列標簽(只針對dataframe數據結構)

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢