熱線電話:13121318867

登錄
首頁精彩閱讀Python數據分析之pandas數據結構
Python數據分析之pandas數據結構
2020-01-16
收藏
作者 | CDA數據分析師

之前的文章寫了Python的基礎知識,從這部分內容開始正式進入到正式的數據分析過程中,主要講述每個數據分析過程都會用到什么操作,這些操作用Excel是怎樣實現的,如果用Python,那么代碼又該怎么寫。

接下來的幾章我們會用到Pandas、NumPy、matplotlib這幾個模塊,在使用它們之前我們需要先將其導入,導入的方法在Python基礎知識部分提到過,一個程序中只需要導入一次即可。

為了引用模塊時書寫方面,上面的代碼中用as分別給這幾個模塊起了別名。所以在本文中見到pd就是代表Pandas,見到np就是代表NumPy,見到plt就是代表matplotlib . pyplot。

  1. Series數據結構
  2. Series是什么

Series是一種類似于一位數組的對象,由一組數據及一組與之相關的數據標簽(即索引)組成。

上面這樣的數據結構就是Series,第一列數字是數據標簽,第二列是具體的數據,數據標簽與數據是一一對應的,上面的數據用Excel表展示如下表所示:

2、創建一個Series

創建一個Series利用的方法是pd.Series(),通過給Series()方法傳入不同的對象即可實現

(1)傳入一個列表

傳入一個列表的實際如下所示:

如果只是傳入一個列表不指定數據標簽,那么Series會默認使用從0開始的數做數據標簽,上面的0、1、2、3就是默認的數據標簽。

(2)指定索引

直接傳入一個列表會使用默認索引,也可以通過設置index參數來自定義索引。

(3)傳入一個字典

也可以將數據與數據標簽以key:value(字典)的形式傳入,這樣字典的key值就是數據標簽,value就是數據值。

3、利用index方法獲取Series的索引

獲取一組數據的索引是比較常見的需求,直接利用index方法 就可以獲取Series的索引值,代碼如下圖所示:

4、利用values方法獲取Series的值

與索引值相對用的就是獲取Series的值,使用的方法是values方法。

  1. DataFrame表格型數據結構
  2. DataFrame是什么

Series是由一組數據與一組索引(行索引)組成的數據結構,而DataFrame是由一組數據與一對索引(行索引和列索引)組成的表格型數據結構。之所以叫表格型數據結構,是因為DataFrame是數據形式和Excel的數據存儲形式很相近,接下來的章節圍繞DataFrame這種表格型數據結構展開。下面就是一個簡單的DataFrame數據結構。

上面這種數據結構和Excel的數據結構很像,既有行索引又有列索引,由行索引和列索引確定唯一值。如果把上面這種結構用Excel表展示如下圖所示。

2、創建一個DataFrame

創建DataFrame使用的方法是pd.Dataframe(),通過DataFrame()的方法傳入不同的對象即可實現。

(1)傳入一個列表

傳入一個列表的實現如下圖所示:

只傳入一個單一列表時,該列表的值會顯示成一列,且行和列都是從0開始的默認索引。

(2)傳入一個嵌套列表

當傳入一個嵌套列表時,會根據嵌套列表數顯示成多列數據,行、列索引同樣是從0 開始的默認索引。列表里面嵌套的列表也可以換成元組。

(3)指定行、列索引

如果只給DataFrame()方法傳入列表,DataFrame()方法的行、列索引都是默認值,則可以通過設置columns參數自定義列索引,設置index參數自定義行索引。

(4)傳入一個字典

傳入一個字典的實現如下圖所示。

直接以字典的形式傳入DataFrame時,字典的key值就相當于列索引,這個時候如果沒有設置行索引,行索引還是使用從0 開始的默認索引,同樣可以使用index參數自定義行索引,代碼如下:

3、獲取DataFrame的行、列索引

利用columns方法獲取DataFrame的列索引。

利用index方法獲取DataFrame的行索引。

4、獲取DataFrame的值

獲取DataFrame的值就是獲取DataFrame中的某些行或列,有關行、列的選擇會在后面的內容說到。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢