熱線電話:13121318867

登錄
首頁精彩閱讀Python數據分析之pandas數據結構
Python數據分析之pandas數據結構
2020-03-31
收藏


Python數據分析之<a href='/map/pandas/' style='color:#000;font-size:inherit;'>pandas</a>數據結構

作者 | CDA數據分析師


之前的文章寫了Python的基礎知識,從這部分內容開始正式進入到正式的數據分析過程中,主要講述每個數據分析過程都會用到什么操作,這些操作用Excel是怎樣實現的,如果用Python,那么代碼又該怎么寫。


接下來的幾章我們會用到Pandas、NumPy、matplotlib這幾個模塊,在使用它們之前我們需要先將其導入,導入的方法在Python基礎知識部分提到過,一個程序中只需要導入一次即可。


Python數據分析之<a href='/map/pandas/' style='color:#000;font-size:inherit;'>pandas</a>數據結構


為了引用模塊時書寫方面,上面的代碼中用as分別給這幾個模塊起了別名。所以在本文中見到pd就是代表Pandas,見到np就是代表NumPy,見到plt就是代表matplotlib . pyplot。

  1. Series數據結構
  2. Series是什么


Series是一種類似于一位數組的對象,由一組數據及一組與之相關的數據標簽(即索引)組成。


Python數據分析之<a href='/map/pandas/' style='color:#000;font-size:inherit;'>pandas</a>數據結構


上面這樣的數據結構就是Series,第一列數字是數據標簽,第二列是具體的數據,數據標簽與數據是一一對應的,上面的數據用Excel表展示如下表所示:


Python數據分析之<a href='/map/pandas/' style='color:#000;font-size:inherit;'>pandas</a>數據結構


2、創建一個Series


創建一個Series利用的方法是pd.Series(),通過給Series()方法傳入不同的對象即可實現


(1)傳入一個列表


傳入一個列表的實際如下所示:


Python數據分析之<a href='/map/pandas/' style='color:#000;font-size:inherit;'>pandas</a>數據結構


如果只是傳入一個列表不指定數據標簽,那么Series會默認使用從0開始的數做數據標簽,上面的0、1、2、3就是默認的數據標簽。


(2)指定索引


直接傳入一個列表會使用默認索引,也可以通過設置index參數來自定義索引。


Python數據分析之<a href='/map/pandas/' style='color:#000;font-size:inherit;'>pandas</a>數據結構


(3)傳入一個字典


也可以將數據與數據標簽以key:value(字典)的形式傳入,這樣字典的key值就是數據標簽,value就是數據值。


Python數據分析之<a href='/map/pandas/' style='color:#000;font-size:inherit;'>pandas</a>數據結構


Python數據分析之<a href='/map/pandas/' style='color:#000;font-size:inherit;'>pandas</a>數據結構


3、利用index方法獲取Series的索引


獲取一組數據的索引是比較常見的需求,直接利用index方法 就可以獲取Series的索引值,代碼如下圖所示:


Python數據分析之<a href='/map/pandas/' style='color:#000;font-size:inherit;'>pandas</a>數據結構


4、利用values方法獲取Series的值


與索引值相對用的就是獲取Series的值,使用的方法是values方法。


Python數據分析之<a href='/map/pandas/' style='color:#000;font-size:inherit;'>pandas</a>數據結構


  1. DataFrame表格型數據結構
  2. DataFrame是什么


Series是由一組數據與一組索引(行索引)組成的數據結構,而DataFrame是由一組數據與一對索引(行索引和列索引)組成的表格型數據結構。之所以叫表格型數據結構,是因為DataFrame是數據形式和Excel的數據存儲形式很相近,接下來的章節圍繞DataFrame這種表格型數據結構展開。下面就是一個簡單的DataFrame數據結構。


Python數據分析之<a href='/map/pandas/' style='color:#000;font-size:inherit;'>pandas</a>數據結構


上面這種數據結構和Excel的數據結構很像,既有行索引又有列索引,由行索引和列索引確定唯一值。如果把上面這種結構用Excel表展示如下圖所示。


Python數據分析之<a href='/map/pandas/' style='color:#000;font-size:inherit;'>pandas</a>數據結構


2、創建一個DataFrame


創建DataFrame使用的方法是pd.Dataframe(),通過DataFrame()的方法傳入不同的對象即可實現。


(1)傳入一個列表


傳入一個列表的實現如下圖所示:


Python數據分析之<a href='/map/pandas/' style='color:#000;font-size:inherit;'>pandas</a>數據結構


只傳入一個單一列表時,該列表的值會顯示成一列,且行和列都是從0開始的默認索引。


(2)傳入一個嵌套列表


Python數據分析之<a href='/map/pandas/' style='color:#000;font-size:inherit;'>pandas</a>數據結構


當傳入一個嵌套列表時,會根據嵌套列表數顯示成多列數據,行、列索引同樣是從0 開始的默認索引。列表里面嵌套的列表也可以換成元組。


Python數據分析之<a href='/map/pandas/' style='color:#000;font-size:inherit;'>pandas</a>數據結構


(3)指定行、列索引


如果只給DataFrame()方法傳入列表,DataFrame()方法的行、列索引都是默認值,則可以通過設置columns參數自定義列索引,設置index參數自定義行索引。


Python數據分析之<a href='/map/pandas/' style='color:#000;font-size:inherit;'>pandas</a>數據結構


(4)傳入一個字典


傳入一個字典的實現如下圖所示。


Python數據分析之<a href='/map/pandas/' style='color:#000;font-size:inherit;'>pandas</a>數據結構


直接以字典的形式傳入DataFrame時,字典的key值就相當于列索引,這個時候如果沒有設置行索引,行索引還是使用從0 開始的默認索引,同樣可以使用index參數自定義行索引,代碼如下:


Python數據分析之<a href='/map/pandas/' style='color:#000;font-size:inherit;'>pandas</a>數據結構


3、獲取DataFrame的行、列索引


利用columns方法獲取DataFrame的列索引。


Python數據分析之<a href='/map/pandas/' style='color:#000;font-size:inherit;'>pandas</a>數據結構


利用index方法獲取DataFrame的行索引。


Python數據分析之<a href='/map/pandas/' style='color:#000;font-size:inherit;'>pandas</a>數據結構


4、獲取DataFrame的值


獲取DataFrame的值就是獲取DataFrame中的某些行或列,有關行、列的選擇會在后面的內容說到。


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢