熱線電話:13121318867

登錄
首頁大數據時代數據分析師教程《Python數據分析極簡入門》第2節 2 Pandas數據類型
數據分析師教程《Python數據分析極簡入門》第2節 2 Pandas數據類型
2024-11-20
收藏

《Python數據分析極簡入門》

第2節 2 Pandas數據類型

Pandas 有兩種自己獨有的基本數據結構。需要注意的是,它固然有著兩種數據結構,因為它依然是 Python 的一個庫,所以 Python 中有的數據類型在這里依然適用。我們分別看一下這兩種數據結構

Series

Series:一維數組。該結構能夠放置各種數據類型,比如字符、整數、浮點數等

我們先引入pandas包,這里有一個約定成俗的寫法import pandas as pdpandas引入,并命其別名為pd

接著將列表[2,3,5,7,11]放到pd.Series()里面

import pandas as pd
s = pd.Series([2,3,5,7,11],name = 'A')
s
0     2
1     3
2     5
3     7
4    11
Name: A, dtype: int64

Time- Series:以時間為索引Series

同樣的,將列['2024-01-01 00:00:00', '2024-01-01 03:00:00','2024-01-01 06:00:00'] 放到pd.DatetimeIndex()里面

dts1 = pd.DatetimeIndex(['2024-01-01 00:00:00''2024-01-01 03:00:00','2024-01-01 06:00:00'])
dts1
DatetimeIndex(['2024-01-01 00:00:00', '2024-01-01 03:00:00',
               '2024-01-01 06:00:00'],
              dtype='datetime64[ns]', freq=None)

還有另外一種寫法pd.date_range 可以按一定的頻率生成時間序列

dts2 = pd.date_range(start='2024-01-01', periods=6, freq='3H')
dts2
DatetimeIndex(['2024-01-01 00:00:00', '2024-01-01 03:00:00',
               '2024-01-01 06:00:00', '2024-01-01 09:00:00',
               '2024-01-01 12:00:00', '2024-01-01 15:00:00'],
              dtype='datetime64[ns]', freq='3H')
dts3 = pd.date_range('2024-01-01', periods=6, freq='d')
dts3
DatetimeIndex(['2024-01-01', '2024-01-02', '2024-01-03', '2024-01-04',
               '2024-01-05', '2024-01-06'],
              dtype='datetime64[ns]', freq='D')

DataFrame

DataFrame:二維的表格型數據結構,可以理解為Series的容器,通俗地說,就是可以把Series放到DataFrame里面。

它是一種二維表格型數據的結構,既有行索引,也有列索引。行索引是 index,列索引是 columns。類似于初中數學里,在二維平面里用坐標軸來定位平面中的點。

注意,DataFrame又是Pandas的核心!接下來的內容基本上以DataFrame為主

先來看看如何創建DataFrame,上面說過Series也好,DataFrame也罷,本質上都是容器。

千萬別被”容器“這個詞嚇住了,通俗來說,就是里面可以放東西的東西。

從字典創建DataFrame

相當于給里面放dict:先創建一個字典d,再把d放進了DataFrame里命名為df

d = {'A': [123], 
     'B': [456],
     'C': [789]}
df = pd.DataFrame(data = d)
df
A B C
0 1 4 7
1 2 5 8
2 3 6 9

從列表創建DataFrame

先創建了一個列表d,再把d放進了DataFrame里命名為df

d = [[4710],[5811],[6912]]
df1 = pd.DataFrame(
    data = d,
    index=['a''b''c'],
    columns=['A''B''C'])
df1
A B C
a 4 7 10
b 5 8 11
c 6 9 12

從數組創建DataFrame

數組(array)對你來說可能是一個新概念,在Python里面,創建數組需要引入一個類似于Pandas的庫,叫做Numpy。與前面引入Pandas類似,我們用 import numpy as np來引入numpy,命其別名為np。

同樣的,先創建一個數組d,再把d放進了DataFrame里命名為df

import numpy as np
d = np.array([[123], [456], [789]])
df2 = pd.DataFrame(data = d,
                   index=['a''b''c'],
                   columns=['A''B''C'])
df2
A B C
a 1 2 3
b 4 5 6
c 7 8 9

以上,我們用了不同的方式來創建DataFrame,接下來,我們看看創建好后,如何查看數據

下一節 《第2節 3 Pandas數據查看》

這里分享一個你一定用得到的小程序——CDA數據分析師考試小程序。 它是專為CDA數據分析認證考試報考打造的一款小程序??梢詭湍憧焖賵竺荚?、查成績、查證書、查積分,通過該小程序,考生可以享受更便捷的服務。 掃碼加入CDA小程序,與圈內考生一同學習、交流、進步!

下一節 《第2節 Pandas簡介》

這里分享一個你一定用得到的小程序——CDA數據分析師考試小程序。 它是專為CDA數據分析認證考試報考打造的一款小程序??梢詭湍憧焖賵竺荚?、查成績、查證書、查積分,通過該小程序,考生可以享受更便捷的服務。 掃碼加入CDA小程序,與圈內考生一同學習、交流、進步! ?

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢