熱線電話:13121318867

登錄
首頁大數據時代pandas 如何在遍歷 DataFrame 時修改數據?
pandas 如何在遍歷 DataFrame 時修改數據?
2023-04-21
收藏

Pandas 是 Python 中非常流行的數據操作和分析庫之一。其中,DataFrame 是 Pandas 提供的一個非常有用的數據結構,它類似于 SQL 中的表格,可以存儲二維數組、CSV 文件、Excel 表格等數據。在 Pandas 中,有很多方法可以遍歷 DataFrame,但是如何在遍歷時修改數據呢?本文將探討這個問題,并提供一些示例代碼。

遍歷 DataFrame

在 Pandas 中,有兩種方式可以遍歷 DataFrame,分別是使用 for 循環和 iterrows() 方法。下面我們分別介紹一下這兩種方式。

使用 for 循環

使用 for 循環遍歷 DataFrame 的方法很簡單,只需要像遍歷列表一樣來遍歷 DataFrame 即可。例如:

import pandas as pd

df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'], 'age': [25, 30, 35]}) for index, row in df.iterrows(): print(row['name'], row['age'])

輸出結果為:

Alice 25
Bob 30
Charlie 35

在上面的代碼中,我們通過 iterrows() 方法來遍歷 DataFrame,其中 index 表示索引,row 表示每一行的數據。對于每一行的數據,我們可以通過 row['name'] 或者 row['age'] 來獲取其中的某一個值。

使用 iterrows() 方法

iterrows() 方法是 Pandas 中另一種遍歷 DataFrame 的方式。它返回一個迭代器,可以通過 for 循環來遍歷 DataFrame 中的每一行數據。例如:

import pandas as pd

df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'], 'age': [25, 30, 35]}) for index, row in df.iterrows(): print(row['name'], row['age'])

輸出結果為:

Alice 25
Bob 30
Charlie 35

在上面的代碼中,我們同樣使用了 iterrows() 方法來遍歷 DataFrame。其中 index 表示索引,row 表示每一行數據。對于每一行數據,我們同樣可以通過 row['name'] 或者 row['age'] 來獲取其中的某一個值。

修改 DataFrame

在遍歷 DataFrame 的過程中,我們有時候需要對其中的數據進行修改。那么如何在遍歷 DataFrame 的同時修改其中的數據呢?下面我們介紹兩種方法:使用 at() 方法和使用 loc() 方法。

使用 at() 方法

at() 方法可以用來選擇 DataFrame 中的某一個元素,并且可以將其修改為指定的值。例如:

import pandas as pd

df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'], 'age': [25, 30, 35]}) for index, row in df.iterrows(): if row['name'] == 'Alice':
        df.at[index, 'age'] = 26 print(df)

輸出結果為:

name  age
0    Alice   26
1      Bob   30
2  Charlie   35

在上面的代碼中,我們使用 for 循環遍歷了 DataFrame,并且通過 if 語句來判斷當前行的 name 是否為 'Alice'。如果是,我們就使用 at() 方法將該行的 age 修改為 26。

使用 loc() 方法

loc() 方法可以用來選取 DataFrame 中的一部分數據,并且可以對其進行修改。例如:

import pandas as pd

df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'], 'age': [25, 30, 35]})

df.loc[df['name'] == 'Alice', 'age'] = 26 print(df)

輸出結果為:

name  age
0    Alice   26
1      Bob   30
2  Charlie   35

在上面的代碼中,我們使用了 loc() 方法來選取 DataFrame 中 name 為 'Alice' 的那一行,并將其中的 age 修改為 26。

總結

本文中,我們介紹了 Pandas 中遍歷 DataFrame 的兩種方式:使用 for 循環和 iterrows() 方法。同時,我們也介紹了兩種在遍歷時修改 DataFrame 數據的方法:使用 at() 方法和 loc() 方法。

需要注意的是,在遍歷 DataFrame 并且修改其中的數據時,我們需要小心地處理索引值和行列標簽,以避免出現錯誤結果。另外,在涉及到大規模數據處理時,盡可能使用向量化方法來進行操作,可以顯著提高代碼的效率。

總之,Pandas 提供了非常強大的數據操作功能。熟練掌握 DataFrame 的遍歷和修改技巧,可以讓我們更加高效地完成數據分析和處理任務。

推薦學習書籍
《CDA一級教材》適合CDA一級考生備考,也適合業務及數據分析崗位的從業者提升自我。完整電子版已上線CDA網校,累計已有10萬+在讀~

免費加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢