熱線電話:13121318867

登錄
首頁精彩閱讀Pandas結構化json數據
Pandas結構化json數據
2024-01-03
收藏

Pandas json_normalize 函數使用教程介紹

json_normalize 是 Pandas 庫中一個強大的函數,用于將嵌套的 JSON 數據規范化成平面的 DataFrame。這對于處理包含嵌套結構的 JSON 數據非常有用,使其更容易分析和操作。在本教程中,我們將深入介紹 json_normalize 函數,并通過通俗的例子幫助你理解其參數的作用。

安裝 Pandas

首先,確保你已經安裝了 Pandas。如果沒有安裝,可以使用以下命令進行安裝:pip install pandas使用 json_normalize基本用法讓我們從最基本的用法開始。假設有如下嵌套的 JSON 數據:{                
  
"name":"John",                
  "age":30,                
  "address":{                
    
"city":"New York",                
    "zip":"10001"                
  
}                
}

  "name":"John",                
  "age":30,                
  "address":{                
    
"city":"New York",                
    "zip":"10001"                
  
}                

}

現在我們將使用 json_normalize 將其規范化成 DataFrameimport pandas as pd                
               
# 嵌套的 JSON 數據                
data 
= {                
    
"name""John",                
    "age"30,                
    "address": {                
        
"city""New York",                
        "zip""10001"                
    }                
}                
               
# 使用 json_normalize 規范化                
df 
= pd.json_normalize(data)                
               
# 打印 DataFrame                
print(df)    

               
# 嵌套的 JSON 數據                
data 
= {                
    
"name""John",                
    "age"30,                
    "address": {                
        
"city""New York",                
        "zip""10001"                
    }                
}                
               
# 使用 json_normalize 規范化                
df 
= pd.json_normalize(data)                
               
# 打印 DataFrame                

print(df)    運行上述代碼,你將得到一個包含規范化數據的 DataFrame。處理嵌套數組json_normalize 也可以處理包含嵌套數組的 JSON 數據。

考慮以下 JSON:{                
  
"name":"John",                
  "age":30,                
  "skills":[                
    
{"language":"Python", "level":"Intermediate"},                
    {"language":"JavaScript", "level":"Advanced"}                
  
]                
}

  "name":"John",                
  "age":30,                
  "skills":[                
    
{"language":"Python", "level":"Intermediate"},                
    {"language":"JavaScript", "level":"Advanced"}                
  
]                

}

我們可以使用 record_path 參數指定要規范化的嵌套數組:# 嵌套數組的 JSON 數據                
data_with_array 
= {                
    
"name""John",                
    "age"30,                
    "skills": [                
        {
"language""Python""level""Intermediate"},                
        {
"language""JavaScript""level""Advanced"}                
    ]                
}                
               
# 使用 json_normalize 規范化,指定嵌套數組路徑                
df_with_array 
= pd.json_normalize(data_with_array, record_path='skills')                
               
# 打印 DataFrame                

data_with_array = {                
    
"name""John",                
    "age"30,                
    "skills": [                
        {
"language""Python""level""Intermediate"},                
        {
"language""JavaScript""level""Advanced"}                
    ]                
}                
               
# 使用 json_normalize 規范化,指定嵌套數組路徑                
df_with_array 
= pd.json_normalize(data_with_array, record_path='skills')                
               
# 打印 DataFrame                

print(df_with_array)

通過指定 record_path 參數,我們將嵌套數組規范化成了 DataFrame。處理嵌套 JSONjson_normalize 還支持處理嵌套的 JSON 結構。

考慮以下 JSON:    {                
  
"name":"John",                
  "age":30,                
  "contact":{                
    
"email":"john@example.com",                
    "phone":{                
      
"home":"123-456-7890",                
      "work":"987-654-3210"                
    
}                
  
}                

  "name":"John",                
  "age":30,                
  "contact":{                
    
"email":"john@example.com",                
    "phone":{                
      
"home":"123-456-7890",                
      "work":"987-654-3210"                
    
}                
  
}                

}

我們可以使用 sep 參數指定嵌套層次的分隔符:# 嵌套 JSON 數據                
data_nested 
= {                
    
"name""John",                
    "age"30,                
    "contact": {                
        
"email""john@example.com",                
        "phone": {                
            
"home""123-456-7890",                
            "work""987-654-3210"                
        }                
    }                
}                
               
# 使用 json_normalize 規范化,指定嵌套層次分隔符                
df_nested 
= pd.json_normalize(data_nested, sep='_')                
               
# 打印 DataFrame                
print(df_nested)

data_nested = {                
    
"name""John",                
    "age"30,                
    "contact": {                
        
"email""john@example.com",                
        "phone": {                
            
"home""123-456-7890",                
            "work""987-654-3210"                
        }                
    }                
}                
               
# 使用 json_normalize 規范化,指定嵌套層次分隔符                
df_nested 
= pd.json_normalize(data_nested, sep='_')                
               
# 打印 DataFrame                

print(df_nested)在這個例子中,我們通過指定 sep 參數,將嵌套的 JSON 結構規范化成了 DataFrame。

總結

通過本教程,你學習了如何使用 Pandas 中的 json_normalize 函數將嵌套的 JSON 數據規范化成易于處理的 DataFrame。我們介紹了基本用法以及如何處理嵌套數組和嵌套 JSON 結構。希望這些通俗易懂的例子能夠幫助你更好地理解 json_normalize 函數的使用。    

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢