python對json的相關操作實例詳解-CDA數據分析師官網

熱線電話：13121318867

登錄

首頁精彩閱讀python對json的相關操作實例詳解

python對json的相關操作實例詳解

2017-08-29

收藏

python對json的相關操作實例詳解

本文實例分析了 python對json的相關操作。分享給大家供大家參考，具體如下：

什么是json：

JSON(JavaScript Object Notation) 是一種輕量級的數據交換格式。易于人閱讀和編寫。同時也易于機器解析和生成。它基于JavaScript Programming Language, Standard ECMA-262 3rd Edition - December 1999的一個子集。JSON采用完全獨立于語言的文本格式，但是也使用了類似于C語言家族的習慣（包括C, C++, C#, Java, JavaScript, Perl, Python等）。這些特性使JSON成為理想的數據交換語言。

JSON建構于兩種結構：

“名稱/值”對的集合（A collection of name/value pairs）。不同的語言中，它被理解為對象（object），紀錄（record），結構（struct），字典（dictionary），哈希表（hash table），有鍵列表（keyed list），或者關聯數組（associative array）。

值的有序列表（An ordered list of values）。在大部分語言中，它被理解為數組（array）。

這些都是常見的數據結構。事實上大部分現代計算機語言都以某種形式支持它們。這使得一種數據格式在同樣基于這些結構的編程語言之間交換成為可能。

對簡單數據類型的encoding 和 decoding：

使用簡單的json.dumps方法對簡單數據類型進行編碼，例如：
import json
obj = [[1,2,3],123,123.123,'abc',{'key1':(1,2,3),'key2':(4,5,6)}]
encodedjson = json.dumps(obj)
print repr(obj)
print encodedjson

輸出：

[[1, 2, 3], 123, 123.123, 'abc', {'key2': (4, 5, 6), 'key1': (1, 2, 3)}]
[[1, 2, 3], 123, 123.123, "abc", {"key2": [4, 5, 6], "key1": [1, 2, 3]}]

通過輸出的結果可以看出，簡單類型通過encode之后跟其原始的repr()輸出結果非常相似，但是有些數據類型進行了改變，例如上例中的元組則轉換為了列表。在json的編碼過程中，會存在從python原始類型向json類型的轉化過程，具體的轉化對照如下：

json.dumps()方法返回了一個str對象encodedjson，我們接下來在對encodedjson進行decode，得到原始數據，需要使用的json.loads()函數：
decodejson = json.loads(encodedjson)
print type(decodejson)
print decodejson[4]['key1']
print decodejson

輸出：


[1, 2, 3]
[[1, 2, 3], 123, 123.123, u'abc', {u'key2': [4, 5, 6], u'key1': [1, 2, 3]}]

loads方法返回了原始的對象，但是仍然發生了一些數據類型的轉化。比如，上例中‘abc'轉化為了unicode類型。從json到python的類型轉化對照如下：

json.dumps方法提供了很多好用的參數可供選擇，比較常用的有sort_keys（對dict對象進行排序，我們知道默認dict是無序存放的），separators，indent等參數。
排序功能使得存儲的數據更加有利于觀察，也使得對json輸出的對象進行比較，例如：
data1 = {'b':789,'c':456,'a':123}
data2 = {'a':123,'b':789,'c':456}
d1 = json.dumps(data1,sort_keys=True)
d2 = json.dumps(data2)
d3 = json.dumps(data2,sort_keys=True)
print d1
print d2
print d3
print d1==d2
print d1==d3

輸出：

{"a": 123, "b": 789, "c": 456}
{"a": 123, "c": 456, "b": 789}
{"a": 123, "b": 789, "c": 456}
False
True

上例中，本來data1和data2數據應該是一樣的，但是由于dict存儲的無序特性，造成兩者無法比較。因此兩者可以通過排序后的結果進行存儲就避免了數據比較不一致的情況發生，但是排序后再進行存儲，系統必定要多做一些事情，也一定會因此造成一定的性能消耗，所以適當排序是很重要的。
indent參數是縮進的意思，它可以使得數據存儲的格式變得更加優雅。
data1 = {'b':789,'c':456,'a':123}
d1 = json.dumps(data1,sort_keys=True,indent=4)
print d1

輸出：

{
"a": 123,
"b": 789,
"c": 456
}

輸出的數據被格式化之后，變得可讀性更強，但是卻是通過增加一些冗余的空白格來進行填充的。json主要是作為一種數據通信的格式存在的，而網絡通信是很在乎數據的大小的，無用的空格會占據很多通信帶寬，所以適當時候也要對數據進行壓縮。separator參數可以起到這樣的作用，該參數傳遞是一個元組，包含分割對象的字符串。
print 'DATA:', repr(data)
print 'repr(data) :', len(repr(data))
print 'dumps(data) :', len(json.dumps(data))
print 'dumps(data, indent=2) :', len(json.dumps(data, indent=4))
print 'dumps(data, separators):', len(json.dumps(data, separators=(',',':')))

輸出：
DATA: {'a': 123, 'c': 456, 'b': 789}
repr(data) : 30
dumps(data) : 30
dumps(data, indent=2) : 46
dumps(data, separators): 25

通過移除多余的空白符，達到了壓縮數據的目的，而且效果還是比較明顯的。
另一個比較有用的dumps參數是skipkeys，默認為False。 dumps方法存儲dict對象時，key必須是str類型，如果出現了其他類型的話，那么會產生TypeError異常，如果開啟該參數，設為True的話，則會比較優雅的過度。
data = {'b':789,'c':456,(1,2):123}
print json.dumps(data,skipkeys=True)

輸出：

{"c": 456, "b": 789}

處理自己的數據類型
json模塊不僅可以處理普通的python內置類型，也可以處理我們自定義的數據類型，而往往處理自定義的對象是很常用的。
首先，我們定義一個類Person。

class Person(object):
def __init__(self,name,age):
self.name = name
self.age = age
def __repr__(self):
return 'Person Object name : %s , age : %d' % (self.name,self.age)
if __name__ == '__main__':
p = Person('Peter',22)
print p

如果直接通過json.dumps方法對Person的實例進行處理的話，會報錯，因為json無法支持這樣的自動轉化。通過上面所提到的json和python的類型轉化對照表，可以發現，object類型是和dict相關聯的，所以我們需要把我們自定義的類型轉化為dict，然后再進行處理。這里，有兩種方法可以使用。

方法一：自己寫轉化函數
'''
Created on 2011-12-14
@author: Peter
'''
import Person
import json
p = Person.Person('Peter',22)
def object2dict(obj):
#convert object to a dict
d = {}
d['__class__'] = obj.__class__.__name__
d['__module__'] = obj.__module__
d.update(obj.__dict__)
return d
def dict2object(d):
#convert dict to object
if'__class__' in d:
class_name = d.pop('__class__')
module_name = d.pop('__module__')
module = __import__(module_name)
class_ = getattr(module,class_name)
args = dict((key.encode('ascii'), value) for key, value in d.items()) #get args
inst = class_(**args) #create new instance
else:
inst = d
return inst
d = object2dict(p)
print d
#{'age': 22, '__module__': 'Person', '__class__': 'Person', 'name': 'Peter'}
o = dict2object(d)
print type(o),o
# Person Object name : Peter , age : 22
dump = json.dumps(p,default=object2dict)
print dump
#{"age": 22, "__module__": "Person", "__class__": "Person", "name": "Peter"}
load = json.loads(dump,object_hook = dict2object)
print load
#Person Object name : Peter , age : 22

上面代碼已經寫的很清楚了，實質就是自定義object類型和dict類型進行轉化。object2dict函數將對象模塊名、類名以及__dict__存儲在dict對象里，并返回。dict2object函數則是反解出模塊名、類名、參數，創建新的對象并返回。在json.dumps 方法中增加default參數，該參數表示在轉化過程中調用指定的函數，同樣在decode過程中json.loads方法增加object_hook,指定轉化函數。

方法二：繼承JSONEncoder和JSONDecoder類，覆寫相關方法

JSONEncoder類負責編碼，主要是通過其default函數進行轉化，我們可以override該方法。同理對于JSONDecoder。

'''
Created on 2011-12-14
@author: Peter
'''
import Person
import json
p = Person.Person('Peter',22)
class MyEncoder(json.JSONEncoder):
def default(self,obj):
#convert object to a dict
d = {}
d['__class__'] = obj.__class__.__name__
d['__module__'] = obj.__module__
d.update(obj.__dict__)
return d
class MyDecoder(json.JSONDecoder):
def __init__(self):
json.JSONDecoder.__init__(self,object_hook=self.dict2object)
def dict2object(self,d):
#convert dict to object
if'__class__' in d:
class_name = d.pop('__class__')
module_name = d.pop('__module__')
module = __import__(module_name)
class_ = getattr(module,class_name)
args = dict((key.encode('ascii'), value) for key, value in d.items()) #get args
inst = class_(**args) #create new instance
else:
inst = d
return inst
d = MyEncoder().encode(p)
o = MyDecoder().decode(d)
print d
print type(o), o

對于JSONDecoder類方法，稍微有點不同，但是改寫起來也不是很麻煩?？创a應該就比較清楚了。

CDA數據分析師考試相關入口一覽（建議收藏）：

? 想報名CDA認證考試，點擊>>> “CDA報名” 了解CDA考試詳情；

? 想學習CDA考試教材，點擊>>> “CDA教材” 了解CDA考試詳情；

? 想加入CDA考試題庫，點擊>>> “CDA題庫” 了解CDA考試詳情；

? 想了解CDA考試含金量，點擊>>> “CDA含金量” 了解CDA考試詳情；

python 數據類型壓縮數據存儲數據結構數據格式

數據分析咨詢請掃描二維碼

若不方便掃碼，搜微信號：CDAshujufenxi

上一篇回歸系列（一）| 怎樣正確地理解線性回歸

下一篇2020美國總統競選大戲開鑼，川普當選的奇跡會再發生嗎？

數據分析師考試動態

考試介紹
考試大綱
考試內容
考試地點

CDA報考指南

報考流程
考試時間
報名費用
聯系我們

數據分析學習

數據分析師資訊

更多

Copyright © 2015-2021, www.ruiqisteel.com All Rights Reserved. CDA數據分析師(北京國富如荷網絡科技有限公司) 版權所有京ICP備11001960號-9

京公網安備 11010802034615號經營許可證編號：京B2-20210330

聯系電話：13321103290 (微信同號)

OK

免費資料
免費試聽
訂制課程
職業規劃
認證考試

客服在線

日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码

客服在線

立即咨詢

免密碼登錄

提交首次登錄驗證后自動注冊