Python解析JSON对象的全过程记录

前言

本章节我们将为大家介绍如何使用 Python 语言来编码和解码 JSON 对象。

json处理模块的主要任务，是将一个JSON对象，转换成Python数据类型数据进行处理，或者反之，将Python数据类型数据，转换成JSON对象（字符串流），在不同的模块或者系统间传输。

1. JSON数据格式特点

对象表示为键值对
数据由逗号分隔
花括号保存对象
方括号保存数组

{
 "students": [
 { "name":"北山啦" , "age":20 },
 { "name":"张三" , "age":30 },
 { "name":"里斯" , "age":17 }
 ]
}

{'students': [{'name': '北山啦', 'age': 20},
 {'name': '张三', 'age': 30},
 {'name': '里斯', 'age': 17}]}

上面就是一个JSON格式数据。它开起来就像是在Python中的字典数据类型。我们可以通过json模块将它转换成字符串或者反过来将字符串转换成字典数据类型。

JSON也支持各种数据类型，它的数据类型和Python各种数据类型之间的对比如下：

object —— dict
array —— list
string —— str
number —— int/float
true/false —— True/False
null —— None

2. 常用方法总结

在json模块中，用于处理json的主要是四个函数，分别是：

loads()：从JSON字符串中读取数据并转换成Python数据类型
load()：从JSON文件中读取数据并转换成Python数据类型
dumps()：将Python数据类型数据转换成JSON字符串
dump():将Python数据类型数据转换成JSON字符串写入到文件

3. 系列化和反系列化

从JSON数据转换到Python数据，叫反系列化（deserialization）

从Python数据转换到JSON数据，叫系列化（serialization）

3.1 系列化

系列化:将Python数据转换成JSON字符串的方法。

下面我们先来看一个简单的例子。

import json

data = {
 "students": [
 { "name":"北山啦" , "age":20 },
 { "name":"张三" , "age":30 },
 { "name":"里斯" , "age":17 }
 ]
}
print(type(data))
print(data)
json_str = json.dumps(data)
print(type(json_str))

<class 'dict'>
{'students': [{'name': '北山啦', 'age': 20}, {'name': '张三', 'age': 30}, {'name': '里斯', 'age': 17}]}
<class 'str'>

上面的例子中，虽然看起来数据没有发生变化，但其实它们的数据类型已经发生了本质的改变：将字典数据类型的data，转换成了str类型，然后我们就可以将这个str类型的数据转换成流，在网络上进行传输或者写入到文件等。

import json

data = {
 "students": [
 { "name":"北山啦" , "age":20 },
 { "name":"张三" , "age":30 },
 { "name":"里斯" , "age":17 }
 ]
}

print(type(data))
print(data)
json_str = json.dumps(data, separators=('>>','::'), indent=2)
print(json_str)

<class 'dict'>
{'students': [{'name': '北山啦', 'age': 20}, {'name': '张三', 'age': 30}, {'name': '里斯', 'age': 17}]}
{
 "students"::[
 {
 "name"::"\u5317\u5c71\u5566">>
 "age"::20
 }>>
 {
 "name"::"\u5f20\u4e09">>
 "age"::30
 }>>
 {
 "name"::"\u91cc\u65af">>
 "age"::17
 }
 ]
}

将data写入txt文件中

import json

data = {
 "students": [
 { "name":"北山啦" , "age":20 },
 { "name":"张三" , "age":30 },
 { "name":"里斯" , "age":17 }
 ]
}
with open("students.txt","w") as fp:
 json.dump(data, fp, ensure_ascii=False)
 print("finish")

finish

这样就将data写入了students.txt，看看是不是已经将数据写进去了。

3.2 反系列化

从JSON数据转换到Python类型数据，叫反系列化。可以通过loads()/load()这两个方法来完成。

import json
with open("students.txt") as fp:
 data = json.load(fp)
 """取出字典key为students的数据，
 得到一个list，再从这个list中取第一个数据"""
 print(data['students'][0])

{'name': '北山啦', 'age': 20}

parse_int参数

默认值为None,如果指定了parse_int，用来对JSON int字符串进行解码,这可以用于为JSON整数使用另一种数据类型或解析器。

parse_int参数，这里我们简单将其指定为float类型。

import json
with open("students.txt") as fp:
 data = json.load(fp, parse_int = float)
 print(data)

{'students': [{'name': '北山啦', 'age': 20.0}, {'name': '张三', 'age': 30.0}, {'name': '里斯', 'age': 17.0}]}

可以看到，age原来是整数类型，通过parse_int已经被转换成了float类型。

object_hook

默认值为None,object_hook是一个可选函数，此功能可用于实现自定义解码器。指定一个函数，该函数负责把反序列化后的基本类型对象转换成自定义类型的对象。

def fromJSON(dct): # 这里会对所有的字典数据类型都进行遍历
 if isinstance(dct, dict) and 'students' in dct:
 return dct['students']
 else:
 return Student(dct['name'], dct['age'])

import json

with open("students.txt") as fp:
 data = json.load(fp, object_hook=fromJSON)
 print(data)

[姓名: 北山啦, 年龄: 20, 姓名: 张三, 年龄: 30, 姓名: 里斯, 年龄: 17]

总结

到此这篇关于Python解析JSON对象的文章就介绍到这了,更多相关Python解析JSON对象内容请搜索自学编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持自学编程网！

编程技巧