Python无法解析JSON数据的原因及解决方法

Python无法解析JSON数据的原因及解决方法

技术背景

在Python开发中,JSON(JavaScript Object Notation)是一种常用的数据交换格式。Python的json模块提供了处理JSON数据的功能,允许开发者将JSON数据解析为Python对象,或者将Python对象转换为JSON格式的字符串。然而,当JSON数据格式不符合规范时,Python的json模块在解析时会抛出异常。

实现步骤

1. 发现问题

假设有一个名为data.json的文件,其内容如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
{
"maps": [
{
"id": "blabla",
"iscategorical": "0"
},
{
"id": "blabla",
"iscategorical": "0"
}
],
"masks": [
"id": "valore"
],
"om_points": "value",
"parameters": [
"id": "valore"
]
}

使用以下Python代码尝试解析该JSON文件:

1
2
3
4
5
6
7
import json
from pprint import pprint

with open('data.json') as f:
data = json.load(f)

pprint(data)

运行上述代码会抛出json.decoder.JSONDecodeError异常,提示Expecting ',' delimiter,这表明JSON数据格式存在问题。

2. 分析问题

在JSON格式中,[]表示数组,{}表示对象。原JSON数据中,"masks""parameters"部分使用了[],但实际内容应该是对象,所以需要将[]替换为{}

3. 修正JSON数据

data.json文件内容修改为:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
{
"maps": [
{
"id": "blabla",
"iscategorical": "0"
},
{
"id": "blabla",
"iscategorical": "0"
}
],
"masks": {
"id": "valore"
},
"om_points": "value",
"parameters": {
"id": "valore"
}
}

4. 重新解析JSON数据

再次运行之前的Python代码:

1
2
3
4
5
6
7
import json
from pprint import pprint

with open('data.json') as f:
data = json.load(f)

pprint(data)

此时,代码可以正常运行,成功解析JSON数据。

核心代码

以下是修正后的完整Python代码:

1
2
3
4
5
6
7
8
9
10
11
12
import json
from pprint import pprint

with open('data.json') as f:
data = json.load(f)

pprint(data)

# 访问JSON数据中的值
print(data["maps"][0]["id"])
print(data["masks"]["id"])
print(data["om_points"])

最佳实践

  • 在编写JSON数据时,确保严格遵循JSON格式规范,注意[]{}的正确使用。
  • 在解析JSON数据之前,对数据进行简单的验证或格式化,以避免格式错误。
  • 处理JSON数据时,使用异常处理机制捕获可能的解析错误,提高代码的健壮性。例如:
1
2
3
4
5
6
7
8
9
import json
from pprint import pprint

try:
with open('data.json') as f:
data = json.load(f)
pprint(data)
except json.JSONDecodeError as e:
print(f"JSON解析错误: {e}")

常见问题

1. 如何知道JSON数组的大小?

可以使用Python的len()函数来获取JSON数组的大小。例如,要获取"maps"数组的大小,可以使用以下代码:

1
2
3
4
5
6
7
import json

with open('data.json') as f:
data = json.load(f)

maps_size = len(data["maps"])
print(f"maps数组的大小为: {maps_size}")

2. 打印JSON数据时出现u'前缀怎么办?

在Python 2中,字符串有strunicode两种类型,u'前缀表示这是一个unicode字符串。在Python 3中,所有字符串都是unicode类型,不会出现这个问题。如果需要在Python 2中处理,可以使用encode()方法将unicode字符串转换为str类型。例如:

1
2
3
4
5
6
7
8
9
import json
from pprint import pprint

with open('data.json') as f:
data = json.load(f)

# 将unicode字符串转换为str类型
encoded_data = {k.encode('utf-8') if isinstance(k, unicode) else k: v.encode('utf-8') if isinstance(v, unicode) else v for k, v in data.items()}
pprint(encoded_data)

3. 能否像访问对象属性一样访问JSON数据?

在Python中,JSON数据解析后是一个字典或列表,不能像访问对象属性一样直接访问。需要使用字典的键来访问对应的值。例如,不能使用data.om_points,而应该使用data["om_points"]


Python无法解析JSON数据的原因及解决方法
https://119291.xyz/posts/2025-04-22.python-json-parsing-issues-and-solutions/
作者
ww
发布于
2025年4月22日
许可协议