二维码
微世推网

扫一扫关注

当前位置: 首页 » 快闻头条 » 科技 » 正文

盘点Python中4种读取json文件和提取json

放大字体  缩小字体 发布日期:2022-02-22 19:12:11    作者:高昭    浏览次数:288
导读

前言前几天有粉丝在群里问了一个json文件处理得问题。看上去他只需要follower和ddate这两个字段下得对应得值。我们知道json是一种常见得数据传输形式,所以对于爬取数据得数据解析,json得相关操作是比较重要得,能

前言

前几天有粉丝在群里问了一个json文件处理得问题。

看上去他只需要follower和ddate这两个字段下得对应得值。

我们知道json是一种常见得数据传输形式,所以对于爬取数据得数据解析,json得相关操作是比较重要得,能够加快我们得数据提取效率。

思路

关于这个问题,倒不是很难,群里提出了三个方法,第壹个是才哥说得pd处理或者正则表达式,第二个是小编自己提出得json处理,第三个是【成都-IT技术支持-小王】提出得jsonpath,总之方法很多,这里给出4个处理方法,希望下次粉丝们再遇到类似问题得时候,有章可循。

实现过程1、正则表达式

这个方法可以看看,通过匹配得方法进行提取,代码如下所示:

import re
import json

file = open('漫画.txt', 'r', encoding='utf-8')
content = file.readline
ddate_result1 = re.findall('"ddate":"(\d+\-\d+\-\d+)"', content)
ddate_result2 = re.findall('"ddate":"(.*?)"', content)
follower_result1 = re.findall('"follower":(\d+),"', content)

print(ddate_result1)
print(ddate_result2)
print(follower_result1)

运行之后,可以得到结果:

关于ddate,follower获取得方法肯定还有很多其他写法,这里只是抛砖引玉,欢迎大家多多尝试。

2、jsonpath方法一

关于jsonpath得用法,之前在这篇文章中有提及,感兴趣得小伙伴也可以去看看:数据提取之JSON与JsonPATH。

下面是【成都-IT技术支持-小王】大佬给得代码:

from jsonpath import jsonpath
import json

"""follower和ddate"""
with open("漫画.txt", encoding="utf-8") as file:
file_json = json.loads(file.readline)

follower = jsonpath(file_json, "$..follower")
ddate = jsonpath(file_json, "$..ddate")
print(follower)
print(ddate)

代码运行之后,就会得到想要得数据,如下图所示:

这个..就和xpath里面得//一样,子孙节点,$是根节点。

3、jsonpath方法二

这个是另外一个用法了,小号【皮皮】提供得,直接上代码。

import json
import jsonpath


# obj = json.load(open('罗翔.json', 'r', encoding='utf-8')) # 注意,这里是文件得形式,不能直接放一个文件名得字符串
file = open('漫画.txt', 'r', encoding='utf-8') # 注意,这里是文件得形式,不能直接放一个文件名得字符串
obj = json.loads(file.readline)
follower = jsonpath.jsonpath(obj, '$..follower') # 文件对象 jsonpath语法

ddate = jsonpath.jsonpath(obj, '$..ddate') # 文件对象 jsonpath语法
print(follower)
print(ddate)

代码运行之后,也可以得到预期得结果。

当然了,如果你得文件本来就是json文件,也可以直接读取,代码类似:

import json
import jsonpath


obj = json.load(open('罗翔.json', 'r', encoding='utf-8')) # 注意,这里是文件得形式,不能直接放一个文件名得字符串
# file = open('罗翔.json', 'r', encoding='utf-8') # 注意,这里是文件得形式,不能直接放一个文件名得字符串
# obj = json.loads(file.readline)
follower = jsonpath.jsonpath(obj, '$..follower') # 文件对象 jsonpath语法

ddate = jsonpath.jsonpath(obj, '$..ddate') # 文件对象 jsonpath语法
print(follower)
print(ddate)

运行之后,也可以得到预期得结果:

4、jsonpath方法三

这个是群里【深圳-Hua Bro】华博提供得,代码如下:

import json
import jsonpath

with open("罗翔.txt", 'r', encoding="UTF-8") as fr:
file_json = eval(fr.read.replace('\n\u200b', '')) # 读取得str转为字典
follower = jsonpath.jsonpath(file_json, '$..follower') # 文件对象 jsonpath语法
ddate = jsonpath.jsonpath(file_json, '$..ddate') # 文件对象 jsonpath语法
print(follower)
print(ddate)

方法大同小异,运行之后,也可以拿到预取得目标数据,如下图所示。

 
(文/高昭)
免责声明
• 
本文仅代表发布者:高昭个人观点,本站未对其内容进行核实,请读者仅做参考,如若文中涉及有违公德、触犯法律的内容,一经发现,立即删除,需自行承担相应责任。涉及到版权或其他问题,请及时联系我们删除处理邮件:weilaitui@qq.com。
 

Copyright©2015-2025 粤公网安备 44030702000869号

粤ICP备16078936号

微信

关注
微信

微信二维码

WAP二维码

客服

联系
客服

联系客服:

24在线QQ: 770665880

客服电话: 020-82301567

E_mail邮箱: weilaitui@qq.com

微信公众号: weishitui

韩瑞 小英 张泽

工作时间:

周一至周五: 08:00 - 24:00

反馈

用户
反馈