读取json文件中多个json对象


一、读取json文件中多个json对象

文件的格式如下图:

拿到文件首先尝试with open读取,马上报错。原因是一个文件中有多个json,这种情况使用json.load()就无法读取了。
我的文件格式是[{{}},{{}},{{}}]这种格式。从上图也能看出,如果是每行一个json的话还是可以使用readline然后load来处理。但可惜我的json文件是格式化的。
所以只能想别的办法,网上搜了一下给的解决方案是一个decdoe什么的模块,看了半天没看出个所以然来,而且资料很少,就没有尝试。
想过将数据文件保存成csv然后用pandas读取,可惜转成csv后dict里的键值关系全乱套了。
苦思冥想之后突然想到既然pandas能读取csv能不能读取json呢,然后尝试一下,大赞。

import pandas as pd
#读取文件
frame = pd.read_json(r'C:\Users\zhaobw\Desktop\news.txt')
#设置显示所有列
pd.set_option('display.max_columns', None)
# print(frame)
#遍历dataframe中的所有行
for index, row in frame.iterrows():
    print(row["_id"], row["_source"])
    #解析行里的dict内容
    mydict = row["_source"]
    for key in mydict:
        print(key['_ch'])


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM