广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Python中优雅处理JSON文件的方法实例
  • 781
分享到

Python中优雅处理JSON文件的方法实例

2024-04-02 19:04:59 781人浏览 薄情痞子

Python 官方文档:入门教程 => 点击学习

摘要

目录1. 引言2. 什么是JSON文件?3. 使用python处理jsON文件3.1. 将JSON文件读取为字典类型3.2. 将JSON文件读取为pandas类型3.3. 使

1. 引言

在本文中,我们将学习如何使用Python读取、解析和编写JSON文件。
我们将讨论如何最好地处理简单的JSON文件以及嵌套的JSON文件,当然我们也将讨论如何访问Json文件数据中的特定值。

2. 什么是JSON文件?

JSON(Java Script Object Notation)是一种流行的文件格式,主要用于在WEB应用程序中存储和传输数据。如果我们经常和数据打交道,那么一定或多或少遇到过JSON格式的文件,因此我们有必要来学习如何读取和写入JSON。

下图为常见的JSON文件结构的示例.

JSON结构看起来和Python中的字典非常类似。需要注意的是,JSON格式通常是由key: 结对组成,其中key是字符串形式,value是字符串、数字、布尔值、数组、对象或null。

为了更直观的进行说明,在下图中我们以蓝色突出显示了所有的key,同时以橙色突出显示了所有的value。请注意,以下每组key/value间均使用逗号进行区分。

3. 使用Python处理JSON文件

在Python中内置了用于读取JSON文件的函数。以下给出几个如何将JSON文件解析为Python对象的示例。

3.1. 将JSON文件读取为字典类型

首先我们需要导入 json库, 接着我们使用open函数来读取JSON文件,最后利用json.load()函数将JSON字符串转化为Python字典形式.

就这么简单,代码如下:


import json
 
with open('superheroes.json') as f:
    superHeroSquad = json.load(f)
    
print(type(superHeroSquad))  # Output: dict
print(superHeroSquad.keys())
# Output: dict_keys(['squadName', 'homeTown', 'fORMed', 'secretBase', 'active', 'members'])

上述代码很简单很直观啦,唯一需要注意的是json库中有load()和loads()两个函数.

函数load()作用为读取JSON文件生成Python对象函数loads()作用为读取JSON 字符串流生成Python对象

我们可以将loads()函数中的字符s的含义理解成 load for strings.

3.2. 将JSON文件读取为Pandas类型

当然我们也可以使用Pandas库中的 read_json函数来读取对应的JSON文件,

代码如下:


import pandas as pd
df = pd.read_json('superheroes.json')

运行结果如下:

需要注意的是使用Pandas库不仅仅可以读取电脑本地磁盘上的JSON文件,也可以通过URL读取网络上存放的文件.

代码如下:


df1 = pd.read_json('https://mdn.GitHub.io/learning-area/javascript/oojs/json/superheroes.json')

3.3. 使用Pandas读取嵌套JSON类型

我们有时候遇到的JSON文件是嵌套的,这经常会让读取工作变得有些困难. 其实嵌套JSON和Python中的嵌套字典思想类似,即字典中嵌套字典.

我们观察上述例子中的member字段,其值也为字典类型,下图中我们使用缩进来展示嵌套结构。

设想一下,当我们将JSON文件加载到Pandas数据框架中时,members列如下所示。每行包含一个字典。


接下来我们讨论两种实现方法,这两种方法中,我们可以解析数据,以便将每个键分解为单独的一列。

方案一

我们可以在members这一列上使用apply方法,代码如下:


df['members'].apply(pd.Series)

上述代码执行后,members列会被拆分为4个新列,如下所示:

当然如果你想将上述拆分后的结果和之前的结果进行合并,可以使用pd.concat函数,

代码如下:


df = pd.concat([df['members'].apply(pd.Series), df.drop('members', axis = 1)], axis = 1)

方案二

在Pandas库中还有一个函数 json_normalize() ,它允许我们把嵌套的JSON展开。这是最简单的方法来解析嵌套的JSON了。

代码如下:


def test2():
    with open('superheroes.json') as f:
        superHeroSquad = json.load(f)
    out = pd.json_normalize(superHeroSquad, record_path=['members'],
                      meta=['squadName', 'homeTown', 'formed', 'secretBase', 'active'])
    print(out)

上述代码中:

  • record_path为我们希望拆分的列的名字
  • meta为列名的list,为我们输出的次序

运行结果如下:

最后我们需要注意的是,我们可以在上述函数json_normalize中添加参数 meta_prefix,这样可以让我们对meta中的名字添加统一的前缀。

代码如下:


pd.json_normalize(superHeroSquad, 
	record_path = ['members'], 
	meta = ['squadName', 'homeTown', 'formed', 'secretBase', 'active'], 
	meta_prefix = 'members_')

运行结果如下:

3.4. 访问特定位置的数据

在Python中我们可以通过Key的名字或者下标来访问JSON文件中任意位置的数据。

比如,假设我们想知道我们的第二个超级英雄的秘密身份。即在下图中,需要访问特定位置的数据在下图中以紫色突出显示。

为了得到这个值,我们可以直接使用以下语句:


superHeroSquad['members'][1]['secretIdentity']

从层次结构的顶部开始,由上往下,我们需要的第一个key是'members',因为它是我们需要访问的值所在的父节点。

在‘members'对应的键值中,我们看中括号,然后下标1表示list中的第二个成员。接着我们来看字段'secretIdentity',如下所示:

将上述过程合并在一起,我们就可以得到我们特定位置出的值为'Jane Wilson'。

细心的同学可能已经注意到,我在上面的JSON片段中突出显示了两个蓝色的值。希望感兴趣的同学们可以作为练习来尝试访问这些值。欢迎在文章后面的评论区中分享你的代码。

3.5. 导出JSON

让我们编辑一下我们最后一位超级英雄,将其secretIdentity从‘Unknow'更改为‘Will Smith',接着将这个字典导出为JSON文件。这里我们将使用json.dump()函数将字典写入文件。

代码如下:


#update secret identity of Eternal Flame
superHeroSquad['members'][2]['secretIdentity'] = 'Will Smith'
with open('superheroes.json', 'w') as file:
    json.dump(superHeroSquad, file)

上述代码运行后,我们打开文件superheroes.json,可以发现最后一名超级英雄的secretIdentity已经由Unknow变为了Will Smith.

当然,作为选择,我们也可以使用Pandas中的to_json()函数,完成上述功能。


df.to_json('superheroes.json')

3.6. 格式化输出

我们有时候在终端直接打印json文件,通常会得到很不美观的输出,样例如下:

为了让其看起来更加美观,我们这里可以在函数json.dump中采用参数indent参数来控制输出格式,代码如下:


with open('superheroes.json', 'w') as file:
    json.dump(superHeroSquad, file, indent = 4)

结果输出如下,是不是看上去更加美观啦。。。

3.7. 输出字段排序

当然dump函数中含有字段sort_key,通过设置其值,可以控制输出时是否对key进行排序。需要注意所有的key包括嵌套的key都会进行排序。

样例如下:


with open('superheroes.json', 'w') as file:
    json.dump(superHeroSquad, file, indent = 4, sort_keys = True)

运行结果如下:

4.总结

最后,让我们对本文做一下回顾,总结如下:

  • JSON文件通常由key:结对组成,这里key通常为字符串格式,value一般为字符串,数字,布尔,数组,对象或者null
  • Python有内置函数可以方便的读取JSON文件转化为Python中的字典类型或者Pandas可以处理的类型
  • 使用pd.read_json()来读取简单的JSON,使用pd.json_normalize()来读取嵌套的JSON
  • 我们可以通过key的名字或者下标来方便的获取JSON文件中特定位置的值
  • Python对象可以转化为JSON文件,同时可以对输出进行格式化输出以增加可读性

5.参考

链接一

到此这篇关于Python中优雅处理JSON文件的文章就介绍到这了,更多相关Python优雅处理JSON文件内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: Python中优雅处理JSON文件的方法实例

本文链接: https://www.lsjlt.com/news/160459.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Python中优雅处理JSON文件的方法实例
    目录1. 引言2. 什么是JSON文件?3. 使用Python处理JSON文件3.1. 将JSON文件读取为字典类型3.2. 将JSON文件读取为Pandas类型3.3. 使...
    99+
    2022-11-12
  • Python中优雅处理JSON文件的方法是什么
    这篇文章给大家介绍Python中优雅处理JSON文件的方法是什么,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。1. 引言我们将学习如何使用Python读取、解析和编写JSON文件。我们将讨论如何最好地处理简单的JSON...
    99+
    2023-06-22
  • 关于python处理大型json文件的方法
    如图所示,要处理的数据是一个json数组,而且非常大 下图为电脑配置,使用 json.load() 方法加载上述json文件电脑直接卡死 解决思路:     先用python进行...
    99+
    2022-11-13
  • Python中优雅使用assert断言的方法实例
    目录什么是 assert 断言 断言和异常的使用场景 使用断言的几个原则建议不使用断言的情况:总结什么是 assert 断言 Assert statements are a co...
    99+
    2022-11-12
  • python中解析json格式文件的方法示例
    前言 JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。它基于JavaScript(Standard ECMA-262 3rd Edition - Decembe...
    99+
    2022-06-04
    示例 格式文件 方法
  • R语言处理JSON文件的方法
    JSON文件以人类可读格式将数据存储为文本。 Json代表JavaScript Object Notation。 R可以使用rjson包读取JSON文件。 安装rjson包 在R语言...
    99+
    2022-11-12
  • Python文件处理方法实例代码分析
    今天小编给大家分享一下Python文件处理方法实例代码分析的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起...
    99+
    2022-10-19
  • python 读写txt文件 json文件的实现方法
    首先第一步,打开文件,有两个函数可供选择:open() 和 file() ①. f = open('file.txt',‘w') ... file.close() ②. f = file(...
    99+
    2022-06-04
    文件 方法 python
  • Python读写Json涉及到中文的处理方法
    今天在帮前端准备数据的时候,需要把数据格式转成json格式,说实话,涉及到中文有时候真的是很蛋疼,除非对Python的编码规则比较了解,不然处理起来真的很蛋疼。 整个逻辑 我们需要处理的是把一些文章处理,生...
    99+
    2022-06-04
    涉及到 中文 方法
  • Vuex中actions优雅处理接口请求的方法
    目录前言文件结构前言 在项目开发中,如果使用到了 vuex,通常我会将所有的接口请求单独用一个文件管理,而业务逻辑写在 actions 中,一方面方便统一管理项目中的所有请求,其次代...
    99+
    2022-11-16
    Vuex actions接口请求 Vuex接口请求 Vuex actions请求
  • SpringBoot读取资源目录中JSON文件的方法实例
    目录前言思路示例1.Maven依赖2.json资源文件3.读取json的Service4.测试接口最后前言 最近在做一个公共相关的内容,公告里边的内容,打算做成配置化的。 但是考虑到...
    99+
    2023-05-15
    springboot 读取json文件并解析 springboot 读取json文件 spring boot 读取文件
  • python中多种文件处理的方法
    基础操作在python 中,文件的操作分为面向目录和面向文件的,本质都是一样的。面向目录的常见操作见下表:方法作用方法作用os.getcwd()得到当前目录os.listdir()列出所有文件和目录os.removedirs( xxx)删除...
    99+
    2023-01-31
    多种 文件 方法
  • Python中使用Numpy优化文件处理的方法是什么?
    文件处理是编程中常见的任务之一,而Python中的Numpy库提供了一些优化文件处理的方法。本文将介绍如何使用Numpy库来优化文件处理,并通过演示代码来说明其实现方法。 一、Numpy库简介 Numpy是Python中一个重要的科学计算...
    99+
    2023-06-01
    numpy django 文件
  • Python脚本实时处理log文件的方法
    这个Python脚本是用来对实时文件的内容监控,比如 Error 或者 time out 字段都可以进行自定义;算是我的第一个真正的Python脚本,自己感觉还是比较臃肿,不过打算放到blog上记录一下(还...
    99+
    2022-06-04
    脚本 实时 文件
  • 如何优雅地删除 Linux 中的垃圾文件的方法
    不知道大家是否也跟我一样,是一只要把的自己电脑文件安排的条理有序,把没用的文件会及时删掉的程序猿呢?如果是的话,那么我们可以愉快地探讨下文章的内容。如果不是的话,你也可以留下来凑凑热闹嘛(>-<)。 下面...
    99+
    2022-06-03
    Linux 垃圾文件 Linux 删除垃圾文件
  • Python中有哪些处理文件方法
    这篇文章给大家介绍Python中有哪些处理文件方法,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。1 、读取文件数据文本文件可存储的数据量非常丰富,像天气数据、交通数据、文学作品等。每当我们需要分析或修改储存在文件中的信...
    99+
    2023-06-16
  • Python处理文本文件中控制字符的方法
    控制字符 控制字符(Control Character),或者说非打印字符,出现于特定的信息文本中,表示某一控制功能的字符,如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)...
    99+
    2022-06-04
    文本文件 字符 方法
  • python处理xml文件的方法小结
    本文实例讲述了python处理xml文件的方法。分享给大家供大家参考,具体如下: 前一段时间因为工作的需要,学习了一点用Python处理xml文件的方法,现在贴出来,供大家参考。 xml文件是按节点一层一层...
    99+
    2022-06-04
    小结 文件 方法
  • Python文件及目录处理的方法
    目录一、目录操作 1. 获取当前代码路径 2. 获取当前文件__file__的所在目录 3. 获取当前文件名名称 4. 拼接路径 5. 创建目录 二、文件操作 1. 创建文本文件 2...
    99+
    2022-11-12
  • Vue后台中优雅书写状态标签的方法实例
    目录前言优化抽离变量二次封装 el-tag 组件使用总结前言 在后台系统开发中,对于列表,常常有一些状态字段的展示,比如审核状态、退货申请状态等等,并且往往伴随有状态筛选的列表查询...
    99+
    2022-11-12
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作