广告
返回顶部
首页 > 资讯 > 后端开发 > Python >python爬取中json、pickle与shelve库有什么用
  • 301
分享到

python爬取中json、pickle与shelve库有什么用

2023-06-07 22:06:20 301人浏览 独家记忆

Python 官方文档:入门教程 => 点击学习

摘要

小编给大家分享一下python爬取中JSON、pickle与shelve库有什么用,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!前言在使用Python进行网络编程

小编给大家分享一下python爬取中JSON、pickle与shelve库有什么用,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!

前言

在使用Python进行网络编程或者爬取一些自己感兴趣的东西时,总避免不了进行一些数据传输、存取等问题,Python的文件对象以及其他扩展库,已经解决了很多关于文本和二进制数据存取的问题,比如网页内容、图片&音视频等多媒体内容,但这些数据基本是最终的数据形态存储,有没有办法可以存储Python本身的一些对象数据,后续在使用的时候,再直接加载为Python对象即可,本文便讲解下常用的Python对象数据存取、传输解决方案,即pickle、shelve、json。

内容比较基础,也比较简单,但也是必须好好掌握的知识点,因为其潜在的应用场景太广

一、pickle

pickle库提供了一种将Python对象(所有对象)本地化存储的解决方案,后续还可以从这些文件内重新加载,加载后又是Python标准的对象数据,可以用Python直接使用。

pickle有以下特点:

  1. 可以存取所有类型Python对象,并本地化到一个文件内

  2. 每个文件内只能存储一个Python对象

1.1 临时转换

可以将Python对象临时转化为pickle序列(存储在变量内而不是文件内),后续再进行加载使用。

import picklea=[1,2,3,4]#以下将a转化为pickle序列p_a=pickle.dumps(a) #以下将pickle序列转化为Python对象a=pickle.loads(p_a)

1.2 永久化存取

可以将Python对象存储到本地文件内,方便下次取出继续使用。

import picklea=[1,2,3,4]f=open('file.pkl','wb') #以下将a转化为pickle序列并存储到本地文件p_a=pickle.dump(a,f) f=open('file.pkl','rb')#以下将存储在本地文件内的pickle序列转化为Python对象a=pickle.load(f) f.close()

以上,首先打开一个文件,注意,因为pickle序列是二进制编码格式,所以文件模式需要有'b'

然后将Python对象序列化并存储到本地文件

后续可通过加载该文件,将里面存储的数据重新加载为Python对象

二、shelve

shelve库相当于基于pickle的优化,因为pickle单文件只能存储单个Python对象,并且每次存取都需要使用dump和load,比较繁琐,所以,该库主要做了以下优化:

  1. 创建了一个轻量级的键值对数据库,支持一个文件内存储多个Python对象

  2. 不需要每次都load,对Python数据的存取,变成了标准的字典访问

以下是演示代码:

import shelvedb=shelve.open('obj_db')class A:...a=[1,2,3];b=dict(name='dennis');c=Adb['a']=adb['b']=bdb['c']=c db['a']db['b']db['c'] db.close()

以上代码,首先使用shelve的open方法创建一个db,可以指定db文件的存储地址

然后便可以像使用字典一样,用来在该键值对的db内存储Python对象(任何Python对象)

然后可像字典访问一样,重新取出之前已经存储的对象,最后,别忘了战术性关闭db

如果想遍历或内省某db内存量键值,该db也有keys()和values()方法,也支持Python的迭代协议

所以,相较于pickle来说,会方便和强大很多

三、json

json是进行网络数据传输应用最为广泛的数据格式,其可以将Python指定的一些数据对象转化为json字符串,便于进行存储和网络传输,并将该json序列化的字符串重新转变为Python对象。

大体过程为Python→JSON→Python,所以可以进行CS数据传输和通信。

以下为json和Python数据转换映射表:

JSONPython
objectdict
arraylist
stringstr
number (int)int
number (real)float
true,falseTure,False
nullNone

3.1 临时转换

可以将Python对象临时转化为json字符串并赋值给某变量,待后续再对其转化为Python对象

一般用于网络传输,尤其是接口调用时数据传输。

import jsonmylist=[1,2,3]mydict={ 'name':dennis}#临时转换a=json.dumps(mydict)b=json.dumps(mylist)#将json字符串重新转为Python对象mylist=json.loads(b)mydict=json.loads(a)

3.2 永久化存取

可以将Python对象转换为json字符串并永久性存储在本地文件内,便于后续重新加载使用。

import jsonmylist=[1,2,3]mydict={ 'name':dennis} #将Python对象转化为json字符串,同时存储到file内with open('myjson.json','w') as f: json.dump(mydict,f) #将存储在文件内的json字符串加载并转化为Python对象with open('myjson.json','r') as f: json.load(f)

以上是“python爬取中json、pickle与shelve库有什么用”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注编程网Python频道!

--结束END--

本文标题: python爬取中json、pickle与shelve库有什么用

本文链接: https://www.lsjlt.com/news/250419.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • python爬取中json、pickle与shelve库有什么用
    小编给大家分享一下python爬取中json、pickle与shelve库有什么用,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!前言在使用Python进行网络编程...
    99+
    2023-06-07
  • Python爬虫中使用代理IP有什么作用
    本篇内容主要讲解“Python爬虫中使用代理IP有什么作用”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python爬虫中使用代理IP有什么作用”吧!web爬虫程序会大规模爬网数据,所以为了避免...
    99+
    2023-06-20
  • python中gitlab库有什么用
    安装首先需要安装 python-gitlab 库pip 安装sudo pip install --upgrade python-gitlab源码安装git clone https://github.com/python-gitlab/pyt...
    99+
    2023-05-16
    Python gitlab
  • python中的muggle_ocr库有什么用
    这篇文章主要介绍“python中的muggle_ocr库有什么用”,在日常操作中,相信很多人在python中的muggle_ocr库有什么用问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”python中的mug...
    99+
    2023-06-20
  • Python中DateTime库Pendulum有什么用
    这篇文章将为大家详细讲解有关Python中DateTime库Pendulum有什么用,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。1.直接替换 datetime使用 pytz 等第三方库来解决一些 Pyt...
    99+
    2023-06-25
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作