iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Python中如何爬取京东商品数据并实现数据可视化
  • 232
分享到

Python中如何爬取京东商品数据并实现数据可视化

2023-06-15 09:06:45 232人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

这篇文章将为大家详细讲解有关python中如何爬取京东商品数据并实现数据可视化,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。一、开发工具Python版本:3.6.4相关模块:DecryptLogin模块;

这篇文章将为大家详细讲解有关python中如何爬取京东商品数据并实现数据可视化,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。

一、开发工具

Python版本:3.6.4

相关模块:

DecryptLogin模块;

argparse模块;

以及一些Python自带的模块。

二、环境搭建

安装Python并添加到环境变量,pip安装需要的相关模块即可。

三、原理简介

原理其实挺简单的,首先,我们利用之前开源的DecryptLogin库来实现一下微博的模拟登录操作:

'''模拟登录京东'''@staticmethoddef login():    lg = login.Login()    infos_return, session = lg.jingdong()    return session

然后写几行简单的代码来保存一下登录后的会话,省得每次运行程序都要先模拟登录京东:

if os.path.isfile('session.pkl'):    print('[INFO]: 检测到已有会话文件session.pkl, 将直接导入该文件...')    self.session = pickle.load(open('session.pkl', 'rb'))    self.session.headers.update({'Referer': ''})else:    self.session = JDGoodsCrawler.login()    f = open('session.pkl', 'wb')    pickle.dump(self.session, f)    f.close()

接着去京东抓一波包,一样的套路,有种屡试不爽的感觉:

Python中如何爬取京东商品数据并实现数据可视化

看看请求这个接口需要提交的参数:

Python中如何爬取京东商品数据并实现数据可视化

我们可以简单分析一下每个参数的含义:

area: 不用管,可以看作一个固定值enc: 指定编码, 可以看作固定值"utf-8"keyWord: 搜索的关键词adType: 不用管,可以看作一个固定值page: 当前的页码ad_ids: 不用管,可以看作一个固定值xtest: 不用管,可以看作一个固定值_: 时间戳

也就是说我们需要提交的params的内容大概是这样子的:

params = {            'area': '15',            'enc': 'utf-8',            'keyword': goods_name,            'adType': '7',            'page': str(page_count),            'ad_ids': '291:19',            'xtest': 'new_search',            '_': str(int(time.time()*1000))        }

构造好需要提交的params之后,只需要利用登录后的session去请求我们抓包得到的接口:

response = self.session.get(search_url, params=params)

然后从返回的数据里解析并提取我们需要的数据就可以啦:

response_JSON = response.json()all_items = response_json.get('291', [])for item in all_items:    goods_infos_dict.update({len(goods_infos_dict)+1:                                 {                                    'image_url': item.get('image_url', ''),                                    'price': item.get('pc_price', ''),                                    'shop_name': item.get('shop_link', {}).get('shop_name', ''),                                    'num_comments': item.get('comment_num', ''),                                    'link_url': item.get('link_url', ''),                                    'color': item.get('color', ''),                                    'title': item.get('ad_title', ''),                                    'self_run': item.get('self_run', ''),                                    'good_rate': item.get('good_rate', '')                                }                            })

四、数据可视化

老规矩,可视化一波我们爬取到的数据呗。以我们爬取到的无人机商品数据为例。首先,我们来看看京东里卖无人机的自营店和非自营店比例吧:

Python中如何爬取京东商品数据并实现数据可视化

咦,竟然是非自营店占多。我一直以为京东基本都是自营店,虽然我基本不用京东。真是个天大的误解T_T。

接着,我们再来看看京东自己给的商品排名前10的那几家店的商品评论数量呗:

Python中如何爬取京东商品数据并实现数据可视化

对比一下评论最多的店铺:

Python中如何爬取京东商品数据并实现数据可视化

看来评论数量和京东给的商品排名并没有直接联系T_T,竟然没有一家店是重复的。

再来看看无人机相关商品的价格分布呗:

Python中如何爬取京东商品数据并实现数据可视化

关于“Python中如何爬取京东商品数据并实现数据可视化”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。

--结束END--

本文标题: Python中如何爬取京东商品数据并实现数据可视化

本文链接: https://www.lsjlt.com/news/279307.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Python中如何爬取京东商品数据并实现数据可视化
    这篇文章将为大家详细讲解有关Python中如何爬取京东商品数据并实现数据可视化,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。一、开发工具Python版本:3.6.4相关模块:DecryptLogin模块;...
    99+
    2023-06-15
  • Python爬虫实战之爬取京东商品数据并实实现数据可视化
    一、开发工具 Python版本:3.6.4 相关模块: DecryptLogin模块; argparse模块; 以及一些python自带的模块。 二、环境搭建 安装Python并添加...
    99+
    2024-04-02
  • Python实现爬取天气数据并可视化分析
    目录核心功能设计实现步骤爬取数据风向风级雷达图温湿度相关性分析24小时内每小时时段降水24小时累计降雨量今天我们分享一个小案例,获取天气数据,进行可视化分析,带你直观了解天气情况! ...
    99+
    2024-04-02
  • Python爬虫爬取疫情数据并可视化展示
    目录知识点开发环境爬虫完整代码导入模块分析网站发送请求获取数据解析数据保存数据数据可视化导入模块读取数据死亡率与治愈率各地区确诊人数与死亡人数情况知识点 爬虫基本流程 ...
    99+
    2024-04-02
  • Python怎么实现爬取天气数据并可视化分析
    本篇内容主要讲解“Python怎么实现爬取天气数据并可视化分析”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python怎么实现爬取天气数据并可视化分析”吧!核心功能设计总体来说,我们需要先对中...
    99+
    2023-06-29
  • Python爬取当网书籍数据并数据可视化展示
    目录一、开发环境二、模块使用三、爬虫代码实现步骤1. 导入所需模块2. 发送请求, 用python代码模拟浏览器发送请求3. 解析数据, 提取我们想要数据内容4. 多页爬取5. 保存...
    99+
    2024-04-02
  • 用Python爬取电影数据并可视化分析
      🤵‍♂️ 个人主页:@艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬...
    99+
    2023-08-31
    python 信息可视化 开发语言
  • Python中如何实现数据可视化
    今天就跟大家聊聊有关Python中如何实现数据可视化,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。热力图热力图(Heat Map)是数据的一种矩阵表示方法,其中每个矩阵元素的值通过一...
    99+
    2023-06-16
  • Python爬取股票交易数据并可视化展示
    目录开发环境第三方模块爬虫案例的步骤爬虫程序全部代码分析网页导入模块请求数据解析数据翻页保存数据实现效果数据可视化全部代码导入数据读取数据可视化图表效果展示 开发环境 解释器版本: ...
    99+
    2024-04-02
  • Python怎么爬取当网书籍数据并数据可视化展示
    Python怎么爬取当网书籍数据并数据可视化展示,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。一、开发环境Python 3.8Pycharm 2021.2 专业...
    99+
    2023-06-22
  • 详解Python如何批量采集京东商品数据流程
    目录准备工作驱动安装模块使用与介绍流程解析完整代码效果展示准备工作 驱动安装 实现案例之前,我们要先安装一个谷歌驱动,因为我们是使用selenium 操控谷歌驱动,然后操控浏览器实现...
    99+
    2024-04-02
  • Python实战实现爬取天气数据并完成可视化分析详解
    目录实现需求:爬虫代码:实现需求: 从网上(随便一个网址,我爬的网址会在评论区告诉大家,dddd)获取某一年的历史天气信息,包括每天最高气温、最低气温、天气状况、风向等,完成以下功能...
    99+
    2024-04-02
  • Python爬取天气数据及可视化分析
    正文 大家好,我是Python人工智能技术天气预报我们每天都会关注,我们可以根据未来的天气增减衣物、安排出行,每天的气温、风速风向、相对湿度、空气质量等成为关注的焦点。得到温湿度度变化曲线、空气质量图、风向雷达图等结果,为获得未来天气信息提...
    99+
    2023-05-14
    Python 天气数据 可视化分析
  • python如何获取商品数据
    要获取商品数据,你可以使用Python中的各种库和模块来实现。以下是一些常用的方法:1. 使用网络爬虫:使用Python的库,如Be...
    99+
    2023-08-23
    python
  • Python怎么爬取股票交易数据并可视化展示
    本篇内容介绍了“Python怎么爬取股票交易数据并可视化展示”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!开发环境解释器版本: python...
    99+
    2023-06-21
  • Python中怎么实现数据可视化
    这期内容当中小编将会给大家带来有关Python中怎么实现数据可视化,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。1.成品图这个是监控服务器网速的***成果,显示的是下载与上传的网速,单位为M。爬虫的原理都...
    99+
    2023-06-17
  • pyecharts如何实现数据可视化
    这篇文章将为大家详细讲解有关pyecharts如何实现数据可视化,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。1.概述pyecharts 是百度开源的,适用于数据可视化的工具,配置灵活,展示图表相对美观,...
    99+
    2023-06-29
  • Python中怎样实现数据可视化
    本篇文章为大家展示了Python中怎样实现数据可视化,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。Matplotlib 是一个流行的 Python 库,可以用来很简单地创建数据可视化方案。但每次创建...
    99+
    2023-06-17
  • 如何使用python爬取电商数据
    要使用Python爬取电商数据,可以按照以下步骤进行:1. 确定目标网站:首先要确定你要爬取的电商网站,以及你要爬取的数据类型。2....
    99+
    2023-08-23
    python
  • 如何实现Python抓取数据到可视化全流程的实现
    本篇文章为大家展示了如何实现Python抓取数据到可视化全流程的实现,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。1、爬取目标网站:业绩预告_数据中心_同花顺财经(ps:headers不会设置的可以...
    99+
    2023-06-26
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作