广告
返回顶部
首页 > 资讯 > 后端开发 > Python >利用Python实现岗位的分析报告
  • 191
分享到

利用Python实现岗位的分析报告

Python实现岗位分析报告Python岗位分析Python岗位 2023-03-22 08:03:30 191人浏览 独家记忆

Python 官方文档:入门教程 => 点击学习

摘要

目录前言一、本文目标二、分析结果1.引入库2.页面结构3.请求参数4.构造请求 解析数据4.获取所有数据总结前言 前两篇我们分别爬取了糗事百科和妹子图网站,学习了 Requests,

前言

前两篇我们分别爬取了糗事百科和妹子图网站,学习了 Requests, Beautiful Soup 的基本使用。不过前两篇都是从静态 html 页面中来筛选出我们需要的信息。这一篇我们来学习下如何来获取 ajax 请求返回的结果。

本篇以拉勾网为例来说明一下如何获取 Ajax 请求内容

一、本文目标

获取 Ajax 请求,解析 JSON 中所需字段

数据保存到 excel

数据保存到 Mysql, 方便分析

二、分析结果

1.引入库

五个城市 python 岗位平均薪资水平

Python 岗位要求学历分布

Python 行业领域分布

Python 公司规模分布:

2.页面结构

我们输入查询条件以 Python 为例,其他条件默认不选,点击查询,就能看到所有 Python 的岗位了,然后我们打开控制台,点击网络标签可以看到如下请求:

从响应结果来看,这个请求正是我们需要的内容。后面我们直接请求这个地址就好了。从图中可以看出 result 下面就是各个岗位信息。

到这里我们知道了从哪里请求数据,从哪里获取结果。但是 result 列表中只有第一页 15 条数据,其他页面数据怎么获取呢?

3.请求参数

我们点击参数选项卡,如下:

发现提交了三个表单数据,很明显看出来 kd 就是我们搜索的关键词,pn 就是当前页码。first 默认就行了,不用管它。剩下的事情就是构造请求,来下载 30 个页面的数据了。

4.构造请求 解析数据

构造请求很简单,我们还是用 requests 库来搞定。首先我们构造出表单数据

data = {'first': 'true', 'pn': page, 'kd': lang_name}

之后用 requests 来请求url地址,解析得到的 jsON 数据就算大功告成了。由于拉勾对爬虫限制比较严格,我们需要把浏览器中 headers 字段全部加上,而且把爬虫间隔调大一点,我后面设置的为 10-20s,然后就能正常获取数据了。

import requests

def get_json(url, page, lang_name):
   headers = {
       'Host': 'www.laGou.com',
       'Connection': 'keep-alive',
       'Content-Length': '23',
       'Origin': 'https://www.lagou.com',
       'X-Anit-Forge-Code': '0',
       'User-Agent': 'Mozilla/5.0 (windows NT 10.0; Win64; x64; rv:61.0) Gecko/20100101 Firefox/61.0',
       'Content-Type': 'application/x-www-fORM-urlencoded; charset=UTF-8',
       'Accept': 'application/json, text/javascript, */*; q=0.01',
       'X-Requested-With': 'XMLHttpRequest',
       'X-Anit-Forge-Token': 'None',
       'Referer': 'https://www.lagou.com/jobs/list_python?city=%E5%85%A8%E5%9B%BD&cl=false&fromSearch=true&labelWords=&suginput=',
       'Accept-Encoding': 'gzip, deflate, br',
       'Accept-Language': 'en-US,en;q=0.9,zh-CN;q=0.8,zh;q=0.7'
   }
   data = {'first': 'false', 'pn': page, 'kd': lang_name}
   json = requests.post(url, data, headers=headers).json()
   list_con = json['content']['positionResult']['result']
   info_list = []
   for i in list_con:
       info = []
       info.append(i.get('companyShortName', '无'))
       info.append(i.get('companyFullName', '无'))
       info.append(i.get('industryField', '无'))
       info.append(i.get('companySize', '无'))
       info.append(i.get('salary', '无'))
       info.append(i.get('city', '无'))
       info.append(i.get('education', '无'))
       info_list.append(info)
   return info_list

4.获取所有数据

了解了如何解析数据,剩下的就是连续请求所有页面了,我们构造一个函数来请求所有 30 页的数据。

def main():
   lang_name = 'python'
   wb = Workbook()
   conn = get_conn()
   for i in ['北京', '上海', '广州', '深圳', '杭州']:
       page = 1
       ws1 = wb.active
       ws1.title = lang_name
       url = 'https://www.lagou.com/jobs/positionAjax.json?city={}&needAddtionalResult=false'.format(i)
       while page < 31:
           info = get_json(url, page, lang_name)
           page += 1
           import time
           a = random.randint(10, 20)
           time.sleep(a)
           for row in info:
               insert(conn, tuple(row))
               ws1.append(row)
   conn.close()
   wb.save('{}职位信息.xlsx'.format(lang_name))

if __name__ == '__main__':
   main()

总结

如果对数据库不熟悉的同学,直接注释掉 main 函数中的三行数据库代码就行了,我在注释中有说明是哪三行。

到此这篇关于利用Python实现岗位的分析报告的文章就介绍到这了,更多相关Python岗位分析内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: 利用Python实现岗位的分析报告

本文链接: https://www.lsjlt.com/news/200796.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 利用Python实现岗位的分析报告
    目录前言一、本文目标二、分析结果1.引入库2.页面结构3.请求参数4.构造请求 解析数据4.获取所有数据总结前言 前两篇我们分别爬取了糗事百科和妹子图网站,学习了 Requests,...
    99+
    2023-03-22
    Python实现岗位分析报告 Python岗位分析 Python岗位
  • 怎么用Python实现岗位分析报告
    本篇内容介绍了“怎么用Python实现岗位分析报告”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!一、本文目标获取 Ajax 请求,解析 JS...
    99+
    2023-07-05
  • 阿里云数据库测试岗位薪资一份全面的分析报告
    阿里云是全球领先的云计算服务提供商,其数据库测试岗位作为其技术团队的重要组成部分,一直备受关注。本文将详细分析阿里云数据库测试岗位的薪资水平,为有意申请此岗位的人提供参考。 一、阿里云数据库测试岗位的薪资待遇简单的薪资待遇:根据公开的招聘信...
    99+
    2023-12-11
    阿里 薪资 分析报告
  • Python利用reportlab实现制作pdf报告
    目录前言reportlab是什么安装和导入库将画图、画表格、编辑文字抽象为类pdf插入图片以文件路径写入pdf以流文件写入pdfpdf分页以生成pdf流文件为例前言 本博客重点内容:...
    99+
    2022-12-23
    Python reportlab制作pdf Python 制作pdf Python reportlab pdf
  • 利用Python自制网页并实现一键自动生成探索性数据分析报告
    目录前言上传文件以及变量的筛选前言 今天小编带领大家用Python自制一个自动生成探索性数据分析报告这样的一个工具,大家只需要在浏览器中输入url便可以轻松的访问,如下所示: 第一...
    99+
    2022-11-11
  • 利用python实现数据分析
    1:文件内容格式为json的数据如何解析 import json,os,sys current_dir=os.path.abspath(".") filename=[file for file in...
    99+
    2022-06-04
    数据 python
  • Python利用memory_profiler实现内存分析
    任何编程语言开发的项目代码都是需要考虑内存问题的,有时候当项目体量比较庞大以后若是出现内存泄漏等问题分析起来更是哦力不从心的。 因此,平时建议从开发的每个函数入手尽量编写的标准、规范...
    99+
    2022-11-11
  • 如何利用报表工具实现排名分析
    排名分析是常见的分析方法,主要是通过排名让使用者了解当前业务维度下数据记录的次序,多用于业绩考核和对比分析。虽然排名的需求看着很简单,但实际操作时会发现有常常并不容易实现,这是因为排名的花样实在不少。今天我就来带大家玩转排名,开外挂分分钟搞...
    99+
    2023-06-05
  • 如何利用python实现简单的情感分析
    今天小编给大家分享一下如何利用python实现简单的情感分析的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。1 数据导入及预处...
    99+
    2023-07-02
  • 利用python实现简单的情感分析实例教程
    目录1 数据导入及预处理1.1 数据导入1.2 数据描述1.3 数据预处理2 情感分析2.1 情感分2.2 情感分直方图2.3 词云图2.4 关键词提取3 积极评论与消极评论3.1 ...
    99+
    2022-11-11
  • 利用Python实现自动工作汇报的脚本分享
    目录一、写在开头二、需要什么三、模型训练四、数据处理和传输五、金融模型六、代码七、MIME八、SMTP九、放在一起一、写在开头 哈喽兄弟们 之前经常编写Python脚本来进行数据处理...
    99+
    2022-11-11
  • 如何使用MySQL和JavaScript实现一个简单的数据分析报告功能
    如何使用MySQL和JavaScript实现一个简单的数据分析报告功能概述:在如今的信息时代,数据分析和报告已经成为企业决策的重要组成部分。MySQL是一个强大的关系型数据库管理系统,而JavaScript是一种广泛应用于网站开发的脚本语言...
    99+
    2023-10-22
    数据分析 MySQL JavaScript
  • 利用python调用摄像头的实例分析
    这篇文章主要介绍了python调用摄像头的示例代码,帮助大家更好的理解和使用python,感兴趣的朋友可以了解下 一、打开摄像头 import cv2 import numpy as np def video...
    99+
    2022-06-02
    python 调用摄像头
  • 如何利用ChatGPT和Python实现情感分析功能
    如何利用ChatGPT和Python实现情感分析功能介绍ChatGPTChatGPT是OpenAI于2021年发布的一种基于强化学习的生成式预训练模型,它采用了强大的语言模型来生成连贯的对话。ChatGPT可以用于各种任务,包括情感分析。导...
    99+
    2023-10-24
    ChatGPT Python 情感分析
  • 如何利用ChatGPT和Python实现对话历史分析
    如何利用ChatGPT和Python实现对话历史分析引言:人工智能的发展给自然语言处理带来了重大突破。OpenAI的ChatGPT模型是一种强大的语言生成模型,能够生成连贯、合理的文本回复。本文将介绍如何使用ChatGPT和Python实现...
    99+
    2023-10-25
    ChatGPT Python 对话历史分析
  • 如何利用Python实现简单C++程序范围分析
    目录1. 实验说明2. 项目使用3. 算法原理3.1 构建CFG3.2 构建Constraint Graph3.3 构建E-SSA Constraint Graph3.4 三步法3....
    99+
    2022-11-13
  • 如何利用ChatGPT和Python实现用户画像分析功能
    如何利用ChatGPT和Python实现用户画像分析功能引言:随着互联网的迅猛发展和普及,人们在网络上留下了大量的个人信息。对于企业来说,了解用户的兴趣和偏好,为其提供个性化的服务,已经成为提高用户黏性和市场竞争力的重要手段之一。本文将介绍...
    99+
    2023-10-27
    ChatGPT 用户画像 Python编程
  • 利用Python Matlab绘制曲线图的实例分析
    利用Python Matlab绘制曲线图的实例分析,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。一、简介我们在这里采用Python中的matplotl...
    99+
    2023-06-22
  • 利用Python实现自动生成图文并茂的数据分析
    目录前言1、一行命令,安装这个库2、核心代码模块导入①提前导入相关内容,并且注册字体②注册字体③生成报告前言 reportlab是Python的一个标准库,可以画图、画表格、编辑文字...
    99+
    2022-11-11
  • 利用python实现聚类分析K-means算法的详细过程
    K-means算法介绍   K-means算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近...
    99+
    2022-11-12
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作