iis服务器助手广告
返回顶部
首页 > 资讯 > 后端开发 > Python >怎么利用python爬取城市公交站点
  • 159
分享到

怎么利用python爬取城市公交站点

2023-06-22 01:06:16 159人浏览 独家记忆

Python 官方文档:入门教程 => 点击学习

摘要

本篇内容介绍了“怎么利用python爬取城市公交站点”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!页面分析https://guiyang.8

本篇内容介绍了“怎么利用python爬取城市公交站点”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

页面分析

https://guiyang.8684.cn/line1

怎么利用python爬取城市公交站点

怎么利用python爬取城市公交站点

爬虫

我们利用requests请求,利用BeautifulSoup来解析,获取我们的站点数据。得到我们的公交站点以后,我们利用高德api来获取站点的经纬度坐标,利用pandas解析JSON文件。接下来开干,我推荐使用面向对象的方法来写代码。

import requestsimport jsonfrom bs4 import BeautifulSoupimport pandas as pdclass bus_stop: ## 定义一个类,用来获取每趟公交的站点名称和经纬度 def __init__(self): self.url = 'Https://guiyang.8684.cn/line{}' self.starnum = [] for start_num in range(1, 17): self.starnum.append(start_num) self.payload = {} self.headers = { 'Cookie': 'JSESSioNID=48304F9E8D55A9F2F8ACC14B7EC5A02D'} ## 调用高德api获取公交线路的经纬度 ### 这个key大家可以自己去申请 def get_location(self, line): url_api = 'https://restapi.amap.com/v3/bus/linename?s=rsv3&extensions=all&key=559bdffe35eec8c8f4dae959451d705c&output=json&city=贵阳&offset=2&keyWords={}&platfORM=JS'.format( line) res = requests.get(url_api).text # print(res) 可以用于检验传回的信息里面是否有自己需要的数据 rt = json.loads(res) dicts = rt['buslines'][0] # 返回df对象 df = pd.DataFrame.from_dict([dicts]) return df ## 获取每趟公交的站点名称 def get_line(self): for start in self.starnum: start = str(start) # 构造url url = self.url.format(start) res = requests.request( "GET", url, headers=self.headers, data=self.payload) soup = BeautifulSoup(res.text, "lxml") div = soup.find('div', class_='list clearfix') lists = div.find_all('a') for item in lists: line = item.text  # 获取a标签下的公交线路  lines.append(line) return linesif __name__ == '__main__': bus_stop = bus_stop() stop_df = pd.DataFrame([]) lines = [] bus_stop.get_line() # 输出路线 print('一共有{}条公交路线'.format(len(lines))) print(lines) # 异常处理 error_lines = [] for line in lines: try: df = bus_stop.get_location(line) stop_df = pd.concat([stop_df, df], axis=0) except: error_lines.append(line) # 输出异常的路线  print('异常路线有{}条公交路线'.format(len(error_lines)))  print(error_lines) # 输出文件大小  print(stop_df.shape) stop_df.to_csv('bus_stop.csv', encoding='gbk', index=False)

怎么利用python爬取城市公交站点

数据清洗

我们先来看效果,我需要对busstops列进行清洗。我们的总体思路,分列->逆透视->分列。我会接受两种方法,一是excel PQ,二是Python

怎么利用python爬取城市公交站点

怎么利用python爬取城市公交站点

Excel PQ 数据清洗

这一方法完全利用PQ,纯界面操作,问题不大,所以我们看看流程就可以了,核心步骤就是和上面一样的。

怎么利用python爬取城市公交站点

python数据清洗

## 我们需要处理的busstops列和ID列data = stop_df[['id','busstops']]data.head()

怎么利用python爬取城市公交站点

## 字典或者列表分列df_pol = data.copy()### 设置索引列df_pol.set_index('id',inplace=True)df_pol.head()

怎么利用python爬取城市公交站点

## 逆透视### 释放索引df_pol.reset_index(inplace=True)### 逆透视操作df_pol_ps = df_pol.melt(id_vars=['id'], value_name='busstops')df_pol_ps.head()

怎么利用python爬取城市公交站点

## 删除空行df_pol_ps.dropna(inplace=True,axis=0)df_pol_ps.shape

怎么利用python爬取城市公交站点

## 分列### 设置line_iddf_parse['line_id'] = df_pol_ps['id']df_parse = df_pol_ps['busstops'].apply(pd.Series)df_parse

怎么利用python爬取城市公交站点

我这里补充一下,我们一般还要对location列进行分列,把Long,lat分列出来,但是我们这里就不做了,都是重复劳动,而且我用的pq清洗,快很多。

## 写入文件df_parse.to_excel('贵阳市公交站点分布.xlsx', index=False)</pre>

QGIS坐标纠偏

QGIS基础操作,我就不说了,顺便说一下QGIS对csv格式支持较好,我推荐我们导入QGIS的文件为csv格式的文件。

导入csv文件

怎么利用python爬取城市公交站点

坐标纠偏

以前说了很多,我们高德地图上的坐标是GCJ02坐标,我们需要转成WGS 1984坐标,我们在QGIS里面需要借助GeoHey插件

怎么利用python爬取城市公交站点

怎么利用python爬取城市公交站点

“怎么利用python爬取城市公交站点”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站,小编将为大家输出更多高质量的实用文章!

--结束END--

本文标题: 怎么利用python爬取城市公交站点

本文链接: https://www.lsjlt.com/news/301665.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 利用python爬取城市公交站点
    目录页面分析爬虫数据清洗Excel PQ 数据清洗python数据清洗QGIS坐标纠偏导入csv文件坐标纠偏总结利用python爬取城市公交站点 页面分析 https://guiya...
    99+
    2024-04-02
  • 怎么利用python爬取城市公交站点
    本篇内容介绍了“怎么利用python爬取城市公交站点”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!页面分析https://guiyang.8...
    99+
    2023-06-22
  • Python怎么爬取城市租房信息
    这篇文章主要介绍了Python怎么爬取城市租房信息的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇Python怎么爬取城市租房信息文章都会有所收获,下面我们一起来看看吧。思路:先单线程爬虫,测试可以成功爬取之后再...
    99+
    2023-06-30
  • Python中怎么利用Beautifulsoup爬取网站
    这篇文章将为大家详细讲解有关Python中怎么利用Beautifulsoup爬取网站,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。1.开始前准备1 python3,本篇博客内容采用pytho...
    99+
    2023-06-17
  • Python怎样实现城市公交网络分析与可视化
    这期内容当中小编将会给大家带来有关Python怎样实现城市公交网络分析与可视化,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。一、数据查看和预处理数据获取自高德地图API,包含了天津市公交线路和站点名称及其...
    99+
    2023-06-22
  • 怎么用python爬取网站
    使用Python爬取网站的一般步骤如下:1. 导入所需的库,如`requests`或`urllib`用于发送HTTP请求,`beau...
    99+
    2023-08-31
    Python
  • 如何利用Python爬虫爬取网站音乐
    小编给大家分享一下如何利用Python爬虫爬取网站音乐,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!具体实现引入发送网络请求的第三方库import re...
    99+
    2023-06-15
  • 怎么在python中利用多线程爬取网站壁纸
    本篇文章给大家分享的是有关怎么在python中利用多线程爬取网站壁纸,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。Python主要用来做什么Python主要应用于:1、Web开...
    99+
    2023-06-06
  • 怎么用python爬取网站数据
    要用Python爬取网站数据,可以使用Python的爬虫库来实现。下面是一个简单的示例,使用`requests`库来获取网页内容,使...
    99+
    2023-09-07
    python
  • Python中怎么爬取金融市场数据
    这期内容当中小编将会给大家带来有关Python中怎么爬取金融市场数据,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。1、正则表达式具体的详细介绍可自行去网上补知识,这里只介绍一些规则和常用的用法。#&nbs...
    99+
    2023-06-16
  • 使用Python爬虫怎么避免频繁爬取网站
    这期内容当中小编将会给大家带来有关使用Python爬虫怎么避免频繁爬取网站,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。python的数据类型有哪些python的数据类型:1. 数字类型,包括int(整型...
    99+
    2023-06-15
  • 怎么利用python多线程爬取天气网站图片并保存
    这篇文章主要介绍了怎么利用python多线程爬取天气网站图片并保存,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。1.1 题目指定一个网站,爬取这个网站中的所有的所有图片,例如...
    99+
    2023-06-25
  • 怎么在python中利用Selenium+Requests爬取数据
    本篇文章给大家分享的是有关怎么在python中利用Selenium+Requests爬取数据,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。python的数据类型有哪些pytho...
    99+
    2023-06-14
  • 怎么利用Python批量爬取网页图片
    你可以使用Python的requests库来发起HTTP请求,并使用BeautifulSoup库来解析HTML文档以获取图片的URL...
    99+
    2023-09-27
    Python
  • 怎么在python中利用selenium爬取斗鱼弹幕
    怎么在python中利用selenium爬取斗鱼弹幕?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。python可以做什么Python是一种编程语言,内置了许多有效的工具,P...
    99+
    2023-06-06
  • 怎么利用Python网络爬虫来提取信息
    怎么利用Python网络爬虫来提取信息,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。下面小编就为大家带来一篇Python网络爬虫与信息提取(实例讲解)。小编觉得挺不错的,现在就...
    99+
    2023-06-02
  • 使用Python怎么爬取网站图片并保存
    这期内容当中小编将会给大家带来有关使用Python怎么爬取网站图片并保存,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。第一步,导入模块import requestsfrom bs4&n...
    99+
    2023-06-06
  • 使用python怎么爬取网站的购买记录
    这期内容当中小编将会给大家带来有关使用python怎么爬取网站的购买记录,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。python的数据类型有哪些python的数据类型:1. 数字类型,包括int(整型)...
    99+
    2023-06-14
  • Python怎么利用多线程爬取LOL高清壁纸
    这篇“Python怎么利用多线程爬取LOL高清壁纸”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“Python怎么利用多线程爬...
    99+
    2023-07-02
  • 怎么使用python爬虫爬取数据
    本篇内容介绍了“怎么使用python爬虫爬取数据”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!python爬出六部曲第一步:安装reques...
    99+
    2023-06-29
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作