返回顶部
首页 > 资讯 > 后端开发 > Python >URL处理----拼接和编码
  • 893
分享到

URL处理----拼接和编码

URL 2023-01-30 22:01:41 893人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

        ps:浪了好几周,我的锅。。。         前几天想爬取一个用户网站自动创建每个用户的资料方便注册一些账号,想写一个通用点的爬虫程序爬取只要配置一些爬取规则、爬取深度就ok,避免代码改动,由于时间关系只完成的个半成品,

        ps:浪了好几周,我的锅。。。

        前几天想爬取一个用户网站自动创建每个用户的资料方便注册一些账号,想写一个通用点的爬虫程序爬取只要配置一些爬取规则、爬取深度就ok,避免代码改动,由于时间关系只完成的个半成品,后面在考虑是用xml文件作为配置文件,还是简单的使用.ini文件,后者虽然简单但局限性太大,所以,,,偷几天懒顺便重新考虑下逻辑。

==================================================================================================================================================          

        既然想通用一些,那url的一些处理必不可少,如拼接、中文编码和空格编码等问题,从网上找了下比较琐碎,所以自己简单封装了一个,主要处理了下url拼接和中文编码的问题。

运行环境:python3PyCharm编辑器

代码如下:

 1 # -*- coding: utf-8 -*-
 2 # au: cpy
 3 # 20181016
 4 # url拼接和编码问题
 5 import re
 6 from urllib.parse import urljoin,quote
 7 
 8 
 9 def check_zh(Word):
10     list_zh = re.findall('[\u4e00-\u9fa5]+',word)  # 正则匹配存在的中文
11     if list_zh:
12         for zh in list_zh:
13             word = re.sub(zh,quote(zh),word)
14             # print(word)
15     return word
16 
17 
18 def checkUrl(domain, url): # domain:域名
19     if type(url) is not str and hasattr(url, "decode"):
20         url = url.decode()
21     if not url.startswith("Http"):
22         url = urljoin(domain, url)
23     url = check_zh(url)
24     return url
25 
26 if __name__ == '__main__':
27     domain = "https://www.baidu.com/"
28     # postfix_url  = "s?ie=UTF-8&wd=python3判断字符串中是否有中文"
29     url  = "s?ie=UTF-8&wd=Python3判断字符串中是否有中文"
30     print(url)
31     print(checkUrl(domain, url))
32     '''
33     结果:
34     s?ie=UTF-8&wd=python3判断字符串中是否有中文
35     https://www.baidu.com/s?ie=UTF-8&wd=python3%E5%88%A4%E6%96%AD%E5%AD%97%E7%AC%A6%E4%B8%B2%E4%B8%AD%E6%98%AF%E5%90%A6%E6%9C%89%E4%B8%AD%E6%96%87
36     '''

ps: 代码在pycharm编辑器中正常运行,其它方式运行可能会提示存在编码问题

--结束END--

本文标题: URL处理----拼接和编码

本文链接: https://www.lsjlt.com/news/180025.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • URL处理----拼接和编码
            ps:浪了好几周,我的锅。。。         前几天想爬取一个用户网站自动创建每个用户的资料方便注册一些账号,想写一个通用点的爬虫程序爬取只要配置一些爬取规则、爬取深度就ok,避免代码改动,由于时间关系只完成的个半成品,...
    99+
    2023-01-30
    URL
  • python 中文url编码处理
    可以直接处理中英混排的urlfrom urllib.parse import quote (python3)from urllib import quote (python2) url = 'http://www.baidu.co...
    99+
    2023-01-31
    中文 python url
  • js完全解析url和拼接
    我们经常会遇到需要自己解析url地址,或者是自己拼接url,因此我们需要一个专门对url处理的js 1、理解url url由6部分组成 例如:https://blog.csdn.ne...
    99+
    2024-04-02
  • 前端url拼接参数格式&?用&和? =拼接方法实例
    目录首先在一些情况下,往url上拼接请求参数1.如何直接往url上拼接请求参数2.js 地址栏url 传一个参数和多个参数时拼接方法:补充知识:url获取后面所有拼接的参数总结首先在...
    99+
    2023-02-07
    url怎么拼接 url拼接 URL参数拼接
  • js怎么完全解析url和拼接
    这篇文章主要介绍“js怎么完全解析url和拼接”,在日常操作中,相信很多人在js怎么完全解析url和拼接问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”js怎么完全解析url和拼接”的疑惑有所帮助!接下来,请跟...
    99+
    2023-06-30
  • get方法中url参数拼接和写到请求体中的理解
    get方法中url参数拼接和写到请求体中的理解 如get的请求参数拼接到了url上那么,他的请求参数body_data给为空,参数类型params,可以执行调用成功 url = ‘http://www...
    99+
    2023-09-05
    python pycharm 开发语言
  • python3的url编码和解码,自定义
    因为很多时候要涉及到url的编码和解码工作,所以自己制作了一个类,废话不多说 码上见!# coding:utf-8 import urllib.parse class Urlchuli(): """Url处理类,需要传入两个实...
    99+
    2023-01-31
    自定义 url
  • Python图像处理之图像拼接
    目录一、前言二、特征点匹配三、匹配错误的特征点干扰四、消除干扰五、RANSAC进行图像匹配六、总结一、前言 图像拼接技术就是将数张有重叠部分的图像(可能是不同时间、不同视角或者不同传...
    99+
    2024-04-02
  • js中如何对url进行编码和解码
    目录js 对url进行编码和解码三种编码和解码函数js url二次编码和解码问题URL编码解码原理js 对url进行编码和解码 三种编码和解码函数 encodeURI和 decode...
    99+
    2022-11-16
    js url js对url进行编码 js对url进行解码
  • 怎么管理和维护大型SQL拼接代码库
    管理和维护大型SQL拼接代码库需要一些有效的方法和工具来确保代码的质量和可维护性。以下是一些建议: 使用版本控制系统:将SQL拼...
    99+
    2024-04-29
    SQL
  • JavaScript、C#中URL编码和解码的示例分析
    这篇文章主要为大家展示了“JavaScript、C#中URL编码和解码的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“JavaScript、C#中URL...
    99+
    2024-04-02
  • 如何整理HTML5中支持的URL编码与字符编码
    本篇文章给大家分享的是有关如何整理HTML5中支持的URL编码与字符编码,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。URL 编码URL 编码...
    99+
    2024-04-02
  • 如何调试和测试SQL拼接代码
    调试和测试SQL拼接代码的步骤如下: 使用日志输出:在拼接SQL语句的过程中,可以使用日志输出来打印拼接的结果,以便查看拼接是否...
    99+
    2024-04-29
    SQL
  • Java对URL进行编码和解码的两种方法
    使用java.net.URLEncoder和java.net.URLDecoder类 public class UrlEncoder { public static void main(Stri...
    99+
    2023-09-06
    java jvm 开发语言
  • Python图像处理之图片拼接和堆叠案例教程
    业务说明: 此示例脚本作用,包含方法和逻辑:图像读取,图片尺寸读取,重置图片大小,图片等比缩放,图片拼接,图片覆盖与堆叠(子母图) 图片展示: 单张素材: origin_image....
    99+
    2024-04-02
  • OpenCV图像处理之图像拼接详解
    目录图像拼接技术一、需求分析二、具体步骤三、代码实现图像拼接技术 一、需求分析 将下面两张图像进行拼接 拼接得到一张完整的图像 二、具体步骤 1.选择特征点 //1、选...
    99+
    2022-11-13
    OpenCV 图像处理 图像拼接 OpenCV 图像拼接 OpenCV 图像处理
  • shell脚本字符串处理的使用(分割、截取和拼接)
    目录1、分割2、截取3、拼接4、示例1、分割 按字符分割:${parameter//pattern/string} 。用string来替换parameter变量中所有匹配的pattern 示例: #!/bin/bash ...
    99+
    2023-03-23
    shell脚本字符串处理 shell 字符串处理
  • 如何实现字符串拼接的批处理
    这篇文章主要为大家展示了“如何实现字符串拼接的批处理”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“如何实现字符串拼接的批处理”这篇文章吧。代码如下:@echo off ::&...
    99+
    2023-06-08
  • PHP处理URL中文参数乱码的方法
    PHP处理URL中文参数乱码的方法 在使用PHP开发网站时,经常会遇到URL参数中含有中文字符的情况。然而,由于URL的编码规则限制,这些中文字符有可能会出现乱码问题。本文将介绍在PH...
    99+
    2024-04-02
  • python pandas数据处理教程之合并与拼接
    目录前言一、join1、left join2、right join3、inner join4、out join二、merge三、concat1、纵向合并2、横向合并四、append1...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作