广告
返回顶部
首页 > 资讯 > 后端开发 > Python >python字符串常规操作大全
  • 734
分享到

python字符串常规操作大全

Python字符串操作python字符串处理函数python截取字符串 2022-06-02 22:06:10 734人浏览 独家记忆

Python 官方文档:入门教程 => 点击学习

摘要

拼接字符串 使用“+”运算符可完成对多个字符串的拼接,“+”运算符可以连接多个字符串并产生一个字符串对象。 字符串不允许直接与其他类型数据拼接。 如果要用来和其他类型拼接,先用str()函

拼接字符串

  • 使用“+”运算符可完成对多个字符串的拼接,“+”运算符可以连接多个字符串并产生一个字符串对象。
  • 字符串不允许直接与其他类型数据拼接。
  • 如果要用来和其他类型拼接,先用str()函数转换成字符串类型。

str1 = 'Hello World'
str2 = '你好,世界'
print(str1+str2)
num = 2021
print(str1+str2+str(num))

计算字符串长度

由于不同的字符所占字节数不同,所以要计算字符串长度,需先了解字符所占字节数。在python中,数字、英文、小数点、下划线和空格占一个字节:一个汉字可能占2-4个字节,具体根据采用的编码决定。汉子在GBK/GB2312编码中占2个字节,UTF-8/Unicode编码中一般占用3或4个字节。Python默认为UTF-8编码,一般一个汉字占3个字节。


str1 = '人生苦短,我用python!'
print(len(str1))             #结果为14

默认情况下,len函数计算字符串长度,不区分英文、数字和汉字,所有字符按一个字符计算。

注:

在实际开发中,有时需要获取字符串实际所占字节数,这时可以使用encode()方法进行编码后获取。


str1 = '人生苦短,我用python!'
print(len(str1.encode()))      #UTF-8结果为28
print(len(str1.encode('gbk'))) #gbk结果为21

截取字符串

语法格式:string[start : end : step]

string:表示截取的字符串;

start:表示要截取的第一个索引(包括该字符),没用默认为0;

end:表示要截取的最好一个字符的索引(不包括该字符),没有默认字符串长度;

step:表示切片的步长,如果省略,默认为1;

进行截取时,如果指定索引不存在,则会抛出异常。


programer_1 = '你知道我的生日吗?'  # 程序员甲问程序员乙的台词
print('程序员甲说:',programer_1)  # 输出程序员甲的台词
programer_2 = '输入你的身份证号码。' # 程序员乙的台词
print('程序员乙说:',programer_2)  # 输出程序员乙的台词
idcard = '123456199006277890'  # 定义保存身份证号码的字符串
print('程序员甲说:',idcard)  # 程序员乙说出身份证号码
birthday = idcard[6:10] + '年' + idcard[10:12] + '月' + idcard[12:14] + '日'   # 截取生日
print('程序员乙说:','你是' + birthday + '出生的,所以你的生日是' + birthday[5:]) # 输出程序员乙的生日

分割字符串

语法格式:string.split(sep,maxsplit)

string:指定要分割的字符串;

sep:指定分隔符,可以包含多个字符,默认为None,即空字符(包括空格、换行“\n”,制表符“\t”等);

maxsplit:可选参数,用于指定分割的次数,如果不指定或者为-1,则分割次数没用限制,否则返回结果的元素个数,个数最多为maxsplit+1;

返回值是字符串列表;


str1 = '分割一个字符串 >>> Http://www.baidu.com'
print('原字符串:',str1)
list1 = str1.split()
list2 = str1.split('>>>')
list3 = str1.split('.')
list4 = str1.split(' ',4)  #用空格进行分割,只分割前4个空格
print(str(list1)+'\n'+str(list2)+'\n'str(list3)+'\n'str(list4))
list5 = str1.split('>')
print(list5)

合并字符串

语法格式:strnew = string.join(iterable)

strnew:表示合并生成的新字符串;

string:字符串类型,用于指定合并时的分隔符;

iterable: 可迭代对象,比如列表,字符串,元组等。


list_friend = ['扎克伯格','俞敏洪','马云','马化腾']  # 好友列表
str_friend = ' @'.join(list_friend)  # 用空格+@符号进行连接
at = '@'+str_friend  # 由于使用join()方法合并时,第一个元素前不加分隔符,所以需要在前面加上@符号
print('您要@的好友:',at)

检索字符串

语法格式:str.count(sub[,start[,end]])

用于检索指定字符串在另一个字符串中出现的次数

str:表示原字符串;

sub:表示要检索的子字符串;

start:可选参数,表示检索范围的起始位置的索引,如果不指定,则从头开始检索;

end:可选参数,表示检索范围的结束位置的索引,如果不指定,则一直检索打末尾。

find()方法

语法格式:str.find(sub[,start[,end]])

用于检索是否包含指定的子字符串。

str:表示原字符串;

sub:表示要检索的子字符串;

start:可选参数,表示检索范围的起始位置的索引,如果不指定,则从头开始检索;

end:可选参数,表示检索范围的结束位置的索引,如果不指定,则一直检索打末尾。

补充:

如果只需要判断存在可以不用find用in,如果没找到则会返回-1,如果想从右边往左边找,可以用rfind()方法。

index()方法

语法格式:str.index(sub[,start[,end]])

index()方法和find()方法类似,用于检索是否包含指定的子字符串,区别是如果不存在会抛出

str:表示原字符串;

sub:表示要检索的子字符串;

start:可选参数,表示检索范围的起始位置的索引,如果不指定,则从头开始检索;

end:可选参数,表示检索范围的结束位置的索引,如果不指定,则一直检索打末尾。

startswith()方法

语法格式:str.startswith(sub[,start[,end]])

用于检索字符串是否是以指定子字符串开头,是返回True,不是返回False

str:表示原字符串;

sub:表示要检索的子字符串;

start:可选参数,表示检索范围的起始位置的索引,如果不指定,则从头开始检索;

end:可选参数,表示检索范围的结束位置的索引,如果不指定,则一直检索打末尾索打末尾。

endswith()方法

语法格式:str.endswith(sub[,start[,end]])

用于检索字符串是否是以指定子字符串结尾,是返回True,不是返回False

str:表示原字符串;

sub:表示要检索的子字符串;

start:可选参数,表示检索范围的起始位置的索引,如果不指定,则从头开始检索;

end:可选参数,表示检索范围的结束位置的索引,如果不指定,则一直检索打末尾。

去除字符串中空格和特殊字符

strip()方法

用于去除字符串两侧的空格和特殊字符。

lstrip()方法

用于去除字符串左侧的空格和特殊字符。

rstrip()方法

用于去除字符串右侧的空格和特殊字符。

特殊字符指:

制表符\t,回车符 \r 、 换行符\n等。

格式化字符串格式一

格式化字符串是指先指定一个模板,在这个模板中预留几个空位,然后根据需要填上相应的内容。这些空位需要通过指定的符号标记(也称为站位符),而这些符号还不会显示出来。

使用“%”操作符

语法格式:'%[-][+][0][m][.n]格式化字符'%exp (注意别漏了单引号)

-:可选参数,用于指定左对齐,正数前方无符号,负数前面加负号;

+:可选参数,用于指定右对齐,正数前方加正号,负数前面加负号;

0:可选参数,表示右对齐,正数前方无符号,负数前方加负号,用0填充空白处(一般与m参数一起使用);

m:可选参数,表示占有宽度;

n:可选参数,表示小数点后保留的位数;

格式化字符:用于指定类型;

exp:要转换的项,如果要指定多个,需要通过元组,但不能用列表。

常用格式化字符串

实例


template = '编号:%09d\t公司名称: %s\t官网:http://www.%s.com' 
context1 = (7,'百度','baidu')
context2 = (8,'新浪','sina')
print(template%context1)
print(template%context2)

格式化字符串格式二(常用)

现在大部分不怎么使用%方法,而是使用第二种fORMat对象来实现格式化。

使用字符串对象的format()方法

语法格式:template.format(args)

template:用于指定字符串的显示样式(即模板)的字符串

args:用于指定要转换的项,如果有多项,则用逗号进行分割。

创建模板时,需要使用“{}”和“:”指定占位符

语法格式:{[index][:[[fill]align][sign][#][width][.precision][type]]}

index:可选参数,用于指定要设置格式对象在参数列表中的索引位置

fill:可选参数,指定空白处填充的字符

align:可选参数,用于指定对齐方式(“<”:左对齐,“>”:右对齐,“=”:右对齐,只对数字有效,“^”:表示居中和

width一起使用。)

sign:可选参数,用于指定有无符号数(正数,负数)

#:可选参数,对二进制数,八进制数,和十六进制数,加上#会显示0b/0o/0x前缀

width:可选参数,用于指定宽度

.precision可选参数,用于指定保留的小数位数

type:可选参数,用于指定类型

实例


import math        # 导入Python的数学模块
print('1251+3950的结果是(以货币形式显示):¥{:,.2f}元'.format(1251+3950)) # 以货币形式显示
print('{0:.1f}用科学计数法表示:{0:E}'.format(120000.1))    # 用科学计数法表示
print('π取5位小数:{:.5f}'.format(math.pi))     # 输出小数点后五位
print('{0:d}的16进制结果是:{0:#x}'.format(100))     # 输出十六进制数
print('天才是由 {:.0%} 的灵感,加上 {:.0%} 的汗水 。'.format(0.01,0.99))   # 输出百分比,并且不带小数

字符串编码转换

最早的字符串编码时美国标准信息交换吗,即ASCII码。它仅有10个数字,26个大小写字母,26个小写英文字母及一些其他符号进行编码。ASCII码最多只能表示256个符号,每个字符占一个字节。GBK和GB2312是我国制定的中文编码规则,使用一个字节表示英文字母,2个字节表示中文。UTF-8是国际通用编码,对全世界所有国家需要用到的字符都进行了编码。UTF-8采用一个字节表示英文,3个字节表示中文。

在python中,有两种常用的字符串类型,分别问str和bytes。其中str表示Unicode字符即ASCII;bytes表示二进制数据。这两种类型的字符串不能拼接在一起使用。通常情况下,str在内存中以Unicode表示,一个字符对应若干个字节。但是如果在网络传输,或者保存到硬盘,就需要str转换成字节类型即bytes。

bytes类型的数据是带有b前缀的字符串(用单引号或双引号)

例如:b'\xd2\xb0 和b'mr'都是bytes类型

str类型和bytes类型可以用encode()和decode()方法相互转换

使用encode()方法编码

encode()方法为str对象的方法,用于将字符串转换为二进制数据(即bytes),也称为“编码”。

语法格式:str.encode([encoding= “utf-8”][,errors= “strict”]

  • str:表示要进行转换的字符串;
  • encoding = “utf-8”:可选参数,用于指定进行转码时采用的字符编码,默认为UTF-8,如果想使用简体中文,也可以设置为gb2312。当只有这一个参数时,也可以省略前面的“encoding=”,直接写编码;
  • errors = “strict”:可选参数,用于指定错误处理方式,其可选择值可以是strict(遇到非法字符就抛出异常)、ignore(忽略非法字符)、replace(用“?”替换非法字符)或xmlcharrefreplace(使用xml的字符引用)等,默认值为strict。

实例


verse = '野渡无人舟自横'    
byte = verse.encode('GBK')  # 采用GBK编码转换为二进制,不处理异常
print('原字符串:',verse)    # 输出原字符串(没有改变)
print('转换后:',byte)    # 输出转换后的二进制数据,如果用UTF-8来转换呢?

使用decode()方法解码

decode()方法为bytes对象的方法用于将二进制数据转换为字符串,即将使用encode()方法转换的结果在转换为字符串,也称为“解码”

语法格式:bytes.decode([encoding= “utf-8”][,errors= “strict”]

  • bytes:表示要进行转换的二进制数据,通常是encode()方法转换的结果
  • encoding = “utf-8”:可选参数,用于指定进行转码时采用的字符编码,默认为UTF-8,如果想使用简体中文,也可以设置为gb2312。当只有这一个参数时,也可以省略前面的“encoding=”,直接写编码。
  • errors = “strict”:可选参数,用于指定错误处理方式,其可选择值可以是strict(遇到非法字符就抛出异常)、ignore(忽略非法字符)、replace(用“?”替换非法字符)或xmlcharrefreplace(使用xml的字符引用)等,默认值为strict。

实例


verse = '野渡无人舟自横'    
byte = verse.encode('GBK')  # 采用GBK编码转换为二进制,不处理异常
print('原字符串:',verse)    # 输出原字符串(没有改变)
print('转换后:',byte)    # 输出转换后的二进制数据,如果用UTF-8来转换呢?
print('解码后:',byte.decode('GBK'))  # 对二进制数据进行解码

总结

到此这篇关于python字符串常规操作大全的文章就介绍到这了,更多相关python字符串操作内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: python字符串常规操作大全

本文链接: https://www.lsjlt.com/news/10531.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • python字符串常规操作大全
    拼接字符串 使用“+”运算符可完成对多个字符串的拼接,“+”运算符可以连接多个字符串并产生一个字符串对象。 字符串不允许直接与其他类型数据拼接。 如果要用来和其他类型拼接,先用str()函...
    99+
    2022-06-02
    Python字符串操作 python字符串处理函数 python 截取字符串
  • Python字符串常规操作小结
    目录一、前言二、拼接字符串三、计算字符串的长度四、截取字符串五、分隔字符串六、检索字符串1.count()方法2.find()方法3.index()方法4.startswith()方...
    99+
    2022-11-13
  • Python 字符串操作方法大全
    python字符串操作实方法大合集,包括了几乎所有常用的python字符串操作,如字符串的替换、删除、截取、复制、连接、比较、查找、分割等,需要的朋友可以参考下1、去空格及特殊符号复制代码 代码如下:s.strip().lstrip().r...
    99+
    2023-01-31
    字符串 操作方法 大全
  • Python字符串常规操作方法有哪些
    一、前言在Python开发的过程中,为了实现某项功能,经常需要对某些字符串进行特殊的处理,如拼接字符串、截取字符串、格式化字符串等。二、拼接字符串在使用“+”运算符可完成对多个字符串的拼接,“+”运算符可以连接多个字符串并产生一个字符串对象...
    99+
    2023-05-14
    Python
  • python 字符串常用操作
    字符串是 Python 中最常用的数据类型。我们可以使用引号('或")来创建字符串。首字母大写name = "zhangbichen"print(name.capitalize())...
    99+
    2023-01-30
    字符串 常用 操作
  • Python字符串常见操作
    Python字符串注意事项 Python字符串是不可以改变值的,更新一个字符串后要放到另一个变量中去 Python 不支持char类型的数据类型,也就是不支持单字符类型的数据。 Python 字符串常用内建函数 encode(enc...
    99+
    2023-01-30
    字符串 常见 操作
  • Python中字符串常见操作
    (1)find  查找 格式:mystr.find(str, start, end) 例如: mystr.find(str, start=0, end=len(mystr)) 作用:检测str是否包含在mystr中,如果是则返回开始值的索...
    99+
    2023-01-30
    字符串 常见 操作
  • python字符串操作
    目录一、字符串方法1.字符串的分割2.字符串的查找,替换3.字符串的判断二、切片操作(列表,元组也可以)1.索引2.切片有三个参数[start:end :step]一、字符串方法 1...
    99+
    2022-11-12
  • C/C++中关于字符串的常见函数操作大全
    目录wcsncpy_sswprintf_smemsetmemcmpmemcpywcslenLoadStringWGetModuleHandleWUuidFromStringWUuid...
    99+
    2023-03-22
    C++字符串常见函数 C++常见函数
  • python常用字符串操作的总结
    本篇内容主要讲解“python常用字符串操作的总结”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“python常用字符串操作的总结”吧!1、字符串使用乘法运算符*做乘法运算的含义是复制。>&...
    99+
    2023-06-20
  • java常见字符串操作
    Java String 类 字符串广泛应用 在 Java 编程中,在 Java 中字符串属于对象,Java 提供了 String 类来创建和操作字符串。今天就为大家介绍一下java常见的字符串操作方法。一、使用length()方法获取字符串...
    99+
    2015-04-21
    java教程 java 字符串
  • Python 字符串操作之字符串的截取
    字符串的截取 字符串的截取是实际应用中经常使用的技术,被截取的部分称为“子串”。Java中使用函数substr()获取子串,C#使用函数substring()获取子串。而Python由于内置了序列,可以通过前面介绍的索引...
    99+
    2023-09-11
    python c# 开发语言
  • 【转载】Python字符串操作之字符串分
    1、 str.split():字符串分割函数   通过指定分隔符对字符串进行切片,并返回分割后的字符串列表。   语法:   str.split(s, num)[n]   参数说明:   s:表示指定的分隔符,不写的话,默认是空格(’ ‘...
    99+
    2023-01-30
    字符串 操作 Python
  • python中字符串的常见操作方法
    1. 字符串概念,字符串是一个容器,包含若干个字符并按照一定的顺序组织成一个整体。字符串支持索引操作。 2. 创建字符串基本语法 变量名 = "字符串信息" 变量名 = '字符串信息' 变量名 = """字符串信息""" 变量名 = ''...
    99+
    2023-01-30
    字符串 操作方法 常见
  • C++常用字符串函数大全(2)
    目录1、cstring.h常用函数介绍2、strlen3、strcat4、strncat5、strcpy6、strncpy7、memset8、memcpy9、strcmp10、str...
    99+
    2022-11-12
  • Python 字符串操作详情
    目录1、字符串的定义2、转义字符串和原始字符串3、字符串的运算3.1 拼接运算符3.2 成员运算4、获取字符串长度5、索引和切片6、字符串的方法6.1 转换大小写6.2 查找操作6....
    99+
    2022-11-12
  • python字符串操作详析
    目录一、5种字符串检索方法二、join字符串拼接方法 [列表/元组 --> 字符串]三、3种字符串分割方法 [字符串 --> 列表/元组]四、5种大小写转换方法五、3种字...
    99+
    2022-11-13
  • Python中字符串的操作
    用单引号或者双引号包含的内容 不支持直接在内存中修改 可支持索引、切片、成员检查、长度查看   字符串赋值到变量 str1 = 'hello world'   字符串打印查看 str1 = 'hello world' prin...
    99+
    2023-01-30
    字符串 操作 Python
  • Python -- 操作字符串[2/3]
          yuan@ThinkPad-SL510:~$ ipython -nobanner  In [1]: comma_delim_string = "pos1,pos2,pos3"  In [2]: pipe_delim_stri...
    99+
    2023-01-31
    字符串 操作 Python
  • Python -- 操作字符串[3/3]
     1,splitlines() yuan@ThinkPad-SL510:~$ ipython -nobanner  In [1]: multiline_string = """This    ...: is    ...: a multi...
    99+
    2023-01-31
    字符串 操作 Python
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作