广告
返回顶部
首页 > 资讯 > 后端开发 > Python >python字符编码与转码
  • 525
分享到

python字符编码与转码

字符python 2023-01-31 01:01:06 525人浏览 安东尼

Python 官方文档:入门教程 => 点击学习

摘要

python 2.x 字符编码与转码打印系统默认编码格式import sys print(sys.getdefaultencoding())UTF-8 转 gbk方式:utf-8--转成--unicode--转成--gbka = "你好"

python 2.x 字符编码与转码


打印系统默认编码格式

import sys
print(sys.getdefaultencoding())


UTF-8 转 gbk

方式:utf-8--转成--unicode--转成--gbk

a = "你好"
print a
utf8_to_unicode = a.decode("utf-8")                 #utf-8转unicode
print utf8_to_unicode
unicode_to_gbk = utf8_to_unicode.encode("gbk")      #unicode转utf-8
print unicode_to_gbk

gbk 转UTF-8

方式:gbk--转成--unicode--转成--utf-8

gbk_to_unicode = unicode_to_gbk.decode("gbk")       #gbk转unicode
print gbk_to_unicode
unicode_to_utf8 = gbk_to_unicode.encode("utf-8")    #unicode转uft-8
print unicode_to_utf8



总结:

    1.python2.X 默认编码是ascii ;支持中文需要加“ #-*- coding:utf-8 ”;

    2.gbk、utf-8之间的转码必须先转码成unicode ;



python 3.x 字符编码与转码


字符编码与转码

UTF-8 可变长编码格式

python3.x 在转码的时候,同时把字符变成一个bytes类型;例如:b'\xc4\xe3\xba\xc3' ;

Python3.X 默认的编码是unicode 支持中文;


打印系统默认编码格式

import sys
print(sys.getdefaultencoding())


utf-8 转 gbk

由于python3.0 默认unicode 支持中文,所以输入中文,可以直接转gbk ;

a = "你好"
print(a)
unicode_to_gbk = a.encode("gbk")    #unicode 转 gbk
print(unicode_to_gbk)


utf-8 转 gbk      

这里编码转化顺序:unicode--转成--utf-8--转成--unicode--转成--gbk;和上边一样的结果。

a = "你好"
print(a)
moren_to_utf8 = a.encode("utf-8")                   
#等于moren_to_utf8 = a.encode()   因为系统编码是utf-8
print(type(moren_to_utf8.decode("utf-8")))          
#utf-8 格式 decode成unicode 就成了一个字符串;
utf8_to_unicdoe = moren_to_utf8.decode("utf-8")
print(utf8_to_unicdoe)
unicode_to_gbk = utf8_to_unicdoe.encode("gbk")
print(unicode_to_gbk)



gbk 转 utf-8

gbk_to_unicode = unicode_to_gbk.decode("gbk")       #gbk 转 unicode
print(gbk_to_unicode)
unicode_to_utf8 = gbk_to_unicode.encode("utf-8")    #unicode 转 utf-8
print(unicode_to_utf8)



总结:

    1.python3.x 默认编码是unicode,支持中文;

    2.python3.x 在转码的时候,同时把字符变成一个bytes类型;例如:b'\xc4\xe3\xba\xc3' ;

    3.python3.x 转码成了bytes类型之后,想显示成中文decode成unicode 就成了一个字符串;


--结束END--

本文标题: python字符编码与转码

本文链接: https://www.lsjlt.com/news/183938.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • python字符编码与转码
    python 2.x 字符编码与转码打印系统默认编码格式import sys print(sys.getdefaultencoding())UTF-8 转 gbk方式:utf-8--转成--unicode--转成--gbka = "你好" ...
    99+
    2023-01-31
    字符 python
  • python 字符编码与转换
    unicode 中文英文默认统一 2个字节ASCII 只有英文和特殊字符 每个占用1个字节 不能存中文每个字节由8个比特(Bit)构成假如一个英文文档是2M,转换为unicode 编码转换,就变成了4M为了解决空间浪费的问题,在unicod...
    99+
    2023-01-30
    字符 python
  • python字符串与url编码的转换
    主要应用的场景 爬虫生成带搜索词语的网址 1.字符串转为url编码 import urllib poet_name = "李白" url_code_name = urllib.quote(poet_name) print url...
    99+
    2023-01-31
    字符串 python url
  • Python中的字符串与字符编码
    Hello,这里是Token_w的博客,欢迎您的到来 今天文章讲解的是Python中的字符串与字符编码,其中有基础的理论知识讲解,也有实战中的应用讲解,希望对你有所帮助 整理不易,如对你有所帮助,希望能得到你的点赞、收藏支持。感谢 ...
    99+
    2023-08-30
    python android 开发语言
  • Python13 字符转编码
    编码: 最开始电脑的字符集是ASCII,英文在ASCII中每个字母占1个字节,但ASCII不支持中文,所以后来出现了Unicode; Unicode中 英文和中文都占用两个字节,对于英文来说不合理,所以在Unicode的基础上出现了Unic...
    99+
    2023-01-31
    字符
  • python字符串编码如何转换
    Python中字符串的编码转换可以使用`encode`和`decode`方法。具体的操作如下:1. 字符串编码:使用`encode`...
    99+
    2023-09-13
    python
  • 字符串与编码
    在最新的Python 3版本中,字符串是以Unicode编码的,即Python的字符串支持多语言 编码和解码  字符串在内存中以Unicode表示,在操作字符串时,经常需要str和bytes互相转换   字符串是可以直接在内存上进行处...
    99+
    2023-01-31
    字符串
  • python字符编码
    近期接触到python的编码相关的东西,发现自己了解的不是太系统,故通过搜索资料做了一些总结。 字符编码 字符串也是一种数据类型,但是,字符串比较特殊的是还有一个编码问题。 我们知道,计算机内部,所有信息最终都是一个二进制值。每一个二进制位...
    99+
    2023-01-31
    字符 python
  • python处理读写与字符编码
    在Python中,可以使用内置的`open()`函数来处理文件的读写操作。`open()`函数接受两个参数:文件名和文件模式。文件模...
    99+
    2023-09-01
    python
  • python中json和字符编码的转换
    json是用来转换python object 和json format 的,字符编码有gb2312,gb18030/gbk,utf-8等。在 Python 中出现的 str 都是用字符集编码的 ansi 字符串。Python 本身并不知道 ...
    99+
    2023-01-31
    字符 python json
  • python中文字符如何转url编码
    目录如何将中文字符转url编码python url编码和url解码方法函数介绍编码解码总结如何将中文字符转url编码 import urllib.parse name = urlli...
    99+
    2023-02-01
    python中文字符 中文字符转url编码 python url编码
  • python字符串编码
    python默认编码   python 2.x默认的字符编码是ASCII,默认的文件编码也是ASCII。   python 3.x默认的字符编码是unicode,默认的文件编码是utf-8。   中文乱码问题   无论以什么编码在内存里显...
    99+
    2023-01-30
    字符串 python
  • 再谈Python中的字符串与字符编码(推荐)
    本节内容: 1.前言 2.相关概念 3.Python中的默认编码 4.Python2与Python3中对字符串的支持 5.字符编码转换 一、前言 Python中的字符编码是个老生常谈的话题,同行们...
    99+
    2022-06-04
    字符串 再谈 字符
  • python字符转码的理解
    encode:字符编码decode:字符解码有些文档可能采用的是某种编码方式(如utf-8)来存储文本,但如果我们展现的工具是另外一种编码方式(如gb2312),若我们不做些转码的工作,我相信你在此工具中显示的将会是乱码.因为,我们的文本采...
    99+
    2023-01-31
    字符 python
  • day08(字符编码,字符与字节,文件操
      一,复习 ''' 类型转换 1.数字类型:int() | bool() | float() 2.str与int: int('10') | int('-10') | int('0') | float('-.5') ...
    99+
    2023-01-31
    字符 字节 文件
  • VBS字符串编码转换函数代码
    因为业务需要将一些字符串转换为指定编码方便后期操作 核心代码 Const adTypeBinary = 1 Const adTypeText = 2 ' accept a stri...
    99+
    2023-05-15
    VBS编码转换 vbscript编码转换
  • Python chardet 字符编码判
    使 用 chardet 可以很方便的实现字符串/文件的编码检测。尤其是中文网页,有的页面使用GBK/GB2312,有的使用UTF8,如果你需要去爬一些页面,知道网页编码 很重要的,虽然HTML页面有charset标签,但是有些时候是不对的...
    99+
    2023-01-31
    字符 Python chardet
  • Python字符集和字符编码详情
    目录前言字符集和字符编码小结前言 这一次我们分析一下Python的字符串,首先字符串是一个变长对象,因为不同长度的字符串所占的内存是不一样的;但同时字符串又是一个不可变对象,因为一旦...
    99+
    2022-11-11
  • 字符编码
    计算机基础 文本编辑器存取文件的原理 1.打开编辑器就打开启动了一个进程,是在内存中,所以,用编码器编写的内容也都存放在内存中的,断电后数据丢失。 2.要想永久保存,需要点击保存按钮:编辑器把内存的数据拴到硬盘上。 3.早我们编写一个...
    99+
    2023-01-31
    字符
  • java字符串怎么转gbk编码
    在Java中,可以使用String.getBytes(String charsetName)方法将字符串转换为指定编码的字节数组。要...
    99+
    2023-10-18
    java
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作