广告
返回顶部
首页 > 资讯 > 后端开发 > Python >python几种编码格式的介绍以及设置编码格式的方法
  • 473
分享到

python几种编码格式的介绍以及设置编码格式的方法

2023-06-02 05:06:10 473人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

本篇内容介绍了“python几种编码格式的介绍以及设置编码格式的方法”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!一、ASCII 码计算机存

本篇内容介绍了“python几种编码格式的介绍以及设置编码格式的方法”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

一、ASCII 码

计算机存储数据是用0、1存储的,为了存储英文字符等,所以出现了一个ASCII编码表,通过这个表就是把对应的英文转换对应为相应的0、1数据存储到计算机,但是英文只有26个字母,中文有6万多汉字,ASCII编码不够,所以根据需要就出现了unicode、utf-8等编码,实际可以理解为它们把全球的文字编码对应到计算机的0、1来存储识别。

ASCII 码使用指定的 7 位或 8 位二进制数组合来表示 128 或 256 种可能的字符。标准 ASCII 码也叫基础ASCII码,使用 7 位二进制数来表示所有的大写和小写字母,数字 0 到 9、标点符号, 以及在美式英语中使用的特殊控制字符。其中:

  • 0~31及127(共33个)是控制字符或通信专用字符(其余为可显示字符),如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)、BEL(振铃)等。通信专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;

  • ASCII值为 8、9、10 和 13 分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。

  • 32~126(共95个)是字符(32sp是空格),其中48~57为0到9十个阿拉伯数字;

  • 65~90为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等

python几种编码格式的介绍以及设置编码格式的方法

Unicode

Unicode是为了解决传统的字符编码的局限而产生的。对世界上大部分的文字系统进行了编码、整理,使电脑可以更方便的处理和展示文字。Unicode采用16位编码空间,每个字符占2个字节。Unicode的实现方式称为Unicode转换格式

Unicode码扩展自ASCII字元集。在严格的ASCII中,每个字元用7位元表示,或者电脑上普遍使用的每字元有8位元宽。而Unicode使用全16位元字元集。这使得Unicode能够表示世界上所有的书写语言中可能用於电脑通讯的字元、象形文字和其他符号。

不同的编码方式会造成乱码问题,Unicode将世界上所有符号都纳入其中。每一个符号都给予一个编码,这样就就解决了乱码问题。Unicode现在的规模可以容纳100多万个符号,每个符号的编码都不一样,例如U+4E0A表示上,U+4E0B表示下,具体的符号对应表可以查看:Http://www.chi2ko.com/tool/CJK.htm

UTF-8

UTF全称(Unicode TransfORMation Format),所以它是一种针对前面提到的Unicode的编码格式,常见的格式就是 UTF-8,还有 UTF-16, UTF-32。

UTF-8 其中的 8 表示的是 8 bit,即Unicode中每8位表示一个字符,UTF-16 和 UTF-32 类似,因为Unicode最多才21位,32位大于21位,所以 UTF-32 的格式就可以表示所有字符对应的Unicode码了,但是呢,32位也就是4字节,让每个字符都占用4字节太费空间了,所以出现了UTF-8和UTF-16。

UTF-8 编码规则如下:

UnicodebitUTF-8byte
0x0000 - 0x007f0 - 70XXX XXXX1
0x0080 - 0x07ff8 - 11110X XXXX 10XX XXXX2
0x0800 - 0xffff12 - 161110 XXXX 10XX XXXX 10XX XXXX3
0x1 0000 - 0x1f ffff17 - 211111 0XXX 10XX XXXX 10XX XXXX 10XX XXXX4
  • 每个字节中不足8位的,高位(左边)先用0补上,比如 0XXXX XXXX;

  • 超过两字节表示的UTF-8,第一个字节高位添加两个 1 和一个 0,后面的字节高位添加 10;

  • 3字节和4字节同理,几个字节高位就添几个 1 再加上一个 0,其余字节高位添 10;

设置编码格式

Python中默认的编码格式是 ASCII 格式,在没修改编码格式时无法正确打印汉字,所以在读取中文时会报错。解决方法为在文件的开头加入 # -*- coding: UTF-8 -*-或者#coding=utf-8 就行了。

我们要记住写python程序的时候一般使用utf-8编码格式来存储编码格式,网页里面同样的也声明utf-8即可,utf-8是中文、英文、日文等全球文字都可以使用的编码格式,通用性很强。

PyCharm 中设置编码格式的步骤:File  —>  setting —> File Encodings

python几种编码格式的介绍以及设置编码格式的方法

“python几种编码格式的介绍以及设置编码格式的方法”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站,小编将为大家输出更多高质量的实用文章!

--结束END--

本文标题: python几种编码格式的介绍以及设置编码格式的方法

本文链接: https://www.lsjlt.com/news/228908.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • python几种编码格式的介绍以及设置编码格式的方法
    本篇内容介绍了“python几种编码格式的介绍以及设置编码格式的方法”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!一、ASCII 码计算机存...
    99+
    2023-06-02
  • 命令行设置mysql编码格式的方法
    这篇文章给大家分享的是有关命令行设置mysql编码格式的方法的内容。小编觉得挺实用的,因此分享给大家做个参考。一起跟随小编过来看看吧。命令行设置mysql编码格式的方法:1、在命令行中登录mysql,进入m...
    99+
    2022-10-18
  • 如何设置html的编码格式
    设置html编码格式的方法:1、使用编辑器打开html文件;2、将“<meta>”标签中的“charset=”后面的值进行修改即可设置html编码格式。具体操作方法:首先使用编辑器将html文件打开。在html代码头部中找到“&...
    99+
    2022-10-16
  • 使用命令行设置MySql编码格式的方法
    这篇文章主要介绍使用命令行设置MySql编码格式的方法,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!使用命令行设置MySql编码格式的方法:首先登录mysql,并输入【SHOW VA...
    99+
    2022-10-18
  • mysql设置数据表默认编码格式的方法
    这篇文章主要介绍mysql设置数据表默认编码格式的方法,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!mysql设置数据表的默认编码格式的方法:1、打开my.ini配置文件;2、添加配...
    99+
    2022-10-18
  • linux设置编码格式的命令是什么
    在Linux系统中,可以使用locale命令来设置编码格式,命令格式如下:locale [option]其中,option为可选参数...
    99+
    2023-05-13
    linux设置编码 linux
  • Python中json格式数据的编码与解码方法详解
    本文实例讲述了Python中json格式数据的编码与解码方法。分享给大家供大家参考,具体如下: python从2.6版本开始内置了json数据格式的处理方法。 1、json格式数据编码 在python中,j...
    99+
    2022-06-04
    详解 格式 方法
  • 怎么在php中设置文件的编码格式
    这期内容当中小编将会给大家带来有关怎么在php中设置文件的编码格式,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。设置php文件编码格式的方法:首先使用notepad++软件打开php文件;然后点击顶部导航...
    99+
    2023-06-14
  • Vscode编辑器的巧妙用法(快速格式化代码的方法)
    相信不少人,写代码忘我的时候,都会忘记层级之间的缩进,导致代码,看着非常不清晰,这个时候,你是否还在手动一点点缩进,这个时候,我们需要利用编辑器的强大功能啦 笔者使用Vscode,一...
    99+
    2022-11-12
  • mysql 数据库几种修改密码的方式以及忘记密码处理办法
    一、mysql修改密码方法:1、使用mysqladmin修改#mysqladmin -uroot -p password 'newpass' Ente...
    99+
    2022-10-18
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作