iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >python读写不同编码txt文件
  • 326
分享到

python读写不同编码txt文件

文件pythontxt 2023-01-31 02:01:51 326人浏览 安东尼

Python 官方文档:入门教程 => 点击学习

摘要

以后整理规范 import os import codecs filenames=os.listdir(os.getcwd()) out=file("name.txt","w") for filename in filenames:

以后整理规范

import os
import codecs
filenames=os.listdir(os.getcwd())

out=file("name.txt","w")
for filename in filenames:
	out.write(filename.decode("gb2312").encode("utf-8"))
out.close()

将执行文件的当前目录及文件名写入到name.txt文件中,以utf-8格式保存

如果采用ANSI编码保存,用如下代码写入即可:

out.write(filename)

打开文件并写入

引用codecs模块,对该模块目前不了解。在此记录下方法,有空掌握该模块功能及用法。

import codecs
file=codecs.open("lol.txt","w","utf-8")
file.write(u"我")
file.close()

读取ANSI编码的文本文件和utf-8编码的文件

读取ANSI编码文件

建立一个文件test.txt,文件格式用ANSI,内容为:
abc中文
python来读取

# coding=gbk
print open("Test.txt").read()

结果:abc中文

读取utf-8编码文件(无BOM)

把文件格式改成UTF-8:
结果:abc涓 枃
显然,这里需要解码:
# -*- coding: utf-8 -*-
import codecs
print open("Test.txt").read().decode("utf-8")
结果:abc中文

读取utf-8编码文件(有BOM)

某些软件在保存一个以UTF-8编码的文件时,默认会在文件开始的地方插入三个不可见的字符(0xEF 0xBB 0xBF,即BOM)。在有些软件可以控制是否插入BOM。如果在有BOM的情况下,在读取时需要自己去掉这些字符,Python中的codecs module定义了这个常量:

# -*- coding: utf-8 -*-
import codecs
data = open("Test.txt").read()
if data[:3] == codecs.BOM_UTF8:
    data = data[3:]
print data.decode("utf-8")

结果:abc中文

在看下面的例子:

# -*- coding: utf-8 -*-
data = open("name_utf8.txt").read()
u=data.decode("utf-8")
print u[1:]

打开utf-8格式的文件并读取utf-8字符串后,解码变成unicode对象。但是会把附加的三个字符同样进行转换,变成一个unicode字符。该字符不能被打印。所以为了正常显示,采用u[1:]的方式,过滤到第一个字符。

注意:在处理unicode中文字符串的时候,必须首先对它调用encode函数,转换成其它编码输出。

更多详细内容:Http://eatsalt.blog.163.com/blog/static/87940266200941483413540/

设置python默认编码

import sys
reload(sys)
sys.setdefaultencoding("utf-8")
print sys.getdefaultencoding()

今天碰到了 python 编码问题, 报错信息如下
Traceback (most recent call last):
  File "ntpath.pyc", line 108, in join
UnicodeDecodeError: 'ascii' codec can't decode byte 0xa1 in position 36: ordinal not in range(128)

显然是当前的编码为ascii, 无法解析0xa1(十进制为161, 超过上限128). 进入python console后, 发现默认编码确实是 ascii, 验证过程为:

在python2.6中无法调用sys.setdefaultencoding()函数来修改默认编码,因为python在启动的时候会调用site.py文件,在这个文件中设置完默认编码后会删除sys的setdefaultencoding方法。不能再被调用了.  在确定sys已经导入的情况下, 可以reload sys这个模块之后, 再 sys.setdefaultencoding('utf8')

import sys
reload(sys)
sys.setdefaultencoding("utf-8")
print sys.getdefaultencoding()

确实有效, 根据 limodou 讲解,  site.py 是 python 解释器启动后, 默认加载的一个脚本. 如果使用 python -S 启动的话, 将不会自动加载 site.py.

上面写的挺啰嗦的.

==================================
如何永久地将默认编码设置为utf-8呢?  有2种方法:
==================================
第一个方法<不推荐>: 编辑site.py, 修改setencoding()函数, 强制设置为 utf-8
第二个方法<推荐>: 增加一个名为 sitecustomize.py, 推荐存放的路径为 site-packages 目录下
sitecustomize.py 是在 site.py 被import 执行的, 因为 sys.setdefaultencoding() 是在 site.py 的最后删除的, 所以, 可以在 sitecustomize.py 使用 sys.setdefaultencoding().

import sys  
sys.setdefaultencoding('utf-8')

既然 sitecustomize.py 能被自动加载,  所以除了设置编码外, 也可以设置一些其他的东西

字符串的编码

s1='中文'

像上面那样直接输入的字符串是按照代码文件的编码来处理的,如果是unicode编码,有以下三种方式:

1 s1 = u'中文'
2 s2 = unicode('中文','gbk')
3 s3 = s1.decode('gbk')

unicode是一个内置函数,第二个参数指示源字符串的编码格式。
decode是任何字符串具有的方法,将字符串转换成unicode格式,参数指示源字符串的编码格式。
encode也是任何字符串具有的方法,将字符串转换成参数指定的格式。

详细参考:http://www.cnblogs.com/springbarley/articles/2338501.html

--结束END--

本文标题: python读写不同编码txt文件

本文链接: https://www.lsjlt.com/news/185754.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • python读写不同编码txt文件
    以后整理规范 import os import codecs filenames=os.listdir(os.getcwd()) out=file("name.txt","w") for filename in filenames: ...
    99+
    2023-01-31
    文件 python txt
  • Java读写txt文件
    Java读写txt文件 读文件写文件 读文件 // 读取文件内容 参数要完成路径和文件名 String filePathName="D:/test/tgj/test1.txt";priv...
    99+
    2023-09-02
    java
  • Android开发创建txt文件并读写txt文件数据
    在Android开发过程中,经常会遇到需要创建txt文件并写入数据的情况。今天我们来介绍一下如何实现这样的功能。 一、创建txt文件 private void createFile() { //传入路径 + 文件名 ...
    99+
    2023-08-17
    android java 开发语言 android studio 程序人生
  • python中读取文本文件txt
    文件创建 f = open(localDirName, 'w')f.write("something\n")f.close() 如果文件不存在就是创建,如果文件存在就是打开操作 文件对象创建 ...
    99+
    2023-10-25
    python 开发语言 Powered by 金山文档
  • python怎样读取txt文件
    python 读取 txt 文件的方法包括:使用 open() 函数打开文件并读取内容使用 for 循环按行读取文件内容使用 readlines() 方法将文件内容读取到列表中 Pyt...
    99+
    2024-05-11
    python
  • python怎么读取TXT文件
    Python提供了多种读取文本文件的方法,以下是其中几种常用的方法:1. 使用`open()`函数:```file = open('...
    99+
    2023-10-11
    python
  • Python怎么读写txt文件和转换csv文件与pandas条件
    这篇文章主要介绍“Python怎么读写txt文件和转换csv文件与pandas条件”,在日常操作中,相信很多人在Python怎么读写txt文件和转换csv文件与pandas条件问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希...
    99+
    2023-06-02
  • R语言文本文件读写(txt/csv/xlsx)
    本文主要介绍了R语言文本文件读写,分享给大家,具体如下: read.table(file,sep,hesder) #file 文件路径 #sep 分隔符 #header 第一行是...
    99+
    2024-04-02
  • Python: 将TXT文件写入MySQ
    当前环境: Windwos 10 Python 2.7 MySQL 5.5 PyCharm 遇到的问题 ImportError: No module named MySQLdb安装MySQLdb, 注意是windows命令符下,不...
    99+
    2023-01-31
    文件 Python TXT
  • python中如何读取txt文件
    这期内容当中小编将会给大家带来有关python中如何读取txt文件,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。1、readline()读取第一行内容只读取文本第一行的内容,以字符串的形式返回结果with...
    99+
    2023-06-15
  • python从txt文件读取数据
      (作为一个python初学者,记录一点学习期间的笔记,方便日后查阅,若有错误或者更加便捷的方法,望指出!)  1、读取TXT文件数据,并对其中部分数据进行划分。一部分作为训练集数据,一部分作为测试集数据: def loadData(...
    99+
    2023-01-30
    文件 数据 python
  • C#读写文本文件(.txt)的方法实例
    读取txt文件 如果你要读取的文件内容不是很多,可以使用 File.ReadAllText(filePath) 或指定编码方式 File.ReadAllText(FilePath...
    99+
    2024-04-02
  • java读取txt文件代码片段
    本文实例为大家分享了java读取txt文件的具体代码,供大家参考,具体内容如下学习小记:  1、首先要根据路径获取你的 txt 文本文件。File file = new File(path);  2、将获取到的这个字节码流读进缓存。new ...
    99+
    2023-05-31
    java txt ava
  • python-yml文件读写与xml文件读写
    目录一、python-yml文件读写更新yml的数值二、python-xml文件读写寻找 XML 节点修改 XML 数据建立 XML 结构XPath 搜索XML 排版一、python...
    99+
    2024-04-02
  • C#中写入和读取TXT文件问题
    目录C#写入和读取TXT文件写入读取C#下xml读取和写入关于xml自定义xml文件读取XML代码写入XML代码总结C#写入和读取TXT文件 写入 /// <summary&g...
    99+
    2023-01-28
    C#写入TXT文件 C#读取TXT文件 C#文件写入读取
  • 如何使用Node读写txt和Excel文件
    今天小编给大家分享一下如何使用Node读写txt和Excel文件的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。首先给出文件的...
    99+
    2023-07-04
  • Python文件读写
    python文件读写 读写文件是最常见的IO操作。Python内置了读写文件的函数,用法和C是兼容的。 读写文件前,我们先必须了解一下,在磁盘上读写文件的功能都是由操作系统提供的,现代操作系统不允许普通的程序直接操作磁盘,所以,读写...
    99+
    2023-01-31
    文件 Python
  • python读写文件
    python 文件操作 本文系海特网编程技术斑竹Cute所发表,版权归海特网与Cute所有,转载请保留完整信息 #打开文件和进行写操作 f=open('test.txt','w') f.write('hello')&...
    99+
    2023-01-31
    文件 python
  • 使用python怎么读取txt文件
    这期内容当中小编将会给大家带来有关使用python怎么读取txt文件,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。(1)txt的切割读取对应内容   (2)时间差计算txt文...
    99+
    2023-06-14
  • python怎么读取txt文件内容
    这篇文章主要讲解了“python怎么读取txt文件内容”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“python怎么读取txt文件内容”吧!python读取txt文件的方法:1、使用read...
    99+
    2023-06-20
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作