广告
返回顶部
首页 > 资讯 > 后端开发 > Python >怎么使用python批量修改文本文件编码格式
  • 827
分享到

怎么使用python批量修改文本文件编码格式

2023-07-05 15:07:36 827人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

今天小编给大家分享一下怎么使用python批量修改文本文件编码格式的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。使用Pyth

今天小编给大家分享一下怎么使用python批量修改文本文件编码格式的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。

使用Python批量修改文本文件编码格式

把文本文件的编码格式进行批量幻化,比如ascii, gb2312, utf8等,相互转化,字符集的大小来看,utf8>gb2312>ascii,因此最好把gb2312转为utf8,否则容易出现乱码。

gb2312和utf-8的主要区别:

关于字库规模: UTF-8 > gb2312(utf8字全而gb2312只有汉字)

关于保存大小: UTF-8> gb2312 (utf8更臃肿、加载更慢,gb2312更小巧,加载更快)

关于适用范围:gb2312主要在中国大陆地区使用,是一个本地化的字符集,UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示。

import sysimport chardetimport codecs def get_encoding_type(fileName):    '''print the encoding fORMat of a txt file '''    with open(fileName, 'rb') as f:        data = f.read()        encoding_type = chardet.detect(data)        #print(encoding_type)        return encoding_type        # such as {'encoding': 'GB2312', 'confidence': 0.99, 'language': 'Chinese'} def convert_encoding_type(filename_in, filename_out, encode_in="gb2312", encode_out="utf-8"):    '''convert encoding format of txt file '''    #filename_in = 'flash.c'    #filename_out = 'flash_gb2312.c'    #encode_in = 'utf-8'  # 输入文件的编码类型    #encode_out = 'gb2312'# 输出文件的编码类型    with codecs.open(filename=filename_in, mode='r', encoding=encode_in) as fi:        data = fi.read()        with open(filename_out, mode='w', encoding=encode_out) as fo:            fo.write(data)            fo.close()        # with open(filename_out, 'rb') as f:        #     data = f.read()        #     print(chardet.detect(data)) if __name__=="__main__":    # fileName = argv[1]    # get_encoding_type(fileName)    # convert_encoding_type(fileName, fileName)    filename_of_files = sys.argv[1]   #the file contain full file path at each line    with open(filename_of_files, 'rb') as f:        lines = f.readlines()        for line in lines:            fileName = line[:-1]            encoding_type = get_encoding_type(fileName)            if encoding_type['encoding']=='GB2312':                print(encoding_type)                convert_encoding_type(fileName, fileName)                print(fileName)

补充:python实现文件批量转为utf-8格式

python实现文件批量转为utf-8格式

xml_path = './'with open(xml_path , 'rb+') as f:    content = f.read()    codeType = detect(content)['encoding']    content = content.decode(codeType, "ignore").encode("utf8")    fp.seek(0)    fp.write(content)

以上就是“怎么使用python批量修改文本文件编码格式”这篇文章的所有内容,感谢各位的阅读!相信大家阅读完这篇文章都有很大的收获,小编每天都会为大家更新不同的知识,如果还想学习更多的知识,请关注编程网Python频道。

--结束END--

本文标题: 怎么使用python批量修改文本文件编码格式

本文链接: https://www.lsjlt.com/news/353271.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 怎么使用python批量修改文本文件编码格式
    今天小编给大家分享一下怎么使用python批量修改文本文件编码格式的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。使用pyth...
    99+
    2023-07-05
  • 如何使用python批量修改文本文件编码格式
    使用python批量修改文本文件编码格式 把文本文件的编码格式进行批量幻化,比如ascii, gb2312, utf8等,相互转化,字符集的大小来看,utf8>gb2312&g...
    99+
    2023-03-24
    python批量修改文本文件编码格式 python批量修改文件编码
  • nodejs批量修改文件编码格式
    摘要:   最近在制作手册的时候遇到了一个问题'文档乱码',查看文件之后发现文件编码不对,总共100多个文件,如果用编辑器另存为utf8,那就悲催了。所以自己就写了个程序,批量修改文件编码格式。 代码: ...
    99+
    2022-06-04
    批量 格式 文件
  • idea怎么修改单个文件编码格式
    要修改单个文件的编码格式,可以按照以下步骤操作:1. 打开需要修改编码格式的文件,例如一个文本文件(.txt)或代码文件。2. 使用...
    99+
    2023-10-18
    idea
  • Shell脚本遍历目录并批量修改文件编码
    在将windows上的jsp网页移植到linux环境中时,发现一个个的转换编码及修改默认编码类型太慢,写此脚本进行尝试文件遍历~ 好久不写,手生了。 #!/bin/bash # # SPATH="/...
    99+
    2022-06-04
    遍历 批量 脚本
  • 如何使用Python批量对文本文件编码互转
    本文小编为大家详细介绍“如何使用Python批量对文本文件编码互转”,内容详细,步骤清晰,细节处理妥当,希望这篇“如何使用Python批量对文本文件编码互转”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。在Wind...
    99+
    2023-07-05
  • 怎么用php修改中文编码格式
    在web开发中,中文编码问题一直都是一个头疼的问题,在php开发中也不例外。常常会遇到当你在网页表单中输入中文,然后提交到服务器,结果发现中文出现了乱码的情况。这种问题一般是由于不同的编码方式所导致的。在php中,我们可以通过一些方法来解决...
    99+
    2023-05-14
    编码 php
  • 使用Python批量对文本文件编码互转的方法
    在Windows下写C语言默认是GB2312,放到Linux上就会乱码,因为Linux和MacOS默认是UTF-8,因此写了个Python小脚本对指定路径下的文件进行转换。 from...
    99+
    2023-03-24
    Python批量转换文本文件编码 Python文本文件编码
  • 使用iconv批量改变文件编码的shell脚本分享
    这篇文章主要介绍“使用iconv批量改变文件编码的shell脚本分享”,在日常操作中,相信很多人在使用iconv批量改变文件编码的shell脚本分享问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”使用iconv...
    99+
    2023-06-09
  • 如何编写Shell脚本批量修改文件后缀名代码
    本篇内容介绍了“如何编写Shell脚本批量修改文件后缀名代码”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!代码如下:#!/bin/basho...
    99+
    2023-06-09
  • 使用dos命令怎么批量修改文件名
    使用dos命令批量修改文件名的方法:1.使用组合键“win+R”输入cmd,点击“确定”;2.进入dos窗口;3.使用cd命令切换到文件夹目录;4.执行ren命令修改文件名;具体步骤如下:首先,在计算机中使用组合键“win+R”输入cmd,...
    99+
    2022-10-03
  • 使用R语言怎么批量修改文件名
    本篇文章给大家分享的是有关使用R语言怎么批量修改文件名,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。 修改文件扩展名folder<-setwd('~/t...
    99+
    2023-06-09
  • 怎么用python在文本文件批量查找
    可以使用Python的文件操作和字符串操作来实现在文本文件中批量查找的功能。下面是一个简单的示例代码:```pythondef se...
    99+
    2023-09-13
    python
  • python怎么批量修改xml文件中的信息
    这篇文章跟大家分析一下“python怎么批量修改xml文件中的信息”。内容详细易懂,对“python怎么批量修改xml文件中的信息”感兴趣的朋友可以跟着小编的思路慢慢深入来阅读一下,希望阅读后能够对大家有所帮助。下面跟着小编一起深入学习“p...
    99+
    2023-06-26
  • 怎么用Shell脚本遍历目录并批量修改文件
    本篇内容主要讲解“怎么用Shell脚本遍历目录并批量修改文件”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“怎么用Shell脚本遍历目录并批量修改文件”吧!在将windows上的jsp网页移植到l...
    99+
    2023-06-09
  • 怎么使用Python对文件进行批量改名
    使用Python对文件进行批量改名Python在Windows系统下的路径表示回顾:反斜杠“\”是转义符,如果继续用windows习惯使用“\”表示文件路径,就会产生歧义。Windows下的原始路径:C:\Users\LUO\Documen...
    99+
    2023-05-14
    Python
  • 怎么用bat批处理实现批量修改文件名
    这篇文章主要讲解了“怎么用bat批处理实现批量修改文件名”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么用bat批处理实现批量修改文件名”吧!我们已经会使用循环命令对大量文件改名进行批量处...
    99+
    2023-06-08
  • 怎么用bat批处理批量修改文件扩展名
    本篇内容主要讲解“怎么用bat批处理批量修改文件扩展名”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“怎么用bat批处理批量修改文件扩展名”吧!有的时候我们可能会遇到,在一个文件夹内有很多个文件,...
    99+
    2023-06-08
  • vbs脚本怎么实现批量转换文件编码
    这篇文章主要介绍“vbs脚本怎么实现批量转换文件编码”,在日常操作中,相信很多人在vbs脚本怎么实现批量转换文件编码问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”vbs脚本怎么实现批量转换文件编码”的疑惑有所...
    99+
    2023-06-08
  • 如何利用Python代码批量将PDF文件转为Word格式
    本篇文章给大家分享的是有关如何利用Python代码批量将PDF文件转为Word格式,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。在日常工作或学习中,经常会遇到这样的无奈:“小任...
    99+
    2023-06-17
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作