广告
返回顶部
首页 > 资讯 > 后端开发 > 其他教程 >R语言 UTF-8各种问题的解决方案
  • 769
分享到

R语言 UTF-8各种问题的解决方案

2024-04-02 19:04:59 769人浏览 独家记忆
摘要

R语言在碰到读UTF-8文件,或者处理UTF-8数据时总是会遇到各种各样的问题,本姑娘也是在碰了n多次壁,被气得吐血好多次之后,终于对这类总结出了一些解决办法: 1. 读UTF-8文

R语言在碰到读UTF-8文件,或者处理UTF-8数据时总是会遇到各种各样的问题,本姑娘也是在碰了n多次壁,被气得吐血好多次之后,终于对这类总结出了一些解决办法:

1. 读UTF-8文件,例如UTF-8格式的csv:

最好的处理办法就是:


a1=read.table('C:\\test11.csv',sep=',',fileEncoding = 'UTF-8',header = F)

如果使用如下方法可能会出错(全是血泪教训啊):


a2=read.csv('C:\\test11.csv',fileEncoding = 'UTF-8',header = F)
a2=read.csv('C:\\test11.csv',encoding = 'UTF-8',header = F)

2. 如何在R里把一个数据转化为UTF-8格式:

因为我在R里写了一段程序,需要把数据转化为JSON格式,通过上面的方法读进来的数据是没有问题,但是数据再R里并不是utf-8格式存储的,所以tojsON()时报了如下错误:

unable to escape string. String is not utf8

后来发现R里有一个函数可以把数据转为utf8格式:enc2utf8()


> a='小源'
> Encoding(a)#查看a的编码格式
[1] "unknown"
> b=enc2utf8(a)
> Encoding(b)
[1] "UTF-8"

3. 如何SOURCE一个UTF-8格式的R文件:

source一个utf8编码保存的R脚本,在windows下(linux由于默认编码就是utf8,直接source就可以)


source('test.R',encoding = 'UTF-8')

补充:mac系统csv乱码_R语言写入UTF-8格式CSV乱码解决办法

中文编码方式有GBK(GB2312)和UTF-8两种。

由于区域设置问题,在Windows系统下,excel程序默认用GBK格式读取CSV文件。

因此会导致乱码。

如下图所示:

eb163b05995ec24dd3c026ef2a1c76bf.png

解决的办法是用tidyverse包中的write_excel_csv()函数。

下面上代码:


library(tidyverse)
x <- c('好好地', '针对是棒极啦', '哈好好好好好爱吼吼吼啊', '啊')
y <- c(1, 2, 3, 4)
z <- c('haha', 'hehe', 'hoho', 'lala')
xyz_tbl <- tibble(x,y,z)
        read_csv(file = 'data1.csv', )
#乱码
write.csv(xyz_tbl,'data_old.csv',row.names = T,fileEncoding='UTF-8')
#再次乱码
write_csv(xyz_tbl, 'data.csv')
#解决问题
write_excel_csv(xyz_tbl, 'data_ex.csv')
#以上文件用R读取都没问题
read_csv(file = 'data.csv')
read_csv(file = 'data_ex.csv')
read_csv(file = 'data_old.csv')

50379635e55fa90a3e6ca3a1e03204a2.png

原数据

3eaf7b79d1df09ea9d48bb785f391c3c.png

data.csv

436a7bb6de0de69e2e81f7c9de54d95d.png

data_ex.csv

56c00a36b452d70dde655a0447c360c0.png

data_old.csv

以上为个人经验,希望能给大家一个参考,也希望大家多多支持编程网。如有错误或未考虑完全的地方,望不吝赐教。

--结束END--

本文标题: R语言 UTF-8各种问题的解决方案

本文链接: https://www.lsjlt.com/news/123851.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • R语言 UTF-8各种问题的解决方案
    R语言在碰到读UTF-8文件,或者处理UTF-8数据时总是会遇到各种各样的问题,本姑娘也是在碰了n多次壁,被气得吐血好多次之后,终于对这类总结出了一些解决办法: 1. 读UTF-8文...
    99+
    2022-11-12
  • R语言编码问题的解决
    今天博客主要是解决一个学R语言里面最最痛苦的问题(嗯,python2.x里面也有),就是中文乱码问题: 一般用R语言的同学,多半遇见过以下这个问题: 反正虾神我每次遇见这个问题,立...
    99+
    2022-11-12
  • 基于R语言xlsx安装遇到的问题及解决方案
    1、java环境的安装,如果java安装的是64位使用R软件一定要是64位,如果使用32位会报错,版本一定要对应。 2、安装顺序要是install.packages(“rJava”)...
    99+
    2022-11-12
  • dedecms utf-8 出现乱码问题的解决方法之一
    当制作dedecms模板的head.htm时页面显示正常当制作index.htm模板时发现在index.htm输入中文时会出现乱码之前没有遇到过,感觉很奇怪,于是在网上搜索了一下相关信息,但遗憾的是没有找到正确的解决办法...
    99+
    2022-06-12
    dedecms utf8 出现乱码
  • R语言 中文乱码的解决方案
    问题背景 在R Studio中重新载入之前编辑好的.r文件,结果发现内容中的所有中文都乱码了。 问题解决 在R Studio中选择菜单栏File->Reopen with En...
    99+
    2022-11-12
  • R语言 解决安装ggplot2报错的问题
    如下所示: install.packages(‘xxx',repos=‘http://cran.us.r-project.org') xxx 改为 ggplot2 补充:R包安...
    99+
    2022-11-12
  • 解决R语言 数据不平衡的问题
    R语言解决数据不平衡问题 一、项目环境 开发工具:RStudio R:3.5.2 相关包:dplyr、ROSE、DMwR 二、什么是数据不平衡?为什么要处理数据不平衡? 首先我们要知...
    99+
    2022-11-11
  • 如何解决R语言循环慢的问题
    小编给大家分享一下如何解决R语言循环慢的问题,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!什么是R语言R语言是用于统计分析、绘图的语言和操作环境,属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计...
    99+
    2023-06-14
  • R语言 解决无法打开链结的问题
    近期,在项目中遇到一个棘手的问题。 R脚本在centos服务器上通过"R --no-save filename.R"的方式运行R脚本可以成功,分析结果也可以存入MySQL,该种方式适...
    99+
    2022-11-12
  • R语言安装R包的方法,mac、windows、linux安装R包常见问题与解决方法
    R语言如何快速安装R包? 如果把R比作是沃土的话,那么R包就是鲜花,开源共享的开发者社区提供了很多功能丰富的R包,方便使用者充分利用R语言完成工作。 但是,有时候在安装R包是会遇到各种各样的报错和问题...
    99+
    2023-09-21
    程序人生
  • R语言 出现矩阵/缺失值的解决方案
    缺失值处理一般包括三步: 1. 识别缺失数据; 2. 检查导致数据缺失的原因; 3. 删除包含缺失值的实例或用合理的数值代替(插补)缺失值。 1.判断缺失值 函数is.na()、is...
    99+
    2022-11-11
  • R语言 install.packages 无法读取索引的解决方案
    问题描述 在公司的Centos服务器上安装R的包,总是安装不成功,然后有如下提醒: Warning: 无法在貯藏處https://mirrors.ustc.edu.cn/CRAN...
    99+
    2022-11-12
  • R语言读取csv文件出错的解决方案
    今天在用R语言读取.csv文件的时候报错 Error in make.names(col.names, unique = TRUE) : invalid multibyte str...
    99+
    2022-11-12
  • 多ajax请求的各类问题解决方案
    这篇文章主要讲解了“多ajax请求的各类问题解决方案”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“多ajax请求的各类问题解决方案”吧! ...
    99+
    2022-10-19
  • R语言多线程运算操作(解决R循环慢的问题)
    已经大半年没有更新博客了。。最近都跑去写分析报告半年没有R 这次记录下关于R循环(百万级以上)死慢死慢的问题,这个问题去年就碰到过,当时也尝试过多线程,but failed........
    99+
    2022-11-12
  • C语言三种方法解决轮转数组问题
    目录题目1.题目描述2.要求3.原题链接二、相关知识点三、解决思路旋转法直接法空间换取时间题目 1.题目描述 给你一个数组,将数组中的元素向右轮转 k 个位置,其中&nbs...
    99+
    2022-11-13
  • R语言如何解决无法打开链结的问题
    这篇文章给大家分享的是有关R语言如何解决无法打开链结的问题的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。近期,在项目中遇到一个棘手的问题。R脚本在centos服务器上通过"R --no-save fil...
    99+
    2023-06-14
  • 解决R语言中install_github中无法安装遇到的问题
    首先,让我们来进入常规步骤 我安装的是recharts包,正常的写法呢,就是以下这个样子: install.packages("devtools") #devtools::ins...
    99+
    2022-11-12
  • Go语言并发编程教程:存储问题的解决方案!
    Go语言作为一门开发高并发系统的语言,其并发编程能力一直是备受瞩目的。然而,在使用Go语言进行并发编程时,我们往往会遇到一些存储问题。本文将介绍一些解决这些问题的方案,同时穿插演示代码。 问题:竞态条件 竞态条件是指多个线程同时访问同一资源...
    99+
    2023-10-17
    并发 教程 存储
  • Go语言项目开发中的常见问题与解决方案
    Go语言项目开发中的常见问题与解决方案Go语言作为一种简洁高效的开发语言,受到越来越多的开发者的青睐。在实际的项目开发中,开发者也会遇到一些常见的问题。本文将提供一些常见问题的解决方案,帮助开发者更好地应对挑战。一、依赖管理在Go语言项目中...
    99+
    2023-11-04
    垃圾回收 内存管理 错误处理 问题:并发 解决方案:协程
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作