首页 > 资讯 > 后端开发 > 其他教程 >R语言出现矩阵/缺失值的解决方案

364

分享到

R语言出现矩阵/缺失值的解决方案

2024-04-02 19:04:59 364人浏览独家记忆

摘要

缺失值处理一般包括三步： 1. 识别缺失数据； 2. 检查导致数据缺失的原因； 3. 删除包含缺失值的实例或用合理的数值代替（插补）缺失值。 1.判断缺失值函数is.na()、is

缺失值处理一般包括三步：

1. 识别缺失数据；

2. 检查导致数据缺失的原因；

3. 删除包含缺失值的实例或用合理的数值代替（插补）缺失值。

1.判断缺失值

函数is.na()、is.nan()和is.infinite()可分别用来识别缺失值、不可能值和无穷值。每个返回结果都是

TRUE或FALSE

na表示缺失值

nan表示NOT A NUMBER

infinite表示+-Inf

一定要亲手试x = 0/0,以及x = 1/0


>x <- NA
> is.na(x)
[1] TRUE
> is.nan(x)
[1] FALSE
> is.infinite(x)
 [1] FALSE

函数complete.cases()可用来识别矩阵或数据框中没有缺失值的行

超级好用


#加载数据集
>data(sleep,package = "VIM")
#没有缺失值的行
>sleep[complete.cases(sleep),]
#列出有一个或多个缺失值的行
>sleep[!complete.cases(sleep),]

2.图形探究缺失数


#自己生成图形
>library("VIM")
>aggr(sleep,prop = FALSE,numbers = TRUE)

matrixplot()函数可生成展示每个实例数据的图形


#自己生成图形
marginplot(sleep[c("Gest","Dream")],phc=c(20),col=c("darkgray","red","blue"))

3.删除缺失值

函数complete.cases()可以用来存储没有缺失值的数据框或者矩阵形式的实例（行）：


#可以把mydata替换成sleep,延续上面的代码
>newdata <- mydata[complete.cases(mydata),]

同样的结果可以用na.omit函数获得:


#可以把mydata替换成sleep,延续上面的代码
>newdata <- na.omit(mydata)

两行代码表示的意思都是：mydata中所有包含缺失数据的行都被删除，然后结果才存储到newdata中，以后拟合就用新数据newdata.

处理含缺失值的数据集时，成对删除常作为行删除的备选方法使用。对于成对删除，观测只是当它含缺失数据的变量涉及某个特定分析时才会被删除：


>cor(sleep,use = "pairwise.complete.obs")

3.1补全缺失值

函数mice()首先从一个包含缺失数据的数据框开始，然后返回一个包含多个（默认为5个）完整数据集的对象。

每个完整数据集都是通过对原始数据框中的缺失数据进行插补而生成的。

由于插补有随机的成分，因此每个完整数据集都略有不同。

然后，with()函数可依次对每个完整数据集应用统计模型（如线性模型或广义线性模型），最后，pool()函数将这些单独的分析结果整合为一组结果。

最终模型的标准误和p值都将准确地反映出由于缺失值和多重插补而产生的不确定性。


>library(mice)
>data("sleep",package = "VIM")
>imp <- mice(sleep,seed = 1234)
#imp <- mice(sleep)
>fit <- with(imp,lm(Dream~Span+Gest))
fit
>pooled <- pool(fit)
>summary(pooled)
imp
>dataset2 <- complete(imp,action = 2)
>cor(sleep,use = "pairwise.complete.obs")

dataset2 is the newData

下图为完整缺失值处理图片：

补充：R语言读取数据空值

一、Txt文件

1. 文件中的内容有双引号，空值的时候是一对双引号

filename.txt 文件内容形如：

"ID" "ITEM"

"1080254842" "汉字"

"1080254842" "中文"

"1080594798" ""

"1080594798" ""

导入数据：


test <-read.table("filename.txt",header=TRUE）

空值部分并不是NA，R语言不会把他识别为NA，改为下面的语句，即可解决。


test <-read.table("filename.txt",header=TRUE,na.strings = "")

2. 文件中内容无双引号，空值即直接空白，形如下面：

ID ITEM

1080254842 汉字

1080254842 中文

1080594798

1080594798

导入数据：


test <-read.table("filename.txt",header=TRUE）

会出现错误：Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :3行没有2元素

第三行第二元素没有。

修改为如下即可：


test <-read.table("filename.txt",header=TRUE,fill=TRUE）

导入数据成功，但是，空值仍然不是NA，还需加上na.strings = ""，


test <-read.table("filename.txt",header=TRUE, fill=TRUE, na.strings = "")

成功导入。

二、csv文件


test <-read.csv("test.csv",header=TRUE,sep=",",na.strings = "")

其中：

header =TRUE，表示把第一行作为标题。

sep=","，因为csv文件的列是用逗号分开的，加上sep=","，帮助R通过识别逗号来分割列。如果没加，会出现原本多列数据导入后变为一列的情况。

na.strings = ""：处理缺失值问题。

以上为个人经验，希望能给大家一个参考，也希望大家多多支持编程网。如有错误或未考虑完全的地方，望不吝赐教。

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: R语言出现矩阵/缺失值的解决方案

本文链接: https://www.lsjlt.com/news/121399.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

c语言怎么计算字符串长度

2024-03-01

c++排序函数sort怎么使用

2024-03-01

c语言怎么实现字符串与数字相互转换

2024-02-29

c语言swap函数如何调用

2024-02-29

C语言怎么实现对文件夹加密

2024-02-29

c语言数组形参怎么定义

2024-02-29

c++字符串怎么转化为数字

2024-02-29

c++中使用swap函数报错怎么解决

2024-02-29

c++智能指针怎么调用

2024-02-29

c语言数组怎么作为参数传入函数

2024-02-29

热门问答

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

R语言出现矩阵/缺失值的解决方案

缺失值处理一般包括三步：

1.判断缺失值

2.图形探究缺失数

3.删除缺失值

3.1补全缺失值

一、Txt文件

二、csv文件

本篇文章演示代码以及资料文档资料下载

R语言出现矩阵/缺失值的解决方案

R语言出现矩阵/缺失值怎么办

使用AndroidStudio出现R文件缺失的解决方法

R语言读取csv文件出错的解决方案

c语言怎么计算字符串长度

c++排序函数sort怎么使用

c语言怎么实现字符串与数字相互转换

c语言swap函数如何调用

C语言怎么实现对文件夹加密

c语言数组形参怎么定义

c++字符串怎么转化为数字

c++中使用swap函数报错怎么解决

c++智能指针怎么调用

c语言数组怎么作为参数传入函数

R语言 出现矩阵/缺失值的解决方案

缺失值处理一般包括三步：

1.判断缺失值

2.图形探究缺失数

3.删除缺失值

3.1补全缺失值

一、Txt文件

二、csv文件

本篇文章演示代码以及资料文档资料下载

R语言出现矩阵/缺失值的解决方案