iis服务器助手广告广告
返回顶部
首页 > 资讯 > 数据库 >proc sql语句在数据清洗中的运用
  • 390
分享到

proc sql语句在数据清洗中的运用

2024-04-02 19:04:59 390人浏览 薄情痞子
摘要

本篇内容介绍了“proc sql语句在数据清洗中的运用”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!lib

本篇内容介绍了“proc sql语句在数据清洗中的运用”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

libname clean "c:/books/clean";                                          

*新建一个样本数据one;
data one;
   input X Y Z;
datalines;
1 2 3
101 202 303
44 55 66
444 555 666
;
title "Values of X from data set ONE where X is greater than 100";

proc sql;
   select X
   from one
   where X gt 100;               
quit;

*Program 8-2;
***检查无效的字符型的数值;
title "Checking for Invalid Character Data";
proc sql;
   select Patno,
          Gender,
          DX,
          AE
   from clean.patients
   where Gender not in ('M','F',' ')           or
         notdigit(trim(DX))and not missing(DX) or
         AE not in ('0','1',' ');
quit;

*检查无效的数值型的数值;
title "Checking for out-of-range numeric values";
proc sql;
   select Patno,
          HR,
          SBP,
          DBP
   from clean.patients
   where HR  not between 40 and 100 and not missing(HR)    or
         SBP not between 80 and 200 and not missing(SBP)   or
         DBP not between 60 and 120 and not missing(DBP);
quit;

*基于标准差利用简单的算法来检查数值;
title "Data values beyond two standard deviations";
proc sql;
   select Patno,
          SBP
   from clean.patients
   having SBP not between mean(SBP) - 2 * std(SBP) and
      mean(SBP) + 2 * std(SBP)                     and
      SBP is not missing;
quit;

*检查缺失值;
options linesize=84;
title "Observations with missing values";
proc sql;
   select *
   from clean.patients
   where Patno   is missing or
         Gender  is missing or
         Visit   is missing or
         HR      is missing or
         SBP     is missing or
         DBP     is missing or
         DX      is missing or
         AE      is missing;
quit;

*检查日期;
title "Dates before June 1, 1998 or after October 15, 1999";
proc sql;
   select Patno,
          Visit
   from clean.patients
   where Visit not between '01jun1998'd and '15oct1999'd and
         Visit is not missing;
quit;

*检查重复值;
title "Duplicate Patient Numbers";
proc sql;
   select Patno,
          Visit
      from clean.patients
      group by Patno
      having count(Patno) gt 1;
quit;

*识别对应多个观察值的变量;
title "Listing of patients who do not have two visits";
proc sql;
   select Patno,
          Visit
      from clean.patients2
      group by Patno
      having count(Patno) ne 2;
quit;

*检查两个文件中对应要求的序列号ID;
data one;
   input Patno X Y;
datalines;
1 69 79
2 56 .
3 66 99
5 98 87
12 13 14
;
data two;
   input Patno Z;
datalines;
1 56
3 67
4 88
5 98
13 99
;

*两个文件都不含的ID;
title "Patient numbers not in both files";
proc sql;
   select One.patno as ID_one,
          Two.patno as ID_two
   from one full join two
   on One.patno eq Two.patno
   where One.patno is missing or Two.patno is missing;
quit;

“proc sql语句在数据清洗中的运用”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站,小编将为大家输出更多高质量的实用文章!

您可能感兴趣的文档:

--结束END--

本文标题: proc sql语句在数据清洗中的运用

本文链接: https://www.lsjlt.com/news/59790.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • proc sql语句在数据清洗中的运用
    本篇内容介绍了“proc sql语句在数据清洗中的运用”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!lib...
    99+
    2024-04-02
  • proc sql语句中的case怎么用
    这篇文章给大家分享的是有关proc sql语句中的case怎么用的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。proc sql;    s...
    99+
    2024-04-02
  • SQL的数据清洗方法有哪些
    这篇文章主要讲解了“SQL的数据清洗方法有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“SQL的数据清洗方法有哪些”吧!大纲如图:01 删除指定列、重命...
    99+
    2024-04-02
  • 怎么在Python中使用numpy清洗数据
    这篇文章给大家介绍怎么在Python中使用numpy清洗数据,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。Python主要用来做什么Python主要应用于:1、Web开发;2、数据科学研究;3、网络爬虫;4、嵌入式应用...
    99+
    2023-06-14
  • r语言中怎么进行数据清洗
    在R语言中进行数据清洗,可以按照以下步骤进行: 缺失值处理:使用函数is.na()判断缺失值,使用函数na.omit()删除包含...
    99+
    2024-03-06
    r语言
  • PHP 数组分组函数在数据清洗中的作用
    php 的分组函数在数据清洗中发挥着重要作用,包括 array_group_by()、array_column() 和 array_multisort()。这些函数可用于对数组进行分组,...
    99+
    2024-05-03
    数据清洗
  • 在SQL中修改数据的基础语句
    目录什么是修改?一、插入数据基本语法二、更新数据基本语法使用update语句的注意事项三、删除语句基本语法注意事项四、特别注意补充:sql update语句根据不同条件修改不同列的值什么是修改? 在SQL中的基...
    99+
    2023-02-15
    mysql修改数据 sql数据库修改数据 sql数据库修改语句怎么写
  • 怎么在Python中使用Pandas进行数据清洗
    怎么在Python中使用Pandas进行数据清洗?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。python的五大特点是什么python的五大特点:1.简单易学,...
    99+
    2023-06-14
  • 如何用sql语句在表中增加数据
    要在表中增加数据,可以使用 SQL 的 INSERT INTO 语句。语法如下: INSERT INTO table_name (c...
    99+
    2024-04-02
  • SQL数据清洗和转换的方法是什么
    数据去重:使用SELECT DISTINCT语句去除重复的数据行。 数据格式转换:使用CAST或CONVERT函数将数据类型转换为...
    99+
    2024-04-29
    SQL
  • GO 语言如何实现大数据处理中的数据清洗?
    随着大数据时代的到来,数据的清洗和处理变得越来越重要。数据清洗可以帮助我们剔除掉一些无用的数据,同时也能够提高我们后续处理数据的效率。在数据清洗的过程中,我们往往需要处理大量的数据,因此我们需要一种高效的语言来完成数据清洗的任务。而 GO...
    99+
    2023-09-17
    大数据 接口 关键字
  • 数据库SQL语句的使用
    这篇文章主要讲解了“数据库SQL语句的使用”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“数据库SQL语句的使用”吧!1、创建数据库 create ...
    99+
    2024-04-02
  • 如何使用SQL语句在MySQL中查询数据
    要在MySQL中查询数据,可以使用SELECT语句。以下是一个简单的例子: SELECT * FROM table_name...
    99+
    2024-04-09
    MySQL
  • 在navicat中利用sql语句建表+添加数据
    在navicat中利用sql语句建表+添加数据 一个小小的记录。 首先双击激活localhost,再右键选择新建数据库,数据库名字定义好。 接着点击该数据库的查询,点击右边的新建查询,在里面输入s...
    99+
    2023-08-31
    sql 数据库 mysql
  • 在数据库中sql的九个常用语句是什么
    这篇文章给大家分享的是有关在数据库中sql的九个常用语句是什么的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。一、基础1、说明:创建数据库CREATE DATABASE datab...
    99+
    2024-04-02
  • sql中修改表数据的语句
    sql 中修改表数据的语句有两种:update 语句:用于更新指定行数据,语法为 update table_name set column = value where...
    99+
    2024-04-28
  • 如何在Couchbase中实现数据清洗和转换
    在Couchbase中实现数据清洗和转换可以通过以下几种方法: 使用N1QL查询语言:N1QL是Couchbase提供的SQL-...
    99+
    2024-04-09
    Couchbase
  • 如何在Python中进行数据清洗和处理
    如何在Python中进行数据清洗和处理数据清洗和处理是数据分析和挖掘过程中非常重要的一步。清洗和处理数据可以帮助我们发现数据中的问题、缺失或异常,并且为后续的数据分析和建模提供准备。本文将介绍如何使用Python进行数据清洗和处理,并提供具...
    99+
    2023-10-22
    Python编程(Python programming) 数据清洗(Data Cleaning) 数据处理(Data P
  • 怎么在SQL语句中使用JOIN连接数据库
    这篇文章给大家介绍怎么在SQL语句中使用JOIN连接数据库,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。通常有以下几种连接方式:JOIN  or  INNER JO...
    99+
    2024-04-02
  • DB2中怎么查看正在运行的SQL语句
    在DB2中,可以使用如下命令来查看正在运行的SQL语句: 使用命令行工具连接到DB2数据库实例。 运行以下命令来查看当前正在...
    99+
    2024-03-07
    DB2
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作