iis服务器助手广告广告
返回顶部
首页 > 资讯 > 服务器 >shell 文本数据处理
  • 784
分享到

shell 文本数据处理

linux服务器运维 2023-08-24 19:08:48 784人浏览 安东尼
摘要

文章目录 重定向管道`grep` 模式搜索`sed` 匹配替换`awk` 复杂业务编程(TODO)参考   在 linux shell 中,不同工具、程序间通过文本进行数据交互,即以文本作为输入、输出标准格式。文本成为公共的

  在 linux shell 中,不同工具、程序间通过文本进行数据交互,即以文本作为输入、输出标准格式。文本成为公共的协议,使得整个 shell 成为一个开放式环境,这给文本数据的处理带来了很大的方便。

重定向

  程序的输出可通过符号 >>> 实现覆盖、追加重定向到文件。我们用 echo 命令(回显,将输入参数原样输出到控制台)和cat 命令(吐文件,将文件内容输出到控制台显示)演示重定向。

  • echo

    $ echo hello world

    hello world

  • 重定向 覆盖 到文件 test.txt

    $ echo -ne “this\nis\na\n” > test.txt

    $ cat test.txt

    this
    is
    a

  • 重定向 追加 到文件 test.txt

    $ echo -ne “test\ntext.\n” >> test.txt

    $ cat test.txt

    this
    is
    a
    test
    text.

  • 标准输出 重定向到 std.txt,标准错误 重定向到 err.txt

    $ (echo hello world && cat a) > std.txt 2> err.txt

    $ cat std.txt

    hello world

    $ cat err.txt

    cat: a: No such file or directory

  • 标准错误 重定向到 标准输出

    $ (echo hello world && cat a) > std.txt 2>&1

    $ cat std.txt

    hello world
    cat: a: No such file or directory

管道

  通过管道(使用符号 | 表示),可以把一个程序(cat)的输出,作为另一个程序(echo)的输入。

  • cat test.txt | xargs echo

    this is a test text.

grep 模式搜索

  简单的模式搜索可以使用 grep 命令来完成。

  • Usage: grep [OPTioN…] PATTERNS [FILE…]

  • 常用 OPTION

    -n 显示行号
    -H 显示文件名
    -h 隐藏文件名
    -r 递归整个目录中的文件
    -o 只显示匹配的内容
    -E 使用扩展的正则表达式 PATTERN

sed 匹配替换

  • Usage: sed OPTIONS… [SCRIPT] [INPUTFILE…]

  • 常用 OPTIONS

    -i 在原文件中 in-place 执行操作
    -e 指定 SCRIPT,可以有多个,如 sed -e 'SCRIPT1' -e 'SCRIPT2' [INPUTFILE...]
    -f 从文件中加载 SCRIPT
    -r, -E 使用扩展的正则表达式
    -u 不使用缓存
    -n 取消自动输出,只输出 p 操作内容

  • [SCRIPT] 格式: [addr]X[options]

    • [addr] 用于定位需要处理的行

      [addr] 格式用例说明
      行号11
      行 range15,3015 ~ 30
      正则匹配/foo/包含字符串 foo 的行
      取反1!除第 1 行外的所有行
    • X 是操作命令,[options]X 命令的参数

      X 命令[options]用例说明
      i要插入的内容1i before在第1行前插入一行,内容为 before
      a要追加的内容1a after在第1行后追加一行,内容为 after
      rfile1r title.txt读取文件 title.txt 中的内容,输出到第1行后面
      wfile/foo/w title.txt将包含 foo 的行输出到文件 file.txt
      s/pattern/replace/[g]s/foo/bar/g将所有 foo 替换为 bar,不加 g 则只替换每行中第一次出现的 foo
      z-/foo/ z将包含 foo 的行清空,保留这个空行
      d-/foo/ d删除包含 foo 的行
      qexit-code/foo/q 2处理完包含 foo 的行就退出,返回错误码 2 到shell
      =-=输出所有行的行号
    • 对匹配的行,执行多个 SCRIPT 操作

      在一条 sed 命令中,可以使用多条用 ; 间隔开的 SCRIPT,形如 sed '[a1]X1[o1]; [a2]X2[o2]; [a3]X3[o3]' [INPUTFILE…]

  • 替换

  • 插入

  • 删除

awk 复杂业务编程(TODO)

  • Usage:
    awk [OPTIONS] ‘program’ [INPUTFILE…]
    awk -f program-file [INPUTFILE…]

参考

来源地址:https://blog.csdn.net/word_world/article/details/129966354

--结束END--

本文标题: shell 文本数据处理

本文链接: https://www.lsjlt.com/news/379684.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • shell 文本数据处理
    文章目录 重定向管道`grep` 模式搜索`sed` 匹配替换`awk` 复杂业务编程(TODO)参考   在 linux shell 中,不同工具、程序间通过文本进行数据交互,即以文本作为输入、输出标准格式。文本成为公共的...
    99+
    2023-08-24
    linux 服务器 运维
  • Linux Shell文本处理
    预计更新 1: 基础知识 简介和安装 基本命令 变量和环境变量 流程控制 条件语句 循环语句 函数 文件处理 文件读写 文件权限和所有权 文件搜索和替换 网络和进程 网络通信 进程管理 信号处理...
    99+
    2023-09-17
    linux php 数据库
  • Shell 脚本如何优化大数据处理?
    随着数据量的不断增加,大数据处理已经成为了许多企业必须面对的问题。而在大数据处理过程中,Shell 脚本作为一种常见的工具语言,也被广泛应用。但是,在处理大数据时,Shell 脚本的效率往往会受到一定的限制。本文将介绍一些 Shell 脚...
    99+
    2023-09-22
    大数据 shell 函数
  • Shell脚本如何实现文本处理
    这篇文章给大家分享的是有关Shell脚本如何实现文本处理的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。4.1 排序文本4.1.1 行的排序未提供命令行选项时,整个记录会根据当前locale所定义的次序排序。在传统...
    99+
    2023-06-09
  • Torch如何处理文本数据
    Torch是一个用于机器学习和深度学习的开源机器学习库。在处理文本数据时,Torch可以使用其内置的文本处理模块来进行文本预处理和特...
    99+
    2024-03-08
    Torch
  • 使用Shell脚本怎么逐行处理文本文件
    使用Shell脚本怎么逐行处理文本文件?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。通过read命令完成.read 命令从标准输入中读取一行,并把输入行的每个字...
    99+
    2023-06-14
  • Caffe中怎么处理文本数据
    在Caffe中处理文本数据通常需要进行以下步骤: 数据预处理:将文本数据转换成适合Caffe处理的格式,一般是将文本数据转换成图...
    99+
    2024-03-07
    Caffe
  • SQL中怎么处理文本数据
    SQL中怎么处理文本数据,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。导入数据  为了简单,我们用一个只有三行(三个文档)的文本文件(a....
    99+
    2024-04-02
  • Torch中如何处理文本数据
    在Torch中处理文本数据通常需要进行以下步骤: Tokenization:将文本数据分割成单词或者子词。可以使用现成的toke...
    99+
    2024-04-02
  • CNTK怎么处理文本数据和图像数据
    CNTK(Microsoft Cognitive Toolkit)是一个深度学习框架,可以用来处理文本数据和图像数据。以下是CNTK...
    99+
    2024-04-02
  • Chainer怎么处理文本数据和图像数据
    Chainer可以处理文本数据和图像数据并进行相应的预处理操作。以下是Chainer处理文本数据和图像数据的一般步骤: 处理文本数据...
    99+
    2024-04-02
  • Pandas数据分析之pandas文本处理
    目录前言文本数据类型字符操作文本格式文本对齐​文本计数和编码格式判断文本高级处理文本分割 文本切片选择 slice划分 partition文本替换指定位置替换重复替换文本连...
    99+
    2024-04-02
  • 怎么使用Python处理文本数据
    本篇内容介绍了“怎么使用Python处理文本数据”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!用python处理文本数据实验目的熟悉pyth...
    99+
    2023-07-02
  • kafka如何处理各种文本数据
    Kafka本身并不处理各种文本数据,它只是一种分布式消息队列,用于可靠地传输数据。但可以使用Kafka来传输和存储各种文本数据。下面...
    99+
    2023-10-12
    kafka
  • 让你一文弄懂Pandas文本数据处理
    目录前言1. 文本数据类型1.1. 类型简介1.2. 类型差异2. 字符串方法2.1. 文本格式2.2. 文本对齐2.3. 计数与编码2.4. 格式判断3. 文本高级操作3.1. 文...
    99+
    2024-04-02
  • 如何用 Shell 脚本实现高效的大数据处理?
    随着数据量的不断增加,大数据处理已经成为了现代科技领域中的一个重要问题。而在处理大数据时,Shell 脚本可以发挥出其强大的功能,帮助我们实现高效的数据处理。本文将为大家介绍如何使用 Shell 脚本实现高效的大数据处理,包括如何处理大文件...
    99+
    2023-09-22
    大数据 shell 函数
  • Pandas文本数据处理的示例分析
    这篇文章主要介绍了Pandas文本数据处理的示例分析,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。1. 文本数据类型在pandas中存储文本数据有两种方式:object 和 ...
    99+
    2023-06-20
  • Python处理文本数据的方法详解
    目录前言用python处理文本数据用python处理数值型数据前言 HI,好久不见,今天是关闭朋友圈的第60天,我是野蛮成长的AC-Asteroid。 人生苦短,我用Python,通...
    99+
    2024-04-02
  • Fastai怎么实现文本数据预处理
    Fastai是一个用于深度学习的开源库,它提供了一种简单而高效的方法来进行文本数据预处理。下面是一些Fastai中常用的文本数据预处...
    99+
    2024-04-02
  • Linux下如何使用Shell文本处理工具
    本篇内容介绍了“Linux下如何使用Shell文本处理工具”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!Linux下的操作习惯不像windo...
    99+
    2023-06-13
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作