首页 > 资讯 > 前端开发 > node.js >Node.js中stream模块怎么用

865

分享到

Node.js中stream模块怎么用

2024-04-02 19:04:59 865人浏览独家记忆

摘要

这篇文章主要介绍了node.js中stream模块怎么用，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。Node.js 流的类型node.js

这篇文章主要介绍了node.js中stream模块怎么用，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。

Node.js 流的类型

node.js stream 提供了四种类型的流

可读流（Readable Streams）
可写流（Writable Streams）
双工流（Duplex Streams）
转换流（TransfORM Streams）

更多详情请查看 Node.js 官方文档
https://nodejs.org/api/stream.html#stream_types_of_streams

让我们在高层面来看看每一种流类型吧。

可读流

可读流可以从一个特定的数据源中读取数据，最常见的是从一个文件系统中读取。Node.js 应用中其他常见的可读流用法有：

process.stdin -通过 stdin 在终端应用中读取用户输入。
Http.IncomingMessage - 在 HTTP 服务中读取传入的请求内容或者在 HTTP 客户端中读取服务器的 HTTP 响应。

可写流

你可以使用可写流将来自应用的数据写入到特定的地方，比如一个文件。

process.stdout 可以用来将数据写成标准输出且被 console.log 内部使用。

接下来是双工流和转换流，可以被定义为基于可读流和可写流的混合流类型。

双工流

双工流是可读流和可写流的结合，它既可以将数据写入到特定的地方也可以从数据源读取数据。最常见的双工流案例是 net.Socket，它被用来从 socket 读写数据。

有一点很重要，双工流中的可读端和可写端的操作是相互独立的，数据不会从一端流向另一端。

转换流

转换流与双工流略有相似，但在转换流中，可读端和可写端是相关联的。

crypto.Cipher 类是一个很好的例子，它实现了加密流。通过 crypto.Cipher 流，应用可以往流的可写端写入纯文本数据并从流的可读端读取加密后的密文。之所以将这种类型的流称之为转换流就是因为其转换性质。

附注：另一个转换流是 stream.PassThrough。stream.PassThrough 从可写端传递数据到可读端，没有任何转换。这听起来可能有点多余，但 Passthrough 流对构建自定义流以及流管道非常有帮助。（比如创建一个流的数据的多个副本）

从可读的 Node.js 流读取数据

一旦可读流连接到生产数据的源头，比如一个文件，就可以用几种方法通过该流读取数据。

首先，先创建一个名为 myfile 的简单的 text 文件，85 字节大小，包含以下字符串：

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Curabitur nec mauris turpis.

现在，我们看下从可读流读取数据的两种不同方式。

1. 监听 `data` 事件

从可读流读取数据的最常见方式是监听流发出的 data 事件。以下代码演示了这种方式：

const fs = require('fs')
const readable = fs.createReadStream('./myfile', { highWaterMark: 20 });

readable.on('data', (chunk) => {
    console.log(`Read ${chunk.length} bytes\n"${chunk.toString()}"\n`);
})

highWaterMark 属性作为一个选项传递给 fs.createReadStream，用于决定该流中有多少数据缓冲。然后数据被冲到读取机制（在这个案例中，是我们的 data 处理程序）。默认情况下，可读 fs 流的 highWaterMark 值是 64kb。我们刻意重写该值为 20 字节用于触发多个 data 事件。

如果你运行上述程序，它会在五个迭代内从 myfile 中读取 85 个字节。你会在 console 看到以下输出：

Read 20 bytes
"Lorem ipsum dolor si"

Read 20 bytes
"t amet, consectetur "

Read 20 bytes
"adipiscing elit. Cur"

Read 20 bytes
"abitur nec mauris tu"

Read 5 bytes
"rpis."

2. 使用异步迭代器

从可读流中读取数据的另一种方法是使用异步迭代器：

const fs = require('fs')
const readable = fs.createReadStream('./myfile', { highWaterMark: 20 });

(async () => {
    for await (const chunk of readable) {
        console.log(`Read ${chunk.length} bytes\n"${chunk.toString()}"\n`);
    }
})()

如果你运行这个程序，你会得到和前面例子一样的输出。

可读 Node.js 流的状态

当一个监听器监听到可读流的 data 事件时，流的状态会切换成”流动”状态（除非该流被显式的暂停了）。你可以通过流对象的 readableFlowing 属性检查流的”流动”状态

我们可以稍微修改下前面的例子，通过 data 处理器来示范：

const fs = require('fs')
const readable = fs.createReadStream('./myfile', { highWaterMark: 20 });

let bytesRead = 0

console.log(`before attaching 'data' handler. is flowing: ${readable.readableFlowing}`);
readable.on('data', (chunk) => {
    console.log(`Read ${chunk.length} bytes`);
    bytesRead += chunk.length

    // 在从可读流中读取 60 个字节后停止阅读
    if (bytesRead === 60) {
        readable.pause()
        console.log(`after pause() call. is flowing: ${readable.readableFlowing}`);

        // 在等待 1 秒后继续读取
        setTimeout(() => {
            readable.resume()
            console.log(`after resume() call. is flowing: ${readable.readableFlowing}`);
        }, 1000)
    }
})
console.log(`after attaching 'data' handler. is flowing: ${readable.readableFlowing}`);

在这个例子中，我们从一个可读流中读取 myfile，但在读取 60 个字节后，我们临时暂停了数据流 1 秒。我们也在不同的时间打印了 readableFlowing 属性的值去理解他是如何变化的。

如果你运行上述程序，你会得到以下输出：

before attaching 'data' handler. is flowing: null
after attaching 'data' handler. is flowing: true
Read 20 bytes
Read 20 bytes
Read 20 bytes
after pause() call. is flowing: false
after resume() call. is flowing: true
Read 20 bytes
Read 5 bytes

我们可以用以下来解释输出：

当我们的程序开始时，readableFlowing 的值是 null，因为我们没有提供任何消耗流的机制。
在连接到 data 处理器后，可读流变为“流动”模式，readableFlowing 变为 true。
一旦读取 60 个字节，通过调用 pause()来暂停流，readableFlowing 也转变为 false。
在等待 1 秒后，通过调用 resume()，流再次切换为“流动”模式，readableFlowing 改为 `true'。然后剩下的文件内容在流中流动。

通过 Node.js 流处理大量数据

因为有流，应用不需要在内存中保留大型的二进制对象：小型的数据块可以接收到就进行处理。

在这部分，让我们组合不同的流来构建一个可以处理大量数据的真实应用。我们会使用一个小型的工具程序来生成一个给定文件的 SHA-256。

但首先，我们需要创建一个大型的 4GB 的假文件来测试。你可以通过一个简单的 shell 命令来完成：

On MacOS: mkfile -n 4g 4gb_file
On linux: xfs_mkfile 4096m 4gb_file

在我们创建了假文件 4gb_file 后，让我们在不使用 stream 模块的情况下来生成来文件的 SHA-256 hash。

const fs = require("fs");
const crypto = require("crypto");

fs.readFile("./4gb_file", (readErr, data) => {
  if (readErr) return console.log(readErr)
  const hash = crypto.createHash("sha256").update(data).digest("base64");
  fs.writeFile("./checksum.txt", hash, (writeErr) => {
    writeErr && console.error(err)
  });
});

如果你运行以上代码，你可能会得到以下错误：

RangeError [ERR_FS_FILE_TOO_LARGE]: File size (4294967296) is greater than 2 GB
    at FSReqCallback.readFileAfterStat [as oncomplete] (fs.js:294:11) {
  code: 'ERR_FS_FILE_TOO_LARGE'
}

以上报错之所以发生是因为 javascript 运行时无法处理随机的大型缓冲。运行时可以处理的最大尺寸的缓冲取决于你的操作系统结构。你可以通过使用内建的 buffer 模块里的 buffer.constants.MAX_LENGTH 变量来查看你操作系统缓存的最大尺寸。

即使上述报错没有发生，在内存中保留大型文件也是有问题的。我们所拥有的可用的物理内存会限制我们应用能使用的内存量。高内存使用率也会造成应用在 CPU 使用方面性能低下，因为垃圾回收会变得昂贵。

使用 `pipeline()` 减少 APP 的内存占用

现在，让我们看看如何修改应用去使用流且避免遇到这个报错：

const fs = require("fs");
const crypto = require("crypto");
const { pipeline } = require("stream");

const hashStream = crypto.createHash("sha256");
hashStream.setEncoding('base64')

const inputStream = fs.createReadStream("./4gb_file");
const outputStream = fs.createWriteStream("./checksum.txt");

pipeline(
    inputStream,
    hashStream,
    outputStream,
    (err) => {
        err && console.error(err)
    }
)

在这个例子中，我们使用 crypto.createHash 函数提供的流式方法。它返回一个“转换”流对象 hashStream，为随机的大型文件生成 hash。

为了将文件内容传输到这个转换流中，我们使用 fs.createReadStream 为 4gb_file 创建了一个可读流 inputStream。我们将 hashStream 转换流的输出传递到可写流 outputStream 中，而 checksum.txt 通过 fs.createWriteStream 创建的。

如果你运行以上程序，你将看见在 checksum.txt 文件中看见 4GB 文件的 SHA-256 hash。

对流使用 `pipeline()` 和 `pipe()` 的对比

在前面的案例中，我们使用 pipeline 函数来连接多个流。另一种常见的方法是使用 .pipe() 函数，如下所示：

inputStream
  .pipe(hashStream)
  .pipe(outputStream)

但这里有几个原因，所以并不推荐在生产应用中使用 .pipe()。如果其中一个流被关闭或者出现报错，pipe() 不会自动销毁连接的流，这会导致应用内存泄露。同样的，pipe() 不会自动跨流转发错误到一个地方处理。

因为这些问题，所以就有了 pipeline()，所以推荐你使用 pipeline() 而不是 pipe() 来连接不同的流。我们可以重写上述的 pipe() 例子来使用 pipeline() 函数，如下：

pipeline(
    inputStream,
    hashStream,
    outputStream,
    (err) => {
        err && console.error(err)
    }
)

pipeline() 接受一个回调函数作为最后一个参数。任何来自被连接的流的报错都将触发该回调函数，所以可以很轻松的在一个地方处理报错。

总结：使用 Node.js 流降低内存并提高性能

在 Node.js 中使用流有助于我们构建可以处理大型数据的高性能应用。

在这篇文章中，我们覆盖了：

四种类型的 Node.js 流（可读流、可写流、双工流以及转换流）。
如何通过监听 data 事件或者使用异步迭代器来从可读流中读取数据。
通过使用 pipeline 连接多个流来减少内存占用。

一个简短的警告：你很可能不会遇到太多必须使用流的场景，而基于流的方案会提高你的应用的复杂性。务必确保使用流的好处胜于它所带来的复杂性。

感谢你能够认真阅读完这篇文章，希望小编分享的“Node.js中stream模块怎么用”这篇文章对大家有帮助，同时也希望大家多多支持编程网，关注编程网node.js频道，更多相关知识等着你来学习!

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: Node.js中stream模块怎么用

本文链接: https://www.lsjlt.com/news/97139.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

Node.js Redis vs. Node.js：数据库性能优化秘籍

Redis 优化利用数据结构：Redis 提供了多种数据结构，如字符串、散列、列表和集合。根据数据的性质选择最合适的数据结构可以提高性能。例如，散列适合存储键值对，而列表适合存储有序数据。缓存命中率：Redis 的主要优势之一是它的...

99+

2024-05-15

对于 Node.js 应用程序在选择数据存储解决方案时 Redis 和关系型数据库（如 MySQL 或 PostgreSQL）是两个常见选项。虽然 Redis 以其出色的性能而闻名但优化 Nod
Node.js Redis 与 Node.js 的性能迷思，一文揭晓

虽然 Node.js 和 Redis 都被认为是高性能技术，但在某些情况下，Redis 的使用可能会对 Node.js 的性能产生负面影响。以下是需要注意的关键迷思：迷思 1：Redis 总能提高 Node.js 性能事实：并非总是如...

99+

2024-05-15

Node.js 是一种流行的 JavaScript 运行时环境以其高性能和可扩展性而闻名。Redis 是一个开源的、基于内存的、键值存储数据库广泛用于缓存、会话管理和其他快速数据访问场景。
Redis 与 Node.js 的完美结合，打造极速应用

Redis简介 Redis是一种内存中键值存储，以其极快的读取和写入速度而闻名。它支持多种数据结构，包括字符串、散列、列表和集合，使其成为缓存、会话存储和消息传递的理想选择。 Node.js简介 Node.js是一个事件驱动的JavaSc...

99+

2024-05-15

引言 Redis与Node.js的结合可以为应用程序提供卓越的性能和可扩展性。本文将深入探讨这种完美结合阐释其优势并提供具体示例帮助您构建极速响应的应用程序。
Node.js Redis vs. Node.js：性能提升的最佳途径

性能差异 Node.js Redis 通常比直接操作数据库更快，原因有以下几个：内存中存储：Redis 将数据存储在内存中，因此访问数据比访问硬盘上的数据库更快。快速数据结构：Redis 提供了高效的数据结构，如哈希表和队列，这使得...

99+

2024-05-15

在现代应用程序开发中优化性能至关重要。Node.js 是一种流行的 JavaScript 运行时环境而 Redis 是一个开源的、内存中的数据结构存储。本文将探讨 Node.js Redis 与
Node.js Redis 与 Node.js 实战指南，让你大开眼界

Redis（Remote Dictionary Server）是一种流行的开源内存数据结构存储，因其高性能和多功能性而受到广泛应用。Node.js 是一个用于构建快速高效的可扩展 Web 应用程序的 JavaScript 运行时环境。本文...

99+

2024-05-15

导言
Node.js Redis vs. Node.js：缓存江湖中的风云对决

Redis：分布式、持久化缓存分布式：Redis 可以在多个服务器之间分发数据，提供高可用性和可扩展性。持久化：Redis 可以将数据存储在磁盘上，即使服务器重新启动或发生故障，数据也不会丢失。数据结构丰富：Redis 支持各种数...

99+

2024-05-15

Node.js 内存缓存和 Redis 都是流行的缓存解决方案旨在提高 Node.js 应用程序的性能。然而在选择最佳选项时了解它们的差异至关重要。
Redis 与 Node.js 的完美邂逅，解锁数据存储新境界

Redis 的优势： Redis 作为内存数据库，将数据保存在内存中，而非磁盘上。这带来了以下优势：极速响应：从内存中访问数据比从磁盘上访问快几个数量级，从而实现毫秒级的查询速度。高吞吐量： Redis 可以同时处理大量并发请求，...

99+

2024-05-15

Redis 一种内存数据库以其闪电般的速度和灵活性而闻名。Node.js 一个事件驱动的 JavaScript 运行时以其轻量级和非阻塞式 I/O 而著称。当这两个技术巨头相遇时便解开了一场数
Node.js Redis vs. Node.js：深入剖析缓存技术

缓存是提升应用程序性能的关键技术，在 Node.js 开发中，Redis 和 Node.js 内置缓存机制是两个常用的选择。 Redis Redis 是一个开源的、内存中的数据结构存储，专为缓存和消息传递而设计。它提供多种数据结构，包括字...

99+

2024-05-15

简介
Node.js Redis 与 Node.js：谁是性能之王？

Node.js Redis：Redis的包装 Node.js Redis是一个Node.js库，允许应用程序与流行的Redis缓存服务器交互。它提供了一个方便的API，简化了应用程序与Redis的通信。优点：无缝Redis集成：...

99+

2024-05-15

Node.js 一种基于事件驱动的JavaScript运行时环境已成为构建高性能Web应用程序的热门选择。然而当涉及到缓存解决方案时经常出现一个问题：Node.js Redis和Node.js
Redis 在 Node.js 中的妙用，助你轻松提升性能

缓存数据，减少数据库查询 Redis可作为数据库的缓存层，存储常用的数据。当需要这些数据时，Node.js 应用可以直接从 Redis 中获取，从而避免昂贵的数据库查询。这显著加快了读取速度，尤其适用于经常访问的、不会频繁更新的数据。会...

99+

2024-05-15

Redis 是一款高性能的内存数据结构存储在 Node.js 开发中广泛用于提升性能。其主要妙用包括：

软考高级职称资格查询

软考职称历年真题下载

2023下半年-信息系统项目管理师-真题考点汇总（完整版）
164.2 KB 查看
2023年下半年信息系统项目管理师第一、二批次各科目真题考点整理(考友回忆版)
143.67 KB 查看
2023上半年软考高级《信息系统项目管理师》真题答案（抢先版）
500.26 KB 查看
2022年下半年软考高级职称考试考情分析
823.36 KB 查看
2022年下半年软考高级职称考试真题
569.84 KB 查看

软考职称资料下载

热门wiki

近期文章

Node.js Redis vs. Node.js：揭示缓存的奥秘

Redis 在 Node.js 中的强劲优势，你不可不知！

Node.js Redis 与 Node.js 实战指南，让你大开眼界

Node.js Redis vs. Node.js：深入剖析缓存技术

Redis 与 Node.js 的完美结合，打造极速应用

Node.js Redis 与 Node.js：谁是性能之王？

Node.js Redis 与 Node.js：孰优孰劣？

Node.js Redis vs. Node.js：性能提升的最佳途径

Node.js Redis 与 Node.js：究竟哪一个称霸缓存江湖？

Node.js Redis 与 Node.js 的性能迷思，一文揭晓

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

Node.js中stream模块怎么用

Node.js 流的类型

可读流

可写流

双工流

转换流

从可读的 Node.js 流读取数据

1. 监听 `data` 事件

2. 使用异步迭代器

可读 Node.js 流的状态

通过 Node.js 流处理大量数据

使用 `pipeline()` 减少 APP 的内存占用

对流使用 `pipeline()` 和 `pipe()` 的对比

总结：使用 Node.js 流降低内存并提高性能

本篇文章演示代码以及资料文档资料下载

Node.js Redis vs. Node.js：数据库性能优化秘籍

Node.js Redis 与 Node.js 的性能迷思，一文揭晓

Redis 与 Node.js 的完美结合，打造极速应用

Node.js Redis vs. Node.js：性能提升的最佳途径

Node.js Redis 与 Node.js 实战指南，让你大开眼界

Node.js Redis vs. Node.js：缓存江湖中的风云对决

Redis 与 Node.js 的完美邂逅，解锁数据存储新境界

Node.js Redis vs. Node.js：深入剖析缓存技术

Node.js Redis 与 Node.js：谁是性能之王？

Redis 在 Node.js 中的妙用，助你轻松提升性能

利用nvm管理多个版本的node.js与npm详解

Node.js中使用socket创建私聊和公聊聊天室

node.js回调函数之阻塞调用与非阻塞调用

node.js抓取并分析网页内容有无特殊内容的js文件

Node.js巧妙实现Web应用代码热更新

Node.js 中使用 async 函数的方法

Node.js重新刷新session过期时间的方法

实例详解Nodejs 保存 payload 发送过来的文件

Nodejs express框架一个工程中同时使用ejs模版和jade模版

深入浅析NodeJs并发异步的回调处理

Node.js中stream模块怎么用

Node.js 流的类型

可读流

可写流

双工流

转换流

从可读的 Node.js 流读取数据

1. 监听 data 事件

2. 使用异步迭代器

可读 Node.js 流的状态

通过 Node.js 流处理大量数据

使用 pipeline() 减少 APP 的内存占用

对流使用 pipeline() 和 pipe() 的对比

总结：使用 Node.js 流降低内存并提高性能

本篇文章演示代码以及资料文档资料下载

1. 监听 `data` 事件

使用 `pipeline()` 减少 APP 的内存占用

对流使用 `pipeline()` 和 `pipe()` 的对比