首页 > 资讯 > 操作系统 >【Linux】基础IO —— 缓冲区深度剖析

940

分享到

【Linux】基础IO —— 缓冲区深度剖析

linux unix 服务器 2023-08-31 08:08:14 940人浏览独家记忆

摘要

🌈欢迎来到linux专栏~~基础io

🌈欢迎来到linux专栏~~基础io

(꒪ꇴ꒪(꒪ꇴ꒪ )🐣,我是Scort
目前状态：大三非科班啃c++中
🌍博客主页：张小姐的猫~江湖背景
快上车🚘，握好方向盘跟我有一起打天下嘞！
送给自己的一句鸡汤🤔：
🔥真正的大师永远怀着一颗学徒的心
作者水平很有限，如果发现错误，可在评论区指正，感谢🙏
🎉🎉欢迎持续关注！

请添加图片描述

请添加图片描述

一. 缓冲区

在这里插入图片描述

🌈缓冲区是什么

💦缓冲区 (buffer)，它是内存空间的一部分。也就是说，在内存空间中预留了一定的存储空间，这些存储空间用来缓冲输入或输出的数据，这部分预留的空间就叫做缓冲区，显然缓冲区是具有一定大小的

🌈为什么要引入缓冲器

高速设备与低速设备的不匹配（cpu运算是纳秒，内存是微秒，磁盘是毫秒甚至是秒相差1000倍），势必会让高速设备花时间等待低速设备，我们可以在这两者之间设立一个缓冲区

💥举个例子：（顺丰就是缓冲区）

在这里插入图片描述

可以解除两者的制约关系，数据可以直接送往缓冲区，高速设备不用再等待低速设备，提高了计算机的效率
可以减少数据的读写次数，如果每次数据只传输一点数据，就需要传送很多次，这样会浪费很多时间，因为开始读写与终止读写所需要的时间很长，如果将数据送往缓冲区，待缓冲区满后再进行传送会大大减少读写次数，这样就可以节省很多时间。例如：我们想将数据写入到磁盘中，不是立马将数据写到磁盘中，而是先输入缓冲区中，当缓冲区满了以后，再将数据写入到磁盘中，这样就可以减少磁盘的读写次数，不然磁盘很容易坏掉

总的来说：

🌈缓冲区的初步认识

⚡缓冲区刷新策略！（一般+特殊）

立即刷新
行刷新（行缓冲） \n
满刷新（全缓冲）
特殊情况：用户强制刷新（fflush）、进程退出（必须刷新）

一般而言，行缓冲的设备文件 —— 显示器
全缓冲的设备文件 —— 磁盘文件

💦所以的设备，永远都倾向于全缓冲！（倾向于，但不绝对） —— 缓冲区满了，才刷新 —— 需要更少次的IO操作 —— 也就是更少次的外设访问（1次IO vs 10次IO）—— 也就可以提高效率

🌈其他刷新策略是结合具体情况做的妥协！

显示器：直接给用户看的，一方面要照顾效率，一方面要照顾用户的体验（极端情况，可以自定义规则的）
磁盘文件：用户不需要立马看见文件的内容，可以把缓冲区写满再输出，更加注重效率的考量

我们可能有疑问：1000个字节，刷一次是1000个字节，刷十次整体也是1000个字节，哪里效率高呢❓

👍和外设进行沟通IO的时候，数据量的大小不是主要矛盾，和外设预备IO的过程才是最耗费时间的

好比：别人找你借钱，每一次都来找你唠嗑大半天，分开十次，沟通的时间花的很久，而转账的时间就几秒钟，一次沟通直接把钱全转过去了，才是效率最高的

🌈解疑答惑

在这里插入图片描述

同样的一个程序，向显示器打印输出4行文本，向普通文件（磁盘上）打印的时候，变成了7行，说明上面测试，并不影响系统接口

C的IO接口是打印了2次的
系统接口，只打印了一次

我们最后调用fork，上面的函数已经被执行完了，但不代表数据已经被刷新了

🥑缓冲区是谁提供的

🔥曾经“我们所谈的缓冲区”，绝对不是由OS提供的，如果是OS同一提供，那么我们上面的代码，表现应该是一样的，而不是C的IO接口打印两次，所以是C标准库提供并且维护的用户级缓冲区

fputs把不是直接把数据直接放进操作系统，而是加载进C标准库的缓冲区中，加载完后自己可以直接返回；如果直接调用的是write接口，则是直接写给OS，不经过缓冲区

在这里插入图片描述

C语言提供的接口都是向显示器打印的，刷新策略都是行刷新，那么最后执行fork的时候 —— 一定是函数执行完了 && 数据已经被刷新了（因为都带\n）,所以fork执行无意义
如你对应的程序进行了重定向 ——> 要向磁盘文件打印 ——> 隐形的刷新策略变成了全缓冲！—— > \n便没有意义了 ——> 函数一定执行完了，数据还没有刷新！！在当前进程对应的C标准库中的缓冲区中！！

这缓冲区的部分数据是父进程的数据吗？是的
fork之后，父子分流，父进程的数据发生写时拷贝给子进程，所以C标准库会打印两次

在这里插入图片描述

总结：

重定向到文件导致：刷新策略改变（变成全缓冲）
写时拷贝：父子进程各自刷新一次

🥑用户级缓冲区在哪里？

当我们用fflush强制刷新的时候

#include#include#includeint main(){ //C语言提供的    printf("hello printf\n");    fprintf(stdout, "hello fprintf\n");    const char *s = "hello fputs\n";    fputs(s, stdout);    //OS提供的    const char *ss = "hello write\n";    write(1, ss, strlen(ss));        //fork之前，强制刷新    fflush(stdout);        //最后调用fork的时候，上面的函数已经被执行完了    fork();//创建子进程                  return 0;}

结果如下：

在这里插入图片描述

数据在fork之前，已经被fflush刷新了，缓冲区里没有数据了，也就不存在写时拷贝。

这里更夸张的是，fflush（stdout）只告诉了stdout就能知道缓冲区在哪里？

FILE *fopen(const char *path, const char *mode);

C语言中，open打开文件，返回的是FILE * ，struct FILE结构体 — 内部封装了fd，还包含了该文件fd对应的语言层的缓冲区结构！（远在天边，近在眼前）

我们可以看看FILE结构体：

//在/usr/include/libio.hstruct _IO_FILE { int _flags; #define _IO_file_flags _flags //缓冲区相关   char* _IO_read_ptr;  char* _IO_read_end;  char* _IO_read_base;  char* _IO_write_base;      char* _IO_write_ptr;   char* _IO_write_end;  char* _IO_buf_base;  char* _IO_buf_end;   char *_IO_save_base;  char *_IO_backup_base;  char *_IO_save_end;  struct _IO_marker *_markers; struct _IO_FILE *_chain; int _fileno; //封装的文件描述符#if 0 int _blksize;#else int _flags2;#endif _IO_off_t _old_offset; #define __HAVE_COLUMN   unsigned short _cur_column; signed char _vtable_offset; char _shortbuf[1];  _IO_lock_t *_lock;#ifdef _IO_USE_OLD_IO_FILE};

所以在C语言上，进行写入的时候放进缓冲区，定期刷新

C语言打开的FILE是文件流。C++中的cout 是类；里面必定包含了 fd、buffer（缓冲区）

🌏设计用户层缓冲区的代码 ~ 实战

💢`struct file`的设计

在这里插入图片描述

struct MyFILE_{                    int fd;            //文件描述符 char buffer[1024]; //缓冲区 int end;           //当前缓冲区的结尾};

💢主函数

open文件 —— fputs输入 —— fclose关闭，接口函数都要我们逐一实现

int main(){MyFILE *fp = fopen_("./log.txt", "r");if(fp = NULL){  printf("open file error"); return 0;} fputs_("hello world error", fp); fclose_(fp);}

我们发现：C语言的接口一旦打开成功，全部都要带上FILE*结构，原因很简单，因为什么数据都在这个FILE结构体中

FILE *fopen(const char *path, const char *mode);//以下全是要带FILE*int fputc(int c, FILE *stream);int fclose(FILE *fp);size_t fread(void *ptr, size_t size, size_t nmemb, FILE *stream);

💢接口实现

💦fputs

在这里插入图片描述

    //此处刷新策略还没定   全部放进缓冲区    void fputs_(const char *message, MyFILE *fp)         {                          assert(message);         assert(fp);           strcpy(fp->buffer + fp->end, message);//abcde\0      fp->end += strlen(message);          }

运行结果：
在这里插入图片描述

上面覆盖了\0，strcpy会在结尾时候自动添加\0

若要往显示器上打印：变成行刷新

    if(fp->fd == 0)    {        //标准输入    }    else if(fp->fd == 1)    {        //标准输出        if(fp->buffer[fp->end-1] =='\n' )        {            //fprintf(stderr, "fflush: %s", fp->buffer); //2            write(fp->fd, fp->buffer, fp->end);            fp->end = 0;        }    }    else if(fp->fd == 2)    {        //标准错误    }    else    {        //其他文件    }}

测试用例：

fputs_("one:hello world error", fp);fputs_("two:hello world error\n", fp);fputs_("three:hello world error", fp);fputs_("four:hello world error\n", fp);

结果：当遇到\n，才刷新
在这里插入图片描述

💦fflush刷新
当end！=0 ，就刷新进内核
内核刷新进外设，这就要用一个函数syncfs

#include //将缓冲区缓存提交到磁盘int syncfs(int fd);

具体实现：

    void fflush(MyFILE *fp)                      {                  assert(fp);      if(fp->end != 0) {                  //暂且认为刷新了 ——其实是把数据写到  内核        write(fp->fd, fp->buffer, fp->end);          syncfs(fp->fd); //将数据写入到磁盘                                 fp->end = 0;      }                      }

💦fclose
关闭之前要先刷新

  void fclose(MyFILE *fp)  {    assert(fp);    fflush(fp);close(fp->fd);    free(fp);  }

💢附源码

#include #include #include #include #include #include #include #include #define NUM 1024struct MyFILE_{    int fd;             //文件描述符    char buffer[1024];  // 缓冲区    int end;            //当前缓冲区的结尾};typedef struct MyFILE_ MyFILE;//类型重命名MyFILE *fopen_(const char *pathname, const char *mode){    assert(pathname);    assert(mode);    MyFILE *fp = NULL;//什么也没做，最后返回NULL    if(strcmp(mode, "r") == 0)    {    }    else if(strcmp(mode, "r+") == 0)    {    }    else if(strcmp(mode, "w") == 0)    {        int fd = open(pathname, O_WRONLY | O_TRUNC | O_CREAT, 0666);        if(fd >= 0)        {            fp = (MyFILE*)malloc(sizeof(MyFILE));            memset(fp, 0, sizeof(MyFILE));            fp->fd = fd;        }    }    else if(strcmp(mode, "w+") == 0)    {    }    else if(strcmp(mode, "a") == 0)    {    }    else if(strcmp(mode, "a+") == 0)    {    }    else{        //什么都不做    }    return fp;}//是不是应该是C标准库中的实现！void fputs_(const char *message, MyFILE *fp){    assert(message);    assert(fp);    strcpy(fp->buffer+fp->end, message); //abcde\0    fp->end += strlen(message);    //for debug    printf("%s\n", fp->buffer);    //暂时没有刷新, 刷新策略是谁来执行的呢？用户通过执行C标准库中的代码逻辑，来完成刷新动作    //这里效率提高，体现在哪里呢？？因为C提供了缓冲区，那么我们就通过策略，减少了IO的执行次数(不是数据量)    if(fp->fd == 0)    {        //标准输入    }    else if(fp->fd == 1)    {        //标准输出        if(fp->buffer[fp->end-1] =='\n' )        {            //fprintf(stderr, "fflush: %s", fp->buffer); //2            write(fp->fd, fp->buffer, fp->end);            fp->end = 0;        }    }    else if(fp->fd == 2)    {        //标准错误    }    else    {        //其他文件    }}void fflush_(MyFILE *fp){    assert(fp);    if(fp->end != 0)    {        //暂且认为刷新了--其实是把数据写到了内核        write(fp->fd, fp->buffer, fp->end);        syncfs(fp->fd); //将数据写入到磁盘        fp->end = 0;    }}void fclose_(MyFILE *fp){    assert(fp);    fflush_(fp);    close(fp->fd);    free(fp);}int main() {     close(1); MyFILE *fp = fopen_("./log.txt", "w");     if(fp == NULL)     {       printf("open file error");       return 1;     }        fputs_("one:hello world error", fp);     fputs_("two:hello world error", fp);     fputs_("three:hello world error", fp);     fputs_("four:hello world error", fp);     fclose(fp);   }

📢写在最后

但行好事，莫问前程

请添加图片描述

来源地址：https://blog.csdn.net/qq_42996461/article/details/127859569

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: 【Linux】基础IO —— 缓冲区深度剖析

本文链接: https://www.lsjlt.com/news/384888.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

【Linux】基础IO —— 缓冲区深度剖析

🌈欢迎来到Linux专栏~~基础IO ...

99+

2023-08-31

linux unix 服务器
【Linux】基础IO --- 内核级和用户级缓冲区、磁盘结构、磁盘的分治管理、block group块组剖析…

出身寒微，不是耻辱。能屈能伸，方为丈夫。文章目录一、缓冲区（语言级：IO流缓冲，内核级：块缓冲）1.观察一个现象2.理解缓冲区存在的意义（节省进程IO数据的时间）3.语言级缓冲区的刷新策略（三种策略，两种特殊情况）4.语言级缓...

99+

2023-08-18

linux 运维服务器
【Linux】基础IO —— 深入理解文件系统 | 软硬链接

🌈欢迎来到Linux专栏~~ 深入理解文件系统 ...

99+

2023-09-11

linux 运维服务器
Spring Boot 底层原理基础深度解析

目录1. 底层注解@Configuration2. 底层注解@Import3. 底层注解@Conditional1. 底层注解@Configuration @Configuratio...

99+

2024-04-02
如何分析Linux分区基础

这篇文章将为大家详细讲解有关如何分析Linux分区基础，文章内容质量较高，因此小编分享给大家做个参考，希望大家阅读完这篇文章后对相关知识有一定的了解。Linux分区在初学Linux时可能会因为windows的影响而搞得很迷惑，因为windo...

99+

2023-06-16
【Linux】基础IO（二）--- 理解内核级和用户级缓冲区、磁盘与ext系列文件系统、inode与软硬连接

🍎作者：阿润菜菜 📖专栏：Linux系统编程这是目录理解缓冲区1.观察调用C库接口的现象2.理解缓冲区存在的意义（节省进程IO数据的时间）3.调用系统接口对文件进行封装 --- 模仿C库设...

99+

2023-08-18

linux 运维服务器
怎么深度剖析JDK和JRE以及JVM三者的区别

本篇文章为大家展示了怎么深度剖析JDK和JRE以及JVM三者的区别，内容简明扼要并且容易理解，绝对能使你眼前一亮，通过这篇文章的详细介绍希望你能有所收获。你对jdk,jre,jvm三者的区别和联系是否了解，这里和大家分享一下， j2sdk(...

99+

2023-06-17
基于统计的预警：同环比预警实现深度剖析

一、UAV预警功能简介UAV.Monitor提供了对全维监控指标的预警功能，各类型的监控指标均可配置预警策略，当预警策略被触发后，可通过邮件、HTTP调用等方式进行通知报警，并会根据预警时间频率等对报警动作进行压制。预警分为流式预警、统计预...

99+

2023-06-04
深入剖析Python数据类型：从基础类型到复杂类型

Python数据类型全解析：从基本类型到复合类型，需要具体代码示例概述：在Python编程中，数据类型是非常重要的概念。Python提供了丰富的数据类型，包括基本类型和复合类型。本文将对Python的数据类型进行全面解析，讲解...

99+

2024-01-20

基本类型复合类型
【看表情包学Linux】缓冲区的概念 | Git 三板斧 | 实现简易进度条

爆笑教程，只送有缘人 👉 《看表情包学Linux》 💭 写在前面：本章我们先对缓冲区的概念进行一个详细的探究，之后会带着大家一步步去编写一个简陋的 "进度条" 小程序，过程还是挺有意思的，虽然实现的过...

99+

2023-09-07

linux 运维服务器 git
PHP 安全性深度解析：从基础到进阶，打造铜墙铁壁

输入过滤和验证：对用户输入的数据进行过滤和验证，防止恶意代码注入。使用安全函数：使用 PHP 内置的安全函数，如 htmlspecialchars()、addslashes() 等，防止跨站点脚本攻击 (XSS) 和 SQL 注...

99+

2024-02-05

基础安全防护