首页 > 资讯 > 服务器 >如何用C写一个web服务器之I/O多路复用

271

分享到

如何用C写一个web服务器之I/O多路复用

2024-04-02 19:04:59 271人浏览独家记忆

摘要

目录前言I/O模型select/poll/epollepoll介绍epoll_createepoll_ctlepoll_waitepoll行为代码实现整体处理逻辑设置epoll ET

前言

I/O模型

接触过 Socket 编程的同学应该都知道一些 I/O 模型的概念，linux 中有阻塞 I/O、非阻塞 I/O、I/O 多路复用、信号驱动 I/O 和异步 I/O 五种模型。

其他模型的具体概念这里不多介绍，只简单地提一下自己理解的 I/O 多路复用：简单的说就是由一个进程来管理多个 socket，即将多个 socket 放入一个表中，在其中有 socket 可操作时，通知进程来处理， I/O 多路复用的实现方式有 select、poll 和 epoll。

select/poll/epoll

在 linux下，通过文件描述符（file descriptor, 下 fd）来进行 socket 的操作，所以下文均是对 fd 操作。

首先说最开始实现的 select 的问题：

select 打开的 fd 最大数目有限制，一般为1024，在当前计算系统的并发量前显然有点不适用了。
select 在收到有 fd 可操作的通知时，是无法得知具体是哪个 fd 的，需要线性扫描 fd 表，效率较低。
当有 fd 可操作时，fd 会将 fd 表复制到内核来遍历，消耗也较大。

随着网络技术的发展，出现了 poll：poll 相对于 select，使用 pollfd 表（链表实现）来代替 fd，它没有上限，但受系统内存的限制，它同样使用 fd 遍历的方式，在并发高时效率仍然是一个问题。

最终，epoll 在 Linux 2.6 的内核面世，它使用事件机制，在每一个 fd 上添加事件，当fd 的事件被触发时，会调用回调函数来处理对应的事件，epoll 的优势总之如下：

只关心活跃的 fd，精确定位，改变了poll的时间效率 O(n) 到 O(1);
fd 数量限制是系统能打开的最大文件数，会受系统内存和每个 fd 消耗内存的影响，以当前的系统硬件配置，并发数量绝对不是问题。
内核使用内存映射，大量 fd 向内核态的传输不再是问题。

为了一步到位，也是为了学习最先进的I/O多路复用模型，直接使用了 epoll 机制，接下来介绍一下 epoll 相关基础和自己服务器的实现过程。

epoll介绍

epoll 需要引入<sys/epoll.h>文件，首先介绍一下 epoll 系列函数：

epoll_create

int epoll_create(int size);

创建一个 epoll 实例，返回一个指向此 epoll 实例的文件描述符，当 epoll 实例不再使用时，需要使用close()方法来关闭它。

在最初的实现中， size 作为期望打开的最大 fd 数传入，以便系统分配足够大的空间。在最新版本的内核中，系统内核动态分配内存，已不再需要此参数了，但为了避免程序运行在旧内核中会有问题，还是要求此值必须大于0；

epoll_ctl

int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);

epfd 是通过 epoll_create 返回的文件描述符
op 则是文件描述符监听事件的操作方式，EPOLL_CTL_ADD/EPOLL_CTL_MOD/EPOLL_CTL_DEL 分别表示添加、修改和删除一个监听事件。
fd 为要监听的文件描述符。
event 为要监听的事件，可选事件和行为会在下面描述

它的结构如下：


typedef uNIOn epoll_data {
   void        *ptr;
   int          fd;
   uint32_t     u32;
   uint64_t     u64;
} epoll_data_t;

struct epoll_event {
   uint32_t     events;      
   epoll_data_t data;        
};

epoll_wait

int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout); 监听 epoll 事件：

events 是 epoll 事件数组，epoll 事件的结构上面已经介绍过。
maxevents 是一次监听获取到的最大事件数目。
timeout 是一次监听中获取不到事件的最长等待时间，设置成 -1 会一直阻塞等待，0 则会立即返回。

epoll行为

在 epoll_ctl 的 event 参数中，事件 events 有如下可选项：

EPOLLIN（可读）、EPOLLOUT（可写）、EPOLLRDHUP（连接关闭）、EPOLLPRI（紧急数据可读），此外 EPOLLERR（错误），EPOLLHUP（连接挂断）事件会被 epoll 默认一直监听。

除了设置事件外，还可以对监听的行为设置：

level trigger：此行为被 epoll 默认支持，不必设置。在 epoll_wait 得到一个事件时，如果应用程序不处理此事件，在 level trigger 模式下，epoll_wait 会持续触发此事件，直到事件被程序处理；
EPOLLET(edge trigger)：在 edge trigger 模式下，事件只会被 epoll_wait 触发一次，如果用户不处理此事件，不会在下次 epoll_wait 再次触发。在处理得当的情况下，此模式无疑是高效的。需要注意的是此模式需求 socket 处理非阻塞模式，下面会实现此模式。
EPOLLONESHOT：在单次命中模式下，对同一个文件描述符来说，同类型的事件只会被触发一次，若想重复触发，需要重新给文件描述符注册事件。
EPOLLWAKEUP：3.5版本加入，如果设置了单次命中和ET模式，而且进程有休眠唤醒能力，当事件被挂起和处理时，此选项确保系统不进入暂停或休眠状态。事件被 epoll_wait 调起后，直到下次 epoll_wait 再次调起此事件、文件描述符被关闭，事件被注销或修改，都会被认为是处于处理中状态。
EPOLLEXCLUSIVE：4.5版本加入，为一个关联到目标文件描述符的 epoll 句柄设置独占唤醒模式。如果目标文件描述符被关联到多个 epoll 句柄，当有唤醒事件发生时，默认所有 epoll 句柄都会被唤醒。而都设置此标识后，epoll 句柄之一被唤醒,以避免“惊群”现象。

当监听事件和行为需求同时设置时，使用运算符 |即可。

代码实现

整体处理逻辑

使用 epoll 时的服务器受理客户端请求逻辑如下：

1.创建服务器 socket，注册服务器 socket 读事件；

2.客户端连接服务器，触发服务器 socket 可读，服务器创建客户端 socket，注册客户端socket 读事件；

3.客户端发送数据，触发客户端 socket 可读，服务器读取客户端信息，将响应写入 socket；

4.客户端关闭连接，触发客户端 socket 可读，服务器读取客户端信息为空，注销客户端 socket 读事件；


erver_fd = server_start();
epoll_fd = epoll_create(FD_SIZE);
epoll_reGISter(epoll_fd, server_fd, EPOLLIN|EPOLLET);// 这里注册socketEPOLL事件为ET模式

while (1) {
    event_num = epoll_wait(epoll_fd, events, MAX_EVENTS, 0);
    for (i = 0; i < event_num; i++) {
        fd = events[i].data.fd;
        // 如果是服务器socket可读，则处理连接请求
        if ((fd == server_fd) && (events[i].events == EPOLLIN)){
            accept_client(server_fd, epoll_fd);
        // 如果是客户端socket可读，则获取请求信息，响应客户端
        } else if (events[i].events == EPOLLIN){
            deal_client(fd, epoll_fd);
        } else if (events[i].events == EPOLLOUT)
            // todo 数据过大，缓冲区不足的情况待处理
            continue;
    }
}

需要注意的是，客户端socket在可读之后也是立刻可写的，我这里直接读取一次请求，然后将响应信息 write 进去，没有考虑读数据时缓冲区满的问题。

这里提出的解决方案为：

1.设置一个客户端 socket 和 buffer 的哈希表；

2.在读入一次信息缓冲区满时 recv 会返回 EAGIN 错误，这时将数据放入 buffer，暂时不响应。

3.后续读事件中读取到数据尾后，再注册 socket 可写事件。

4.在处理可写事件时，读取 buffer 内的全部请求内容，处理完毕后响应给客户端。

5.最后注销 socket 写事件。

设置epoll ET（edge trigger）模式

上文说过，ET模式是 epoll 的高效模式，事件只会通知一次，但处理良好的情况下会更适用于高并发。它需要 socket 在非阻塞模式下才可用，这里我们实现它。


sock_fd = socket(AF_INET, SOCK_STREAM, 0);

// 获取服务器socket的设置，并添加"不阻塞"选项
flags = fcntl(sock_fd, F_GETFL, 0);
fcntl(sock_fd, F_SETFL, flags|O_NONBLOCK);

.....
// 这里注册服务器socket EPOLL事件为ET模式
epoll_register(epoll_fd, server_fd, EPOLLIN|EPOLLET);

我将处理事件注掉后使用一次客户端连接请求进行了测试，很清晰地说明了 ET模式下，事件只触发一次的现象，前后对比图如下：

小结

Mac OS X 操作系统的某些部分是基于 FreeBSD 的，FreeBSD 不支持，MAC 也不支持（不过有相似的 kqueue），跑到开发机上开发的，作为一个最基础的 C learner, 靠着printf()和fflush()两个函数来调试的，不过搞了很久总算是完成了，有用 C 的前辈推荐一下调试方式就最好了

以上就是如何用C写一个WEB服务器之I/O多路复用的详细内容，更多关于用C写一个web服务器之I/O多路复用的资料请关注编程网其它相关文章！

点击免费下载>>软考高级考试备考技巧/历年真题/备考精华资料

--结束END--

本文标题: 如何用C写一个web服务器之I/O多路复用

本文链接: https://www.lsjlt.com/news/126925.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑，方便收藏和打印～

下载Word文档

去做题

猜你喜欢

空间子目录怎么绑定域名

空间子目录怎么绑定域名？子目录和子域名都是为你的网站添加更多内容的有效途径。它们可以改善你的网站结构，提高 SEO 效果，增强用户体验。下面将介绍一下，空间子目录绑定域名的大致过程。什么是子目录和子域名？ – 子目录跟文件夹...

99+

2024-05-14

空间子目录空间子目录怎么绑定域名虚拟主机知识
空间域名有了如何上传网页

空间域名有了如何上传网页？使用空间域名创建网站涉及很多步骤，当已经购买了空间域名后，还需要将网页程序上传到空间上。上传网页程序的步骤可能略有不同，具体取决于具体的空间提供商，可以参考他们提供的操作指南。 1、建立网站先需要创建你的网页。...

99+

2024-05-14

空间域名空间域名有了如何上传网页虚拟主机知识
空间域名如何绑定子目录

空间域名如何绑定子目录？在网站建设和运营中，我们经常需要将空间域名绑定到网站的子目录上，以实现某些特定的功能，比如创建二级或者子网站。以下是如何实现这一目标的步骤： 1、购买并设置域名先需要购买一个域名。这可以在西部数码等域名服务提供商...

99+

2024-05-14

空间域名空间域名如何绑定子目录域名知识
空间域名续费怎么缴费

空间域名续费怎么缴费？空间域名是互联网上每个网站的独特标识，通常每年需要进行续费，以保持其有效性。如果你拥有一个或多个空间域名，而不清楚如何进行续费，下面将为解释如何完成这个过程。因域名空间提供商不同而操作可能有会差异。 1、登录空间域名...

99+

2024-05-14

空间域名续费空间域名续费怎么缴费域名知识
租个云服务器的步骤

随着云计算技术的发展，云服务器已受到广大用户的认可和应用。租个云服务器来部署应用程序或网站，是当下众多用户的需求。下面介绍一下，租个云服务器的步骤： 1. 需求分析：先要明确自己需要云服务器的目的，是用来做网站主机、游戏服务器、数据存储还...

99+

2024-05-14

租个云服务器的步骤租云服务器租用云服务器云服务器知识
租用云服务器的几大优势

租用云服务器的几大优势是什么？当今的技术领域，云计算已经成为一种主流的 IT 解决方案，而云服务器作为云计算的一个重要部分，也受到了越来越多的关注和认可。租用云服务器有许多优势，下面就来详细探讨一下。 1.灵活性和扩展性：云服务器的一大优...

99+

2024-05-14

云服务器优势租用云服务器租用云服务器的几大优势云服务器知识
租云服务器可以建内网吗

租云服务器可以建内网吗？云计算技术的发展和应用已经深入到各行各业，其中，云服务器的使用频率极高。云服务器被广泛应用的一个重要原因是其弹性和可扩展性。然而，有些用户可能会有这样的疑问，能不能用租用的云服务器建立内网呢？答案是肯定的。先要明...

99+

2024-05-14

云服务器内网租云服务器租云服务器可以建内网吗云服务器知识
云服务器到期会立马被收回么

云服务器到期会立马被收回么？当使用云服务器服务时，一般都是按照一定的使用期限进行购买与使用，例如一个月、半年、一年或两年等等。这个使用期限到期后，云服务器会怎样处理？通常云服务器到期后不会立马被收回。因为云服务器提供商一般都有提供一定时...

99+

2024-05-14

云服务器到期云服务器到期会立马被收回么云服务器续费云服务器知识
做企业站选什么样的云服务器

做企业站选什么样的云服务器？在构建企业网站时，选择正确的云服务器是一项至关重要的任务。这不仅对网站的性能有着巨大影响，也直接决定了企业服务能力和客户体验。应该参考哪些因素来选取适合的云服务器呢？以下是一些关键的考虑因素。 1. 可靠性：一...

99+

2024-05-14

企业站云服务器企业网站云服务器做企业站选什么样的云服务器云服务器知识
使用云主机时，如果发生误操作删除系统数据怎么办

使用云主机时，如果发生误操作删除系统数据怎么办？在数字化时代，云主机已经成为了储存和管理数据的关键工具之一。然而，误操作删除云主机上的系统数据的情况偶尔也会发生。下面来探讨一下在使用云主机时，如果发生误操作删除系统数据，应该如何应对。 1...

99+

2024-05-14

云主机数据恢复使用云主机时，如果发生误操作删除系统数据怎么办云服务器知识