Linux网络:多路转接 select
select
是最早的多路转接方式,它允许用户同时监听多个文件的状态变化,当一个或多个文件状态发生变化,select
就会通知用户。
看似这是对文件的管理,实际上更多用于网络,因为Linux
中网络是当作文件管理的,用户操作每个socket
都是通过操作文件描述符fd
。因此select
更多的是对网络的IO
进行处理,用于同时监听多个网络套接字。
系统调用
Linux
提供的系统调用函数就叫做select
,需要包含头文件<sys/select.h>
,函数声明如下:
int select(int nfds,
fd_set *_Nullable restrict readfds,
fd_set *_Nullable restrict writefds,
fd_set *_Nullable restrict exceptfds,
struct timeval *_Nullable restrict timeout);
此处引入了两个新的类型fd_set
和struct timeval
,它们是select
所需的配置项。
fd_set
表示一个文件描述符的集合
,定义如下:
typedef struct {
unsigned long fds_bits[__FDSET_LONGS];
} __kernel_fd_set;
这个结构体内部,存储了一个unsigned long
的数组,其实这是一张位图,位图的大小由__FDSET_LONGS
这个宏决定。可以把多个文件的描述符fd
添加到这张位图中,就可以形成一个文件描述符的集合。
struct timeval
表示一个时间,它用于设定select
的返回时间,定义如下:
struct timeval{
time_t tv_sec;
susseconds_t tu_usec;
};
这个结构体的第一个变量tv_sec
指定秒数,第二个变量tu_usec
指定微秒数,两个数值结合,就得到一个指定的时间段。
简单了解了这两个结构体的功能后,再看看select
的五个参数:
nfds
:监听的所有文件描述符中,最大的描述符的值+1
readfds
:文件描述符集指针,可以为NULL
,集合内包含要监听读事件的文件writefds
:文件描述符集指针,可以为NULL
,集合内存包含要监听写事件的文件exceptfds
:文件描述符集指针,可以为NULL
,集合内包含要监听异常事件的文件timeout
:指向struct timeval
的指针,表示这个select
的超时时间NULL
:传入空指针,如果没有文件就绪,就一直阻塞等待非空指针
:如果等待指定的时间,还没有文件就绪,直接返回
再解释一下三个文件描述符集合的事件:
读事件
:这个文件内有数据到来了,可以进行读取写事件
:这个文件内有空位置了,可以进行写入异常事件
:这个文件发生了异常,需要进行异常处理
在网络的IO
模型中,最常用的就是readfds
读事件,因为不确定网络报文何时到达,也就是文件内何时有数据,此时就可以让select
代管。当select
检测到某一个网络文件内有数据到来了,本质就是有网络报文到达,就会触发读事件
,表示这个文件内有数据可读了。
文件描述符集合fd_set
不能直接操作,操作系统提供了四个函数专门操作fd_set
:
// 把 fd 从 fd_set 中移除
void FD_CLR(int fd, fd_set *set);
// 把 fd 添加到 fd_set 中
void FD_SET(int fd, fd_set *set);
// 检测 fd 是否在 fd_set 中
int FD_ISSET(int fd, fd_set *set);
// 把 fd_set 清空
void FD_ZERO(fd_set *set);
刚刚提到,fd_set
本质是一个位图,它的大小由__FDSET_LONGS
控制。而这个宏由操作系统维护,如果想要修改,需要重新编译内核,非常麻烦。所以select
有一个重要的特性:
select
能够同时监听的文件描述符fd
是有上限的。
这其实是select
的一个缺点,但是也不算很大的缺点。
另一个缺点才是最麻烦的:
每次
select
返回,三张fd_set
集合全部都会被重新设置
在select
中,三个fd_set
传入的都是指针,这其实是一个输入输出型参数
,输入时fd_set
存储要监听事件的文件描述符,而返回时,三个fd_set
都会被重新设置,表示这次调用select
触发事件的文件描述符。
比如说一开始准备监听读事件,在readfds
中设置五个文件描述符:
5 6 7 8 9
假设7
和8
中有网络报文到达,当select
返回时readfds
内的文件描述符变成:
7 8
这说明7
和8
这两个文件描述符对应的网络套接字有数据到达了。这个过程可以反映出两个事情:
- 每次
select
返回,都会清空没有触发事件的描述符,下一次调用select
要把所有文件描述符重新设置一遍 - 用户等到
select
返回后,要遍历整个fd_set
才知道哪些文件描述符就绪了
除此之外timeval
也是一个输入输出型参数
,它的返回值表示剩余的时间。一个select
不一定等到timeval
设置的事件结束才返回,有可能某些文件就绪就提前返回了,此时timeval
会被设置成剩余时间。
最后select
本身还有一个int
的返回值,这表示本次select
中,有多少个文件描述符就绪了。
总结一下select
的四个返回值:
函数返回值
:表示本次调用select
有几个文件就绪readfds
:读事件就绪的文件描述符集合writefds
:写事件就绪的文件描述符集合exceptfds
:异常事件就绪的文件描述符集合timeout
:返回时的剩余时间
echo server
接下来使用select
系统调用,实现一个简单的echo server
。
总代码地址:[多路转接Select-EchoServer]
SelectServer类
首先是一个错误类型的枚举,它用于在遇到错误时进行简单的报错。
enum
{
SOCKET_ERROR = 1, // 套接字错误
BIND_ERROR, // 绑定错误
ACCEPT_ERROR, // 接收连接错误
SELECT_ERROR // 多路转接错误
};
SelectServer
类结构如下:
class SelectServer
{
static const int MAX_SZ = sizeof(fd_set) * 8; // select可以监听的最大文件描述符数量
public:
SelectServer(uint16_t port); // 构造函数
void start() // 开启网络服务
private:
void handlerEvent(fd_set& fds); // 事件派发
void acceptClient(); // 接收客户端连接
void serviceIO(int pos); // 处理客户端数据
private:
int _listenfd; // 监听套接字
std::vector<int> _sockfds; // 客户端套接字数组
};
在SelectSerer
类中,包含两个成员变量:
_listenfd
:TCP
的监听套接字的文件描述符,用于监听到来的客户端连接_sockfds
:套接字文件描述符数组,表示当前建立连接的客户端的文件描述符
除此之外,还维护了一个常量MAX_SZ
,这是select
可以监听的套接字的最大数量。sizeof(fd_set)
是fd_set
的字节数,每个字节8 bit
,所以MAX_SZ = sizeof(fd_set) * 8
。
构造函数:
SelectServer(uint16_t port); // 构造函数
构造函数接收一个端口号,表示这个服务监听的端口。
开启服务:
void start() // 开启网络服务
这个函数用于进行死循环,每一轮循环进行一次select
的调用,监听所有套接字,并处理数据。
事件派发:
void handlerEvent(fd_set& fds); // 派发事件
这个函数用于进行事件派发,接受一个fd_set
,因为套接字包含两种类型:listensockfd
用于接收客户端连接,以及一般的客户端套接字sockfd
用于完成echo server
。这需要两个不同的函数进行处理。
事件处理:
void acceptClient(); // 接收客户端连接
void serviceIO(int pos); // 处理客户端数据
刚刚提到不同套接字处理事件的方式不同,此处两个函数分别用用于处理不同的事件。acceptClient
用于接收客户端连接,而serviceIO
用于与客户端通信,serviceIO
接受一个参数pos
,表示客户端的套接字在_sockfds
数组的下标。
构造函数
构造函数代码如下:
SelectServer(uint16_t port)
: _sockfds(MAX_SZ, -1) // 初始化_sockfds
{
// 创建套接字
_listenfd = socket(AF_INET, SOCK_STREAM, 0);
if (_listenfd < 0)
{
std::cerr << "socket error!" << std::endl;
exit(SOCKET_ERROR);
}
// 创建套接字地址
struct sockaddr_in addr;
bzero(&addr, sizeof(addr));
addr.sin_family = AF_INET;
addr.sin_addr.s_addr = INADDR_ANY;
addr.sin_port = htons(port);
// 绑定地址
int n = bind(_listenfd, (struct sockaddr*)&addr, sizeof(addr));
if (n < 0)
{
std::cerr << "bind error!" << std::endl;
exit(BIND_ERROR);
}
// 把listensockfd添加到数组头部
_sockfds[0] = _listenfd;
// 开始监听
listen(_listenfd, 16);
}
初始化列表中_sockfds(MAX_SZ, -1)
把数组的长度设置为MAX_SZ
,值全部初始化为-1
表示这个位置没有值。
随后其实就是Linux
中很标准的创建TCP
服务的流程:创建套接字
、绑定套接字
、监听套接字
。
唯一不同的是添加了一步_sockfds[0] = _listenfd
,因为最后_sockfds
内的文件描述符要被select
监听,listensockfd
同样要被监听,所以一开始就要把这个监听套接字加入到数组中。
事件循环
事件循环流程如下:
void start()
{
while(true)
{
· // 设置 set_fd
// 设置 timeval
// select 监听
// 处理结果
}
}
整个事件循环分为如上四步。
设置set_fd
:
void start()
{
while(true)
{
// 设置 set_fd
fd_set fds; // 创建一个fd_set
FD_ZERO(&fds); // 清空这个fd_set
int max_fd = _listenfd; // 初始化最大的fd
// 把所有数组元素(套接字)加入到文件集
for (int i = 0; i < MAX_SZ; i++)
{
if (_sockfds[i] == -1)
continue;
FD_SET(_sockfds[i], &fds);
max_fd = std::max(max_fd, _sockfds[i]);
}
// 设置 timeval
// select 监听
// 处理结果
}
}
首先创建一个集合fd_set
,此处只监听读事件,只创建一个集合。FD_ZERO(&fds)
把整个集合清空,防止有之前残留的数据。
此处的max_fd
,是因为select
的第一个参数是所有文件描述符中最大的那个+1
,所以要提前统计最大的文件描述符。
随后进入一个for
循环,遍历_sockfds
,只要_sockfds[i] != -1
说明这是一个有效的套接字,把这个通过FD_SET
添加到fd_set
中。顺便统计当前最大的max_fd
。
此处注意fds
这个变量,每轮循环都要重新设置一次,因为select
会改动传入的fd_set
,这在之前讲过。
设置timeval
:
void start()
{
while(true)
{
· // 设置 set_fd
// 设置 timeval
struct timeval timeout = { 1, 0 };
// select 监听
// 处理结果
}
}
此处直接把timeval
的时间设置为1 s
。
开启select
:
void start()
{
while(true)
{
· // 设置 set_fd
// 设置 timeval
// select 监听
int ret = select(max_fd + 1, &fds, nullptr, nullptr, &timeout);
// 处理结果
}
}
此时正式开始调用select
函数,开始多路转接。第一个参数传入max_fd + 1
,也就是最大的文件描述符加一。读事件传入&fds
,剩下两个集合传入nullptr
,最后再把超时时间传进去。
用ret
变量接收返回值。
处理返回值
:
void start()
{
while(true)
{
· // 设置 set_fd
// 设置 timeval
// select 监听
// 处理结果
switch (ret)
{
case 0:
std::clog << "timeout..." << std::endl;
break;
case -1:
std::cerr << "select error..." << std::endl;
exit(SELECT_ERROR);
break;
default:
std::clog << "event happen..." << std::endl;
handlerEvent(fds);
}
}
}
如果返回值是0
,说明这次没有任何文件描述符就绪,进入下一轮循环。如果ret == -1
,说明出现错误,直接退出。
如果ret > 0
,说明有事件就绪了,调用handlerEvent
开始进行事件派发。
事件派发
事件派发很简单,就是判断文件描述符是_listenfd
还是普通的sockfd
,调用不同的函数进行处理。
void handlerEvent(fd_set& fds)
{
for (int i = 0; i < MAX_SZ; i++)
{
if (_sockfds[i] == -1 || !FD_ISSET(_sockfds[i], &fds))
continue;
if (_sockfds[i] == _listenfd)
acceptClient();
else
serviceIO(i);
}
}
遍历整个_sockfds
数组,判断_sockfds[i]
在不在集合fds
中,如果在说明这个套接字有数据到来可以读取了。
随后进行判断,如果是_listenfd
就执行acceptClient
,反之执行serviceIO
。
事件处理
- 处理
listenfd
:
void acceptClient()
{
// 接收连接
// 把套接字插入 _sockfds 数组中
}
监听套接字只需要两部:先通过accept
接收这个连接,随后把这个套接字加入到_sockfds
数组中,下一轮select
会自动对_sockfds
内的套接字进行监听。
接收请求:
void acceptClient()
{
// 接收连接
struct sockaddr_in peer; // 预设客户端的地址结构体
bzero(&peer, sizeof(peer));
socklen_t len;
int clientfd = accept(_listenfd, (sockaddr*)&peer, &len); // 接收客户端连接
if (clientfd < 0)
{
std::cerr << "accept error!" << std::endl;
exit(ACCEPT_ERROR);
}
// 把套接字插入 _sockfds 数组中
}
这也是Linux
中TCP
的基础操作,通过accept
接受一个TCP
连接。
添加到_sockfds
:
void acceptClient()
{
// 接收连接
// 把套接字插入 _sockfds 数组中
int pos = 0;
for (; pos < MAX_SZ; pos++) // 找到合适的位置进行插入
{
if (_sockfds[pos] == -1)
break;
}
if (pos == MAX_SZ) // 监听的套接字达到上限
{
std::clog << "select if full..." << std::endl;
close(clientfd);
}
else // 还可以插入
{
_sockfds[pos] = clientfd;
std::clog << clientfd << " add to sockfds" << std::endl;
}
}
首先通过循环遍历,找到第一个值为-1
的位置,记录下pos
。
如果pos
的值到达了最大值,说明数组满了,此时无法接收更多连接,直接关闭。反之则把这个新的套接字添加到_sockfds[pos]
位置。
- 处理客户端
echo server
:
void serviceIO(int pos)
{
// 接收数据
char buffer[1024];
int n = recv(_sockfds[pos], buffer, sizeof(buffer) - 1, 0);
// 处理数据
if (n > 0)
{
buffer[n] = '\0';
std::cout << "message: " << buffer << std::endl;
std::string ret = "echo: " + (std::string)buffer;
send(_sockfds[pos], ret.c_str(), ret.size(), 0);
}
else if (n == 0)
{
std::clog << _sockfds[pos] << " exit..." << std::endl;
close(_sockfds[pos]);
_sockfds[pos] = -1;
}
else
{
std::cerr << _sockfds[pos] << " error..." << std::endl;
close(_sockfds[pos]);
_sockfds[pos] = -1;
}
}
首先通过recv
接收来自客户端的数据,最后进行数据的处理。
如果n > 0
,那么说明收到的数据,直接把数据通过send
返回客户端。
如果n == 0
,说明客户端发起了关闭连接的请求,或者n < 0
说明发生一次,此时close
关闭连接,并把_sockfds[pos]
设为-1
。
测试
最后只需要通过一个main
函数启动这个SelectServer
即可:
#include <iostream>
#include <memory>
#include "SelectServer.hpp"
// ./selectServer port
int main(int argc, char* argv[])
{
if (argc != 2)
{
std::cout << "Usage: " << argv[0] << " port" << std::endl;
exit(-1);
}
uint16_t port = std::stoi(argv[1]);
SelectServer svr(port); // 启动SelectServer
svr.start(); // 开启事件循环
return 0;
}
运行效果:
左侧是SelectServer
,右侧是telnet
客户端。可以看到,起初没有数据到来,一直触发timeout
,当telnet
发起连接,此时触发listenfd
的事件,4 add to sockfds
表示新的连接建立成功,并被select
开始监听了。
随后用户发送hello
、world
都正常得到了响应,message: hello
表示成功处理了普通的客户端请求。
总结
在刚才的代码中可以看出select
的特性,每次循环都要重新设置所有的套接字。当select
返回后,要遍历所有的套接字,来判断哪个套接字可以进行读取了。所以select
是一个比较麻烦的多路转接策略。
而当select
返回后,还要依据不同的套接字类型,来进行不同的事件处理。这也就是基本的多路转接使用流程:事件循环
、事件派发
、事件处理
。