EDA365电子论坛网

标题: 五种I/O 模式 [打印本页]

作者: mutougeda 时间: 2020-10-21 13:57
标题: 五种I/O 模式

在Linux/UNIX 下，有下面这五种I/O 操作方式：
阻塞I/O
非阻塞I/O
I/O 多路复用
信号驱动I/O（SIGIO）
异步I/O
程序进行输入操作有两步：
等待有数据可以读
将数据从系统内核中拷贝到程序的数据区。
对于一个对套接字的输入操作:
   第一步一般来说是,等待数据从网络上传到本地,当数据包到达的时候，数据将会从网络层拷贝到内核的缓存中；
   第二步是从内核中把数据拷贝到程序的数据区中

.阻塞I/O 模式
   简单的说，阻塞就是＂睡眠＂的同义词
   如你运行上面的listen 的时候，它只不过是简单的在那里等待接收数据。它调用recvfrom()函数，但是那个时候（listener 调用recvfrom()函数的时候），它并没有数据可以接收．所以recvfrom()函数阻塞在那里（也就是程序停在recvfrom()函数处睡大觉）直到有数据传过来阻塞．你应该明白它的意思。
   阻塞I/O 模式是最普遍使用的I/O 模式。大部分程序使用的都是阻塞模式的I/O 。
   缺省的，一个套接字建立后所处于的模式就是阻塞I/O 模式。
   对于一个UDP 套接字来说，数据就绪的标志比较简单：
      已经收到了一整个数据报
      没有收到。
   而TCP 这个概念就比较复杂，需要附加一些其他的变量
      一个进程调用recvfrom ，然后系统调用并不返回知道有数据报到达本地系统，然后系统将数据拷贝到进程的缓存中。
      （如果系统调用收到一个中断信号，则它的调用会被中断）我们称这个进程在调用recvfrom 一直到从recvfrom 返回这段时间是阻塞的。
      当recvfrom正常返回时，我们的进程继续它的操作。

.非阻塞模式I/O
当我们将一个套接字设置为非阻塞模式，我们相当于告诉了系统内核：“当我请求的I/O 操作不能够马上完成，你想让我的进程进行休眠等待的时候，不要这么做，请马上返回一个错误给我。”

如我们开始对recvfrom 的三次调用，因为系统还没有接收到网络数据，所以内核马上返回一个EWOULDBLOCK的错误。
第四次我们调用recvfrom 函数，一个数据报已经到达了，内核将它拷贝到我们的应用程序的缓冲区中，然后recvfrom 正常返回，我们就可以对接收到的数据进行处理了。

当一个应用程序使用了非阻塞模式的套接字，它需要使用一个循环来不听的测试是否一个文件描述符有数据可读（称做polling）。
应用程序不停的polling 内核来检查是否I/O操作已经就绪。这将是一个极浪费CPU 资源的操作。这种模式使用中不是很普遍

.I/O 多路复用 select()
在使用I/O 多路技术的时候，我们调用select()函数和poll()函数，在调用它们的时候阻塞，而不是我们来调用recvfrom（或recv）的时候阻塞。
当我们调用select 函数阻塞的时候，select 函数等待数据报套接字进入读就绪状态。当select 函数返回的时候，也就是套接字可以读取数据的时候。这时候我们就可以调用recvfrom函数来将数据拷贝到我们的程序缓冲区中。
和阻塞模式相比较，select()和poll()并没有什么高级的地方，而且，在阻塞模式下只需要调用一个函数：读取或发送，在使用了多路复用技术后，我们需要调用两个函数了：先调用select()函数或poll()函数，然后才能进行真正的读写。

多路复用的高级之处在于，它能同时等待多个文件描述符，而这些文件描述符（套接字描述符）其中的任意一个进入读就绪状态，select()函数就可以返回
假设我们运行一个网络客户端程序，要同时处理套接字传来的网络数据又要处理本地的标准输入输出。在我们的程序处于阻塞状态等待标准输入的数据的时候，假如服务器端的程序被kill（或是自己Down 掉了），那么服务器程端的TCP 协议会给客户端（我们这端）的TCP 协议发送一个FIN 数据代表终止连接。但是我们的程序阻塞在等待标准输入的数据上，在它读取套接字数据之前（也许是很长一段时间），它不会看见结束标志．我们就不能够使用阻塞模式的套接字。
I/O多路技术一般在下面这些情况中被使用：
   当一个客户端需要同时处理多个文件描述符的输入输出操作的时候（一般来说是标准的输入输出和网络套接字）， I/O 多路复用技术将会有机会得到使用。
   当程序需要同时进行多个套接字的操作的时候。
   如果一个TCP 服务器程序同时处理正在侦听网络连接的套接字和已经连接好的套接字。
   如果一个服务器程序同时使用TCP 和UDP 协议。
   如果一个服务器同时使用多种服务并且每种服务可能使用不同的协议（比如inetd就是这样的）。

I/O 多路服用技术并不只局限与网络程序应用上。几乎所有的程序都可以找到应用I/O多路复用的地方。

fcntl()函数
      当你一开始建立一个套接字描述符的时候，系统内核就被设置为阻塞状态。如果你不想你的套接字描述符是处于阻塞状态的，那么你可以使用函数fcntl()。
   #include
   #include
   int fcntl (int fd, int cmd, long arg）;
示例:
   sockfd = socket（AF_INET, SOCK_STREAM, 0）;
   fcntl（sockfd, F_SETFL, O_NONBLOCK）;
   这样将一个套接字设置为无阻塞模式后，你可以对套接字描述符进行有效的“检测”．
   如果你尝试从一个没有接收到任何数据的无阻塞模式的套接字描述符那里读取数据，那么读取函数会马上返回–1 代表发生错误，全局变量errno 中的值为EWOULDBLOCK。
   一般来说，这种无阻塞模式在某些情况下不是一个好的选择。假如你的程序一直没有接收到传过来的数据，那么你的程序就会进行不停的循环来检查是否有数据到来，浪费了大量的CPU 时间，而这些CPU 时间本来可以做其他事情的。
   另外一个比较好的检测套接字描述符的方法是调用select()函数

套接字选择项select()函数
/*int select(int numfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);
*
*  这个技术有一点点奇怪但是它对我们的程序确是非常有用的。
*  假想一下下面的情况：
*    你写的服务器程序想监听客户端的连接，但是你同时又想从你以前已经建立过的连接中来读取数据。
*  你可能会说：“没有问题，我不就是需要使用一个accept()函数和一对儿recv()函数吗？”。
*  不要这么着急，你要想想，当你调用accept()函数阻塞的时候，你还能调用recv()函数吗？
*  “使用非阻塞套接字！”你可能会这么说。是的，你可以。但是如果你又不想浪费宝贵的CPU 时间，该怎么办呢？
*  Select()函数可以帮助你同时监视许多套接字。它会告诉你哪一个套接字已经可以读取数据，
*  哪个套接字已经可以写入数据，甚至你可以知道哪个套接字出现了错误，如果你想知道的话。
*
*
*
* 当select()函数返回的时候，readfds 将会被修改用来告诉你哪一个文件描述符你可以用来读取数据。
*
* numfds       是readfds，writefds，exceptfds 中fd 集合中文件描述符中最大的数字加上1 也就是sockfd+1（因为标准输入的文件描述符的值为0 ，所以其他任何的文件描述符都会比标准输入的文件描述符大）。
*
* readfds       中的fd 集合将由select 来监视是否可以读取,如果你想知道是是否可以从标准输入和一些套接字（sockfd）中读取数据，你就可以把文件描述符和sockfd 加入readfds 中。
* writefds    中的fds 集合将由select 来监视是否可以写入
* exceptfds    中的fds 集合将由select 来监视是否有例外发生
* struct timeval 超时设置。
*                   一般来说，如果没有任何文件描述符满足你的要求，你的程序是不想永远等下去的．也许每隔1 分钟你就想在屏幕上输出信息：“hello！”。
*             这个代表时间的结构将允许你定义一个超时。
*             在调用select()函数中，如果时间超过timeval 参数所代表的时间长度，
*             而还没有文件描述符满足你的要求，那么select()函数将回返回，允许你进行下面的操作。
*             只需要将tv_sec 设置为你想等待的秒数，然后设置tv_usec 为想等待的微秒数
*             (真正的时间就是tv_sec 所表示的秒数加上tv_usec 所表示的微秒数）．注意，是微秒（百万分之一）而不是毫秒．
*             一秒有1,000 毫秒，一毫秒有1,000 微秒。所以，一秒有1,000,000 微秒．
*             这个timeval 结构定义如下：
*             struct timeval
*             {
*                   int tv_sec ; //秒数
*                   int tv_usec ;  //微秒
*             };
*             我们拥有了一个以微秒为单位的记时器！但是因为Linux 和UNIX 一样，最小的时间片是100 微秒，所以不管你将tv_usec 设置的多小，实质上记时器的最小单位是100微秒．
*
*             如果你将struct timeval 设置为0，则select()函数将会立即返回，同时返回在你的集合中的文件描述符的状态。
*
*             如果你将timeout 这个参数设置为NULL，则select()函数进入阻塞状态，除了等待到文件描述符的状态变化，否则select()函数不会返回。
*
*
* return       当select()函数返回的时候，timeval 中的时间将会被设置为执行为select()后还剩下的时间。
*
*
*
*/

使用FD_ISSET() 宏，你可以选出select()函数执行的结果。
在进行更深的操作前，我们来看一看怎样处理这些fd_sets。下面这些宏可以是专门进行这类操作的：
  FD_ZERO(fd_set *set)          将一个文件描述符集合清零
  FD_SET(int fd, fd_set *set) 将文件描述符fd 加入集合set 中。
  FD_CLR(int fd, fd_set *set) 将文件描述符fd 从集合set 中删除．
  FD_ISSET(int fd, fd_set *set)  测试文件描述符fd 是否存在于文件描述符set 中．
下面这段代码演示了从标准输入等待输入等待2.5 秒．
#include
#include
#include
/* 标准输入的文件描述符数值 */
#define STDIN 0
main()
{
fd_set readfds;
struct timeval tv;
/* 设置等待时间为2 秒零500,000 微秒 */
tv.tv_sec  = 2;
tv.tv_usec = 500000;
FD_ZERO(&readfds);
FD_SET(STDIN, &readfds);
/* 因为我们只想等待输入，所以将writefds 和execeptfds 设为NULL */
/* 程序将会在这里等待2 秒零500,000 微秒，除非在这段时间中标准输入有操作 */
select(STDIN+1, &readfds, NULL, NULL, &tv);
/* 测试ST

作者: youOK 时间: 2020-10-21 14:48
五种I/O 模式

欢迎光临 EDA365电子论坛网 (https://bbs.eda365.com/)