现代操作系统提供了基于三种基本的构造并发程序的方法。分别为:进程、I/O 多路复用和线程。
基于进程的并发编程方法很简单,使用我们很熟悉的fork、exec、waitpid等函数就可以了。比如构造一个并发服务器的方法就是,在父进程中接受客户端的请求,然后创建一个新的子进程来为每个客户端提供服务。
因为进程有独立的地址空间,所以不会出现进程不小心覆盖另一个进程虚拟内存的情况,这是一个显著的优点。但独立地址空间也让不同进程之间共享信息变得更加困难。
考虑下面一种场景,服务器也能对用户从标准输入键入的交互命令做出响应,那服务器就必须响应两个相互独立的 I/O 事件:1)客户端连接请求,2)用户键入命令行。我们无法选择应该等待哪个事件,因为等待其中一个就不能响应另一个事件,所以就有了 I/O 多路技术。
其基本思路就是使用select函数,要求内核挂起进程,只有在一个或多个 I/O 事件发生后,才将控制返回给应用程序。
该技术可以用作并发事件驱动程序的基础,在事件驱动程序中某些事件会导致流向前推进(比如 web 前端程序),一般思路是将逻辑流转换为状态机(去查编译原理),某些事件会导致从一个状态转移到另一个状态。
如果使用进程并发实现上面的场景,那可能就需要两个进程分别监听两个事件,而使用 I/O 多路复用技术的程序时运行在单一进程上下文中,因此每个逻辑流都能访问全部该进程全部的地址空间,也就是说共享数据变得很容易,但是事件驱动要比基于进程更加复杂,而且随着并发粒度的减小,复杂性还会上升。另外如果某个逻辑流正忙于读一个文本行,那么其它逻辑流就不会有进展,这防不住恶意客户端的攻击。
线程同时结合了前面两种方法。线程是运行在进程上下文的逻辑流,它有自己的栈、栈指针、程序计数器等,但是共享这个进程虚拟空间的所有内容,包括堆、代码、数据、共享库及打开文件。