线程编程:事件驱动、并发、竞争与同步
1. 事件驱动线程
在现代编程中,事件驱动模式是对每个连接一个线程模式的一种改进。以 Web 服务器为例,现代硬件在计算能力上能够同时处理大量请求。但在每个连接一个线程的模式下,这意味着会创建大量线程。线程存在固定开销,特别是需要内核和用户空间栈。这些固定开销限制了给定进程中线程的可扩展性,在 32 位系统上尤为明显(虽然在 64 位系统上,对每个连接一个线程模式的反对理由没那么强烈,但事件驱动模式仍被认为是更好的选择)。系统可能有足够的计算资源来处理数千个并发连接,但在运行这么多并发线程时会遇到可扩展性瓶颈。
系统设计师发现,大多数线程大部分时间都在等待,比如读取文件、等待数据库返回结果、发起远程过程调用等。实际上,使用比系统处理器数量更多的线程并不能提高并行性,这种多线程的使用更多是一种编程抽象,而这种编程便利性可以通过更正式的控制流模型来实现。
基于这些观察,事件驱动线程应运而生。由于每个连接一个线程的工作负载中有很多时间是在等待,我们可以将等待操作与线程解耦。具体做法是异步发出所有 I/O 请求(异步 I/O),并使用多路复用 I/O 来管理服务器中的控制流。在这个模型中,请求处理被转换为一系列异步 I/O 请求和相关的回调函数。这些回调函数可以通过多路复用 I/O 进行等待,这个过程称为事件循环。当 I/O 请求返回时,事件循环将回调函数交给一个等待的线程。
与每个连接一个线程的模式一样,事件驱动模式不一定需要多线程。实际上,事件循环可以是单线程进程执行完回调函数后的自然流程。只有在需要真正的并行性时才添加线程,并且线程数量不应超过处理器数量。
目前,事件驱动模式是设计多线程服务器的首选方法。