Java线程池ThreadPoolExecutor的实现原理详解,让面试官仰望

发布于:2022-11-09 ⋅ 阅读:(14) ⋅ 点赞:(0) ⋅ 评论:(0)

本文将分析Java线程池ThreadPoolExecutor的实现原理,掌握了实现原理能帮助你更好的优化程序的性能,避免很多错误用法。本文的代码量较少,主要讲原理,等你把原理完全弄明白了代码随便一写一大堆。

1. 线程池的状态

首先,线程池是一个有状态的对象。状态有以下几种:

· RUNNING: 运行中。此时线程池能接受任务,并且会处理队列中的任务;

· SHUTDOWN: 关闭中。此时,线程池不接受新任务,但是会处理队列中的任务;

· STOP: 停止。此时线程池不接受新任务,也不会处理队列中的任务,还会中断worker线程。

· TIDYING: 清理中。所有任务都已终止且线程数等于0,开始调用terminated()。

· TERMINATED: 终止。terminated()执行结束。

线程池的状态变化方式如下图所示。

2. 线程池的内部组件

线程池的内部主要包含如下表所示组件。知道ThreadPoolExecutor内部包含哪些对象,基本就清楚线程池的实现原理了。注意,表中未给出largestPoolSize、completedTaskCount、keepAliveTime、corePoolSize和maximumPoolSize等参数。

3. 线程池提交任务执行逻辑

之前的文章介绍过线程池中线程数和阻塞队列的变化关系。一般就是优先创建核心线程,然后存放在任务队列,再然后就是创建更多线程,如下图所示。

实际上,线程池ThreadPoolExecutor的提交方法,即execute(),就是按照这三个阶段执行的。提交分3步:首先,判断线程数是否小于核心线程数,如果小于,则立即创建一个worker并且直接把任务传入新创建的worker(任务不会进入阻塞队列),立即启动worker线程,函数返回;然后,若线程数大于核心线程数,则尝试把任务放入阻塞队列,如果成功则需要再判断一下线程池的状态是否为SHUTDOWN,并且也要判断一下worker线程数是否又变成0。如果变成SHUTDOWN,则需要把刚刚放入队列的任务拿出队列(因为突然发生的shutdown()调用),然后执行按照饱和策略处理(给handler)。如果线程数变成0,则需要重新再创建一个worker线程(刚才检查过的核心线程正好挂掉,如果不创建worker则线程池此时进入静止状态);最后,如果放入阻塞队列失败,则创建非核心worker线程处理该任务。如果这个操作也失败,则把任务交给饱和策略(handler)处理。流程图如下:

注意:在每两个操作之间都要重新判断线程池的状态和线程数(中间有其他操作),这样才能保证ThreadPoolExecutor的线程安全性。由此可见,设计线程安全的类是很难的。

4. Worker线程的执行逻辑

线程池使用worker线程从队列取任务执行。当worker执行完一个任务,如果时间片还未用完,并且任务队列中也有任务,那么worker会继续取任务执行,这样可以减少不必要的切换。所以,我们可以猜测到Worker线程大致是一个循环。事实上,worker的确是一个循环,主体逻辑就是不断从队列取任务然后执行。除此以外,worker线程的执行代码还包含一些性能优化措施和容错逻辑,例如第一个任务直接放在worker中而不放入队列(所以worker每次先看自己的firstTask是否非空);任务代码抛出异常导致线程终止后,重新创建一个线程以替换掉挂掉的这个线程等(见processWorkerExit方法的代码)。根据对
ThreadPoolExecutor.runWorker代码的分析,得出worker的执行逻辑如下图所示:

转存失败重新上传取消

要说明的是,当队列为空时getTask会阻塞;当调用了shutdown()之类的操作getTask会返回null,此时worker线程会判断是否需要执行清理操作。线程池的清理操作是由一个空闲worker线程完成的,且只有一个worker做清理工作,shutdown和shutdownNow只修改状态和发出通知。更进一步,即使把corePoolSize设为0以允许核心线程退出,线程池也至少保留一个线程用于做清理工作,只有关闭线程池之后,线程才全部退出

5. 如何判断worker线程是否空闲、如何区分核心和非核心线程

每个worker其实是一个锁(通过继承
AbstractQueuedSynchronizer),worker线程封装在这个worker内部。当worker开始运行之后,会对worker进行加锁动作,等任务执行完以后,再对worker执行解锁动作(这是为了避免线程池的中断信号影响任务代码,线程池通过给worker发中断,让阻塞在getTask上的worker线程被唤醒来)。所以,如果对这个worker执行tryLock操作成功,那么这个worker是空闲的。

转存失败重新上传取消

那么keepAliveTime到哪里去了?实际上,它在getTask方法中。每个worker线程通过计时的等待方法poll(keepAliveTime, TimeUnit.NANOSECONDS)来获取任务。当poll返回之后,说明空闲时间已超过keepAliveTime时间。那么,核心线程与非核心线程如何区分?其实,线程池中的worker线程都是对等的,不区分核心和非核心线程。在每次从队列取任务之前,会先判断一下当前线程数,如果当前线程数大于corePoolSize,那么就用计时版本的poll取任务,此时这个worker线程是非核心线程;而如果小于等于corePoolSize,则用不限时间等待方法take从队列取任务,此时它是核心线程。

6. 其他细节

worker线程执行任务前后会分别调用beforeExecute()和afterExecute()。

线程池在关闭之后会调用terminated()。

若要监控线程池状态:getPoolSize()、getActiveCount()、getLargestPoolSize()、getTaskCount()、getCompletedTaskCount()。

最后

线程池其实可以改进的,我们不知道每个任务的执行时间长短,所以每个worker线程不区分runnable的大小,一般按照FIFO策略执行任务。如果使用合理的规划算法(动态规划),让时间片的利用率最大化,能进一步优化线程池的性能,不过这可能设计起来非常复杂。