Appearance
第11讲:线程池之刨根问底
我们在课时 09 介绍 synchronized 原理时,已经了解了 Java 中线程的创建以及上下文切换是比消耗性能的,因此引入了偏向锁、轻量级锁等优化技术,目的就是减少用户态和核心态之间的切换频率。但是在这些优化基础之上,还有另外一个角度值得思考:创建和销毁线程非常损耗性能,那有没有可能复用一些已经被创建好的线程呢?答案是肯定的,那就是线程池。
另外,线程的创建需要开辟虚拟机栈、本地方法栈、程序计数器等线程私有的内存空间,在线程销毁时需要回收这些系统资源,频繁地创建销毁线程会浪费大量资源,而通过复用已有线程可以更好地管理和协调线程的工作。
线程池主要解决两个问题:
一、 当执行大量异步任务时线程池能够提供很好的性能。
二、 线程池提供了一种资源限制和管理的手段,比如可以限制线程的个数,动态新增线程等。
------《Java并发编程之美》
线程池体系
用一张图来表示线程池体系如下:
解释说明:
Executor 是线程池最顶层的接口,在 Executor 中只有一个 execute 方法,用于执行任务。至于线程的创建、调度等细节由子类实现。
ExecutorService 继承并拓展了 Executor,在 ExecutorService 内部提供了更全面的任务提交机制以及线程池关闭方法。
ThreadPoolExecutor 是 ExecutorService 的默认实现,所谓的线程池机制也大多封装在此类当中,因此它是本课时分析的重点。
ScheduledExecutorService 继承自 ExecutorService,增加了定时任务相关方法。
ScheduledThreadPoolExecutor 继承自 ThreadPoolExecutor,并实现了 ScheduledExecutorService 接口。
ForkJoinPool 是一种支持任务分解的线程池,一般要配合可分解任务接口 ForkJoinTask 来使用。
创建线程池
为了开发者可以更方便地使用线程池,JDK 中给我们提供了一个线程池的工厂类---Executors。在 Executors 中定义了多个静态方法,用来创建不同配置的线程池。常见有以下几种。
newSingleThreadExecutor
创建一个单线程化的线程池,它只会用唯一的工作线程来执行任务,保证所有任务按先进先出的顺序执行。
执行上述代码结果如下,可以看出所有的 task 始终是在同一个线程中被执行的。
newCachedThreadPool
创建一个可缓存线程池,如果线程池长度超过处理需要,可灵活回收空闲线程,若无可回收,则新建线程。
执行效果如下:
从上面日志中可以看出,缓存线程池会创建新的线程来执行任务。但是如果将代码修改一下,在提交任务之前休眠 1 秒钟,如下:
再次执行则打印日志同 SingleThreadPool 一模一样,原因是提交的任务只需要 500 毫秒即可执行完毕,休眠 1 秒导致在新的任务提交之前,线程 "pool-1-thread-1" 已经处于空闲状态,可以被复用执行任务。
newFixedThreadPool
创建一个固定数目的、可重用的线程池。
上述代码创建了一个固定数量 3 的线程池,因此虽然向线程池提交了 10 个任务,但是这 10 个任务只会被 3 个线程分配执行,执行效果如下:
newScheduledThreadPool
创建一个定时线程池,支持定时及周期性任务执行。
上面代码创建了一个线程数量为 2 的定时任务线程池,通过 scheduleAtFixedRate 方法,指定每隔 500 毫秒执行一次任务,并且在 5 秒钟之后通过 shutdown 方法关闭定时任务。执行效果如下:
上面这几种就是常用到的线程池使用方式,但是,在 阿里Java开发手册 中已经严禁使用 Executors 来创建线程池,这是为什么呢?要回答这个问题需要先了解线程池的工作原理。
线程池工作原理分析
现实案例
先来看一个现实生活中的实际案例,某工艺品加工厂有 3 台加工机器用来生产订单所需的产品,正常情况下 3 台机器能够保证所有订单按时按需生产完毕,如下图所示:
如果订单量突然大幅增加,3 台机器已经处于满负荷状态,一时间无法完成新增的订单任务。那怎么办呢?正所谓钱是不可能不挣的,只能硬着头皮接下新来的订单,但是会将新来的订单暂存在仓库中,当有加工机器空闲下来之后,再用来生产仓库中的订单,如下图所示:
如果订单量持续快速增长,导致仓库也存储满了。那怎么办呢? 正常情况下加工厂肯定会通过购买新的加工机器来满足订单需求,如下所示:
有了仓库和新购买的加工机器加持,加工厂业务还是能够正常流转。但是当某些极端情况发生,比如双十一搞活动之后订单爆单了。这时新增的订单任务连仓库以及所有的加工机器都已经无法容纳,说明加工厂已经不能接受新的订单任务了,因此只能拒绝所有新的订单。
线程池的工作流程同上面描述的加工厂完成订单任务非常相似,并且在线程池的构造器中,通过传入的参数可以设置默认有多少台加工机器、仓库的大小、可以购买新的加工机器的最大数量等等。
线程池结构
从上图中可以大体看出,在线程池内部主要包含以下几个部分:
worker 集合:保存所有的核心线程和非核心线程(类比加工厂的加工机器),其本质是一个HashSet。
等待任务队列:当核心线程的个数达到 corePoolSize 时,新提交的任务会被先保存在等待队列中(类比加工厂中的仓库),其本质是一个阻塞队列 BlockingQueue。
ctl:是一个 AtomicInteger 类型,二进制高 3 位用来标识线程池的状态,低 29 位用来记录池中线程的数量。
获取线程池状态、工作线程数量、修改 ctl 的方法分别如下:
线程池主要有以下几种运行状态:
参数分析
线程池的构造器如下:
构造参数说明。
corePoolSize:表示核心线程数量。
maximumPoolSize:表示线程池最大能够容纳同时执行的线程数,必须大于或等于 1。如果和 corePoolSize 相等即是固定大小线程池。
keepAliveTime:表示线程池中的线程空闲时间,当空闲时间达到此值时,线程会被销毁直到剩下 corePoolSize 个线程。
unit:用来指定 keepAliveTime 的时间单位,有 MILLISECONDS、SECONDS、MINUTES、HOURS 等。
workQueue:等待队列,BlockingQueue 类型。当请求任务数大于 corePoolSize 时,任务将被缓存在此 BlockingQueue 中。
threadFactory:线程工厂,线程池中使用它来创建线程,如果传入的是 null,则使用默认工厂类 DefaultThreadFactory。
handler:执行拒绝策略的对象。当 workQueue 满了之后并且活动线程数大于 maximumPoolSize 的时候,线程池通过该策略处理请求。
注意:当 ThreadPoolExecutor 的 allowCoreThreadTimeOut 设置为 true 时,核心线程超时后也会被销毁。
流程解析
当我们调用 execute 或者 submit,将一个任务提交给线程池,线程池收到这个任务请求后,有以下几种处理情况:
1.当前线程池中运行的线程数量还没有达到 corePoolSize 大小时,线程池会创建一个新线程执行提交的任务,无论之前创建的线程是否处于空闲状态。
举例:
上面代码创建了 3 个固定数量的线程池,每次提交的任务耗时 100 毫秒。每次提交任务之前都会延迟2秒,保证线程池中的工作线程都已经执行完毕,但是执行效果如下:
可以看出虽然线程 1 和线程 2 都已执行完毕并且处于空闲状态,但是线程池还是会尝试创建新的线程去执行新提交的任务,直到线程数量达到 corePoolSize。
2.当前线程池中运行的线程数量已经达到 corePoolSize 大小时,线程池会把任务加入到等待队列中,直到某一个线程空闲了,线程池会根据我们设置的等待队列规则,从队列中取出一个新的任务执行。举例:
上述代码提交的任务耗时 4 秒,因此前 2 个任务会占用线程池中的 2 个核心线程。此时有新的任务提交给线程池时,任务会被缓存到等待队列中,结果如下:
可以看到红框 1 中通过 2 个核心线程直接执行提交的任务,因此等待队列中的数量为 0;而红框 2 中表明,此时核心线程都已经被占用,新提交的任务都被放入等待队列中。
3.如果线程数大于 corePoolSize 数量但是还没有达到最大线程数 maximumPoolSize,并且等待队列已满,则线程池会创建新的线程来执行任务。
上述代码创建了一个核心线程数为 2,最大线程数为 10,等待队列长度为 2 的线程池。执行效果如下:
解释说明:
1 处表示线程数量已经达到 corePoolSize;
2 处表明等待队列已满;
3 处会创建新的线程执行任务。
4.最后如果提交的任务,无法被核心线程直接执行,又无法加入等待队列,又无法创建"非核心线程"直接执行,线程池将根据拒绝处理器定义的策略处理这个任务。比如在 ThreadPoolExecutor 中,如果你没有为线程池设置 RejectedExecutionHandler。这时线程池会抛出 RejectedExecutionException 异常,即线程池拒绝接受这个任务。
将上面非核心线程的代码稍微修改一下,如下:
修改最大线程数为 3,并提交 6 次任务给线程池,执行效果如下:
程序会报异常 RejectedExecutionException,拒绝策略是线程池的一种保护机制,目的就是当这种无节制的线程资源申请发生时,拒绝新的任务保护线程池。默认拒绝策略会直接报异常,但是 JDK 中一共提供了 4 种保护策略,如下:
实际上拒绝策略都是实现自接口 RejectedExecutionException,开发者也可以通过实现此接口,定制自己的拒绝策略。
整个流程的动画演示可以参考:漫画Java线程池的工作机制
为何禁止使用 Executors
现在再回头看一下为何在阿里 Java 开发手册中严禁使用 Executors 工具类来创建线程池。尤其是 newFixedThreadPool 和 newCachedThreadPool 这两个方法。
比如如下使用 newFixedThreadPool 方法创建线程的案例:
上述代码创建了一个固定数量为 2 的线程池,并通过 for 循环向线程池中提交 100 万个任务。
通过 java -Xms4m -Xmx4m FixedThreadPoolOOM 执行上述代码:
可以发现当任务添加到 7 万多个时,程序发生 OOM。这是为什么呢? 看一下newSingleThreadExecutor 和 newFixedThreadPool() 的具体实现,如下:
可以看到传入的是一个无界的阻塞队列,理论上可以无限添加任务到线程池。当核心线程执行时间很长(比如 sleep10s),则新提交的任务还在不断地插入到阻塞队列中,最终造成
OOM。
再看下 newCachedThreadPool 会有什么问题。
上述代码同样会报 OOM,只是错误的 log 信息有点区别:无法创建新的线程。
看一下 newCachedThreadPool 的实现:
可以看到,缓存线程池的最大线程数为 Integer 最大值。当核心线程耗时很久,线程池会尝试创建新的线程来执行提交的任务,当内存不足时就会报无法创建线程的错误。
以上两种情况如果发生在生产环境将会是致命的,从阿里手册中严禁使用 Executors 的态度上也能看出,阿里也是经历过血淋淋的教训。
总结
线程池是一把双刃剑,使用得当会使代码如虎添翼;但是使用不当将会造成重大性灾难。而剑柄是握在开发者手中,只有理解线程池的运行原理,熟知它的工作机制与使用场景,才会使这把双刃剑发挥更好的作用。
这节课的实例代码已经放到 github 上:拉勾教育《Android 工程师进阶34讲》