原文地址:http://gee.cs.oswego.edu/dl/cpj/mechanics.html
声明: 个人英文水平有限,翻译的不对的地方请重拍!
Doug Lee的书:Concurrent Programming In Java的网上地址:http://gee.cs.oswego.edu/dl/cpj/index.html
线程
- 线程是一个可以彼此间独立执行、同时共享底层系统资源(如文件、共享对象)的调用序列,Thread类是控制和记录线程活动的类。
- 每个应用至少包含一个线程(即启动JVM的那个线程), 其他的内部后台线程也会在JVM初始化的时候启动,线程数量和特性随各个JVM不同会有很大差异,但是,所有的用户线程都是由主线程(或者说它们的父线程)明确构建和启动的。
- 下面是一些对线程Thread类相关的重要方法、属性以及使用注意事项的总结, 所有这些都会在本书的其他章节进行讨论和解读。 针对JLS和公开的相关API文档应当咨询更详细和权威的描述。
构造
不同的构造方法接受不同组合的构造参数如下:
- 一个Runnable对象,这种情况下,接下来调用
Thread.start()
方法会调用Runnable对象的run()
方法,默认的Thread本身就是实现了Runnable接口的对象,只不过默认的run方法是空; - 一个标示线程的字符串,这个可以用来追踪和调试,除此之外没什么其他用处;
- 接受一个
ThreadGroup
,新线程都会放在这个线程组里,注意,如果没有访问当前线程组的权限,会抛出SecurityException异常;
- 一个Runnable对象,这种情况下,接下来调用
Thread类自身实现了Runnable接口,所以除了构造函数里传入一个Runnable对象,你还可以通过继承Thread类实现一个带有run方法的子类的方式来实现一个线程。但是最好的策略还是定义一个单独的Runnable接口的实现类并作为构造函数的参数传递给Thread类,因为:
- 在一个单独的Runnable实现类里面实现代码逻辑可以免去潜在的Thread类和Runnable实现类中的同步代码块和同步方法交互的问题。 更具普遍意义的是,这种类型的代码分离有助于我们对具体的处理过程和对应的线程上下文做单独的控制。
- 同时,针对同一个Runnable可以提供给多个有不同实例化方式的线程,也可以提供给其他轻量级的线程池框架处理。
- 继承Thread类的方式会使得子类无法继承其他的类,不利于扩展。
Thread类有一个可以通过构造函数设置的
daemon
属性(但是只能在一个线程启动之前设置)。- setDaemon方法的意思是设置当前线程为后台驻留线程,JVM会判断,当所有的非
daemon
线程都结束时,立即停止所有daemon
线程并退出JVM。 - isDaemon方法会返回当前线程是否是
daemon
线程,这个方法的作用不大,即便后台线程在程序退出时经常需要做一些清理工作(daemon
读成day-mon)。
- setDaemon方法的意思是设置当前线程为后台驻留线程,JVM会判断,当所有的非
线程启动
- 调用start方法后,会触发Thread实例启动一个独立的活动流去执行实例的run方法。 调用线程(父线程)所持有的同步锁不会被新的线程持有。
- 当线程的run方法无论是正常返回还是抛出一个未受检异常(如RuntimeException),线程都会终止。 线程即便终止之后也是==不可重启==,调用start方法多次会抛出InvalidThreadStateException异常。
isAlive
方法返回true代表线程已经启动但还没有终止。 如果当前线程阻塞了,该方法会返回true
,在这个点上不同的JVM实现会有不同,有的JVM在线程被取消cancelled
的情况下会返回false
。没有方法可以判断一个是is not alive
状态的线程是否曾经被启动过,同样的,一个线程也不能很轻易的判断出是由哪个父线程启动的,虽然可以知道其他在同一个线程组ThreadGroup
里面的线程是谁。
1 | //ThreadPoolExecutor.java |
优先级
为了可以使得JVM实现跨越不同硬件平台和操作系统,Java语言对线程调度和公平性不做保证,甚至不严格保证线程会一直执行。但是线程是支持通过启发式的设置线程优先级方法来影响线程调度器的执行
- 每个线程都有一个优先级,优先级序号处在
Thread.MIN_PRIORITY
和Thread.MAX_PRIORITY
之间。 - 默认请情况下,每一个新线程都拥有和其创建线程一致的优先级。初始执行main方法的线程默认情况下的优先级为
Thread.NORM_PRIORITY
。 - 可以通过
getPriority
方法获取任意线程的当前优先级。 - 可以通过
setPriority
方法动态设置任意线程的优先级,最大优先级由其所在的线程组的大小限定。
- 每个线程都有一个优先级,优先级序号处在
当存在超过可用CPU核心数的可执行线程时,CPU线程调度器更倾向于优先执行高优先级的线程。
具体的策略在不同的平台可能会有不同,例如,一些JVM的实现总是会选择最高优先级的线程执行,其他一些JVM会匹配线程的十个优先级到一些系统支持的更小(<10)的优先级类别,这样就会使得不同优先级的线程有可能会被JVM当做同等优先级对待。其他一些混淆声明的优先级或其他的调度策略会保证即便低优先级的线程最终也会有机会得到执行。 同样的,由于计算机系统中其他应用的存在,设置JVM线程的优先级,可能会,但不一定会影响调度器的执行策略。
优先级并不承载其他的计算机语义和正确性方面的义务。
尤其是不能用优先级控制来替代线程执行中的锁,优先级只能被用来表示不同线程间的重要性和紧急程度,在线程间竞争获取执行机会非常激烈的的场合下优先级会显得非常有用。程序应该优先按照运行正确的设计理念来设计,即便设置优先级的方法
setPriority
被定义为无操作的方法.下面的表格列出了一些约定俗成的优先级设置策略的任务类型。 在存在很多并发场景的应用中,相对来说只有非常少的一部分线程在任何时候都是可执行状态(其他的线程都由于各种原因被阻塞了), 这种场合下控制线程的优先级显得没有多大意义。其他的并发系统的场景中,微小的优先级设置的变化会对最终的执行产生影响。
Range |
Use |
Remark |
---|---|---|
10 |
Crisis management | 危机处理,最高 |
7-9 |
Interactive, event-dirven | 交互,事件驱动 |
4-6 |
IO-bound | IO类型 |
2-3 |
Background computation | 后台运行 |
1 |
Run only if noting else on | 仅当其他线程都不执行的情况下 |
控制方法
只有很少的几个方法可以用来做线程间的交互:
每个线程都有一个关联的
boolean
变量interruption status
标示出线程的中断状体。调用线程的
interrupt
方法会把线程的中断状态设置成true
,除非线程正处以下方法的执行状态中:Object.wait(),Thread.sleep(),Thread.join()
,这些情况下interrupt()
方法会导致线程抛出异常InterruptException
,但是线程的interrupt
状态会设置为false
。任何线程的中断状态都可以通过
isInterrupt
方法来检测。如果是通过调用
interrupt
方法来中断线程的话,该方法会返回true
,
但是status
状态为false,因为无论是通过调用Thread.interrupted
方法还是处在
Object.wait(),Thread.sleep(),Thread.join()
等方法的处理中系统都会抛出中断异常
InterruptException
。调用
thread.join()
方法会将调用线程挂起suspend
,并等待目标线程thread
完成。当线程的
thread.isAlive()
返回false
时,thread.join()
会立即返回。还有一个带有超时时间版本的join(time)
方法,这个方法会在超时时间之后强制返回,即便线程还有没有处理完成。由isAlive()
方法的定义可以看出,对一个还未开始的线程join()
是没有任何意义的。同样的理由join
一个不是你创建的线程也是不明智的。
最开始的时候,
Thread
类是支持一些额外的控制方法的,如suspend,stop,resume,destroy
。现在suspend,resume,stop
方法已经被废弃了,destroy
方法从来就没在任何的发行版本的JDK中实现过,以后估计也不会了。现在可以通过
wating|notification
技术实现和suspend|resume
方法一样的效果,并且更加安全,后续还会围绕stop
方法产生的问题继续展开讨论。
静态方法
一些线程的方法被设计成只适用于当前运行的线程(例如,调用这些方法的的线程,即当前线程)。 为了强化这个意义,这些方法被定义成静态方法
Thread.currentThread
方法返回一个当前线程的引用,这个引用随后可以用于调用其他的非静态方法会。Thread.interrupted
方法会清除当前线程的中断状态并返回之前的状态(这也说明,一个线程的中断状态不可能被其他的线程清除)。Thread.sleep(long millseconds)
方法会导致当前线程挂起一段时间。
Thread.yield
方法仅仅是提示虚拟机如果有其他的可执行但是不在执行中的线程存在,线程调度器应该优先调度运行这些线程。但是不同的虚拟机可能对这个操作提示有任意的不同的解读。尽管没有强制的保证,
yield
方法在一些不使用时间分片的提前抢占式调度策略的单核CPU的JVM实现版本中可能会非常有效果。在这种情况下,只有当一个线程阻塞了(执行IO或者sleep),其他线程才有可能会被重新调度,在这些系统中,执行耗时的非阻塞计算的线程会一直占用线程执行周期,降低应用的响应响应速度。作为一个安全保护机制,执行非阻塞的可能会超过时间处理器的可接受的响应时间的计算的线程或者其他的响应式线程可以插入执行yield
方法(甚至执行sleep),当然同样可以设置低的优先级,来让出CPU的执行时间。为了尽可能的减少不必要的影响,你还可以偶尔的时不时的调用一下yield
方法。- 在其他一些拥有预抢占式策略的虚拟机实现中,尤其是对于多核CPU来说,调度器可能甚至是提倡忽略
yield
方法给出的提醒。
线程组
- 每一个线程都是作为一个线程组的成员来构造的,默认情况下,这个线程组就是调用线程构造器的线程所在的线程组,线程组嵌套类似于树状结构。 当一个对象构造一个新的线程组时,这个线程组是嵌套在当前线程组下的,
getThreadGroup
方法返回任何线程的线程组。 设计线程组的目的是用来支持动态地限制对线程访问操作的安全策略。
例如,
interrupt
中断一个和当前线程不是同一个线程组的线程是非法的,这个是虚拟机保护机制的一部分,有些问题,例如一个applet
想杀掉一个主屏幕的显示更新线程,通过限制不同线程组之间的访问权限可以阻止它们发生。
线程组同样可以设置一个最大的优先级,所有组内的线程都不能超过这个优先级。不提倡直接将线程组用于线程编程模型中,大部分的应用中,为达到独立于应用的目的,使用一般的集合类来追踪一组线程对象是更好的选择。
- 在并发编程中极少用到的几个线程组的方法中,有一个方法
uncaughtException
, 这个方法是当一个线程由于抛出一个未受检异常的时候调用,这个方法一般是会打印出异常栈。
同步
对象和锁
- 每个
Object
和其子类的对象实例都拥有一个锁。 - 基础类型如:
int,float,long
等并不是对象,只有通过他们的包装类才能被锁住。 - 单独的变量不能被同步关键字修饰。
- 锁操作只能在方法内使用。
- 被
volatile
关键字修饰的的字段,执行时会在原子性、可见性、和顺序执行上得到保障。 - 基础数据类型的数组对象可以持有锁,但是数组内单个的元素是不能的。
Class
实例是对象,和Class
对象关联的锁一般被用在静态方法中。
同步方法和同步块
synchronized
关键字有两种语法形式,同步方法和同步代码块。同步块有一个对象参数,这个对象就是需要锁定的对象。
最常用的同步块参数是this
当前对象。同步关键字不作为方法签名的一部分。
所以同步修饰关键字在重写父类的方法时不会自动的继承
并且接口内的方法无法用同步修饰符修饰,构造方法也不可以用同步修饰符修饰- 同步修饰的子类实例方法和父类拥有同样的锁。但是内部类的同步方法和外部类是不同的锁。然而,一个非静态内部类方法可以锁住其外部类。
1 | private Class Inner{ |
获取和释放锁
当使用
sychronized
关键字的时候,锁操作遵循一个获取和释放协议。所有的锁操作都是块结构的,只有当要进入一个同步块或者同步方法的时候才会需要获取锁,退出的时候释放锁,即便是由于异常导致的退出也不能忘记释放锁的操作。
- 锁操作是基于一个线程维度的,不是针对每个调用来说的。
当一个线程抵达同步临界点,如果线程本就持有该对象的锁或者该对象的锁没有被其他线程持有,就占有锁并执行通过,否则就阻塞当前的线程执行。
重入锁和递归锁和默认的POSIX线程默认的锁策略不同。
这种机制对于同样的一个对象,允许一个同步方法针对同样的锁定对象调用
另外一个同步方法。 - 针对同一个对象,不同线程的同步块同步方法之间遵循同样的对锁的获取和释放协议。即便一个同步方法在执行,另一个线程也可以同时调用同一个对象的其他非同步方法。也就是说,同步不等于原子操作,但是同步可以用来实现原子操作。
- 当一个线程释放一个锁的时候,其他线程就可以获取到这个锁(有可能是同一个线程哦,如果线程释放后立即进入另外一个同步方法中)。但是对于接下来哪个线程会获取到锁或什么时候一个线程能获取到锁虚拟机对此不作保证。 也即是没有公平性的保证,同样的,也没有一种机制去确定对于一个给定的锁,当前正在被哪个线程锁持有。
- 接下来会讨论到,除了控制锁,同步同样也对底层的内存模型有副作用。
静态
锁定一个对象的意思不是说会对该对象的类和父类的静态字段做访问限制。要对静态字段做访问限制需要通过静态方法和静态块来实现。静态同步锁是通过类对象关联的静态方法来实现的。
类C的静态锁也可以通过以下方式在实例方法中访问:
synchronized(C.class) { /* body */ }
JVM内部获取和释放类对象的锁是在类加载和初始化的阶段之间完成的,使用普通类方法和类对象的同步块是不会影响这些JVM的内部机制的,除非是你自己写的一个特殊的类加载器或是你在静态序列初始化阶段同时持多个类对象的锁。
没有其他的内部JVM的动作会单独的为你使用和创建的类获取锁。但是如果你的子类是
java.*
包的,你 需要注意在这些包中的类的锁的策略。静态锁关联的类和其他类包括其父类都是不相关的。想通过在子类中增加一个静态方法来实现对父类中静态字段的访问现在是无效的。
推荐使用明确的类名的静态块实现方式代替
getClass()
的方式
1 | synchronized(C.class) { /* 推荐使用 */ } |
监视器
同每个对象都有一把锁一样,每个对象都有一个只能被这些方法:
wait, notify, notifyAll and Thread.interrupt
操控的线程等待集合。同时持有锁和等待集合的对象一般统称为:监视器。大部分的其他语言对这个的细节定义都有所不同。java中,任何对象都可以作为一个监视器。
每一个对象的等待集合都是在内部被JVM操控的。每个集合中都包含了一个被
wait
方法阻塞住的线程列表,只有当其他线程调用了对象的通知方法或wait被释放了之后这些线程才有可能继续执行。由于对象的等待集合和同步锁的交互方式决定了,这些方法
wait, notify, and notifyAll
只能在对象的同步锁被占有的情况下才能被调用。这些约定机制无法在编译期由编译器去校验,所以如果在运行时不遵从这个机制的话会抛出一个运行时的 异常
IllegalMonitorStateException
。这些方法的执行解释如下:
wait
线程T
执行这个方法会产生下列影响:- 如果当前线程被打断,则这个方法会立即退出,抛出
InterruptedException
异常,否则该方法一直阻塞。 - JVM会把这个线程放在内部(也即是不提供给外部访问)的和目标对象关联的一个等待集合中。
- 目标对象的同步锁被释放,但是所有该线程下持有的其他的锁还是会继续持有。即便这个目标对象的锁由于嵌套同步调用的原因被重入,也照样会被释放,在后者恢复后,锁的状态会被完全重置。
- 如果当前线程被打断,则这个方法会立即退出,抛出
notify
线程K
执行这个方法会有下列影响:- 如果在该对象的监视器等待集合中存在线程,JVM任务选择一个线程
T
并从等待集合中移除。如果等待集合中存在超过一个的线程的话,JVM对具体选择哪个进行移除操作不做保证。 - 被选择的线程
T
必须重新去竞争获取目标对象的同步锁,这样总是会导致线程T
阻塞一直到调用notify
的线程K
释放目标对象的锁为止。这期间如果其他的线程P
先抢占到这个锁的话,阻塞会一直继续。 - 最后如果线程
T
获取到对象的锁,就会从等待的执行点唤醒恢复执行。
- 如果在该对象的监视器等待集合中存在线程,JVM任务选择一个线程
notifyAll
这个方法和notify
方法的工作机制是一样的,不同之处是,这个方法是针对等待集合中的所有线程都有效果,但是同样的,由于需要竞争获取目标对象的同步锁,所以实际上是一次一个线程执行的。interrupt
- 如果一个线程正在挂起等待状态,这时候调用
Thread.interrupt
方法,这种情况会产生和notify
机制同样的反应,只不过在重新获取到锁之后会抛出一个InterruptedException
异常,并且线程的的中断状态会被置成false
。 - 如果
interrupt
和notify
在同一时间发生,JVM不保证哪一个会先得到执行,所以两个结果都是有可能的(以后的Java语言规范(JLS)可能对这种情况的结果会有一个确定的保证)。
- 如果一个线程正在挂起等待状态,这时候调用
timed waits
带过期时间的wait方法- 带过期时间的wait方法:
wait(long msecs), wait(long msecs, int nanosecs)
会在设置的最大时间内将线程维持在等待队列中。这个的执行效果和不带时间限制的wait方法的执行效果是基本一致的,只是说,带过期时间的wait方法会在过期时间到之后如果还没有被notify
的话,等待线程会自动被从等待集合中释放。这两个版本的方法并没有其他的状态上的区别。 - 超时时间版的wait方法会在超时时间到之后,随机的一个时间点被唤醒,这是由于线程竞争和CPU调度策略以及定时器的时间粒度等决定的。(对于定时器的时间粒度的影响,JVM并不给出保证,我们观察到的大部分的JVM是:当时间参数设置的小于1毫秒的情况下,响应时间大约在1-20毫秒之内)。
Thread.sleep(long msecs)
方法内部其实使用的是wait(long msecs)
方法,但是这个睡眠方法并没有绑定到当前同步块或者同步方法对应的对象的锁。它的实现可以用以下代码来展现:1
2
3
4if (msecs != 0) {
Object s = new Object();
synchronized(s) { s.wait(msecs); }
}当然了,各个系统不必非得按照这种方式实现
sleep
方法,同时请注意,sleep(0)
的意思是线 程至少暂停0毫秒,鬼知道这是什么意思!
- 带过期时间的wait方法: