曹大带我学 Go(2)—— 迷惑的 goroutine 执行顺序
上一篇文章我们讲了 Go 调度的本质是一个生产-消费流程。
生产端是正在运行的 goroutine 执行 go func(){}()
语句生产出 goroutine 并塞到三级队列中去。
消费端则是 Go 进程中的 m 在不断地执行调度循环,从三级队列中拿到 goroutine 来运行。
今天我们来通过 2 个实际的代码例子来看看 goroutine 的执行顺序是怎样的。
第一个例子
首先来看第一个例子:
1package main
2
3import (
4 "fmt"
5 "runtime"
6 "time"
7)
8
9func main() {
10 runtime.GOMAXPROCS(1)
11 for i := 0; i < 10; i++ {
12 i := i
13 go func() {
14 fmt.Println(i)
15 }()
16 }
17
18 var ch = make(chan int)
19 <- ch
20}
首先通过 runtime.GOMAXPROCS(1)
设置只有一个 P,接着创建了 10 个 goroutine,并分别打印出 i
值。你可以先想一下输出会是什么,再对着答案会有更深入的理解。
揭晓答案:
19
20
31
42
53
64
75
86
97
108
11fatal error: all goroutines are asleep - deadlock!
12
13goroutine 1 [chan receive]:
14main.main()
15 /home/raoquancheng/go/src/hello/main.go:16 +0x96
16exit status 2
程序输出的 fatal error
是因为 main goroutine 正在从一个 channel 里读数据,而这时所有的 channel 都已经挂了,因此出现死锁。这里先忽略这个,只需要关注 i
输出的顺序:9, 0, 1, 2, 3, 4, 5, 6, 7, 8
。
我来解释一下原因:因为一开始就设置了只有一个 P,所以 for 循环里面“生产”出来的 goroutine 都会进入到 P 的 runnext 和本地队列,而不会涉及到全局队列。
每次生产出来的 goroutine 都会第一时间塞到 runnext,而 i 从 1 开始,runnext 已经有 goroutine 在了,所以这时会把 old goroutine 移到 P 的本队队列中去,再把 new goroutine 放到 runnext。之后会重复这个过程……
因此这后当一次 i 为 9 时,新 goroutine 被塞到 runnext,其余 goroutine 都在本地队列。
之后,main goroutine 执行了一个读 channel 的语句,这是一个好的调度时机:main goroutine 挂起,运行 P 的 runnext 和本地可运行队列里的 gorotuine。
而我们又知道,runnext 里的 goroutine 的执行优先级是最高的,因此会先打印出 9,接着再执行本地队列中的 goroutine 时,按照先进先出的顺序打印:0, 1, 2, 3, 4, 5, 6, 7, 8
。
是不是非常有意思?
第二个例子
别急,我们再来看第 2 个例子:
1package main
2
3import (
4 "fmt"
5 "runtime"
6 "time"
7)
8
9func main() {
10 runtime.GOMAXPROCS(1)
11 for i := 0; i < 10; i++ {
12 i := i
13 go func() {
14 fmt.Println(i)
15 }()
16 }
17
18 time.Sleep(time.Hour)
19}
和第一个例子的不同之处是我们把读 channel 的代码换成 Sleep 操作。这一次,你还能正确回答 i
的输出顺序是什么吗?
我们直接揭晓答案。
当我们用 go1.13 运行时:
而当我们用 go1.14 及之后的版本运行时:
可以看到,用 go1.14 及之后的版本运行时,输出顺序和之前的一致。而用 go1.13 运行时,却先输出了 0
,这又是什么原因呢?
这就要从 Go 1.14 修改了 timer 的实现开始说起了。
go 1.13
的 time 包会生产一个名字叫 timerproc 的 goroutine 出来,它专门用于唤醒挂在 timer 上的时间未到期的 goroutine;因此这个 goroutine 会把 runnext 上的 goroutine 挤出去。因此输出顺序就是:0, 1, 2, 3, 4, 5, 6, 7, 8, 9
。
而 go 1.14
把这个唤醒的 goroutine 干掉了,取而代之的是,在调度循环的各个地方、sysmon 里都是唤醒 timer 的代码,timer 的唤醒更及时了,但代码也更难看懂了。所以,输出顺序和第一个例子是一致的。
总结
今天通过 2 个实际的例子再次复习了 Go 调度消费端的流程,也学到了 time 包在不同 go 版本下的不同之处以及它对程序输出造成的影响。
有些人还会把例子中的 10 改成比 256 更大的数去尝试。曹大说这是考眼力,不要给自己找事。因为这时 P 的本地队列装不下这么多 goroutine 了,只能放到全局队列。这下程序的输出顺序就不那么直观了。
所以,记住本文的核心内容就行了:
- runnext 的优先级最高。
- time.Sleep 在老版本中会创建一个 goroutine,在 1.14(包含)之后不会创建 goroutine 了。
如果被别人考到,知道三级队列,以及 time 包在 1.14 的变更就行了。
- 原文作者:饶全成
- 原文链接:https://qcrao.com/post/confusing-goroutine-running-orders/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。