深入 Go 的底层,带你走进一群有追求的人
上周六晚上,我参加了“Go夜读”活动,这期主要讲Go汇编语言,由滴滴大佬曹春晖大神主讲。活动结束后,我感觉打通了任督二脉。活动从晚上9点到深夜11点多,全程深度参与,大呼过瘾,以至于活动结束之后,久久不能平静。
可以说理解了Go汇编语言,就可以让我们对Go的理解上一个台阶,很多以前模棱的东西,在汇编语言面前都无所遁形了。我在活动上收获了很多,今天我来作一个总结,希望给大家带来启发!
缘起
几周前我写了一篇关于defer
的文章:《Golang之如何轻松化解defer的温柔陷阱》。这篇文章发出后不久就被GoCN
的每日新闻收录了,然后就被Go夜读群的大佬杨文看到了,之后被邀请去夜读活动分享。
正式分享前,我又主题阅读了很多文章,以求把defer讲清楚。阅读过程中,我发现但凡深入一点的文章,都会抛出Go汇编语言。于是就去搜索资料,无奈相关的资料太少,看得云里雾里,最后到了真正要分享的时候也没有完全弄清楚。
夜读活动结束之后,杨大发布了由春晖大神带来的夜读分享预告:《plan9 汇编入门,带你打通应用和底层》
。我得知这个消息后,非常激动!终于有牛人可以讲讲Go汇编语言了,听完之后估计会有很大提升,也能搞懂defer的底层原理了!
接着,我发现,春晖大神竟然和我在同一个公司!我在公司内网上搜到了他写的plan9汇编相关文章,发布到Go夜读的github上。我提前花时间预习完了文章,整理出了遇到的问题。
周六晚上9点准时开讲,曹大的准备很充分!原来1个小时的时间被拉长到了2个多小时,而曹大精力和反应一直很迅速,问的问题很快就能得到回答。我全程和曹大直接对话,感觉简直不要太爽!
这篇文章既是对这次夜读的总结,也是为了宣传一下Go夜读活动。那里是一群有追求的人,他们每周都会聚在一起,通过网络,探讨Go语言的方方面面。我相信,参与的人都会有很多不同的收获。
我直接参与的Go夜读活动有三期,一期分享,两期听讲,每次都有很多的收获。
自我介绍的技巧
很多人都不知道怎么做好一个自我介绍,要么含糊其辞,介绍完大家都不知道你讲了什么;要么说了半天无效的信息,大家并不关心的事情,搞得很尴尬。 其实自我介绍没那么难,掌握套路后,是可以做得很好的!
我在上上期Go夜读分享的时候,用一张PPT完成了自我介绍。包含了四个方面:个人基本信息
、出现在此时此地的原因
、我能带来的帮助
、我希望得到的帮助
。
个人基本信息
包括你叫什么名字,是哪里人,在什么地方工作,毕业于哪个学校,有什么兴趣爱好……这些基本的属性。这些信息可以让大家快速形成对你的直观认识。
出现在此时此地的原因
,可以讲解你的故事。你在什么地方通过什么人知道了这个活动,然后因为什么打动你来参加……通过故事可以迅速拉近与现场其他参与者的距离。
我能带来的帮助
,参加活动的人都是想获取一些东西的:知识、经验、见闻等等。但是,我们不能只索取,不付出。因此,可以讲讲你可以提供的帮助。比如我可以联系场地,我会写宣传文章等等,你可以讲出你独特的价值。
我希望得到的帮助
。每个参与的人都希望从活动中获得自己想要的东西,正是因为此,这个活动对于参与者才有意义,也才会持续下去的动力。
这四个方面,可以组成一个非常精彩的自我介绍。它最早是我在听罗胖的《罗辑思维》听到的,我把它写进了我的人生算法
里,今天推荐给大家。希望大家以后在需要自我介绍的场合有话可说,而且能说的精彩。
硬核知识点
什么是plan9汇编
我们知道,CPU是只认二进制指令的,也就是一串的0101;人类无法记住这些二进制码,于是发明了汇编语言。汇编语言实际上是二进制指令的文本形式,它与指令可以一一对应。
每一种CPU指令都是不一样的,因此对应的汇编语言也就不一样。人类写完汇编语言后,把它转换成二进制码,就可以被机器执行了。转换的动作由编译器完成。
Go语言的编译器和汇编器都带了一个-S参数,可以查看生成的最终目标代码。通过对比目标代码和原始的Go语言或Go汇编语言代码的差异可以加深对底层实现的理解。
Go汇编语言实际上来源于plan9汇编语言,而plan9汇编语言最初来源于Go语言作者之一的Ken Thompson为plan9系统所写的C语言编译器输出的汇编伪代码。这里强烈推荐一下春晖大神的新书《Go语言高级编程》,即将上市,电子版的点击阅读原文可以看到地址,书中有一整个章节讲Go的汇编语言,非常精彩!
理解Go的汇编语言,哪怕只是一点点,都能对Go的运行机制有更深入的理解。比如我们以前讲的defer,如果从Go源码编译后的汇编代码来看,就能深刻地掌握它的底层原理。再比如,很多文章都会分析Go的函数参数传递都是值传递,如果把汇编代码秀出来,很容易就能得出结论。
汇编角度看函数调用及返回过程
假设我们有一个这样年幼无知的例子,求两个int的和,Go源码如下:
使用如下命令得到汇编代码:
1go tool compile -S main.go
go tool compile
命令用于调用Go语言提供的底层命令工具,其中-S
参数表示输出汇编格式。
我们现在只关心add函数的汇编代码:
1"".add STEXT nosplit size=19 args=0x18 locals=0x0
2 0x0000 00000 (main.go:7) TEXT "".add(SB), NOSPLIT, $0-24
3 0x0000 00000 (main.go:7) FUNCDATA $0, gclocals·54241e171da8af6ae173d69da0236748(SB)
4 0x0000 00000 (main.go:7) FUNCDATA $1, gclocals·33cdeccccebe80329f1fdbee7f5874cb(SB)
5 0x0000 00000 (main.go:7) MOVQ "".b+16(SP), AX
6 0x0005 00005 (main.go:7) MOVQ "".a+8(SP), CX
7 0x000a 00010 (main.go:8) ADDQ CX, AX
8 0x000d 00013 (main.go:8) MOVQ AX, "".~r2+24(SP)
9 0x0012 00018 (main.go:8) RET
看不懂没关系,我目前也不是全部都懂,但是对于理解一个函数调用的整体过程而言,足够了。
10x0000 00000 (main.go:7) TEXT "".add(SB), NOSPLIT, $0-24
这一行表示定义add
这个函数,最后的数字$0-24
,其中0
表示函数栈帧大小为0;24
表示参数及返回值的大小:参数是2个int型变量,返回值是1个int型变量,共24字节。
再看中间这四行:
1 0x0000 00000 (main.go:7) MOVQ "".b+16(SP), AX
2 0x0005 00005 (main.go:7) MOVQ "".a+8(SP), CX
3 0x000a 00010 (main.go:8) ADDQ CX, AX
4 0x000d 00013 (main.go:8) MOVQ AX, "".~r2+24(SP)
代码片段中的第1行,将第2个参数b
搬到AX
寄存器;第2行将1个参数a
搬到寄存器CX
;第3行将a
和b
相加,相加的结果搬到AX
;最后一行,将结果搬到返回参数的地址,这段汇编代码非常简单,来看一下函数调用者和被调者的栈帧图:
(SP)指栈顶,b+16(SP)表示参数1的位置,从SP往上增加16个字节,注意,前面的b仅表示一个标号;同样,a+8(SP)表示实参0;~r2+24(SP)则表示返回值的位置。
具体可以看下面的图:
上面add函数的栈帧大小为0,其实更一般的调用者与被调用者的栈帧示意图如下:
最后,执行RET
指令。这一步把被调用函数add
栈帧清零,接着,弹出栈顶的返回地址
,把它赋给指令寄存器rip
,而返回地址
就是main
函数里调用add
函数的下一行。
于是,又回到了main
函数的执行环境,add
函数的栈帧也被销毁了。但是注意,这块内存是没有被清零的,清零动作是之后再次申请这块内存的时候要做的事。比如,声明了一个int型变量,它的默认值是0,清零的动作是在这里完成的。
这样,main函数完成了函数调用,也拿到了返回值,完美。
汇编角度看slice
再来看一个例子,我们来看看slice
的底层到底是什么。
1package main
2
3func main() {
4 s := make([]int, 3, 10)
5 _ = f(s)
6}
7
8func f(s []int) int {
9 return s[1]
10}
用上面同样的命令得到汇编代码,我们只关注f
函数的汇编代码:
1"".f STEXT nosplit size=53 args=0x20 locals=0x8
2 // 栈帧大小为8字节,参数和返回值为32字节
3 0x0000 00000 (main.go:8) TEXT "".f(SB), NOSPLIT, $8-32
4 // SP栈顶指针下移8字节
5 0x0000 00000 (main.go:8) SUBQ $8, SP
6 // 将BP寄存器的值入栈
7 0x0004 00004 (main.go:8) MOVQ BP, (SP)
8 // 将新的栈顶地址保存到BP寄存器
9 0x0008 00008 (main.go:8) LEAQ (SP), BP
10 0x000c 00012 (main.go:8) FUNCDATA $0, gclocals·4032f753396f2012ad1784f398b170f4(SB)
11 0x000c 00012 (main.go:8) FUNCDATA $1, gclocals·69c1753bd5f81501d95132d08af04464(SB)
12 // 取出slice的长度len
13 0x000c 00012 (main.go:8) MOVQ "".s+24(SP), AX
14 // 比较索引1是否超过len
15 0x0011 00017 (main.go:9) CMPQ AX, $1
16 // 如果超过len,越界了。跳转到46
17 0x0015 00021 (main.go:9) JLS 46
18 // 将slice的数据首地址加载到AX寄存器
19 0x0017 00023 (main.go:9) MOVQ "".s+16(SP), AX
20 // 将第8byte地址的元素保存到AX寄存器,也就是salaries[1]
21 0x001c 00028 (main.go:9) MOVQ 8(AX), AX
22 // 将结果拷贝到返回参数的位置(y)
23 0x0020 00032 (main.go:9) MOVQ AX, "".~r1+40(SP)
24 // 恢复BP的值
25 0x0025 00037 (main.go:9) MOVQ (SP), BP
26 // SP向上移动8个字节
27 0x0029 00041 (main.go:9) ADDQ $8, SP
28 // 返回
29 0x002d 00045 (main.go:9) RET
30 0x002e 00046 (main.go:9) PCDATA $0, $1
31 // 越界,panic
32 0x002e 00046 (main.go:9) CALL runtime.panicindex(SB)
33 0x0033 00051 (main.go:9) UNDEF
34 0x0000 48 83 ec 08 48 89 2c 24 48 8d 2c 24 48 8b 44 24 H...H.,$H.,$H.D$
35 0x0010 18 48 83 f8 01 76 17 48 8b 44 24 10 48 8b 40 08 .H...v.H.D$.H.@.
36 0x0020 48 89 44 24 28 48 8b 2c 24 48 83 c4 08 c3 e8 00 H.D$(H.,$H......
37 0x0030 00 00 00 0f 0b .....
38 rel 47+4 t=8 runtime.panicindex+0
通过上面的汇编代码,我们画出函数调用的栈帧图:
我们可以清晰地看到,一个slice本质上是用一个数据首地址,一个长度Len,一个容量Cap。所以在参数是slice的函数里,对slice的操作会影响到实参的slice。
正确参与Go夜读活动的方式
最后再说一下Go夜读活动的方式和目标。引自Go夜读的github说明文件:
由一个主讲人带着大家一起去阅读 Go 源代码,一起去啃那些难啃的算法、学习代码里面的奇淫技巧,遇到问题或者有疑惑了,我们可以一起去检索,解答这些问题。我们可以一起学习,共同成长。
我们希望可以推进大家深入了解 Go ,快速成长为资深的 Gopher 。我们希望每次来了的人和没来的人都能够有收获,成长。
前面我说Go夜读活动的小伙伴是一群有追求的人,这里我也指出一些问题吧。就我参与的三期来看,虽然zoom接入人数很多,高峰期50+人,但是全过程大家交流比较少,基本上是主讲人一个人在那自嗨。春晖大佬讲的那期,只有我全程提问。感觉像是我们两个人在对话,我的问题弄清楚了,只是不知道其他的参与同学如何?
我再给分享者和参与者提一些建议吧:
对于分享者,事先做好充足的准备,可以在文章里列出主要的点,放在github里,参考春晖大佬的plan9汇编讲义;最重要的一点,分享前给大家提供一份预习资料。
对于参与者,能获得最多收获的方式就是会前预习,会中积极提问,会后复习总结发散。另外,强烈建议参与者会前要准备至少一个问题,有针对性地听,才会有收获。会中也要积极提问,这也是对主讲者的反馈,不至于主讲者觉得只有自己在对着电脑讲。
最后,欢迎每一个学习Go语言的同学都能来Go夜读看看!点击阅读原文可以看到文章里提到的所有资料,包括上期曹大plan9汇编的视频回放,不容错过!
阅读原文
- 原文作者:饶全成
- 原文链接:https://qcrao.com/post/dive-into-go-asm/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。