Go是一个内存安全的语言。在数组和切片的索引和子切片操作中,Go运行时将检查操作中使用的下标是否越界。 如果下标越界,一个恐慌将产生,以防止这样的操作破坏内存安全。这样的检查称为边界检查。 边界检查使得我们的代码能够安全地运行;但是另一方面,也使得我们的代码运行效率略微降低。
从Go官方工具链1.7开始,官方标准编译器使用了一个新的基于SSA(single-assignment form,静态单赋值形式)的后端。 SSA使得Go编译器可以有效利用诸如BCE(bounds check elimination,边界检查消除)和CSE(common subexpression elimination,公共子表达式消除)等优化。 BCE可以避免很多不必要的边界检查,CSE可以避免很多重复表达式的计算,从而使得编译器编译出的程序执行效率更高。有时候这些优化的效果非常明显。
本文将展示一些例子来解释边界检查消除在官方标准编译器1.7+中的表现。
对于Go官方工具链1.7+,我们可以使用编译器选项-gcflags="-d=ssa/check_bce"
来列出哪些代码行仍然需要边界检查。
// example1.go
package main
func f1(s []int) {
_ = s[0] // 第5行: 需要边界检查
_ = s[1] // 第6行: 需要边界检查
_ = s[2] // 第7行: 需要边界检查
}
func f2(s []int) {
_ = s[2] // 第11行: 需要边界检查
_ = s[1] // 第12行: 边界检查消除了!
_ = s[0] // 第13行: 边界检查消除了!
}
func f3(s []int, index int) {
_ = s[index] // 第17行: 需要边界检查
_ = s[index] // 第18行: 边界检查消除了!
}
func f4(a [5]int) {
_ = a[4] // 第22行: 边界检查消除了!
}
func main() {}
$ go run -gcflags="-d=ssa/check_bce" example1.go
./example1.go:5: Found IsInBounds
./example1.go:6: Found IsInBounds
./example1.go:7: Found IsInBounds
./example1.go:11: Found IsInBounds
./example1.go:17: Found IsInBounds
我们可以看到函数f2
中的第12行和第13行不再需要边界检查了,因为第11行的检查确保了第12行和第13行中使用的下标肯定不会越界。
但是,函数f1
中的三行仍然都需要边界检查,因为第5行中的边界检查不能保证第6行和第7行中的下标没有越界,第6行中的边界检查也不能保证第第7行中的下标没有越界。
在函数f3
中,编译器知道如果第一个s[index]
是安全的,则第二个s[index]
是无需边界检查的。
编译器也正确地认为函数f4
中的唯一一行(第22行)是无需边界检查的。
// example1b.go
package main
func foo[E any](s []E) {
_ = s[0] // 第5行
_ = s[1] // 第6行
_ = s[2] // 第7行
}
// var _ = foo[bool]
func main() {
}
如果其中的变量声明行被注释掉,则标准编译器什么也不输出:
$ go run -gcflags="-d=ssa/check_bce" example1b.go
如果其中的变量声明行被启用,则标准编译器输出:
./aaa.go:5:7: Found IsInBounds
./example1b.go:6:7: Found IsInBounds
./example1b.go:7:7: Found IsInBounds
./example1b.go:4:6: Found IsInBounds
// example2.go
package main
func f5(s []int) {
for i := range s {
_ = s[i]
_ = s[i:len(s)]
_ = s[:i+1]
}
}
func f6(s []int) {
for i := 0; i < len(s); i++ {
_ = s[i]
_ = s[i:len(s)]
_ = s[:i+1]
}
}
func f7(s []int) {
for i := len(s) - 1; i >= 0; i-- {
_ = s[i]
_ = s[i:len(s)]
}
}
func f8(s []int, index int) {
if index >= 0 && index < len(s) {
_ = s[index]
_ = s[index:len(s)]
}
}
func f9(s []int) {
if len(s) > 2 {
_, _, _ = s[0], s[1], s[2]
}
}
func main() {}
$ go run -gcflags="-d=ssa/check_bce" example2.go
酷!官方标准编译器消除了上例程序中的所有边界检查。
注意:在Go官方工具链1.11之前,官方标准编译器没有足够聪明到认为第22行是不需要边界检查的。
// example3.go
package main
import "math/rand"
func fa() {
s := []int{0, 1, 2, 3, 4, 5, 6}
index := rand.Intn(7)
_ = s[:index] // 第9行: 需要边界检查
_ = s[index:] // 第10行: 边界检查消除了!
}
func fb(s []int, index int) {
_ = s[:index] // 第14行: 需要边界检查
_ = s[index:] // 第15行: 需要边界检查(不够智能?)
}
func fc() {
s := []int{0, 1, 2, 3, 4, 5, 6}
s = s[:4]
index := rand.Intn(7)
_ = s[:index] // 第22行: 需要边界检查
_ = s[index:] // 第23行: 需要边界检查(不够智能?)
}
func main() {}
$ go run -gcflags="-d=ssa/check_bce" example3.go
./example3.go:9: Found IsSliceInBounds
./example3.go:14: Found IsSliceInBounds
./example3.go:15: Found IsSliceInBounds
./example3.go:22: Found IsSliceInBounds
./example3.go:23: Found IsSliceInBounds
噢,仍然有这么多的边界检查!
但是等等,为什么官方标准编译器认为第10行不需要边界检查,却认为第15和第23行仍旧需要边界检查呢? 是标准编译器不够智能吗?
事实上,这里标准编译器做得对!为什么呢? 原因是一个子切片表达式中的起始下标可能会大于基础切片的长度。 让我们先看一个简单的使用了子切片的例子:
package main
func main() {
s0 := make([]int, 5, 10)
// len(s0) == 5, cap(s0) == 10
index := 8
// 在Go中,对于一个子切片表达式s[a:b],a和b须满足
// 0 <= a <= b <= cap(s);否则,将产生一个恐慌。
_ = s0[:index]
// 上一行是安全的不能保证下一行是无需边界检查的。
// 事实上,下一行将产生一个恐慌,因为起始下标
// index大于终止下标(即切片s0的长度)。
_ = s0[index:] // panic
}
所以如果s[:index]
是安全的则s[index:]
是无需边界检查的这条论述只有在len(s)
和cap(s)
相等的情况下才正确。这就是函数fb
和fc
中的代码仍旧需要边界检查的原因。
标准编译器成功地检测到在函数fa
中len(s)
和cap(s)
是相等的。干得漂亮!Go语言开发团队!
// example4.go
package main
import "math/rand"
func fb2(s []int, index int) {
_ = s[index:] // 第7行: 需要边界检查
_ = s[:index] // 第8行: 边界检查消除了!
}
func fc2() {
s := []int{0, 1, 2, 3, 4, 5, 6}
s = s[:4]
index := rand.Intn(7)
_ = s[index:] // 第15行: 需要边界检查
_ = s[:index] // 第16行: 边界检查消除了!
}
func main() {}
$ go run -gcflags="-d=ssa/check_bce" example4.go
./example4.go:7:7: Found IsSliceInBounds
./example4.go:15:7: Found IsSliceInBounds
在此例子中,标准编译器成功推断出:
fb2
中,如果第7行是安全的,则第8行是无需边界检查的;
fc2
中,如果第15行是安全的,则第16行是无需边界检查的。
注意:Go官方工具链1.9之前中的标准编译器没有出推断出第8行不需要边界检查。
// example5.go
package main
func fd(is []int, bs []byte) {
if len(is) >= 256 {
for _, n := range bs {
_ = is[n] // 第7行: 需要边界检查
}
}
}
func fd2(is []int, bs []byte) {
if len(is) >= 256 {
is = is[:256] // 第14行: 一个暗示
for _, n := range bs {
_ = is[n] // 第16行: 边界检查消除了!
}
}
}
func main() {}
$ go run -gcflags="-d=ssa/check_bce" example5.go
./example5.go:7: Found IsInBounds
本文上面列出的例子并没有涵盖标准编译器支持的所有边界检查消除的情形。本文列出的仅仅是一些常见的情形。
尽管标准编译器中的边界检查消除特性依然不是100%完美,但是对很多常见的情形,它确实很有效。 自从标准编译器支持此特性以来,在每个版本更新中,此特性都在不断地改进增强。 无需质疑,在以后的版本中,标准编译器会更加得智能,以至于上面第5个例子中提供给编译器的暗示有可能将变得不再必要。 谢谢Go语言开发团队出色的工作!
Go101.org网站内容包括Go编程各种相关知识(比如Go基础、Go优化、Go细节、Go实战、Go测验、Go工具等)。后续将不断有新的内容加入。敬请收藏关注期待。
本丛书微信公众号(联系方式一)名称为"Go 101"。二维码在网站首页。此公众号将时不时地发表一些Go语言相关的原创短文。各位如果感兴趣,可以搜索关注一下。
《Go语言101》系列丛书项目目前托管在Github上(联系方式二)。欢迎各位在此项目中通过提交bug和PR的方式来改进完善《Go语言101》丛书中的各篇文章。我们可以在项目目录下运行go run .
来浏览和确认各种改动。
本书的twitter帐号为@Golang_101(联系方式三)。玩推的Go友可以适当关注。
你或许对本书作者老貘开发的一些App感兴趣。
sync
标准库包sync/atomic
标准库包