Go 语言的闭包捕获的外部变量,我还是习惯以 Lua 的叫法,称之为 Upvalue,毕竟 Go 借鉴了很多 Lua 的特性。
让我们首先看五个几乎一样的代码片段。
package main
import (
"log"
"sync"
)
func main() {
wg := sync.WaitGroup{}
for i := 0; i < 5; i++ {
wg.Add(1)
go func(wg sync.WaitGroup, i int) {
log.Printf("i:%d", i)
wg.Done()
}(wg, i)
}
wg.Wait()
log.Println("exit")
}
输出:
go run wgtest1.go
2017/01/01 23:43:08 i:4
2017/01/01 23:43:08 i:2
2017/01/01 23:43:08 i:3
2017/01/01 23:43:08 i:1
2017/01/01 23:43:08 i:0
fatal error: all goroutines are asleep - deadlock!
goroutine 1 [semacquire]:
sync.runtime_Semacquire(0xc42000a2ac)
/usr/local/Cellar/go/1.7.4_1/libexec/src/runtime/sema.go:47 +0x30
sync.(*WaitGroup).Wait(0xc42000a2a0)
/usr/local/Cellar/go/1.7.4_1/libexec/src/sync/waitgroup.go:131 +0x97
main.main()
/Users/linkerlin/gos/wgtest1.go:17 +0xba
exit status 2
这是因为 Go 语言中 WaitGroup 是一个不可以在第一次使用后复制的对象。而 goroutine 的主函数其实是传值的方法传递了 WaitGroup。这里可以特别注意下 i 的输出是符合预期的。
好,让我们接下来看第二段代码:
package main
import (
"log"
"sync"
)
func main() {
wg := sync.WaitGroup{}
for i := 0; i < 5; i++ {
wg.Add(1)
go func() {
log.Printf("i:%d", i)
wg.Done()
}()
}
wg.Wait()
log.Println("exit")
}
输出:
go run wgtest2.go
2017/01/01 23:48:10 i:5
2017/01/01 23:48:10 i:5
2017/01/01 23:48:10 i:5
2017/01/01 23:48:10 i:5
2017/01/01 23:48:10 i:5
2017/01/01 23:48:10 exit
没有死锁,但是 i 值的输出是错误的。因为,Go 语言里面 upvalue 是引用的。Goroutine 多次捕获的是同一个 i。
再来,我们看第三段代码:
package main
import (
"log"
"sync"
)
func main() {
wg := sync.WaitGroup{}
for i := 0; i < 5; i++ {
wg.Add(1)
go func() {
log.Printf("i:%d", i)
wg.Done()
}()
}
wg.Wait()
log.Println("exit")
}
输出:
go run wgtest3.go
2017/01/01 23:51:46 i:5
2017/01/01 23:51:46 i:5
2017/01/01 23:51:46 i:5
2017/01/01 23:51:46 i:4
2017/01/01 23:51:46 i:5
2017/01/01 23:51:46 exit
没死锁,i 的数值还是不对。因为 upvaule 的 i 是 byRef 传递。注意,这里出现了 4 个 5 和一个 4,最终输出什么其实是随机,取决于操作系统和硬件。goroutine 调度的越快,就越可能出现比 5 小的输出。
再来,我们看第四段代码:
package main
import (
"log"
"sync"
)
func main() {
wg := sync.WaitGroup{}
for i := 0; i < 5; i++ {
wg.Add(1)
go func(wg *sync.WaitGroup, i int) {
log.Printf("i:%d", i)
wg.Done()
}(&wg, i)
}
wg.Wait()
log.Println("exit")
}
输出:
go run wgtest4.go
2017/01/01 23:56:51 i:1
2017/01/01 23:56:51 i:0
2017/01/01 23:56:51 i:4
2017/01/01 23:56:51 i:2
2017/01/01 23:56:51 i:3
2017/01/01 23:56:51 exit
一切正常,符合预期。但是,这种写法却比较累赘。首先,没有利用闭包的 upvalue 来构建一个高阶函数,而是恢复到传统的传值,同时这种写法对写代码的人的心智负担太重了,传值和传引用要手动指定,而且还要在 goroutine 的主函数入口一一指定。那么我们推荐的写法应该是什么样子的呢?
最后,来看第五段代码:
package main
import (
"log"
"sync"
)
func main() {
wg := sync.WaitGroup{}
for i := 0; i < 5; i++ {
func(i int) {
wg.Add(1)
go func() {
log.Printf("i:%d", i)
wg.Done()
}()
}(i)
}
wg.Wait()
log.Println("exit")
}
输出:
go run wgtest5.go
2017/01/02 00:03:32 i:4
2017/01/02 00:03:32 i:0
2017/01/02 00:03:32 i:1
2017/01/02 00:03:32 i:2
2017/01/02 00:03:32 i:3
2017/01/02 00:03:32 exit
一样的一切正常。但是在第五段代码中,Goroutine 的主函数是没有参数的。传引用的情况利用了 upvalue,而需要传值的 i 变量用了一个外包函数的参数来复制。因为每次循环都会调用这个外包函数,从而复制了一次 i 的数值,虽然里层的 Goroutine 主函数还是 通过 upvalue 来捕获 i,不过每次捕获的都是外包函数的 i 副本而已。
综上所述,处于降低开发人员心智负担的考虑,我建议:
1. Go 语言里面的 goroutine 的入口函数不要传递参数。
2. 所有的传 ref 参数都通过 upvalue 来捕获。
3. 如果要传值,可以在 goroutine 外面包一个函数,把要传 value 的参数用传值的方法传给这个外包的函数。参数名保持同名。
欢迎来到这里!
我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。
注册 关于