Uber Go 风格指南
- 译文:https://github.com/Allenxuxu/uber-go-guide
- 原文:https://github.com/uber-go/guide/blob/master/style.md
简介
风格是指规范代码的共同约定。风格一词其实是有点用词不当的,因为共同约定的范畴远远不止 gofmt 所做的源代码格式化这些。
本指南旨在通过详尽描述 Uber 在编写 Go 代码中的注意事项(规定)来解释其中复杂之处。制定这些注意事项(规定)是为了提高代码可维护性同时也让工程师们高效的使用 Go 的特性。
这份指南最初由 Prashant Varanasi 和 Simon Newton 编写,目的是让一些同事快速上手 Go 。多年来,已经根据其他人的反馈不断修改。
这份文档记录了我们在 Uber 遵守的 Go 惯用准则。其中很多准则是 Go 的通用准则,其他方面依赖于外部资源:
所有的代码都应该通过 golint
和 go vet
检查。我们建议您设置编辑器:
- 保存时自动运行
goimports
- 自动运行
golint
和go vet
来检查错误
您可以在这找到关于编辑器设定 Go tools 的相关信息:
指南
指向接口(interface)的指针
你基本永远不需要一个指向接口的指针。你应该直接将接口作为值传递,因为接口的底层数据就是指针。
一个接口包含两个字段:
- 类型指针,指向某些特定类型信息的指针。
- 数据指针。如果存储数据是一个指针变量,那就直接存储。如果存储数据是一个值变量,那就存储指向该值的指针。
如果你需要接口方法来修改这些底层数据,那你必须使用指针。
方法接收器和接口
具有值类型接收器的方法可以被值类型和指针类型调用。
例如,
type S struct {
data string
}
func (s S) Read() string {
return s.data
}
func (s *S) Write(str string) {
s.data = str
}
sVals := map[int]S{1: {"A"}}
// 值类型变量只能调用 Read 方法
sVals[1].Read()
// 无法编译通过:
// sVals[0].Write("test")
sPtrs := map[int]*S{1: {"A"}}
// 指针类型变量可以调用 Read 和 Write 方法:
sPtrs[1].Read()
sPtrs[1].Write("test")
同理,即使方法是值类型接收器,接口也可以通过指针来满足调用需求。
type F interface {
f()
}
type S1 struct{}
func (s S1) f() {}
type S2 struct{}
func (s *S2) f() {}
s1Val := S1{}
s1Ptr := &S1{}
s2Val := S2{}
s2Ptr := &S2{}
var i F
i = s1Val
i = s1Ptr
i = s2Ptr
// 无法编译通过, 因为 s2Val 是一个值类型变量, 并且 f 方法不具有值类型接收器。
// i = s2Val
Effective Go 中关于 Pointers vs. Values 写的很棒。
零值 Mutexes 是有效的
零值的 sync.Mutex
和 sync.RWMutex
是有效的,所以基本是不需要一个指向 Mutex
的指针的。
Bad | Good |
---|---|
|
|
如果你希望通过指针操作结构体,mutex 可以作为其非指针结构体字段,或者最好直接嵌入结构体中。
|
|
嵌入到非导出类型或者需要实现 Mutex 接口的类型。 | 对于导出类型,将 mutex 作为私有成员变量。 |
Slices 和 Maps 的边界拷贝操作
切片和 map 包含一个指针来指向底层数据,所以当需要复制他们时需要特别注意。
接收 Slices 和 Maps
请记住,如果存储了对 slice 或 map 的引用,那么用户是可以对其进行修改。
Bad | Good |
---|---|
|
|
返回 Slices 和 Maps
同理,谨慎提防用户修改暴露内部状态的 slices 和 maps 。
Bad | Good |
---|---|
|
|
使用 defer 来做清理工作
使用 defer 来做资源的清理工作,例如文件的关闭和锁的释放。
Bad | Good |
---|---|
|
|
defer 只有非常小的性能开销,只有当你能证明你的函数执行时间在纳秒级别时才可以不使用它。使用 defer 对代码可读性的提高是非常值得的,因为使用 defer 的成本真的非常小。特别是在一些主要是做内存操作的长函数中,函数中的其他计算操作远比 defer
重要。
Channel 的大小设为 1 还是 None
通道的大小通常应该设为 1 或者设为无缓冲类型。默认情况下,通道是无缓冲类型的,大小为 0 。将通道大小设为其他任何数值都应该经过深思熟虑。认真考虑如何确定其大小,是什么阻止了工作中的通道被填满并阻塞了写入操作,以及何种情况会发生这样的现象。
Bad | Good |
---|---|
|
|
枚举类型值从 1 开始
在 Go 中使用枚举的标准方法是声明一个自定义类型并通过 iota 关键字来声明一个 const 组。但是由于 Go 中变量的默认值都为该类型的零值,所以枚举变量的值应该从非零值开始。
Bad | Good |
---|---|
|
|
在某些情况下,从零值开始也是可以的。例如,当零值是我们期望的默认行为时。
type LogOutput int
const (
LogToStdout LogOutput = iota
LogToFile
LogToRemote
)
// LogToStdout=0, LogToFile=1, LogToRemote=2
错误类型
有很多种方法来声明 errors:
errors.New
声明简单的静态字符串错误信息fmt.Errorf
声明格式化的字符串错误信息- 为自定义类型实现
Error()
方法 - 通过
"pkg/errors".Wrap
包装错误类型
返回错误时,请考虑以下因素来作出最佳选择:
- 这是一个不需要其他额外信息的简单错误吗?如果是,使用
error.New
。 - 客户需要检测并处理此错误吗?如果是,那应该自定义类型,并实现
Error()
方法。 - 是否是在传递一个下游函数返回的错误?如果是,请查看 error 封装部分。
- 其他,使用
fmt.Errorf
。
如果客户需要检测错误,并且是通过 errors.New
创建的一个简单的错误,请使用 var 声明这个错误类型。
Bad | Good |
---|---|
|
|
如果你有一个错误需要客户端来检测,并且你想向其添加更多信息(例如,它不是一个简单的静态字符串),那么应该声明一个自定义类型。
Bad | Good |
---|---|
|
|
直接将自定义的错误类型设为导出需要特别小心,因为这意味着他们已经成为包的公开 API 的一部分了。更好的方式是暴露一个匹配函数来检测错误。
// package foo
type errNotFound struct {
file string
}
func (e errNotFound) Error() string {
return fmt.Sprintf("file %q not found", e.file)
}
func IsNotFoundError(err error) bool {
_, ok := err.(errNotFound)
return ok
}
func Open(file string) error {
return errNotFound{file: file}
}
// package bar
if err := foo.Open("foo"); err != nil {
if foo.IsNotFoundError(err) {
// handle
} else {
panic("unknown error")
}
}
Error 封装
下面提供三种主要的方法来传递函数调用失败返回的错误:
- 如果想要维护原始错误类型并且不需要添加额外的上下文信息,就直接返回原始错误。
- 使用
"pkg/errors".Wrap
来增加上下文信息,这样返回的错误信息中就会包含更多的上下文信息,并且通过"pkg/errors".Cause
可以提取出原始错误信息。 - 如果调用方不需要检测或处理特定的错误情况,就直接使用
fmt.Errorf
。
情况允许的话建议增加更多的上下文信息来代替诸如 "connection refused"
之类模糊的错误信息。返回 "failed to call service foo: connection refused"
用户可以知道更多有用的错误信息。
在将上下文信息添加到返回的错误时,请避免使用 "failed to" 之类的短语以保持信息简洁,这些短语描述的状态是显而易见的,并且会随着错误在堆栈中的传递而逐渐堆积:
Bad | Good |
---|---|
|
|
|
|
但是,如果这个错误信息是会被发送到另一个系统时,必须清楚的表明这是一个错误(例如,日志中 err
标签或者 Failed
前缀)。
另见 Don't just check errors, handle them gracefully。
处理类型断言失败
类型断言的单返回值形式在遇到类型错误时会直接 panic 。因此,请始终使用 "comma ok" 惯用方法。
Bad | Good |
---|---|
|
|
不要 Panic
生产级的代码必须避免 panics 。panics 是级联故障的主要源头。如果错误发生,函数应该返回错误并且允许调用者决定如果处理它。
Bad | Good |
---|---|
|
|
Panic/recover 并不是错误处理策略。程序只有在遇到无法处理的情况下才可以 panic ,例如,nil 引用。程序初始化时是一个例外情况:程序启动时遇到需要终止执行的错误可能会 painc 。
var _statusTemplate = template.Must(template.New("name").Parse("_statusHTML"))
即使是在测试中,也应优先选择 t.Fatal
或 t.FailNow
而非 panic,以确保测试标记为失败。
Bad | Good |
---|---|
|
|
使用 go.uber.org/atomic
Go 的 sync/atomic
包仅仅提供针对原始类型(int32, int64, ...)的原子操作。因此,很容易忘记使用原子操作来读写变量。
go.uber.org/atomic 通过隐藏基础类型,使这些操作类型安全。并且,它还提供一个方便的 atomic.Bool
类型。
Bad | Good |
---|---|
|
|
性能
性能方面的特定准则,仅适用于热路径。
strconv 性能优于 fmt
将原语转换为字符串或从字符串转换时,strconv
速度比 fmt
更快。
Bad | Good |
---|---|
|
|
|
|
避免 string to byte 的转换
不要反复地从字符串字面量创建 byte 切片。相反,执行一次转换后存储结果供后续使用。
Bad | Good |
---|---|
|
|
|
|
代码风格
声明分组
Go 支持将相似的声明分组:
Bad | Good |
---|---|
|
|
分组同样适用于常量、变量和类型的声明:
Bad | Good |
---|---|
|
|
仅将相似的声明放在同一组。不相关的声明不要放在同一个组内。
Bad | Good |
---|---|
|
|
声明分组可以在任意位置使用。例如,可以在函数内部使用。
Bad | Good |
---|---|
|
|
Import 组内顺序
import 有两类导入组:
- 标准库
- 其他
goimports 默认的分组如下:
Bad | Good |
---|---|
|
|
包名
当为包命名时,请注意如下事项:
- 字符全部小写,没有大写或者下划线
- 在大多数情况下引入包不需要去重命名
- 简单明了,命名需要能够在被导入的地方准确识别
- 不要使用复数。例如,
net/url
, 而不是net/urls
- 不要使用“common”,“util”,“shared”或“lib”之类的。这些都是不好的,表达信息不明的名称
另见 Package Names 和 Style guideline for Go packages
函数命名
我们遵循 Go 社区关于使用的 MixedCaps for function names。有一种情况例外,对相关的测试用例进行分组时,函数名可能包含下划线,如: TestMyFunction_WhatIsBeingTested
。
包导入别名
如果包的名称与导入路径的最后一个元素不匹配,那必须使用导入别名。
import (
"net/http"
client "example.com/client-go"
trace "example.com/trace/v2"
)
在其他情况下,除非导入的包名之间有直接冲突,否则应避免使用导入别名。
Bad | Good |
---|---|
|
|
函数分组与排布顺序
- 函数应该粗略的按照调用顺序来排布
- 同一文件中的函数应该按照接收器的类型来分组排布
所以,公开的函数应排布在文件首,并在 struct、const 和 var 定义之后。
newXYZ()/ NewXYZ() 之类的函数应该排布在声明类型之后,具有接收器的其余方法之前。
因为函数是按接收器类别分组的,所以普通工具函数应排布在文件末尾。
Bad | Good |
---|---|
|
|
减少嵌套
代码应该通过尽可能地先处理错误情况/特殊情况,并且及早返回或继续下一循环来减少嵌套。尽量减少嵌套于多个级别的代码数量。
Bad | Good |
---|---|
|
|
不必要的 else
如果一个变量在 if 的两个分支中都设置了,那应该使用单个 if 。
Bad | Good |
---|---|
|
|
全局变量声明
在顶层使用标准 var 关键字声明变量时,不要显式指定类型,除非它与表达式的返回类型不同。
Bad | Good |
---|---|
|
|
如果表达式的返回类型与所需的类型不完全匹配,请显示指定类型。
type myError struct{}
func (myError) Error() string { return "error" }
func F() myError { return myError{} }
var _e error = F()
// F 返回一个 myError 类型的实例,但是我们要 error 类型
非导出的全局变量或者常量以 _ 开头
非导出的全局变量和常量前面加上前缀 _
,以明确表示它们是全局符号。
例外:未导出的错误类型变量,应以 err
开头。
解释:顶级(全局)变量和常量具有包范围作用域。使用通用名称命名,可能在其他文件中不经意间地使用一个错误值。
Bad | Good |
---|---|
|
|
结构体中的嵌入类型
嵌入式类型(例如 mutex )应该放置在结构体字段列表的顶部,并且必须以空行与常规字段隔开。
Bad | Good |
---|---|
|
|
使用字段名来初始化结构
初始化结构体时,必须指定字段名称。go vet
强制执行。
Bad | Good |
---|---|
|
|
例外:在测试文件中,如果结构体只有 3 个或更少的字段,则可以省略字段名称。
tests := []struct{
}{
op Operation
want string
}{
{Add, "add"},
{Subtract, "subtract"},
}
局部变量声明
如果声明局部变量时需要明确设值,应使用短变量声明形式(:=)。
Bad | Good |
---|---|
|
|
但是,在某些情况下,使用 var 关键字声明变量,默认的初始化值会更清晰。例如,声明空切片。
Bad | Good |
---|---|
|
|
nil 是一个有效的 slice
nil 是一个有效的长度为 0 的 slice,这意味着:
-
不应明确返回长度为零的切片,而应该直接返回 nil 。
Bad Good if x == "" { return []int{} }
if x == "" { return nil }
-
若要检查切片是否为空,始终使用
len(s) == 0
,不要与 nil 比较来检查。Bad Good func isEmpty(s []string) bool { return s == nil }
func isEmpty(s []string) bool { return len(s) == 0 }
-
零值切片(通过 var 声明的切片)可直接使用,无需调用 make 创建。
Bad Good nums := []int{} // or, nums := make([]int) if add1 { nums = append(nums, 1) } if add2 { nums = append(nums, 2) }
var nums []int if add1 { nums = append(nums, 1) } if add2 { nums = append(nums, 2) }
缩小变量作用域
如果有可能,尽量缩小变量作用范围,除非这样与减少嵌套的规则冲突。
Bad | Good |
---|---|
|
|
如果需要在 if 之外使用函数调用的结果,则不应尝试缩小范围。
Bad | Good |
---|---|
|
|
避免裸参数
函数调用中的裸参数可能会降低代码可读性。所以当参数名称的含义不明显时,请为参数添加 C 样式的注释(/* … */)。
Bad | Good |
---|---|
|
|
上面更好的作法是将 bool 类型替换为自定义类型,从而使代码更易读且类型安全。将来需要拓展时,该参数也可以不止两个状态(true/false)。
type Region int
const (
UnknownRegion Region = iota
Local
)
type Status int
const (
StatusReady = iota + 1
StatusDone
// 也许将来我们会有 StatusInProgress。
)
func printInfo(name string, region Region, status Status)
使用原始字符串字面值,避免使用转义
Go 支持原始字符串字面值,可以多行并包含引号。使用它可以避免使用肉眼阅读较为困难的手工转义的字符串。
Bad | Good |
---|---|
|
|
初始化结构体引用
在初始化结构引用时,使用 &T{}
而非 new(T)
,以使其与结构体初始化方式保持一致。
Bad | Good |
---|---|
|
|
格式化字符串放在 Printf 外部
如果为 Printf-style 函数声明格式化字符串,将格式化字符串放在函数外面 ,并将其设置为 const 常量。
这有助于 go vet
对格式字符串进行静态分析。
Bad | Good |
---|---|
|
|
为 Printf 样式函数命名
声明 Printf-style 函数时,请确保 go vet
可以检查它的格式化字符串。
这意味着应尽可能使用预定义的 Printf-style 函数名称。go vet
默认会检查它们。更多相关信息,请参见 Printf 系列。
如果不能使用预定义的名称,请以 f 结尾:Wrapf,而非 Wrap。因为 go vet
可以指定检查特定的 Printf 样式名称,但名称必须以 f 结尾。
$ go vet -printfuncs=wrapf,statusf
...
另见 go vet: Printf family check
模式
测试表
在核心测试逻辑重复时,将表驱动测试与子测试一起使用,以避免重复代码。
Bad | Good |
---|---|
|
|
测试表使得向错误消息注入上下文信息,减少重复的逻辑,添加新的测试用例变得更加容易。
我们遵循这样的约定:将结构体切片称为 tests。 每个测试用例称为 tt 。此外,我们鼓励使用 give 和 want 前缀说明每个测试用例的输入和输出值。
tests := []struct {
give string
wantHost string
wantPort string
}{
// ...
}
for _, tt := range tests {
// ...
}
功能选项
功能选项是一种模式,声明一个不透明 Option 类型,该类型记录某些内部结构体的信息。您的函数接受这些不定数量的选项参数,并将选项参数上的信息作用于内部结构上。
此模式可用于扩展构造函数和实现其他公共 API 中的可选参数,特别是这些参数已经有三个或者超过三个的情况下。
Bad | Good |
---|---|
|
|
另见,
欢迎来到这里!
我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。
注册 关于