目前,当 Go 需要和 C/C++ 代码集成的时候,大家最先想到的肯定是 CGO。毕竟是官方的解决方案,而且简单。
但是 CGO 是非常慢的。因为 CGO 其实一个桥接器,通过自动生成代码,CGO 在保留了 C/C++ 运行时的情况下,搭建了一个桥来沟通 C/C++ 世界和 Go 的世界。这就意味着,兼容性很好,但是对 C 的函数的调用,必须先把当前的 goroutine 挂起,并切换执行栈到当前的线程 M 的主栈(大小 2MB)。如果不做这个操作,那么只能在 goroutine 的栈上执行 C 函数调用,可是,goroutine 的栈一般都很小,很容易就导致了栈溢出了。
调用 C 函数的时候,必须切换当前的栈为线程的主栈,这带来了两个比较严重的问题:
- 线程的栈在 Go 运行时是比较少的,受到 P/M 数量的限制,一般可以简单的理解成受到 GOMAXPROCS 限制;
- 由于需要同时保留 C/C++ 的运行时,CGO 需要在两个运行时和两个 ABI(抽象二进制接口)之间做翻译和协调。这就带来了很大的开销。
minio 项目的一个副产品是 c2goasm 项目,这个项目也被 go-cv-simd 项目使用获得了很好的效果。
c2goasm 的角色是一个 汇编语言转换器,输入是 clang 输出的 amd64 汇编,输出是 go 汇编。而 clang 的输入是 C/C++ 语言。限制是不能有 RTTI 和异常。也就是说不能有 C/C++ 运行时提供的高级功能。
c2goasm 输出的 go 汇编,交给 go 的工具链可以直接生成 go 的可执行代码。
c2goasm 和 CGO 比,最大的改进就是:
- 不再有 C/C++ 运行时,也就没了在两者之间不停转换的逻辑开销;
- 不需要切换到线程的主栈来执行函数,因为 c2goasm 生成的是纯正的 go 函数,不需要线程的主栈就可以执行;
由此就极大的改进了性能,代价是兼容性和可移植性损失了。
欢迎来到这里!
我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。
注册 关于