Kaleidoscope 系列第八章：编译为目标代码

原文链接：

本文是系列第八章，将生成的代码编译为目标机器代码。

第八章简介

欢迎来到“”教程的第八章。本章介绍如何将我们的中间代码编译为目标代码。

选择一个目标

LLVM 支持本地交叉编译。我们可以将代码编译为当前计算机的体系结构，也可以像针对其他体系结构一样轻松地进行编译。在本教程中，我们主要针对当前计算机。

为了指定要定位的体系结构，我们使用一个称为 target Triple 的字符串。这采用表格形式 <arch><sub>-<vendor>-<sys>-<abi>（请参阅交叉编译文档）。

例如，通过 clang 我们可以看到我们当前的 target Triple：


$ clang --version | grep Target
Target: x86_64-unknown-linux-gnu

运行此命令可能会显示与您使用的体系结构或操作系统不同的计算机上的某些内容。

幸运的是，我们不需要对目标三元组进行硬编码就可以将当前机器作为目标。LLVM 提供了 sys::getDefaultTargetTriple，它返回当前计算机的目标三元组。


auto TargetTriple = sys::getDefaultTargetTriple();

LLVM 不需要我们链接所有目标功能。例如，如果我们仅使用 JIT，则不需要组装打印机。同样，如果我们仅针对某些架构，则只能链接这些架构的功能。

在此示例中，我们将初始化所有目标以发出目标代码。


InitializeAllTargetInfos();
InitializeAllTargets();
InitializeAllTargetMCs();
InitializeAllAsmParsers();
InitializeAllAsmPrinters();

现在，我们就可以使用目标三元组获得 Target：


std::string Error;
auto Target = TargetRegistry::lookupTarget(TargetTriple, Error);

// Print an error and exit if we couldn't find the requested target.
// This generally occurs if we've forgotten to initialise the
// TargetRegistry or we have a bogus target triple.
if (!Target) {
  errs() << Error;
  return 1;
}

目标机器

我们还将需要一个 TargetMachine 类。此类提供了我们要定位的机器的完整机器描述。如果我们要针对特定功能（例如 SSE）或特定 CPU（例如英特尔的 Sandylake）。

要查看 LLVM 知道哪些功能和 CPU，我们可以使用 llc 命令。例如，让我们看一下 x86：


$ llvm-as < /dev/null | llc -march=x86 -mattr=help
Available CPUs for this target:

  amdfam10      - Select the amdfam10 processor.
  athlon        - Select the athlon processor.
  athlon-4      - Select the athlon-4 processor.
  ...

Available features for this target:

  16bit-mode            - 16-bit mode (i8086).
  32bit-mode            - 32-bit mode (80386).
  3dnow                 - Enable 3DNow! instructions.
  3dnowa                - Enable 3DNow! Athlon instructions.
  ...

对于我们的示例，我们将使用不带任何其他功能，选项或重定位模型的通用 CPU。


auto CPU = "generic";
auto Features = "";

TargetOptions opt;
auto RM = Optional<Reloc::Model>();
auto TargetMachine = Target->createTargetMachine(TargetTriple, CPU, Features, opt, RM);

配置 Module

现在，我们可以配置模块，以指定目标和数据布局。这不是严格必要的，但是前端性能指南建议这样做。优化可以从了解目标和数据布局中受益。


TheModule->setDataLayout(TargetMachine->createDataLayout());
TheModule->setTargetTriple(TargetTriple);

生成目标代码

我们准备生成目标代码！我们先定义要将文件写入的位置：


auto Filename = "output.o";
std::error_code EC;
raw_fd_ostream dest(Filename, EC, sys::fs::OF_None);

if (EC) {
  errs() << "Could not open file: " << EC.message();
  return 1;
}

最后，我们定义一个发出目标代码的过程，然后运行该 pass：


legacy::PassManager pass;
auto FileType = TargetMachine::CGFT_ObjectFile;

if (TargetMachine->addPassesToEmitFile(pass, dest, nullptr, FileType)) {
  errs() << "TargetMachine can't emit a file of this type";
  return 1;
}

pass.run(*TheModule);
dest.flush();

组合起来

它行得通吗？试一试吧。我们需要编译代码，但是请注意，to 的参数 llvm-config 与前面的章节不同。


$ clang++ -g -O3 chapter8-Compiling-to-Object-Code.cpp `llvm-config --cxxflags --ldflags --system-libs --libs all` -o toy

让我们运行它，并定义一个简单的 average 函数。完成后按 Ctrl-D。


$ ./toy
ready> def average(x y) (x + y) * 0.5;
^D
Wrote output.o

我们有一个目标文件！为了测试它，让我们编写一个简单的程序并将其与我们的输出链接。这是源代码：


#include <iostream>

extern "C" {
    double average(double, double);
}

int main() {
    std::cout << "average of 3.0 and 4.0: " << average(3.0, 4.0) << std::endl;
}

我们将程序链接到 output.o，并检查结果是否符合预期：


$ clang++ main.cpp output.o -o main
$ ./main
average of 3.0 and 4.0: 3.5

完整代码集合

chapter8-Compiling-to-Object-Code.cpp

参考： Kaleidoscope: Compiling to Object Code

Kaleidoscope 系列第九章：增加调试信息

原文链接:[链接] 本文是[链接]系列第九章，将为 Kaleidoscope 添加调试信息，帮助高效开发新语言。第九章简介欢迎来到“[链接]”教程的第九章。在第一章至第八章中，我们构建了一种带有函数和变量的体面的小型编程语言。这时会有一个问题，那就是如果出了问题怎么办，如何调试程序？源代码级调试使用格式化的数据， ..

Kaleidoscope 系列第十章：总结和其他技巧

原文链接：本文是[链接]系列第十章，对 Kaleidoscope 开发过程进行总结，分析可能使用到的其他技巧。教程总结欢迎来到“[链接]”教程的最后一章。在本教程的过程中，我们已经将 Kaleidoscope 这种小语言从一种无用的玩具发展为一种半有趣（但可能仍然无用）的玩具语言。有趣的是，我们已经走了多远，花 ..

Kaleidoscope 系列第七章：扩展语言—可变变量

原文链接: [链接] 本文是[链接]系列第七章，继续扩展 Kaleidoscope 语言特性，增加可变变量处理。第七章简介欢迎来到“[链接]”教程的第七章。在第一章至第六章中，我们构建了一种尽管简单的但是非常像样的 [链接]。在我们的开发过程中，我们学习了一些解析技术，包括如何构建和表示 AST，如何构建 LLVM ..

Kaleidoscope 系列第六章：扩展语言—用户自定义运算符

原文链接:[链接] 本文是[链接]系列第六章，继续扩展 Kaleidoscope 语言特性，增加用户自定义运算符处理。第六章简介欢迎来到“[链接]”教程的第六章。至此，在本教程中，我们现在有了一种功能齐全的语言，该语言相当少，但也很有用。但是，仍然存在一个大问题。我们的语言没有很多有用的运算符（例如除法，逻辑求反， ..

Kaleidoscope 系列第五章：扩展语言—控制流

原文链接: Kaleidoscope 系列第五章：扩展语言---控制流本文是使用 LLVM 开发新语言 Kaleidoscope 教程系列第五章，主要扩展 Kaleidoscope 语言特性，增加多种控制流处理。第五章简介欢迎来到“使用 LLVM 开发新语言 Kaleidoscope 教程”教程的第五章。第 1- ..

Kaleidoscope 系列第四章：添加 JIT 和 Optimizer 支持

原文链接: [链接] 本文是[链接]系列第四章，主要添加 JIT 编译器及 LLVM 中部分优化功能。第四章简介欢迎来到“[链接]”教程的第四章。前一至三章介绍了一种简单语言的实现并增加了对生成 LLVM IR 的支持。本章介绍了两种新技术：为我们的语言添加优化器支持，以及添加 JIT 编译器支持。这些补充内容将演 ..

Kaleidoscope 系列第三章：生成 LLVM 中间代码 IR

原文链接:[链接] 本文是[链接]系列第三章，主要实现将 AST 转化为 LLVM IR 的功能。第三章简介欢迎来到“[链接]”教程的第三章。本章介绍如何将第二章中构建的[链接]转换为 LLVM IR。本章将告诉我们一些有关 LLVM 如何工作的知识，并演示它的易用性。构建词法分析器和解析器要比生成 LLVM IR ..

欢迎来到这里！

我们正在构建一个小众社区，大家在这里相互信任，以平等 • 自由 • 奔放的价值观进行分享交流。最终，希望大家能够找到与自己志同道合的伙伴，共同成长。

关于