container-executor 详解

简介

container-executor 是 NodeManager 管理 Container 很重要的一个工具，是深入学习 Yarn 作业调度不可缺少的一个知识点，值得深入学习。本文只描述比较基础的功能点(目前不会包含 Docker 相关)。

核心功能点

checksetup

主要是检查 container-executor 的配置是否 ok，没有其他功能。核心代码如下：


case CHECK_SETUP:
  //we already did this 
  exit_code = 0;
  break;

mount-cgroups

在配置项 feature.mount-cgroup.enabled 为 true 的时候为 nodemanager 挂载 cgroup。核心是调用系统函数 mount。下面代码中的是配置的挂载点。由命令行参数传入。


if (mount("none", mount_path, "cgroup", 0, controller) == 0) {
  // 挂载成功
    if (mkdirs(hier_path, perms) == 0) {
        change_owner(hier_path, nm_uid, nm_gid);
        // 修改子目录权限。
        chown_dir_contents(hier_path, nm_uid, nm_gid);
    }
}

exec-container

前提条件：配置 feature.terminal.enabled=true

当前功能的核心实现在 container-executor.c 的函数 int exec_container(const char *command_file) 中。
在非 Docker 模式下，主要步骤如下：


// 切换用户
if (change_user(user_detail->pw_uid, user_detail->pw_gid) != 0) {
  _exit(DOCKER_EXEC_FAILED);
}
// 切换工作目录
ret = chdir(workdir);
if (ret != 0) {
  fprintf(ERRORFILE, "chdir failed - %s", strerror(errno));
  _exit(DOCKER_EXEC_FAILED);
}
// 执行启动脚本。
execve(binary, args, env);
fprintf(ERRORFILE, "exec failed - %s\n", strerror(errno));
_exit(DOCKER_EXEC_FAILED);

最后会执行配置 launch-command 中的命令。当前步骤的核心应该主要是判断当前用户是否有权限启动 Container。

启动 Container

真正启动 Container，参数格式如下：

container-executor <user> <yarn-user> <command> <command-args>
源代码中的解释如下：


fprintf(stream,
    "       container-executor <user> <yarn-user> <command> <command-args>\n"
    "       where command and command-args: \n" \
    "            initialize container:  %2d appid containerid tokens nm-local-dirs "
    "nm-log-dirs cmd...\n"
    "            launch container:      %2d appid containerid workdir "
    "container-script tokens http-option pidfile nm-local-dirs nm-log-dirs resources ",
    INITIALIZE_CONTAINER, LAUNCH_CONTAINER);

可以看出提供了两个功能：

初始化 Container。
启动 Container。

distributedShell 样例源码详解

[图片] 简介 distributedShell 是 Yarn 自带的应用程序，和 MR 类似，当前工具可以用来对 Yarn 进行压测。使用示例参考命令如下： ./bin/hadoop jar ./share/hadoop/yarn/hadoop-yarn-applications-distributedshell ..

HDFS 报错：Permission denied: user=dr.who, access=WRITE, inode="/":hadoop01

背景新建的 HDFS 使用 web 短上传文件的时候报错： Permission denied: user=dr.who, access=WRITE, inode='/':hadoop01 解决在 core-site.xml 中增加下面配置,其中 hadoop01 为 hdfs 运行的用户，修改完重启 hdfs 即 ..

DistCp 源码解析

说明 DistCp（分布式拷贝）是用于大规模集群内部和集群之间拷贝的工具。它使用 Map/Reduce 实现文件分发，错误处理和恢复，以及报告生成。它把文件和目录的列表作为 map 任务的输入，每个任务会完成源列表中部分文件的拷贝。由于使用了 Map/Reduce 方法，这个工具在语义和执行上都会有特殊的地方。 ..

webhdfs 详解

[图片] 简介 hdfs 提供了一种除了通过 rpc 的方式进行文件操作的方式之外，还提供了 http 的方式对文件进行操作的方式：webhdfs。支持 HDFS 的完整 FileSystem / FileContext 接口。其中 Router 和 NameNode 都支持了 webhdfs 的功能，具体实现有差别 ..

【Hadoop 仿真】如何在仿真 NodeManager 中实现心跳

[图片] 背景 Hadoop 自带的 hadoop-sls 只能用于压测调度器，可在实际中影响 ResourceManager 性能的因素比较多，不能只看调度器。当前项目可构造海量的 Fake NM 节点，用于模拟线上 RM 的巨大压力场景，进行优化。首先需要对 NM 进行仿真。仿真 NodeManager 仿真 N ..

Mapredcue 作业启动

作业启动作业提交的客户端比较核心的类是 Job.java，看作业启动的源码需要从这个类开始看。 Job.java 作业启动的入口函数为 waitForCompletion 函数。当前函数的核心函数为 submit()，主要如下： public void submit() throws IOException, Int ..

ContainerManager 详解

简介 ContainerManager 主要负责 NM 中管理所有 Container 生命周期，其主要包含启动 Container、恢复 Container、停止 Container 等功能。主要功能由 ContainerManagerImpl 类实现，具体代码可以参考当前类。初始化初始化主要分为两部分： Co ..

欢迎来到这里！

我们正在构建一个小众社区，大家在这里相互信任，以平等 • 自由 • 奔放的价值观进行分享交流。最终，希望大家能够找到与自己志同道合的伙伴，共同成长。

关于