ssh 连接过程分析

本贴最后更新于 1170 天前,其中的信息可能已经事过景迁

本文由 简悦 SimpRead 转码, 原文地址 blog.csdn.net 

SSH 建立连接的过程主要分为下面几个阶段:

  1. SSH 协议版本协商阶段。SSH 目前包括 SSH1 和 SSH2 两个大版本。
  2. 密钥和算法协商阶段,SSH 支持多种加密算法,双方根据自己和对端支持的算法进行协商,最终决定要使用的算法。
  3. 认证阶段,服务器对客户端进行身份验证。
  4. 会话请求阶段,完成认证后,客户端会向服务器端发送会话请求。
  5. 交互会话阶段,会话请求通过后,服务器端和客户端进行信息的交互。

1)SSH 协议版本协商阶段:

  1. 客户端通过 TCP 三次握手与服务器的 SSH 端口建立 TCP 连接。
  2. 服务器通过建立好的连接向客户端发送一个包含 SSH 版本信息的报文,格式为 “SSH-<SSH 协议大版本号 >.<SSH 协议小版本号 >-< 软件版本号 >”,软件版本号主要用于调试。
  3. 客户端收到版本号信息后,如果服务器使用的协议版本号低于自己的,但是客户端能够兼容这个低版本的 SSH 协议,则就使用这个版本进行通信。否则,客户端会使用自己的版本号。
  4. 客户端将自己决定使用的版本号发给服务器,服务器判断客户端使用的版本号自己是否支持,从而决定是否能够继续完成 SSH 连接。
  5. 如果协商成功,则进入密钥和算法协商阶段。
  1. 密钥和算法协商阶段:
  1. 服务器端和客户端分别发送算法协商报文给对端,报文中包含自己支持的公钥算法列表,加密算法列表,MAC(Message Authentication Code,消息验证码)算法列表,压缩算法列表等。
  2. 和版本协商阶段类似,服务器端和客户端根据自己和对端支持的算法来决定最终要使用的各个算法。
  3. 服务器端和客户端利用 Diffie-Hellman 密钥交换算法,主机密钥对等参数,生成共享密钥和会话 ID。会话密钥用于在后续的通信过程中两端对传输的数据进行加密和解密,而会话 ID 用于认证过程。
  1. 认证阶段:
  1. 客户端向服务器端发送认证请求,请求中包含用户名,认证方法,密码或密钥。
  2. 服务器端对客户端进行认证,如果认证失败,则向客户端发送失败消息,其中包含可以再次认证的方法列表。
  3. 客户端再次使用支持的认证方法中的一种进行认证,直到达到认证次数上限被服务器终止连接,或者认证成功为止。

SSH 支持的两种认证方式:

  1. 密码认证:客户端通过用户名 / 密码进行认证,将使用会话密钥加密后的用户名和密码发送给服务器,服务器解密后与系统保存的用户名和密码进行对比,并向客户端返回认证成功或失败的消息。
  2. 密钥认证:采用数字签名来进行认证,目前可以通过 RSA 和 DSA 两种算法实现数字签名,客户端通过用户名,公钥以及公钥算法等信息来与服务器完成验证。
  1. 会话请求阶段:
  1. 服务器等待客户端请求。
  2. 认证完成后,客户端想服务器发送会话请求。
  3. 服务器处理客户端请求,完成后,会向客户端回复 SSH_SMSG_SUCCESS 报文,双方进入交互会话阶段。如果请求未被成功处理,则服务器返回 SSH_SMSG_FAILURE 报文,表示请求处理失败或者不能识别客户端请求。
  1. 交互会话阶段:
  1. 客户端将要执行的命令加密发送给服务器。
  2. 服务器收到后,解密命令,执行后将结果加密返回客户端。
  3. 客户端将返回结果解密后显示到终端上。

下面我们通过客户端(172.31.100.107)抓包来简单说明密钥认证的过程:

报文 1-3:可以看到前三个包是客户端与服务器端三次握手的过程

报文 4:在建立连接后,服务器端将自己支持的 SSH 版本发送给客户端

报文 5:客户端返回给服务器自己要使用的 SSH 版本,如果服务器端不支持这个版本,则到此就终止了 SSH 连接

报文 6:客户端将自己支持的公钥算法列表,加密算法列表,MAC(MessageAuthentication Code,消息验证码)算法列表,压缩算法列表等发送给服务器

报文 7,8:服务器返回 ACK 报文

报文 9:服务器将自己支持的公钥算法列表,加密算法列表,MAC(MessageAuthentication Code,消息验证码)算法列表,压缩算法列表等发送给客户端

这里在双方协商的原则是以客户端支持的协议为主,客户端支持的协议从左向右优先级依次递减,从优先级高的协议开始匹配,如果客户端支持的第一个协议,服务器也支持,则双方就使用这个协议,如果服务器不支持,则在匹配第二个客户端支持的协议,直到匹配到最后一个客户端支持的协议,如果服务器都不支持,则双方协商失败。

报文 10:客户端开始与服务器进行通信的共享密钥的协商,由于前面使用的是 SSH2.0 的协议,所以这里使用的是 Diffie-Hellman-Group-Exchange-SHA 算法(关于 DH-GEX-SHA 算法的原理,可以参考 http://blog.csdn.net/lee244868149/article/details/51790397),在这个报文中,客户端限制了密钥交换参数 Min,Numbers of Bits,Max

报文 11:服务器端收到客户端 DH 请求后,将用于生成公钥的 P 和 G 发送给客户端,P 是一个大素数,满足客户端在报文 10 中的限制,G 是大于 1 的数,不需要特别大,通常取 2 或者 5

报文 12:客户端收到 P 和 G 后,自己生成私钥 a,并根据私钥 a 计算出自己的公钥 e,将 e 发送给服务器端

报文 13:服务器收到客户端发来的 e 后,根据 e 和服务器的私钥 b 可以计算出双方的共享密钥 K,同时服务器通过私钥 b 计算出客户端计算 K 需要的参数 f,将 f 发给客户端

此外,KEY DH host key 为服务器的主机公钥,通常为 RSA 公钥,KEY DH HSignature 为服务器用主机私钥对计算出的哈希值 H 进行签名的结果。

H 的计算方法为:H=hash(V_C||V_S||I_C||I_S||K_S||e||f||K)

其中的参数:

类型

说明

string

V_C

客户端的初始报文(版本信息:SSH-2.0-xxx,不含结尾的 CR 和 LF)

string

V_S

服务器的初始报文

string

I_C

客户端 SSH_MSG_KEX_INIT 的有效载荷(不含开头的数据长度值)

string

I_S

服务器的同上

string

K_S

主机秘钥(dh gex reply(33) 过程服务器发送 host key (RSA 公钥))

mpint

e

客户端 DH 公钥

mpint

f

服务器 DH 公钥

mpint

K

共同 DH 计算结果

客户端收到服务器发来的 f 后,根据 f 和自己的私钥可以计算出 K,进而计算出 H,同时客户端会利用服务器发送过来的主机公钥 K_S 来验证服务器发送过来的 H 的签名是否有效,如果有效,则客户端在报文 14 中向服务器发送 New Keys 报文,表示双方密钥交换成功,计算出的 H 则作为整个会话的会话 ID。

为了更直观的理解,可以参考下面的计算过程:

后面的数据报文都使用双方协商的共享密钥,所以在抓包结果中就看不到里面的信息了,这里说明一下后续密钥认证的大致过程:

  1. 客户端向服务器发送登陆要使用的 IP 地址和用户名,服务器识别对应的客户端公钥(保存在 authorized_keys 中),找到该公钥后,服务器通过公钥加密一段随机字符串,并使用共享密钥加密后发送给客户端。
  2. 客户端首先使用共享密钥解密得到使用自己的公钥加密的字符串,再使用自己的私钥解密得到原始字符串,再通过共享密钥加密后发送给服务器。
  3. 服务器通过共享密钥解密得到字符串,与之前自己用公钥加密的那个字符串进行对比,如果一致,则说明客户端的私钥与自己的公钥对应,认证成功,否则认证失败。

学习抓包真的能解决好多问题,运维还是一个必备知识

因为经常需要处理上线部署包问题,应用到的地方比较多,觉得有必要把这个学习下。

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • 程序员

    程序员是从事程序开发、程序维护的专业人员。

    584 引用 • 3537 回帖
  • 书籍

    宋真宗赵恒曾经说过:“书中自有黄金屋,书中自有颜如玉。”

    76 引用 • 389 回帖
  • Wide

    Wide 是一款基于 Web 的 Go 语言 IDE。通过浏览器就可以进行 Go 开发,并有代码自动完成、查看表达式、编译反馈、Lint、实时结果输出等功能。

    欢迎访问我们运维的实例: https://wide.b3log.org

    30 引用 • 218 回帖 • 639 关注
  • OpenCV
    15 引用 • 36 回帖 • 2 关注
  • 开源

    Open Source, Open Mind, Open Sight, Open Future!

    409 引用 • 3585 回帖 • 1 关注
  • JetBrains

    JetBrains 是一家捷克的软件开发公司,该公司位于捷克的布拉格,并在俄国的圣彼得堡及美国麻州波士顿都设有办公室,该公司最为人所熟知的产品是 Java 编程语言开发撰写时所用的集成开发环境:IntelliJ IDEA

    18 引用 • 54 回帖 • 3 关注
  • Docker

    Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的操作系统上。容器完全使用沙箱机制,几乎没有性能开销,可以很容易地在机器和数据中心中运行。

    493 引用 • 928 回帖
  • CAP

    CAP 指的是在一个分布式系统中, Consistency(一致性)、 Availability(可用性)、Partition tolerance(分区容错性),三者不可兼得。

    12 引用 • 5 回帖 • 631 关注
  • H2

    H2 是一个开源的嵌入式数据库引擎,采用 Java 语言编写,不受平台的限制,同时 H2 提供了一个十分方便的 web 控制台用于操作和管理数据库内容。H2 还提供兼容模式,可以兼容一些主流的数据库,因此采用 H2 作为开发期的数据库非常方便。

    11 引用 • 54 回帖 • 664 关注
  • 百度

    百度(Nasdaq:BIDU)是全球最大的中文搜索引擎、最大的中文网站。2000 年 1 月由李彦宏创立于北京中关村,致力于向人们提供“简单,可依赖”的信息获取方式。“百度”二字源于中国宋朝词人辛弃疾的《青玉案·元夕》词句“众里寻他千百度”,象征着百度对中文信息检索技术的执著追求。

    63 引用 • 785 回帖 • 116 关注
  • 人工智能

    人工智能(Artificial Intelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。

    152 引用 • 279 回帖
  • 房星科技

    房星网,我们不和没有钱的程序员谈理想,我们要让程序员又有理想又有钱。我们有雄厚的房地产行业线下资源,遍布昆明全城的 100 家门店、四千地产经纪人是我们坚实的后盾。

    6 引用 • 141 回帖 • 588 关注
  • WebSocket

    WebSocket 是 HTML5 中定义的一种新协议,它实现了浏览器与服务器之间的全双工通信(full-duplex)。

    48 引用 • 206 回帖 • 299 关注
  • GraphQL

    GraphQL 是一个用于 API 的查询语言,是一个使用基于类型系统来执行查询的服务端运行时(类型系统由你的数据定义)。GraphQL 并没有和任何特定数据库或者存储引擎绑定,而是依靠你现有的代码和数据支撑。

    4 引用 • 3 回帖 • 2 关注
  • Ngui

    Ngui 是一个 GUI 的排版显示引擎和跨平台的 GUI 应用程序开发框架,基于
    Node.js / OpenGL。目标是在此基础上开发 GUI 应用程序可拥有开发 WEB 应用般简单与速度同时兼顾 Native 应用程序的性能与体验。

    7 引用 • 9 回帖 • 397 关注
  • TextBundle

    TextBundle 文件格式旨在应用程序之间交换 Markdown 或 Fountain 之类的纯文本文件时,提供更无缝的用户体验。

    1 引用 • 2 回帖 • 73 关注
  • RIP

    愿逝者安息!

    8 引用 • 92 回帖 • 390 关注
  • ActiveMQ

    ActiveMQ 是 Apache 旗下的一款开源消息总线系统,它完整实现了 JMS 规范,是一个企业级的消息中间件。

    19 引用 • 13 回帖 • 684 关注
  • 大疆创新

    深圳市大疆创新科技有限公司(DJI-Innovations,简称 DJI),成立于 2006 年,是全球领先的无人飞行器控制系统及无人机解决方案的研发和生产商,客户遍布全球 100 多个国家。通过持续的创新,大疆致力于为无人机工业、行业用户以及专业航拍应用提供性能最强、体验最佳的革命性智能飞控产品和解决方案。

    2 引用 • 14 回帖
  • WebComponents

    Web Components 是 W3C 定义的标准,它给了前端开发者扩展浏览器标签的能力,可以方便地定制可复用组件,更好的进行模块化开发,解放了前端开发者的生产力。

    1 引用 • 10 关注
  • HTML

    HTML5 是 HTML 下一个的主要修订版本,现在仍处于发展阶段。广义论及 HTML5 时,实际指的是包括 HTML、CSS 和 JavaScript 在内的一套技术组合。

    108 引用 • 295 回帖
  • JSON

    JSON (JavaScript Object Notation)是一种轻量级的数据交换格式。易于人类阅读和编写。同时也易于机器解析和生成。

    52 引用 • 190 回帖 • 1 关注
  • HHKB

    HHKB 是富士通的 Happy Hacking 系列电容键盘。电容键盘即无接点静电电容式键盘(Capacitive Keyboard)。

    5 引用 • 74 回帖 • 493 关注
  • etcd

    etcd 是一个分布式、高可用的 key-value 数据存储,专门用于在分布式系统中保存关键数据。

    6 引用 • 26 回帖 • 546 关注
  • InfluxDB

    InfluxDB 是一个开源的没有外部依赖的时间序列数据库。适用于记录度量,事件及实时分析。

    2 引用 • 90 关注
  • 架构

    我们平时所说的“架构”主要是指软件架构,这是有关软件整体结构与组件的抽象描述,用于指导软件系统各个方面的设计。另外还有“业务架构”、“网络架构”、“硬件架构”等细分领域。

    143 引用 • 442 回帖 • 2 关注
  • 职场

    找到自己的位置,萌新烦恼少。

    127 引用 • 1707 回帖