FTP 的 PORT 模式,PASV 模式, FXP 协议和在 java 中使用时的一些问题

本贴最后更新于 4346 天前,其中的信息可能已经东海扬尘

这是最近一礼拜遇到的一个很头疼的问题,由于我们的系统需要需要用到 ftp 的 fxp 进行两个 ftp 服务器之间进行数据传输。 但是就是在这上出现了让我很郁闷的问题,连着几天,一个坑接一个坑,连续解决了 5,6 个问题,到今天下午才算是把所有问题解决。 在讲述我遇到的问题之前我们先了解下几个概念: * 首先是 PORT 模式和 PASV 模式,也就是 FTP 的主动模式和被动模式: > * 主动模式的 FTP 连接建立要遵循以下步骤: >> 1. 客户端打开一个随机的端口(端口号大于 1024,在这里,我们称它为 x),同时一个 FTP 进程连接至服务器的 21 号命令端口。此时,源端口为随机端口 x,在客户端,远程端口为 21,在服务器。 >> 2. 客户端开始监听端口(x+1),同时向服务器发送一个端口命令(通过服务器的 21 号命令端口),此命令告诉服务器客户端正在监听的端口号并且已准备好从此端口接收数据。这个端口就是我们所知的数据端口。 >> 3. 服务器打开 20 号源端口并且建立和客户端数据端口的连接。此时,源端口为 20,远程数据端口为(x+1)。 >> 4. 客户端通过本地的数据端口建立一个和服务器 20 号端口的连接,然后向服务器发送一个应答,告诉服务器它已经建立好了一个连接。 > > > * 被动模式 FTP: 为了解决服务器发起到客户的连接的问题,人们开发了一种不同的 FTP 连接方式。这就是所谓的被动方式,或者叫做 PASV,当客户端通知服务器它处于被动模式时才启用。 >> 在被动方式 FTP 中,命令连接和数据连接都由客户端发起,这样就可以解决从服务器到客户端的数据端口的入方向连接被防火墙过滤掉的问题。 >> 当开启一个 FTP 连接时,客户端打开两个任意的非特权本地端口(N > 1024 和 N+1)。第一个端口连接服务器的 21 端口,但与主动方式的 FTP 不同,客户端不会提交 PORT 命令并允许服务器来回连它的数据端口,而是提交 PASV 命令。这样做的结果是服务器会开启一个任意的非特权端口(P > 1024),并发送 PORT P 命令给客户端。然后客户端发起从本地端口 N+1 到服务器的端口 P 的连接用来传送数据。 >> 对于服务器端的防火墙来说,必须允许下面的通讯才能支持被动方式的 FTP: >> >> 1. 从任何大于 1024 的端口到服务器的 21 端口 (客户端的初始化连接) >> 2. 服务器的 21 端口到任何大于 1024 的端口 (服务器响应到客户端的控制端口的连接) >> 3. 从任何大于 1024 端口到服务器的大于 1024 端口 (客户端初始化数据连接到服务器指定的任意端口) >> 4. 服务器的大于 1024 端口到远程的大于 1024 的端口(服务器发送 ACK 响应和数据到客户端的数据端口) * FPX 全称:File Exchange Protocol (文件交换协议)(貌似很对人对这个全称持有不赞同的意见) >  FXP 是一个服务器之间传输文件的协议,这个协议控制着两个支持 FXP 协议的服务器,在无需人工干预的情况下,自动地完成传输文件的操作。在我们的客户机上,可以简单的发送一个传输的命令,即可控制服务器从另一个 FTP 服务器上下载一个文件,下载过程中,无须客户机干预,客户机甚至可以断网关机。这种协议通常只适用于管理员作管理的用途,在一般的公开 FTP 服务器上,是不会允许 FXP 的,因为这样会浪费服务器资源,而且有可能出现安全问题。 以上这些都是我从百度百科扒出来的,也只是给各位简单的了解先 FTP 和我这几天遇到的问题的技术背景 我们的系统环境是这样的,数据是从 A 服务器(系统是 window server 2003,ftp 服务器 serv-u,使用的默认模式配置,应该是被动模式,但是貌似是主被动都支持) 先通过 FXP 传送到 B 服务器(中转服务器,是 linux,ftp 服务器是 vsftpd,被动模式,不能主被动同时开启,会出现 5XX 错误),然后在使用 fxp 分别传送到 c1,c2 服务器(windows server 2003, ftp 服务器是 serv-u,同样是使用的默认配置模式), 我们在项目中使用的是 Apache 的 net 包的 ftp 功能进行 FTP 操作,下面是我们使用 FXP 功能的代码: FTPClient srcServer = connect(source, ftpLog); FTPClient targetServer = connect(target, ftpLog); // Let's just assume success for now. srcServer.enterRemotePassiveMode(); targetServer.enterRemoteActiveMode(InetAddress.getByName(srcServer.getPassiveHost()), srcServer.getPassivePort()); // Although you would think the store command should be sent to // server2 // first, in reality, ftp servers like wu-ftpd start accepting data // connections right after entering passive mode. Additionally, they // don't even send the positive preliminary reply until after the // transfer is completed (in the case of passive mode transfers). // Therefore, calling store first would hang waiting for a // preliminary // reply. if (targetServer.remoteStoreUnique(encodepath(target.getPath())) && srcServer.remoteRetrieve(source.getPath())) { // if(ftp1.remoteRetrieve(file1) && ftp2.remoteStore(file2)) { // We have to fetch the positive completion reply. srcServer.completePendingCommand(); targetServer.completePendingCommand(); } 这段代码是我们头从 apache 网站中扒下来,稍作改动,目的就是为了从 src 服务器向 target 服务器发送一个文件,文件在 10G 左右。 代码很简单创建两个 FTP 连接,分别连接源服务器和目标服务器,告诉源服务器使用被动模式,并告诉目标服务器使用主动模式,并告诉目标服务器源服务器的 ip 和端口。 最后面的几句就简单的,if 判断条件里&&的左边的语句 targetServer.remoteStoreUnique(encodepath(target.getPath())) 的意思是,目标服务器接收数据, &&右边 srcServer.remoteRetrieve(source.getPath()) 是告诉源服务器发送数据,这样两个服务器就会进行数据传输,直到传输完成,如果这两个服务器不支持 FXP, 那么 if 语句里面的两句话就会返回 false。 从 Apache 的代码中不难看出,进行 FXP 需要两个 FTP 服务器一个是被动模式一个是主动模式,将被动模式的服务器的地址和端口告诉主动模式的服务器,有主动模式服务器连接被动模式服务器进行数据传输。 这里不一定是要源服务器是主动模式,目标服务器是主动模式,反过来也是完全可以的,我们这里之前的代码是目标服务器是被动模式,源服务器是主动模式,但是由于系统架构的变化所以这里的代码也有了变化。 这里需要注意的是: * srcServer.enterRemotePassiveMode(); 这句话需要在前面,targetServer.enterRemoteActiveMode(InetAddress.getByName(srcServer.getPassiveHost()), srcServer.getPassivePort()); 一定要在后面, 因为主动模式的服务器需要被动模式的服务器的地址和端口。 * targetServer.remoteStoreUnique(encodepath(target.getPath())) && srcServer.remoteRetrieve(source.getPath()) 这两句也是有顺序的, 最开始的时候 srcServer.remoteRetrieve(source.getPath())targetServer.remoteStoreUnique(encodepath(target.getPath())) 之前,在两个都是 serv-u 的情况下是没有问题的, 但是后面我们的源 ftp 服务器换成了 vsftpd 这样就不可以,在内网中进行测试呃时候,只有 20 字节的速度,而在公网中这两个就干脆连不上,但是改成现在的样子速度就能跑满。 我们在调试中还发现,vsftpd 是不能同时启动两种模式的,不然在执行命令的时候会返回一个 5XX 的错误,只能启动主动或者被动模式,网上的一些文章发的配置信息很多都是主被动同时启动的,我认为这是错的,但是我有一点很疑惑我们的 serv-u 使用的是默认配置, 这种的配置貌似既是主动也是被动,有点不理解,也就是说客户端连接的时候需要什么模式就会切换到什么模式。 还想提醒一下不论什么程序,只要是在程序中使用 FTP 操作的,需要注意 FTP 是否支持一些命令,比方说 vsftpd 就不支持 mlst 这个命令,还有 serv-u 默认配置下,是不能使用 list 命令的,会返回 425 错误,但是 serv-u 支持 mlst 命令,等等各种问题。 下午在闲下来的时候在和同时讨论这个问题的时候,得到结论是:FTP 的协议规范可能太简单,很多服务器的开发者,对协议支持的都不太一样,虽然大部分功能是一样的,但是在一些细节上有很大的差别,这些差别和可能就是我们需要进行攻关的地方。 当然我们也在这里拌了好几天,一个问题一个问题的解决,虽然耽误了很多时间但是收获也很多。

  • FTP
    19 引用 • 20 回帖
  • Java

    Java 是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由 Sun Microsystems 公司于 1995 年 5 月推出的。Java 技术具有卓越的通用性、高效性、平台移植性和安全性。

    3187 引用 • 8213 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • RIP

    愿逝者安息!

    8 引用 • 92 回帖 • 351 关注
  • Shell

    Shell 脚本与 Windows/Dos 下的批处理相似,也就是用各类命令预先放入到一个文件中,方便一次性执行的一个程序文件,主要是方便管理员进行设置或者管理用的。但是它比 Windows 下的批处理更强大,比用其他编程程序编辑的程序效率更高,因为它使用了 Linux/Unix 下的命令。

    122 引用 • 74 回帖
  • RabbitMQ

    RabbitMQ 是一个开源的 AMQP 实现,服务器端用 Erlang 语言编写,支持多种语言客户端,如:Python、Ruby、.NET、Java、C、PHP、ActionScript 等。用于在分布式系统中存储转发消息,在易用性、扩展性、高可用性等方面表现不俗。

    49 引用 • 60 回帖 • 362 关注
  • flomo

    flomo 是新一代 「卡片笔记」 ,专注在碎片化时代,促进你的记录,帮你积累更多知识资产。

    5 引用 • 107 回帖
  • 30Seconds

    📙 前端知识精选集,包含 HTML、CSS、JavaScript、React、Node、安全等方面,每天仅需 30 秒。

    • 精选常见面试题,帮助您准备下一次面试
    • 精选常见交互,帮助您拥有简洁酷炫的站点
    • 精选有用的 React 片段,帮助你获取最佳实践
    • 精选常见代码集,帮助您提高打码效率
    • 整理前端界的最新资讯,邀您一同探索新世界
    488 引用 • 384 回帖 • 8 关注
  • gRpc
    11 引用 • 9 回帖 • 73 关注
  • GAE

    Google App Engine(GAE)是 Google 管理的数据中心中用于 WEB 应用程序的开发和托管的平台。2008 年 4 月 发布第一个测试版本。目前支持 Python、Java 和 Go 开发部署。全球已有数十万的开发者在其上开发了众多的应用。

    14 引用 • 42 回帖 • 764 关注
  • Bug

    Bug 本意是指臭虫、缺陷、损坏、犯贫、窃听器、小虫等。现在人们把在程序中一些缺陷或问题统称为 bug(漏洞)。

    75 引用 • 1737 回帖 • 5 关注
  • 数据库

    据说 99% 的性能瓶颈都在数据库。

    340 引用 • 708 回帖
  • Logseq

    Logseq 是一个隐私优先、开源的知识库工具。

    Logseq is a joyful, open-source outliner that works on top of local plain-text Markdown and Org-mode files. Use it to write, organize and share your thoughts, keep your to-do list, and build your own digital garden.

    6 引用 • 63 回帖
  • frp

    frp 是一个可用于内网穿透的高性能的反向代理应用,支持 TCP、UDP、 HTTP 和 HTTPS 协议。

    20 引用 • 7 回帖
  • danl
    132 关注
  • 大疆创新

    深圳市大疆创新科技有限公司(DJI-Innovations,简称 DJI),成立于 2006 年,是全球领先的无人飞行器控制系统及无人机解决方案的研发和生产商,客户遍布全球 100 多个国家。通过持续的创新,大疆致力于为无人机工业、行业用户以及专业航拍应用提供性能最强、体验最佳的革命性智能飞控产品和解决方案。

    2 引用 • 14 回帖
  • Python

    Python 是一种面向对象、直译式电脑编程语言,具有近二十年的发展历史,成熟且稳定。它包含了一组完善而且容易理解的标准库,能够轻松完成很多常见的任务。它的语法简捷和清晰,尽量使用无异义的英语单词,与其它大多数程序设计语言使用大括号不一样,它使用缩进来定义语句块。

    543 引用 • 672 回帖 • 1 关注
  • Android

    Android 是一种以 Linux 为基础的开放源码操作系统,主要使用于便携设备。2005 年由 Google 收购注资,并拉拢多家制造商组成开放手机联盟开发改良,逐渐扩展到到平板电脑及其他领域上。

    334 引用 • 323 回帖 • 1 关注
  • 微软

    微软是一家美国跨国科技公司,也是世界 PC 软件开发的先导,由比尔·盖茨与保罗·艾伦创办于 1975 年,公司总部设立在华盛顿州的雷德蒙德(Redmond,邻近西雅图)。以研发、制造、授权和提供广泛的电脑软件服务业务为主。

    8 引用 • 44 回帖 • 1 关注
  • SMTP

    SMTP(Simple Mail Transfer Protocol)即简单邮件传输协议,它是一组用于由源地址到目的地址传送邮件的规则,由它来控制信件的中转方式。SMTP 协议属于 TCP/IP 协议簇,它帮助每台计算机在发送或中转信件时找到下一个目的地。

    4 引用 • 18 回帖 • 614 关注
  • Angular

    AngularAngularJS 的新版本。

    26 引用 • 66 回帖 • 537 关注
  • PWL

    组织简介

    用爱发电 (Programming With Love) 是一个以开源精神为核心的民间开源爱好者技术组织,“用爱发电”象征开源与贡献精神,加入组织,代表你将遵守组织的“个人开源爱好者”的各项条款。申请加入:用爱发电组织邀请帖
    用爱发电组织官网:https://programmingwithlove.stackoverflow.wiki/

    用爱发电组织的核心驱动力:

    • 遵守开源守则,体现开源&贡献精神:以分享为目的,拒绝非法牟利。
    • 自我保护:使用适当的 License 保护自己的原创作品。
    • 尊重他人:不以各种理由、各种漏洞进行未经允许的抄袭、散播、洩露;以礼相待,尊重所有对社区做出贡献的开发者;通过他人的分享习得知识,要留下足迹,表示感谢。
    • 热爱编程、热爱学习:加入组织,热爱编程是首当其要的。我们欢迎热爱讨论、分享、提问的朋友,也同样欢迎默默成就的朋友。
    • 倾听:正确并恳切对待、处理问题与建议,及时修复开源项目的 Bug ,及时与反馈者沟通。不抬杠、不无视、不辱骂。
    • 平视:不诋毁、轻视、嘲讽其他开发者,主动提出建议、施以帮助,以和谐为本。只要他人肯努力,你也可能会被昔日小看的人所超越,所以请保持谦虚。
    • 乐观且活跃:你的努力决定了你的高度。不要放弃,多年后回头俯瞰,才会发现自己已经成就往日所仰望的水平。积极地将项目开源,帮助他人学习、改进,自己也会获得相应的提升、成就与成就感。
    1 引用 • 487 回帖
  • QQ

    1999 年 2 月腾讯正式推出“腾讯 QQ”,在线用户由 1999 年的 2 人(马化腾和张志东)到现在已经发展到上亿用户了,在线人数超过一亿,是目前使用最广泛的聊天软件之一。

    45 引用 • 557 回帖 • 67 关注
  • IDEA

    IDEA 全称 IntelliJ IDEA,是一款 Java 语言开发的集成环境,在业界被公认为最好的 Java 开发工具之一。IDEA 是 JetBrains 公司的产品,这家公司总部位于捷克共和国的首都布拉格,开发人员以严谨著称的东欧程序员为主。

    180 引用 • 400 回帖
  • Q&A

    提问之前请先看《提问的智慧》,好的问题比好的答案更有价值。

    8112 引用 • 37001 回帖 • 160 关注
  • VirtualBox

    VirtualBox 是一款开源虚拟机软件,最早由德国 Innotek 公司开发,由 Sun Microsystems 公司出品的软件,使用 Qt 编写,在 Sun 被 Oracle 收购后正式更名成 Oracle VM VirtualBox。

    10 引用 • 2 回帖 • 6 关注
  • V2EX

    V2EX 是创意工作者们的社区。这里目前汇聚了超过 400,000 名主要来自互联网行业、游戏行业和媒体行业的创意工作者。V2EX 希望能够成为创意工作者们的生活和事业的一部分。

    17 引用 • 236 回帖 • 328 关注
  • Lute

    Lute 是一款结构化的 Markdown 引擎,支持 Go 和 JavaScript。

    25 引用 • 191 回帖 • 16 关注
  • MySQL

    MySQL 是一个关系型数据库管理系统,由瑞典 MySQL AB 公司开发,目前属于 Oracle 公司。MySQL 是最流行的关系型数据库管理系统之一。

    690 引用 • 535 回帖
  • MyBatis

    MyBatis 本是 Apache 软件基金会 的一个开源项目 iBatis,2010 年这个项目由 Apache 软件基金会迁移到了 google code,并且改名为 MyBatis ,2013 年 11 月再次迁移到了 GitHub。

    170 引用 • 414 回帖 • 387 关注