将 Tomcat、MySQL 从 Linux 迁移到 Windows 的心路历程(干货):令人恐惧的字符编码

本贴最后更新于 1882 天前,其中的信息可能已经沧海桑田

前言

近日打算对服务端进行进一步的解耦,便购入了云数据库服务,将数据库独立,使得Tomcat主机独立运行,提高安全性和便利性。
心血来潮,想将服务器重装为Windows,便有了下面的一系列文章:

迁移MySQL

平时我都是使用Navicat对MySQL进行管理。在备份的第一时间我便想到了使用Navicat进行数据的迁移。

Dump SQL File



右键指定的数据库,选择Dump SQL File -> Structure + Data就可以将选定数据库全部的结构、参数、表、键值保存到一个文件中,我将其输出到桌面以便恢复。

Execute SQL File

登录到新的数据库中,并建立一个名称相同的数据库。右键该数据库,选中Execute SQL File



为什么要迁移

比对Windows和Linux的区别,对我而言:

Linux(Ubuntu 16.04)

优点

  1. 占用内存小
  2. Terminal用起来太爽
  3. 开源
  4. 安装工具方便(apt)
  5. ......

不足

  1. 不知道,别问我

Windows (Windows Server 2016)

优点

  1. 桌面环境比较成熟
  2. 文件权限划分清晰严谨
  3. 图形界面进行编辑(学不会Vim)、服务安装配置比较快捷
  4. 能挂QQ成长值(?!)

不足

  1. 内存占用太高,开机就2G
  2. ......

迁移前我做的规划

  1. 将Tomcat服务端打包,备份到本地
  2. 安装Java并配置环境变量
  3. 用IIS配置FTP服务
  4. 将Tomcat服务端上传,并运行测试
  5. 配置防火墙,禁止一大堆自带的服务监听端口

我遇到的问题

1. 控制台中文乱码

遇到这个问题的时候,我还是不慌的,在我的意料之内。
在查找资料后,我找到了解决办法:
conf/logging.properties文件中,添加下面一行(先检查是否已经存在,如果已经存在直接修改即可):
java.util.logging.ConsoleHandler.encoding = GBK

这是因为Windows的控制台编码为GBK,而Linux的终端编码一般为UTF-8而导致的。

2. ​​​HTML中文乱码

这可真是令人手忙脚乱了... JSP和Servlet都是正常的,但HTML的中文却是乱码。排除法:
√ HTML头部设置了<meta charset="utf-8"/>
√ HTML源文件编码经检测为UTF-8
√ web.xml拦截器编码设置为UTF-8
? 问题可能出在Tomcat的配置

—— 再次经过几经查找,我找到了两种解决方法:

方法一:server.xml

编辑conf/server.xml文件,在Connector后边追加参数URIEncoding="UTF-8"

由于我开启了SSL,所以在port443的后方加入。如果你没有使用HTTPS而只是使用了HTTP,那么找到port80的后方加入即可。

方法二:catalina.sh

编辑bin/catalina.sh文件:

找到JAVA_OPTS并追加参数:
-Dfile.encoding=utf-8

通过这条参数,我们可以从根源(JVM)处告诉 Tomcat,要以 UTF-8 的编码来读取文件。

最后,通过方法二(推荐都使用)解决了 HTML 中文乱码的问题。

3. APR模式不可用

经常使用Tomcat的小伙伴可能知道APR模式。

Tomcat的三种模式

模式 描述 性能
BIO Blocking I/O 阻塞式I/O操作,表示Tomcat使用的是传统的Java I/O操作。
NIO Non-Blocking I/O 基于缓冲区,并能提供非阻塞I/O操作的Java API。
APR Tomcat将以JNI的形式调用Apache HTTP服务器的核心动态链接库来处理文件读取或网络传输操作,从而大大地提高Tomcat对静态文件的处理性能。
在Linux,我一直使用APR模式来运行Tomcat服务端,但这次有些不对劲儿。

JAVA_OPTS可能与APR模式冲突

由于APR模式需要安装额外的扩展,我便安装并进行了测试,但并没有效果。
在这之后,我尝试了:
  1. 使用安装版Tomcat并勾选APR扩展
  2. 重新生成配置文件
  3. 重新生成并导入域名SSL证书
  4. 查找可能导致冲突的配置
最终的一个现象:
一旦我开启APR模式,HTTPS就无法访问。
在一个下午的苦苦挣扎后,我找到了问题所在:

一旦为JAVA_OPTS添加参数-Dfile.encoding=utf-8,APR模式就无法正常工作。

为什么不直接将所有文件转码为GBK?

其实我本可以直接将所有的页面文件转码为GBK(Windows的默认编码)从而直接防止上述所有情况的发生,但过程复杂,且一旦需要迁移回Linux非常繁琐
所以最后,我放弃了APR,使用无需额外扩展及配置的NIO模式:
编辑conf/server.xml

修改protocol的参数为 ``` org.apache.coyote.http11.Http11NioProtocol
<h1>后语</h1>
总的来说,除了在文件编码方面略有困难之外,在<strong>提前做好充足功课</strong>之后还是能够迁移成功的。<br />
生命在于折腾。<br />
(如果事事都能像自己预想的那样运行,谁还愿意瞎折腾呢?)
  • Tomcat

    Tomcat 最早是由 Sun Microsystems 开发的一个 Servlet 容器,在 1999 年被捐献给 ASF(Apache Software Foundation),隶属于 Jakarta 项目,现在已经独立为一个顶级项目。Tomcat 主要实现了 JavaEE 中的 Servlet、JSP 规范,同时也提供 HTTP 服务,是市场上非常流行的 Java Web 容器。

    162 引用 • 529 回帖 • 6 关注
  • Linux

    Linux 是一套免费使用和自由传播的类 Unix 操作系统,是一个基于 POSIX 和 Unix 的多用户、多任务、支持多线程和多 CPU 的操作系统。它能运行主要的 Unix 工具软件、应用程序和网络协议,并支持 32 位和 64 位硬件。Linux 继承了 Unix 以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。

    939 引用 • 940 回帖
  • Windows

    Microsoft Windows 是美国微软公司研发的一套操作系统,它问世于 1985 年,起初仅仅是 Microsoft-DOS 模拟环境,后续的系统版本由于微软不断的更新升级,不但易用,也慢慢的成为家家户户人们最喜爱的操作系统。

    221 引用 • 473 回帖
  • utf-8
    5 引用 • 3 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...