java+selenium+autoIt 实现下载（打印）功能

selenium 是一个开源的自动化测试框架，它可以模拟用户对浏览器的操作，进行自动化的测试。但是，它不仅仅只能用来做测试。

AutoIt 是一个使用类似 BASIC 脚本语言的免费软件,它设计用于 Windows GUI(图形用户界面)中进行自动化操作。它利用模拟键盘按键，鼠标移动和窗口/控件的组合来实现自动化任务。而这是其它语言不可能做到或无可靠方法实现的(例如 VBScript 和 SendKeys)。在这个项目中 AutoIt 主要用于在浏览器中点击下载后，保存文件时，对 windos 弹框进行操作。

因为业务需求，需要把一个 html 网页转化成 PDF，本来准备考虑用 iText 来对 html 转为 PDF，但是我们已经拥有 html 的网页了，用 iText 感觉太麻烦，然后又找了一个第三方 html->pdf，结果需要收费等一些其它原因，最终决定采用 selenium+chrome+java+autol 对网页进行导出 PDF。

即使这个是打印成 PDF，也可用于下载

环境:springboot v2.1.2 + maven + selenium 3.141.59 + chrome 71.0.3578.98

1 selenium

1.1 关于 selenium

selenium 是一个自动化测试框架，可以模拟用户的浏览器操作，可以和几门热门的语言相结合，例如 java，python，接下来我将使用 selenuim 来操作 chrome 来模拟用户将网页保存为 PDF。

1.2 selenium 连接 chrome

1.2.1 添加 selenium 的 jar 包


				<!-- Selenium dependency -->
        <dependency>
            <groupId>org.seleniumhq.selenium</groupId>
            <artifactId>selenium-java</artifactId>
            <version>3.141.59</version>
        </dependency>

        <dependency>
            <groupId>org.seleniumhq.selenium</groupId>
            <artifactId>selenium-server</artifactId>
            <version>3.141.59</version>
        </dependency>

1.2.2 下载谷歌浏览器驱动

谷歌浏览器驱动下载

因为我用的是最新的 chrome，所以下载的也是暂时最新的驱动，每个驱动对应的谷歌浏览器版本也不一样，你们可以查看相应的文档，查看自己所对应的驱动

下载完驱动之后，将驱动放置于 resource 目录下的 driver 文件夹内

1.2.3 加载 WebDriver



    /*获取浏览器的连接*/
    public static WebDriver openAccess() {

        //在idea运行的谷歌驱动路径
        System.setProperty("webdriver.chrome.driver",
                "src/main/resources/driver/chromedriver.exe");
        //打jar包后的谷歌驱动路径
		/*String driverPath = System.getProperty("user.dir")+File.separator+"driver"+ File.separator+"chromedriver.exe";*/
        HashMap<String, Object> chromePrefs = new HashMap<>();
        chromePrefs
                .put("profile.default_content_settings.popups", 0);//设置为禁止弹出下载窗口
        chromePrefs
                .put("download.default_directory", downloadFilepath);//设置为文件下载路径
        ChromeOptions options = new ChromeOptions();
        HashMap<String, Object> chromeOptionsMap = new HashMap<>();
        options.setExperimentalOption("prefs", chromePrefs);
        options.addArguments("--test-type");
        options.addArguments("disable-infobars");//取消Chrome正在受到自动测试软件的控制
       /*
        用户浏览器地址，用于加载浏览器的用户信息，
        这一步将增加浏览器的性能消耗，
        如果不加这一行，浏览器默认已访客模式进入浏览器，
        可根据自己的需求来选择是否使用
         */
        options.addArguments("user-data-dir=C:\\Users\\onegene\\AppData\\Local\\Google\\Chrome\\User Data");
        DesiredCapabilities cap = DesiredCapabilities.chrome();
        cap.setCapability(ChromeOptions.CAPABILITY, chromeOptionsMap);
        cap.setCapability(CapabilityType.ACCEPT_SSL_CERTS, true);
        cap.setCapability(ChromeOptions.CAPABILITY, options);
        WebDriver driver = null;
        boolean flag = true;
        while (flag) {
            try {
                flag = false;
                driver = new ChromeDriver(cap);
                //响应时间超过8秒，则重新开启浏览器连接
                driver.manage().timeouts().pageLoadTimeout(15, TimeUnit.SECONDS);
                driver.manage().window().maximize();
//                driver.get(url);

            } catch (Exception e) {
                flag = true;
                if (driver != null) {
                    driver.quit();
                }
                log.info("wait for connection browser ");
            }
        }
        return driver;
    }

①System.setProperty("webdriver.chrome.driver","src/main/resources/driver/chromedriver.exe"); 这一步用于在 IDEA 中运行的是否加载驱动，如果，打成 jar 包之后，加载驱动的话，应该用下面一行加载驱动，驱动放在与 jar 包同目录的 dreiver 目录下


String driverPath = System.getProperty("user.dir")+File.separator+"driver"+ File.separator+"chromedriver.exe";
System.setProperty("webdriver.chrome.driver",driverPath);

②options.addArguments("user-data-dir=" + DriverPathUtils.getChromePath()); 用户浏览器地址，用于加载浏览器的用户信息，这一步将增加浏览器的性能消耗，如果不加这一行，浏览器默认已访客模式进入浏览器，可根据自己的需求来选择是否使用

1.3 加载 url，进行元素操作


        webDriver.get(url);//自己定义
        Thread.sleep(1000);
				//根绝class寻找元素，并且点击
        WebElement addpBtn = webDriver.findElement(By.className("addp"));
        addpBtn.click();

        Thread.sleep(1000);
				//根据id寻找元素，并且点击
        WebElement genLayoutBtn = webDriver.findElement(By.id("genLayout"));
        genLayoutBtn.click();

注：selenium 切换 tab，并且关闭


String currentWin = webDriver.getWindowHandle();
Set<String> handles = webDriver.getWindowHandles();
for (String handle : handles) {
    if (currentWin.equals(handle)) continue;
    webDriver = webDriver.switchTo().window(handle);
}
webDriver.close();

1.4 调起打印事件

调起如下的谷歌浏览器打印事件

调起浏览器的打印事件有以下两种方法：


① 点击鼠标右键，然后点击打印按钮

②按住键盘的`Ctrl`+`P`

显而易见，第 ② 中方法更实用，所以我们采用第 ② 种

我查看了 selenium 的键盘事件，发现是有键盘事件的，调起方法如下：


Actions action = new Actions(driver); 
action.keyDown(Keys.CONTROL);// 按下 Ctrl 键
action.sednKeys("p")//按下P键
action.keyUp(Keys.CONTROL);// 释放 Ctrl 键
action.perform()//发送组合按键

本来以为操作键盘的方法很简单，但是不知道为啥 chrome 一直无法调起键盘事件，谷歌了很久，也没有找到原因，网上也有很多人说无法调起。于是查看 jdk 文档，发现 java 提供了一个操作键盘事件的类。如下

所以，我就用以下方法来实现键盘事件 Ctrl+P


        Robot robot = new Robot();
        robot.keyPress(KeyEvent.VK_CONTROL);
        robot.keyPress(KeyEvent.VK_P);
        robot.keyRelease(KeyEvent.VK_P);
        robot.keyRelease(KeyEvent.VK_CONTROL);

本以为事情终于解决了，然后才发现，SpringBoot 无法启动这个键盘事件，百度之后，才发现有两种实现的办法

① 启动 SpringBoot 钱，给虚拟机添加参数 -ea -Djava.awt.headless=false

② 在 SpringBoot 启动类中添加代码，开启 awt


public static void main(String[] args) {
		System.setProperty("java.awt.headless", "false");
		SpringApplication.run(SeleniumApplication.class, args);
}

1.5 进入保存界面

打印界面进入保存界面只需要按下回车键，所以只需按照上一步操作键盘点击回车键就好了


		Robot robot = new Robot();
        robot.keyPress(KeyEvent.VK_CONTROL);
        robot.keyPress(KeyEvent.VK_P);
        robot.keyRelease(KeyEvent.VK_P);
        robot.keyRelease(KeyEvent.VK_CONTROL);

		//睡眠7S，因为谷歌浏览器进入打印要先进行渲染，这个需要一段时间
        Thread.sleep(7000);
        robot.keyPress(KeyEvent.VK_ENTER);
        robot.keyRelease(KeyEvent.VK_ENTER);

2 autolt

AutoIt 目前最新是 v3 版本，这是一个使用类似 BASIC 脚本语言的免费软件,它设计用于 Windows GUI(图形用户界面)中进行自动化操作。它利用模拟键盘按键，鼠标移动和窗口/控件的组合来实现自动化任务。而这是其它语言不可能做到或无可靠方法实现的

2.1 autolt 基本脚本语法

进入到了另存为得界面，这个时候 selenium 就基本上无法进行操作了，因为 selenium 只对谷歌浏览器进行操作，不对 window 窗口进行操作，所以这个时候就需要 autolt 进行处理了。autolt 是一个脚本语言，因为我们只需要保存一个文件，所以并不需要那么深入，所以下面我讲下 autolt 基本使用方法

2.1.1 安装完软件之后，各个文件的作用

编辑器：用于编写脚本语言，并且进行调试，按住 F5 进行调试
运行器：将脚本语言进行运行
转脚本为 exe：将编写的脚本转换成 exe 文件，用于 java 或者 python 直接运行
查看窗口信息：用于获取将要操作窗口的基本信息，例如将要操作按钮和编辑框的信息等等

2.1.2 查看窗口信息

查看窗口信息的方法：按住 Finder Tool 的，然后拖拽到你要操作的位置，这个时候查看 Control 窗口，就能得到你要操作的元素信息

Title：当前窗口的标题
Calss：当前元素的类型，例如当前窗口为编辑框，则这里显示 Edit
Instance:这个是这个窗口的第一个 Edit，所以 Instance 为 1
ClassnameNN：可以作为当前元素的唯一 id，但是没有 AdvancedModel 准确

2.2 autolt 保存文件


#该脚本的语法是：  ;分号代表注释,为了博客好看，我先把;换成#
##ControlFocus ( "title", "窗口文本", controlID)   设置输入焦点到指定窗口的某个控件上
#WinWait ( "title题" , "窗口文本" , 超时时间 )  暂停脚本的执行直至指定窗口存在（出现）为止
#ControlSetText ( "title", "窗口文本", controlID, "新文本" )   修改指定控件的文本
#Sleep ( 延迟 )   使脚本暂停指定时间段
#ControlClick ( "title", "窗口文本", 控件ID , 按钮 , 点击次数 )   向指定控件发送鼠标点击命令
#其中，title即AutoIt Window Info识别出的Title字段，controlID即AutoIt Window Info识别
#出的Class和Instance的拼接，如上图拼接后的结果应为：Button1
#ControlClick(
#ControlClick("另存为","保存","Button2")

ControlFocus("另存为","text","1001")
WinWait("[CLASS:#32770]","",100)
ControlSetText("另存为","","[CLASS:Edit; INSTANCE:1]","$CmdLine[1]")
Sleep(1500)
ControlClick("另存为","保存","Button2")

2.3 autolt 打包成 exe

运行转脚本为 exe 的文件，将其转换成 exe 文件，放入 resource 目录下的 driver 下面

2.4 java 运行 exe 文件


//第一个参数是exe路径，后面是执行cmd得参数，这个也就是对应保存PDF的名称
String[] commandArray = {"src/main/resources/driver/pdf.exe", sample.getCode() + ".pdf"};
runtime.exec(commandArray);

3 结尾

虽然我写的这个博客是关于 java+selenium+autolt 将 html 打印成 PDF，但是也可以用到下载文件里边，原理是一样的。在进行爬虫的时候，经常要遇到下载文件的业务，这样可以很好的完成。

java+selenium+autoIt 实现下载（打印）功能