常用 POI 方法

本贴最后更新于 1810 天前,其中的信息可能已经时移世改

目前常见读写 Excel 的工具类开源 javaAPI 有两种方式,一个是 JXL(Java Excel API) 官网地址:http://jexcelapi.sourceforge.net/一个是 Apache 的 POI(Poor Obfuscation Implementation)官网地址:http://poi.apache.org/

POI 支持微软的 OLE2 格式文件 Office 2003 及以下版本;同时支持微软的 OOXML(Office Open XML)标准,也就是 Office 2007 以上版本。JXL 只能实现对 Excel 2003 以下版本的支持。

POI 使用 HSSF 对象操作 OLE2 格式 Excel,文件后缀为.xls 的;使用 XSSF、SXSSF 对象操作 OOXML 格式 Excel,文件后缀为.xlsx 的。

对于 OLE2 版本的 Excel,一个 Sheet 工作表它的行最多支持到 65536 行,列支持到 256 列;对于 OOXML 版本的 Excel,一个 Sheet 工作表它的行支持到 1048576 行,列支持到 16384 列。

核心 API:

数据限制:

  
Excel2003  2007、2010

列: 255 16384 行: 65535 1048576

=================== 基础 ===================

// 创建 excel(工作簿) 使用接口的方式来创建 Workbook wb = new HSSFWorkbook();

新建工作簿:HSSFWorkbook wb = new HSSFWorkbook();

打开工作簿:HSSFWorkbook wb = new HSSFWorkbook(new FileInputStream(xlsFile));

建立新的 sheet 对象:HSSFSheet sheet = wb.createSheet("我的第一个工作簿");

选择第一个工作簿:HSSFSheet sheet = wb.getSheetAt(0);

设置工作簿的名称:wb.setSheetName(0, "我的第一个工作簿");

创建行对象: HSSFRow nRow = null;nRow = sheet.createRow(1); //第 2 行

指定列 创建单元格对象:HSSFCell nCell = null;nCell = nRow.createCell((short)(2)); //第 3 列

指定列 创建单元格对象:nCell.setCellValue("我是单元格");

// 获取到样式的对象 CellStyle style = wb.createCellStyle();

// 创建字体对象 Font font = wb.createFont();// 设置字体大小 font.setFontHeightInPoints((short) 16);// 设置字体的名称 font.setFontName("楷体");// 设置字体 style.setFont(font);

设置样式 注意:样式不能重复设置 nCell.setCellStyle(leftStyle(wb));

文件下载方法 1:

先在服务器产生临时文件,再下载临时文件。

  
关闭保存excel文件  
FileOutputStream fOut = new FileOutputStream(xlsFile);  //创建xls文件,无内容 0字节  
wb.write(fOut);  //写内容,xls文件已经可以打开  
fOut.flush();  //刷新缓冲区  
fOut.close();  //关闭

文件下载方法 2:

  
 //7.生成excel文件  
 ByteArrayOutputStream byteArrayOutputStream = new ByteArrayOutputStream();  //生成流对象  
 wb.write(byteArrayOutputStream);  //将excel写入流  
​  
 //工具类,封装弹出下载框:   
 String outFile = "生产厂家通讯录.xls";  
 DownloadBaseAction down = new DownloadBaseAction();  
 down.download(byteArrayOutputStream, response, outFile);

文件下载方法 3:(适用于 struts2)

  
 ServletActionContext.getResponse().setContentType("application/octet-stream");  
 String returnName = ServletActionContext.getResponse().encodeURL( new String("购销合同.xls".getBytes(), "ISO-8859-1"));  
 ServletActionContext.getResponse().addHeader("Content-Disposition", "attachment;filename=" + returnName);  
​  
 wb.write(ServletActionContext.getResponse().getOutputStream());

文件下载方法 4:

  
 //下载文件  
 response.setContentType("application/octet-stream");  
 String returnName = response.encodeURL( new String("生产厂家通讯录.xls".getBytes(), "ISO-8859-1"));  
 response.addHeader("Content-Disposition", "attachment;filename=" + returnName);  
​  
 wb.write(response.getOutputStream());

字体修饰:

  
//设置单元格样式  
private HSSFCellStyle leftStyle(HSSFWorkbook wb){  
 HSSFCellStyle curStyle = wb.createCellStyle();  
 HSSFFont curFont = wb.createFont();  //设置字体  
 //curFont.setFontName("Times New Roman");  //设置英文字体  
 curFont.setFontName("微软雅黑");  //设置英文字体  
 curFont.setCharSet(HSSFFont.DEFAULT_CHARSET);  //设置中文字体,那必须还要再对单元格进行编码设置  
 curFont.setFontHeightInPoints((short)10);  //字体大小  
 curFont.setBoldweight(HSSFFont.BOLDWEIGHT_BOLD);  //加粗  
​  
 curStyle.setFont(curFont);  
    
 curStyle.setBorderTop(HSSFCellStyle.BORDER_THICK);  //粗实线  
 curStyle.setBorderBottom(HSSFCellStyle.BORDER_THIN);  //实线  
 curStyle.setBorderLeft(HSSFCellStyle.BORDER_MEDIUM);  //比较粗实线  
 curStyle.setBorderRight(HSSFCellStyle.BORDER_THIN);  //实线  
    
 curStyle.setWrapText(true);   //换行   
 curStyle.setAlignment(HSSFCellStyle.ALIGN_RIGHT);  //横向具右对齐  
 curStyle.setVerticalAlignment(HSSFCellStyle.VERTICAL_CENTER);  //单元格垂直居中  
    
 return curStyle;  
}

=================== web 环境 ===================

设置打印方向:默认纵向

PrintSetup ps = sheet.getPrintSetup();ps.setLandscape(true); //横向打印

自适应列宽://bug 对中文支持不好,列宽不够宽 for(int i=0 ;i<titles.length;i++){

  
sheet.autoSizeColumn((short)i);

}

设置行高:nRow.setHeightInPoints(18);

设置列宽:sheet.setColumnWidth((short)colNo, (short)(256*8));

设置每列默认宽度:sheet.setDefaultColumnWidth((short) 20);

设置标题:将第一行作为标题,即每页都打印此行 sheetN,startCol,stopCol,startRow,stopRow

wb.setRepeatingRowsAndColumns(0,1,8,0,1);

页脚:HSSFFooter footer = sheet.getFooter();footer.setRight("第"+HSSFFooter.page()+"页 共"+HSSFFooter.numPages()+"页 "); //页数

工具类-单元格自适应高度:float height = pioUtil.getCellAutoHeight(extcproducts, 12f);nRow.setHeightInPoints(height); //(一行字 + 行之间的间隙)*行数

分页:// POI 分页符有 BUG,必须在模板文件中插入一个分页符,然后再此处删除预设的分页符;最后在下面重新设置分页符。// sheet.setAutobreaks(false);// int iRowBreaks[] = sheet.getRowBreaks();// sheet.removeRowBreak(3);// sheet.removeRowBreak(4);// sheet.removeRowBreak(5);// sheet.removeRowBreak(6);

sheet.setRowBreak(行数); //在第 startRow 行设置分页符

==出货表:

合并单元格://纵向合并单元格 Region region = null;region = new Region(curRow-1, (short)(1), curRow-1+3, (short)1); sheet.addMergedRegion(region);

//横向合并单元格 CellRangeAddresssheet.addMergedRegion(new CellRangeAddress(开始行,结束行,开始列,结束列));

// 横向居中 style.setAlignment(CellStyle.ALIGN_CENTER); // 纵向居中 style.setVerticalAlignment(CellStyle.VERTICAL_CENTER);

文件直接输出:

  
 ByteArrayOutputStream byteArrayOutputStream = new ByteArrayOutputStream();  //生成流对象  
 wb.write(byteArrayOutputStream);  //将excel写入流  
    
 HttpServletResponse response = ServletActionContext.getResponse();  
​  
 //工具类,封装弹出下载框:   
 DownloadBaseAction down = new DownloadBaseAction();  
 down.download(byteArrayOutputStream, response, outFile);

获取模板:

  
 int curRow = 0;  //当前行  
 int colNo = 1;  //当前列  
    
 //得到模板路径  
 String rootPath = UtilFuns.getROOTPath();  
 String xlsFile = rootPath + "/make/xlsprint/tOUTPRODUCT.xls";  
    
 //新建临时目录,存放excel  /root/web/tmpfile/yyyy-mm-dd/...  
 String filePath = "/web/tmpfile/" + UtilFuns.sysDate()+"/";  
 File tmpDir = new File(rootPath + filePath);  
 if(!tmpDir.exists()){  
 tmpDir.mkdirs();  //创建多级目录  
 }  
    
 FileUtil fu = new FileUtil();  
 String sFile = fu.newFile(rootPath+filePath, "outproduct.xls");  //防止文件并发访问  
    
 String outFile = rootPath+filePath+sFile;  //输出文件

==合同打印:

1、 分页

sheet.setRowBreak(当前行); //设置分页符

2、怎么插入一个图片 HSSFPatriarch patriarch = sheet.createDrawingPatriarch(); //add picture

pioUtil.setPicture(wb, patriarch, rootPath+"make/xlsprint/logo.jpg", curRow, 2, curRow+4, 2);

3、怎么插入一条线

pioUtil.setLine(wb, patriarch, curRow, 2, curRow, 8); //draw line

4、设置数值类型 nCell.setCellType(HSSFCell.CELL_TYPE_NUMERIC);

5、设置前导符

HSSFDataFormat format = wb.createDataFormat();return format.getFormat(""¥"#,###,##0.00"); // 设置格式

6、设置公式

nCell.setCellType(HSSFCell.CELL_TYPE_FORMULA);nCell.setCellFormula("F11*H11");nCell.setCellFormula("F"+String.valueOf(curRow)+"*H"+String.valueOf(curRow));

nCell.setCellFormula("SUM(I"+String.valueOf(curRow-4)+":I"+String.valueOf(curRow-1)+")");

7、工具类:替换等量空格

fixSpaceStr(String str,int len)

8、业务要求:1)同一个厂家的货物才能打印到同一个页面

List oList = oDao.find("from ContractProduct o where o.contract.id='"+contractId+"' order by o.factory.id,o.orderNo");

//厂家不同另起新页打印,除去第一次的比较 if(oProduct.getFactory().getFactoryName().equals(oldFactory)){ }

2)打印可以选择打印一款货物,还是两款货物 if(contract.getPrintStyle().equals("2")){}

9、数据和业务分离

//填写每页的内容,之后在循环每页读取打印 Map<String,String> pageMap = null;List pageList = new ArrayList(); //打印页

==报运打印:

wb.cloneSheet(0); //复制 sheet0 工作簿,名字会自动重命名

SpringMVC 的 POI 实现方式

  
 //前端部分----goodsService.js-----  
 this.exportExcel = function(){  
 window.open('../goods/export.do');  
 }  
 //前端部分----goodsController.js-----  
 $scope.exportExcel = function(){  
 goodsService.exportExcel();  
 }  
 //后端部分  
 // 1.创建工作簿  
 Workbook wb = new HSSFWorkbook();  
 // 2.创建工作表  
 Sheet sheet = wb.createSheet();  
 // 3.设置一些参数,设置一些公用变量, 列宽就是个bug  
 nRow = sheet.createRow(0);  
 // 4.给行设置值  
 nCell = nRow.createCell(0);  
 nCell.setCellValue("测试导出数据");  
 // 5.设置导出头信息,指定下载的文件名,写出excel  
 try {  
 response.setHeader("Content-Disposition","attachment;filename="+URLEncoder.encode("商品明细.xls","UTF-8"));  
 OutputStream output = response.getOutputStream();  
 wb.write(output);  
 output.flush();  
 output.close();  
 } catch (IOException e1) {  
 // TODO Auto-generated catch block  
 e1.printStackTrace();  
 }

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • someone
    作者

    百万数据上传

  • visus

    真妹

  • someone
    作者

    你说啥?

  • visus

    真美~=真妹

  • someone

    你是个好人

  • someone
    作者

    哦,😰

  • PeterChu 3 评论

    哇塞,厉害哇!
    正好我现在需要一个导入 PDF 或者 WORD 的工具。
    情况是这样的,客户这有份 PDF(就是我们之前用过的那种高考志愿招生报考指南的 PDF 版),这份 PDF 恐怕还是扫描件,经处理后是可以得到可以读取文本的 PDF,或者 WORD、Excel 文件,但是其中存在各种文本识别错误,(甚至未识别某块区域中的文本,还是保存未一块图片,或者是某块区域识别为一个表格-word 中),
    然后,需要做的是:将得到的这份文件中的数据,存储到系统数据库表中,以供系统使用。

    样图:
    image.png

    这种情况不知到有哪个好用的工具 API 使用?或者有什么思路建议吗?

    我现在的思路是:应该可以根据文本的缩进、去区分文本内容的类型,然后进行存储,但是,如果其中包含了表格,就不太能想到怎么处理表格了。

    还有个 docx4j?不知道好用吗
    PeterChu
  • someone
    作者

    你需要把 pdf 转成 html

请输入回帖内容 ...

推荐标签 标签

  • Firefox

    Mozilla Firefox 中文俗称“火狐”(正式缩写为 Fx 或 fx,非正式缩写为 FF),是一个开源的网页浏览器,使用 Gecko 排版引擎,支持多种操作系统,如 Windows、OSX 及 Linux 等。

    8 引用 • 30 回帖 • 408 关注
  • 阿里云

    阿里云是阿里巴巴集团旗下公司,是全球领先的云计算及人工智能科技公司。提供云服务器、云数据库、云安全等云计算服务,以及大数据、人工智能服务、精准定制基于场景的行业解决方案。

    89 引用 • 345 回帖
  • Jenkins

    Jenkins 是一套开源的持续集成工具。它提供了非常丰富的插件,让构建、部署、自动化集成项目变得简单易用。

    53 引用 • 37 回帖
  • GraphQL

    GraphQL 是一个用于 API 的查询语言,是一个使用基于类型系统来执行查询的服务端运行时(类型系统由你的数据定义)。GraphQL 并没有和任何特定数据库或者存储引擎绑定,而是依靠你现有的代码和数据支撑。

    4 引用 • 3 回帖 • 9 关注
  • TextBundle

    TextBundle 文件格式旨在应用程序之间交换 Markdown 或 Fountain 之类的纯文本文件时,提供更无缝的用户体验。

    1 引用 • 2 回帖 • 54 关注
  • Sphinx

    Sphinx 是一个基于 SQL 的全文检索引擎,可以结合 MySQL、PostgreSQL 做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索。

    1 引用 • 217 关注
  • frp

    frp 是一个可用于内网穿透的高性能的反向代理应用,支持 TCP、UDP、 HTTP 和 HTTPS 协议。

    20 引用 • 7 回帖 • 2 关注
  • 单点登录

    单点登录(Single Sign On)是目前比较流行的企业业务整合的解决方案之一。SSO 的定义是在多个应用系统中,用户只需要登录一次就可以访问所有相互信任的应用系统。

    9 引用 • 25 回帖 • 5 关注
  • Dubbo

    Dubbo 是一个分布式服务框架,致力于提供高性能和透明化的 RPC 远程服务调用方案,是 [阿里巴巴] SOA 服务化治理方案的核心框架,每天为 2,000+ 个服务提供 3,000,000,000+ 次访问量支持,并被广泛应用于阿里巴巴集团的各成员站点。

    60 引用 • 82 回帖 • 597 关注
  • ReactiveX

    ReactiveX 是一个专注于异步编程与控制可观察数据(或者事件)流的 API。它组合了观察者模式,迭代器模式和函数式编程的优秀思想。

    1 引用 • 2 回帖 • 158 关注
  • 倾城之链
    23 引用 • 66 回帖 • 140 关注
  • 招聘

    哪里都缺人,哪里都不缺人。

    190 引用 • 1057 回帖 • 1 关注
  • CongSec

    本标签主要用于分享网络空间安全专业的学习笔记

    1 引用 • 1 回帖 • 12 关注
  • 开源

    Open Source, Open Mind, Open Sight, Open Future!

    408 引用 • 3576 回帖
  • 小薇

    小薇是一个用 Java 写的 QQ 聊天机器人 Web 服务,可以用于社群互动。

    由于 Smart QQ 从 2019 年 1 月 1 日起停止服务,所以该项目也已经停止维护了!

    34 引用 • 467 回帖 • 746 关注
  • JSON

    JSON (JavaScript Object Notation)是一种轻量级的数据交换格式。易于人类阅读和编写。同时也易于机器解析和生成。

    52 引用 • 190 回帖 • 2 关注
  • OnlyOffice
    4 引用 • 3 关注
  • 大数据

    大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

    93 引用 • 113 回帖
  • TensorFlow

    TensorFlow 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。

    20 引用 • 19 回帖 • 2 关注
  • GAE

    Google App Engine(GAE)是 Google 管理的数据中心中用于 WEB 应用程序的开发和托管的平台。2008 年 4 月 发布第一个测试版本。目前支持 Python、Java 和 Go 开发部署。全球已有数十万的开发者在其上开发了众多的应用。

    14 引用 • 42 回帖 • 767 关注
  • Gzip

    gzip (GNU zip)是 GNU 自由软件的文件压缩程序。我们在 Linux 中经常会用到后缀为 .gz 的文件,它们就是 Gzip 格式的。现今已经成为互联网上使用非常普遍的一种数据压缩格式,或者说一种文件格式。

    9 引用 • 12 回帖 • 134 关注
  • 外包

    有空闲时间是接外包好呢还是学习好呢?

    26 引用 • 232 回帖 • 1 关注
  • Caddy

    Caddy 是一款默认自动启用 HTTPS 的 HTTP/2 Web 服务器。

    12 引用 • 54 回帖 • 163 关注
  • Kafka

    Kafka 是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是现代系统中许多功能的基础。 这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。

    36 引用 • 35 回帖 • 1 关注
  • Kubernetes

    Kubernetes 是 Google 开源的一个容器编排引擎,它支持自动化部署、大规模可伸缩、应用容器化管理。

    110 引用 • 54 回帖 • 1 关注
  • Openfire

    Openfire 是开源的、基于可拓展通讯和表示协议 (XMPP)、采用 Java 编程语言开发的实时协作服务器。Openfire 的效率很高,单台服务器可支持上万并发用户。

    6 引用 • 7 回帖 • 99 关注
  • 音乐

    你听到信仰的声音了么?

    60 引用 • 511 回帖