Apache POI 操作 Excel 和 Word

本贴最后更新于 2780 天前,其中的信息可能已经沧海桑田

Apache POI 官网下载:
http://poi.apache.org/download.html
下面需要用到的 poi jar 包百度网盘分享:
https://pan.baidu.com/s/1i4DDcpB

具体代码

java 使用 poi 读取 Word:
这里我们把在 word 中读取到的图片保存到一个专门的地方,内容用 html 的 img 标签代替

	/**
	 * 读取doc文件
	 * docPath: doc文件路径
	 * descImageFolder: doc文件中的图片存放位置文件夹
	 */
	public static StringBuilder readDoc(String docPath,String descImageFolder) throws Exception{
		InputStream is=new FileInputStream(new File(docPath));
		//poi读取doc
		HWPFDocument doc=new HWPFDocument(is);
		//存储doc内容
		StringBuilder sb=new StringBuilder();
		//获取doc图片表格对象
		PicturesTable pt=doc.getPicturesTable();
		Range docr=doc.getRange();
		CharacterRun run=null;
		for (int i = 0; i < docr.numCharacterRuns(); i++) {
			run=docr.getCharacterRun(i);
			//判断是不是图片
			if(pt.hasPicture(run)){
				//图片对象
				Picture pic=pt.extractPicture(run, true);
				//图片路径,文件以系统时间命名
				String imgSrc=descImageFolder+"/"+System.currentTimeMillis()+"."+pic.suggestFullFileName();
				sb.append("<img src='").append(imgSrc).append("' />");
				//输出图片
				this.writeFile(imgSrc,pic.getContent());
			}else{
				//在该范围内遍历字符,判断是否有换行符
				for(int j=run.getStartOffset();j<run.getEndOffset();j++){
					//获取单个字符
					String text=new Range(j, j+1, doc).text();
					int code=text.hashCode();
					//根据code判断是否有换行
					if(code==13||code==7)
						sb.append("\n");
					else
						sb.append(text);
				}
			}
		}
		return sb;
	}

	/**输出文件*/
	public static void writeFile(String path,byte []file){
		try{
			File f=new File(path);
			if(!f.exists())
				f.createNewFile();
			OutputStream os=new FileOutputStream(f);
			os.write(file);
			os.close();
		}catch(Exception e){e.printStackTrace();}
	}
	
	//main方法测试
	public static void main(String[] args) throws Exception {
		String docPath="C:/Users/Administrator/Desktop/测试.doc";
		String descImageFolder="C:/Users/Administrator/Desktop";
		StringBuilder sb=readDoc(docPath, descImageFolder);
		System.out.println(sb.toString());
	}

java 使用 poi 读取 Excel:

	//读取Excel打印到控制台
	public static void main(String[] args) throws Exception{
		String xlsPath="C:/Users/Administrator/Desktop/测试.xls";
		//读取excel对象
		HSSFWorkbook workbook=new HSSFWorkbook(new FileInputStream(xlsPath));
		//获取sheet数
		int sheets=workbook.getNumberOfSheets();
		HSSFSheet sheet=null;//sheet
		HSSFRow row=null;//row
		HSSFCell cell=null;//cell
		//遍历sheets
		for (int i = 0; i < sheets; i++) {
			sheet=workbook.getSheetAt(i);
			//遍历行
			for (int j = 0; j <= sheet.getLastRowNum(); j++) {
				row=sheet.getRow(j);
				//遍历列
				for (int s = 0; s < row.getLastCellNum(); s++) {
					cell=row.getCell(s);
					//打印列的值用|隔开,这里需要判断列的类型
					System.out.print(getCellValue(cell)+" | ");
				}
				//换行
				System.out.println();
			}
		}
	}

	
	//获取列的值,返回String
	public static String getCellValue(HSSFCell cell){
		if(cell==null) return null;
		Object obj=null;
		int type=cell.getCellType();
		//列为空
		if(type==cell.CELL_TYPE_BLANK){
			obj="";
		//boolean类型
		}else if(type==cell.CELL_TYPE_BOOLEAN){
			obj=cell.getBooleanCellValue();
		//数字/时间
		}else if(type==cell.CELL_TYPE_NUMERIC){
			if(HSSFDateUtil.isCellDateFormatted(cell))
				obj=cell.getDateCellValue();
			else
				obj=cell.getNumericCellValue();
		//字符串类型
		}else if(type==cell.CELL_TYPE_STRING){
			obj=cell.getStringCellValue();
		//其他类型
		}else/* if(type==cell.CELL_TYPE_FORMULA)*/{
			obj=cell.toString();
		}
		return obj!=null?String.valueOf(obj):null;
	}
  • Java

    Java 是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由 Sun Microsystems 公司于 1995 年 5 月推出的。Java 技术具有卓越的通用性、高效性、平台移植性和安全性。

    3190 引用 • 8214 回帖 • 1 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • Bootstrap

    Bootstrap 是 Twitter 推出的一个用于前端开发的开源工具包。它由 Twitter 的设计师 Mark Otto 和 Jacob Thornton 合作开发,是一个 CSS / HTML 框架。

    18 引用 • 33 回帖 • 667 关注
  • sts
    2 引用 • 2 回帖 • 197 关注
  • Solo

    Solo 是一款小而美的开源博客系统,专为程序员设计。Solo 有着非常活跃的社区,可将文章作为帖子推送到社区,来自社区的回帖将作为博客评论进行联动(具体细节请浏览 B3log 构思 - 分布式社区网络)。

    这是一种全新的网络社区体验,让热爱记录和分享的你不再感到孤单!

    1435 引用 • 10056 回帖 • 489 关注
  • Bug

    Bug 本意是指臭虫、缺陷、损坏、犯贫、窃听器、小虫等。现在人们把在程序中一些缺陷或问题统称为 bug(漏洞)。

    76 引用 • 1737 回帖 • 1 关注
  • OpenShift

    红帽提供的 PaaS 云,支持多种编程语言,为开发人员提供了更为灵活的框架、存储选择。

    14 引用 • 20 回帖 • 632 关注
  • GitBook

    GitBook 使您的团队可以轻松编写和维护高质量的文档。 分享知识,提高团队的工作效率,让用户满意。

    3 引用 • 8 回帖
  • C++

    C++ 是在 C 语言的基础上开发的一种通用编程语言,应用广泛。C++ 支持多种编程范式,面向对象编程、泛型编程和过程化编程。

    107 引用 • 153 回帖
  • Notion

    Notion - The all-in-one workspace for your notes, tasks, wikis, and databases.

    7 引用 • 40 回帖
  • 友情链接

    确认过眼神后的灵魂连接,站在链在!

    24 引用 • 373 回帖 • 1 关注
  • CongSec

    本标签主要用于分享网络空间安全专业的学习笔记

    1 引用 • 1 回帖 • 15 关注
  • WebComponents

    Web Components 是 W3C 定义的标准,它给了前端开发者扩展浏览器标签的能力,可以方便地定制可复用组件,更好的进行模块化开发,解放了前端开发者的生产力。

    1 引用 • 4 关注
  • jsoup

    jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。

    6 引用 • 1 回帖 • 483 关注
  • AngularJS

    AngularJS 诞生于 2009 年,由 Misko Hevery 等人创建,后为 Google 所收购。是一款优秀的前端 JS 框架,已经被用于 Google 的多款产品当中。AngularJS 有着诸多特性,最为核心的是:MVC、模块化、自动化双向数据绑定、语义化标签、依赖注入等。2.0 版本后已经改名为 Angular。

    12 引用 • 50 回帖 • 483 关注
  • SEO

    发布对别人有帮助的原创内容是最好的 SEO 方式。

    35 引用 • 200 回帖 • 27 关注
  • SSL

    SSL(Secure Sockets Layer 安全套接层),及其继任者传输层安全(Transport Layer Security,TLS)是为网络通信提供安全及数据完整性的一种安全协议。TLS 与 SSL 在传输层对网络连接进行加密。

    70 引用 • 193 回帖 • 416 关注
  • 星云链

    星云链是一个开源公链,业内简单的将其称为区块链上的谷歌。其实它不仅仅是区块链搜索引擎,一个公链的所有功能,它基本都有,比如你可以用它来开发部署你的去中心化的 APP,你可以在上面编写智能合约,发送交易等等。3 分钟快速接入星云链 (NAS) 测试网

    3 引用 • 16 回帖 • 6 关注
  • Hadoop

    Hadoop 是由 Apache 基金会所开发的一个分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。

    86 引用 • 122 回帖 • 626 关注
  • WordPress

    WordPress 是一个使用 PHP 语言开发的博客平台,用户可以在支持 PHP 和 MySQL 数据库的服务器上架设自己的博客。也可以把 WordPress 当作一个内容管理系统(CMS)来使用。WordPress 是一个免费的开源项目,在 GNU 通用公共许可证(GPLv2)下授权发布。

    66 引用 • 114 回帖 • 223 关注
  • Wide

    Wide 是一款基于 Web 的 Go 语言 IDE。通过浏览器就可以进行 Go 开发,并有代码自动完成、查看表达式、编译反馈、Lint、实时结果输出等功能。

    欢迎访问我们运维的实例: https://wide.b3log.org

    30 引用 • 218 回帖 • 635 关注
  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    23020 引用 • 92599 回帖
  • 学习

    “梦想从学习开始,事业从实践起步” —— 习近平

    171 引用 • 512 回帖
  • 数据库

    据说 99% 的性能瓶颈都在数据库。

    343 引用 • 723 回帖
  • 服务

    提供一个服务绝不仅仅是简单的把硬件和软件累加在一起,它包括了服务的可靠性、服务的标准化、以及对服务的监控、维护、技术支持等。

    41 引用 • 24 回帖
  • 宕机

    宕机,多指一些网站、游戏、网络应用等服务器一种区别于正常运行的状态,也叫“Down 机”、“当机”或“死机”。宕机状态不仅仅是指服务器“挂掉了”、“死机了”状态,也包括服务器假死、停用、关闭等一些原因而导致出现的不能够正常运行的状态。

    13 引用 • 82 回帖 • 60 关注
  • 小说

    小说是以刻画人物形象为中心,通过完整的故事情节和环境描写来反映社会生活的文学体裁。

    28 引用 • 108 回帖
  • OkHttp

    OkHttp 是一款 HTTP & HTTP/2 客户端库,专为 Android 和 Java 应用打造。

    16 引用 • 6 回帖 • 75 关注
  • ActiveMQ

    ActiveMQ 是 Apache 旗下的一款开源消息总线系统,它完整实现了 JMS 规范,是一个企业级的消息中间件。

    19 引用 • 13 回帖 • 668 关注