Apache POI 操作 Excel 和 Word

本贴最后更新于 2547 天前,其中的信息可能已经沧海桑田

Apache POI 官网下载:
http://poi.apache.org/download.html
下面需要用到的 poi jar 包百度网盘分享:
https://pan.baidu.com/s/1i4DDcpB

具体代码

java 使用 poi 读取 Word:
这里我们把在 word 中读取到的图片保存到一个专门的地方,内容用 html 的 img 标签代替

	/**
	 * 读取doc文件
	 * docPath: doc文件路径
	 * descImageFolder: doc文件中的图片存放位置文件夹
	 */
	public static StringBuilder readDoc(String docPath,String descImageFolder) throws Exception{
		InputStream is=new FileInputStream(new File(docPath));
		//poi读取doc
		HWPFDocument doc=new HWPFDocument(is);
		//存储doc内容
		StringBuilder sb=new StringBuilder();
		//获取doc图片表格对象
		PicturesTable pt=doc.getPicturesTable();
		Range docr=doc.getRange();
		CharacterRun run=null;
		for (int i = 0; i < docr.numCharacterRuns(); i++) {
			run=docr.getCharacterRun(i);
			//判断是不是图片
			if(pt.hasPicture(run)){
				//图片对象
				Picture pic=pt.extractPicture(run, true);
				//图片路径,文件以系统时间命名
				String imgSrc=descImageFolder+"/"+System.currentTimeMillis()+"."+pic.suggestFullFileName();
				sb.append("<img src='").append(imgSrc).append("' />");
				//输出图片
				this.writeFile(imgSrc,pic.getContent());
			}else{
				//在该范围内遍历字符,判断是否有换行符
				for(int j=run.getStartOffset();j<run.getEndOffset();j++){
					//获取单个字符
					String text=new Range(j, j+1, doc).text();
					int code=text.hashCode();
					//根据code判断是否有换行
					if(code==13||code==7)
						sb.append("\n");
					else
						sb.append(text);
				}
			}
		}
		return sb;
	}

	/**输出文件*/
	public static void writeFile(String path,byte []file){
		try{
			File f=new File(path);
			if(!f.exists())
				f.createNewFile();
			OutputStream os=new FileOutputStream(f);
			os.write(file);
			os.close();
		}catch(Exception e){e.printStackTrace();}
	}
	
	//main方法测试
	public static void main(String[] args) throws Exception {
		String docPath="C:/Users/Administrator/Desktop/测试.doc";
		String descImageFolder="C:/Users/Administrator/Desktop";
		StringBuilder sb=readDoc(docPath, descImageFolder);
		System.out.println(sb.toString());
	}

java 使用 poi 读取 Excel:

	//读取Excel打印到控制台
	public static void main(String[] args) throws Exception{
		String xlsPath="C:/Users/Administrator/Desktop/测试.xls";
		//读取excel对象
		HSSFWorkbook workbook=new HSSFWorkbook(new FileInputStream(xlsPath));
		//获取sheet数
		int sheets=workbook.getNumberOfSheets();
		HSSFSheet sheet=null;//sheet
		HSSFRow row=null;//row
		HSSFCell cell=null;//cell
		//遍历sheets
		for (int i = 0; i < sheets; i++) {
			sheet=workbook.getSheetAt(i);
			//遍历行
			for (int j = 0; j <= sheet.getLastRowNum(); j++) {
				row=sheet.getRow(j);
				//遍历列
				for (int s = 0; s < row.getLastCellNum(); s++) {
					cell=row.getCell(s);
					//打印列的值用|隔开,这里需要判断列的类型
					System.out.print(getCellValue(cell)+" | ");
				}
				//换行
				System.out.println();
			}
		}
	}

	
	//获取列的值,返回String
	public static String getCellValue(HSSFCell cell){
		if(cell==null) return null;
		Object obj=null;
		int type=cell.getCellType();
		//列为空
		if(type==cell.CELL_TYPE_BLANK){
			obj="";
		//boolean类型
		}else if(type==cell.CELL_TYPE_BOOLEAN){
			obj=cell.getBooleanCellValue();
		//数字/时间
		}else if(type==cell.CELL_TYPE_NUMERIC){
			if(HSSFDateUtil.isCellDateFormatted(cell))
				obj=cell.getDateCellValue();
			else
				obj=cell.getNumericCellValue();
		//字符串类型
		}else if(type==cell.CELL_TYPE_STRING){
			obj=cell.getStringCellValue();
		//其他类型
		}else/* if(type==cell.CELL_TYPE_FORMULA)*/{
			obj=cell.toString();
		}
		return obj!=null?String.valueOf(obj):null;
	}
  • Java

    Java 是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由 Sun Microsystems 公司于 1995 年 5 月推出的。Java 技术具有卓越的通用性、高效性、平台移植性和安全性。

    3169 引用 • 8207 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • 阿里巴巴

    阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的 18 人,于 1999 年在中国杭州创立,他们相信互联网能够创造公平的竞争环境,让小企业通过创新与科技扩展业务,并在参与国内或全球市场竞争时处于更有利的位置。

    43 引用 • 221 回帖 • 238 关注
  • Solidity

    Solidity 是一种智能合约高级语言,运行在 [以太坊] 虚拟机(EVM)之上。它的语法接近于 JavaScript,是一种面向对象的语言。

    3 引用 • 18 回帖 • 349 关注
  • Sym

    Sym 是一款用 Java 实现的现代化社区(论坛/BBS/社交网络/博客)系统平台。

    下一代的社区系统,为未来而构建

    523 引用 • 4581 回帖 • 694 关注
  • 程序员

    程序员是从事程序开发、程序维护的专业人员。

    534 引用 • 3528 回帖 • 2 关注
  • 职场

    找到自己的位置,萌新烦恼少。

    126 引用 • 1699 回帖
  • Lute

    Lute 是一款结构化的 Markdown 引擎,支持 Go 和 JavaScript。

    25 引用 • 191 回帖 • 24 关注
  • 深度学习

    深度学习(Deep Learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。

    40 引用 • 40 回帖
  • Ubuntu

    Ubuntu(友帮拓、优般图、乌班图)是一个以桌面应用为主的 Linux 操作系统,其名称来自非洲南部祖鲁语或豪萨语的“ubuntu”一词,意思是“人性”、“我的存在是因为大家的存在”,是非洲传统的一种价值观,类似华人社会的“仁爱”思想。Ubuntu 的目标在于为一般用户提供一个最新的、同时又相当稳定的主要由自由软件构建而成的操作系统。

    123 引用 • 168 回帖
  • JVM

    JVM(Java Virtual Machine)Java 虚拟机是一个微型操作系统,有自己的硬件构架体系,还有相应的指令系统。能够识别 Java 独特的 .class 文件(字节码),能够将这些文件中的信息读取出来,使得 Java 程序只需要生成 Java 虚拟机上的字节码后就能在不同操作系统平台上进行运行。

    180 引用 • 120 回帖 • 1 关注
  • PHP

    PHP(Hypertext Preprocessor)是一种开源脚本语言。语法吸收了 C 语言、 Java 和 Perl 的特点,主要适用于 Web 开发领域,据说是世界上最好的编程语言。

    164 引用 • 407 回帖 • 525 关注
  • Sandbox

    如果帖子标签含有 Sandbox ,则该帖子会被视为“测试帖”,主要用于测试社区功能,排查 bug 等,该标签下内容不定期进行清理。

    370 引用 • 1215 回帖 • 583 关注
  • 阿里云

    阿里云是阿里巴巴集团旗下公司,是全球领先的云计算及人工智能科技公司。提供云服务器、云数据库、云安全等云计算服务,以及大数据、人工智能服务、精准定制基于场景的行业解决方案。

    89 引用 • 345 回帖 • 2 关注
  • OpenStack

    OpenStack 是一个云操作系统,通过数据中心可控制大型的计算、存储、网络等资源池。所有的管理通过前端界面管理员就可以完成,同样也可以通过 Web 接口让最终用户部署资源。

    10 引用 • 9 关注
  • 爬虫

    网络爬虫(Spider、Crawler),是一种按照一定的规则,自动地抓取万维网信息的程序。

    106 引用 • 275 回帖
  • 996
    13 引用 • 200 回帖 • 2 关注
  • 开源

    Open Source, Open Mind, Open Sight, Open Future!

    397 引用 • 3416 回帖
  • WebSocket

    WebSocket 是 HTML5 中定义的一种新协议,它实现了浏览器与服务器之间的全双工通信(full-duplex)。

    48 引用 • 206 回帖 • 390 关注
  • Wide

    Wide 是一款基于 Web 的 Go 语言 IDE。通过浏览器就可以进行 Go 开发,并有代码自动完成、查看表达式、编译反馈、Lint、实时结果输出等功能。

    欢迎访问我们运维的实例: https://wide.b3log.org

    30 引用 • 218 回帖 • 602 关注
  • 心情

    心是产生任何想法的源泉,心本体会陷入到对自己本体不能理解的状态中,因为心能产生任何想法,不能分出对错,不能分出自己。

    59 引用 • 369 回帖 • 1 关注
  • flomo

    flomo 是新一代 「卡片笔记」 ,专注在碎片化时代,促进你的记录,帮你积累更多知识资产。

    3 引用 • 82 回帖 • 1 关注
  • SQLServer

    SQL Server 是由 [微软] 开发和推广的关系数据库管理系统(DBMS),它最初是由 微软、Sybase 和 Ashton-Tate 三家公司共同开发的,并于 1988 年推出了第一个 OS/2 版本。

    19 引用 • 31 回帖 • 5 关注
  • webpack

    webpack 是一个用于前端开发的模块加载器和打包工具,它能把各种资源,例如 JS、CSS(less/sass)、图片等都作为模块来使用和处理。

    41 引用 • 130 回帖 • 292 关注
  • Solo

    Solo 是一款小而美的开源博客系统,专为程序员设计。Solo 有着非常活跃的社区,可将文章作为帖子推送到社区,来自社区的回帖将作为博客评论进行联动(具体细节请浏览 B3log 构思 - 分布式社区网络)。

    这是一种全新的网络社区体验,让热爱记录和分享的你不再感到孤单!

    1425 引用 • 10043 回帖 • 470 关注
  • 30Seconds

    📙 前端知识精选集,包含 HTML、CSS、JavaScript、React、Node、安全等方面,每天仅需 30 秒。

    • 精选常见面试题,帮助您准备下一次面试
    • 精选常见交互,帮助您拥有简洁酷炫的站点
    • 精选有用的 React 片段,帮助你获取最佳实践
    • 精选常见代码集,帮助您提高打码效率
    • 整理前端界的最新资讯,邀您一同探索新世界
    488 引用 • 383 回帖 • 4 关注
  • JavaScript

    JavaScript 一种动态类型、弱类型、基于原型的直译式脚本语言,内置支持类型。它的解释器被称为 JavaScript 引擎,为浏览器的一部分,广泛用于客户端的脚本语言,最早是在 HTML 网页上使用,用来给 HTML 网页增加动态功能。

    711 引用 • 1173 回帖 • 162 关注
  • 大数据

    大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

    89 引用 • 113 回帖 • 1 关注
  • JetBrains

    JetBrains 是一家捷克的软件开发公司,该公司位于捷克的布拉格,并在俄国的圣彼得堡及美国麻州波士顿都设有办公室,该公司最为人所熟知的产品是 Java 编程语言开发撰写时所用的集成开发环境:IntelliJ IDEA

    18 引用 • 54 回帖 • 1 关注