Apache POI是一个功能强大、开源免费的项目,旨在提供一套可以操纵Office办公文件的Java APIs。其中有一套组件APIs,可以方便地实现对PPT文件的读写。
在PPT的范畴,POI提供了两套API,HSLF和XLSF,分别对应实现03(.ppt)和07(.pptx)文件的操纵功能。这些API呢,主要为了提供两类功能:
- 数据的抽取(文本、图片、内嵌对象、声音)
- 创建、读取、修改ppt文件
在真正学习和使用POI的API之前,需要先了解一些PPT的基本操作和概念,不然学习API操作PPT示例,连ppt的功能怎么用都不清楚,又怎能用好POI的API呢?如果遇到ppt自身功能不清楚的,不妨亲自动手试一试,熟悉一下。
和这两套API的使用很简单,官方文档也有详细的示例与说明。这里总结一些使用经验,可以有助于更有效地认知这些API。
- 在学习的过程中,多留意API中类名、接口名以及它们的继承体系,这些API的命名规则和使用方式还是比较贴近PPT的实操习惯的,只不过在PPT我们采用的是拖拽方式,在代码中采用是new+add的方式。
- 笔者认为有几个重要的概念,Slide(幻灯片)、Shape(抽象图形)、AutoShape(自选图形)、TextRun等,抽取、新建等操作几乎都围绕着这些类在进行着。