服务热线:13616026886

技术文档 欢迎使用技术文档,我们为你提供从新手到专业开发者的所有资源,你也可以通过它日益精进

位置:首页 > 技术文档 > JAVA > 新手入门 > 基础入门 > 查看文档

使用技巧:利用java控制excel实例详解

使用windows操作系统的朋友对excel(电子表格)一定不会陌生,但是要使用java语言来操纵excel文件并不是一件容易的事。在web应用日益盛行的今天,通过web来操作excel文件的需求越来越强烈,目前较为流行的操作是在jsp或servlet 中创建一个csv (comma separated values)文件,并将这个文件以mime,text/csv类型返回给浏览器,接着浏览器调用excel并且显示csv文件。这样只是说可以访问到excel文件,但是还不能真正的操纵excel文件,本文将给大家一个惊喜,向大家介绍一个开放源码项目 java excel api,使用它大家就可以方便地操纵excel文件了。

java excel api简介

java excel是一开放源码项目,通过它java开发人员可以读取excel文件的内容、创建新的excel文件、更新已经存在的excel文件。使用该api非windows操作系统也可以通过纯java应用来处理excel数据表。因为是使用java编写的,所以我们在web应用中可以通过jsp、servlet来调用api实现对excel数据表的访问。 现在发布的稳定版本是v2.0,提供以下功能:

?从excel 95、97、2000等格式的文件中读取数据;

?读取excel公式(可以读取excel 97以后的公式);

?生成excel数据表(格式为excel 97);

?支持字体、数字、日期的格式化;

?支持单元格的阴影操作,以及颜色操作;

?修改已经存在的数据表;

? 现在还不支持以下功能,但不久就会提供了:

?不能够读取图表信息;

可以读,但是不能生成公式,任何类型公式最后的计算值都可以读出;

应用示例

从excel文件读取数据表

java excel api既可以从本地文件系统的一个文件(.xls),也可以从输入流中读取excel数据表。读取excel数据表的第一步是创建workbook(术语:工作薄),下面的代码片段举例说明了应该如何操作:(完整代码见excelreading.java)

import java.io.*; 
import jxl.*; 
… … … … 
try 
{ 
//构建workbook对象, 只读workbook对象 
//直接从本地文件创建workbook 
//从输入流创建workbook 
inputstream is = new fileinputstream(sourcefile); 
jxl.workbook rwb = workbook.getworkbook(is); 
} 
catch (exception e) 
{ 
e.printstacktrace(); 
}

一旦创建了workbook,我们就可以通过它来访问excel sheet(术语:工作表)。参考下面的代码片段:

//获取第一张sheet表 
sheet rs = rwb.getsheet(0);

我们既可能通过sheet的名称来访问它,也可以通过下标来访问它。如果通过下标来访问的话,要注意的一点是下标从0开始,就像数组一样。

一旦得到了sheet,我们就可以通过它来访问excel cell(术语:单元格)。参考下面的代码片段:

//获取第一行,第一列的值 
cell c00 = rs.getcell(0, 0); 
string strc00 = c00.getcontents(); 
//获取第一行,第二列的值 
cell c10 = rs.getcell(1, 0); 
string strc10 = c10.getcontents(); 
//获取第二行,第二列的值 
cell c11 = rs.getcell(1, 1); 
string strc11 = c11.getcontents(); 
system.out.println("cell(0, 0)" + " value : " + strc00 + "; type : " + 
c00.gettype()); 
system.out.println("cell(1, 0)" + " value : " + strc10 + "; type : " + 
c10.gettype()); 
system.out.println("cell(1, 1)" + " value : " + strc11 + "; type : " + 
c11.gettype());

如果仅仅是取得cell的值,我们可以方便地通过getcontents()方法,它可以将任何类型的cell值都作为一个字符串返回。示例代码中cell(0, 0)是文本型,cell(1, 0)是数字型,cell(1,1)是日期型,通过getcontents(),三种类型的返回值都是字符型。

如果有需要知道cell内容的确切类型,api也提供了一系列的方法。参考下面的代码片段:

string strc00 = null; 
double strc10 = 0.00; 
date strc11 = null; 
cell c00 = rs.getcell(0, 0); 
cell c10 = rs.getcell(1, 0); 
cell c11 = rs.getcell(1, 1); 
if(c00.gettype() == celltype.label) 
{ 
labelcell labelc00 = (labelcell)c00; 
strc00 = labelc00.getstring(); 
} 
if(c10.gettype() == celltype.number) 
{ 
nmbercell numc10 = (numbercell)c10; 
strc10 = numc10.getvalue(); 
} 
if(c11.gettype() == celltype.date) 
{ 
datecell datec11 = (datecell)c11; 
strc11 = datec11.getdate(); 
} 
system.out.println("cell(0, 0)" + " value : " + strc00 + "; type : " + 
c00.gettype()); 
system.out.println("cell(1, 0)" + " value : " + strc10 + "; type : " + 
c10.gettype()); 
system.out.println("cell(1, 1)" + " value : " + strc11 + "; type : " + 
c11.gettype());

在得到cell对象后,通过gettype()方法可以获得该单元格的类型,然后与api提供的基本类型相匹配,强制转换成相应的类型,最后调用相应的取值方法getxxx(),就可以得到确定类型的值。api提供了以下基本类型,与excel的数据格式相对应。

每种类型的具体意义,请参见java excel api document。

当你完成对excel电子表格数据的处理后,一定要使用close()方法来关闭先前创建的对象,以释放读取数据表的过程中所占用的内存空间,在读取大量数据时显得尤为重要。参考如下代码片段:

//操作完成时,关闭对象,释放占用的内存空间 
rwb.close();

java excel api提供了许多访问excel数据表的方法,在这里我只简要地介绍几个常用的方法,其它的方法请参考附录中的java excel api document。

workbook类提供的方法

1. int getnumberofsheets()

获得工作薄(workbook)中工作表(sheet)的个数,示例:

jxl.workbook rwb = jxl.workbook.getworkbook(new file(sourcefile)); 
int sheets = rwb.getnumberofsheets();

2. sheet[] getsheets()

返回工作薄(workbook)中工作表(sheet)对象数组,示例:

jxl.workbook rwb = jxl.workbook.getworkbook(new file(sourcefile)); 
sheet[] sheets = rwb.getsheets();

3. string getversion()

返回正在使用的api的版本号,好像是没什么太大的作用。

jxl.workbook rwb = jxl.workbook.getworkbook(new file(sourcefile)); 
string apiversion = rwb.getversion();

sheet接口提供的方法

1. string getname()

获取sheet的名称,示例:

jxl.workbook rwb = jxl.workbook.getworkbook(new file(sourcefile)); 
jxl.sheet rs = rwb.getsheet(0); 
string sheetname = rs.getname();

2. int getcolumns()

获取sheet表中所包含的总列数,示例:

jxl.workbook rwb = jxl.workbook.getworkbook(new file(sourcefile)); 
jxl.sheet rs = rwb.getsheet(0); 
int rscolumns = rs.getcolumns();

3. cell[] getcolumn(int column)

获取某一列的所有单元格,返回的是单元格对象数组,示例:

jxl.workbook rwb = jxl.workbook.getworkbook(new file(sourcefile)); 
jxl.sheet rs = rwb.getsheet(0); 
cell[] cell = rs.getcolumn(0);

4. int getrows()

获取sheet表中所包含的总行数,示例:

jxl.workbook rwb = jxl.workbook.getworkbook(new file(sourcefile)); 
jxl.sheet rs = rwb.getsheet(0); 
int rsrows = rs.getrows();

5. cell[] getrow(int row)

获取某一行的所有单元格,返回的是单元格对象数组,示例子:

jxl.workbook rwb = jxl.workbook.getworkbook(new file(sourcefile)); 
jxl.sheet rs = rwb.getsheet(0); 
cell[] cell = rs.getrow(0);

6. cell getcell(int column, int row)

获取指定单元格的对象引用,需要注意的是它的两个参数,第一个是列数,第二个是行数,这与通常的行、列组合有些不同。

jxl.workbook rwb = jxl.workbook.getworkbook(new file(sourcefile)); 
jxl.sheet rs = rwb.getsheet(0); 
cell cell = rs.getcell(0, 0);

生成新的excel工作薄

下面的代码主要是向大家介绍如何生成简单的excel工作表,在这里单元格的内容是不带任何修饰的(如:字体,颜色等等),所有的内容都作为字符串写入。(完整代码见excelwriting.java)

与读取excel工作表相似,首先要使用workbook类的工厂方法创建一个可写入的工作薄(workbook)对象,这里要注意的是,只能通过api提供的工厂方法来创建workbook,而不能使用writableworkbook的构造函数,因为类writableworkbook的构造函数为protected类型。示例代码片段如下:

import java.io.*; 
import jxl.*; 
import jxl.write.*; 
… … … … 
try 
{ 
//构建workbook对象, 只读workbook对象 
//method 1:创建可写入的excel工作薄 
jxl.write.writableworkbook wwb = workbook.createworkbook(new file(targetfile)); 
//method 2:将writableworkbook直接写入到输出流 
/* 
outputstream os = new fileoutputstream(targetfile); 
jxl.write.writableworkbook wwb = workbook.createworkbook(os); 
*/ 
} 
catch (exception e) 
{ 
e.printstacktrace(); 
}

api提供了两种方式来处理可写入的输出流,一种是直接生成本地文件,如果文件名不带全路径的话,缺省的文件会定位在当前目录,如果文件名带有全路径的话,则生成的excel文件则会定位在相应的目录;另外一种是将excel对象直接写入到输出流,例如:用户通过浏览器来访问web服务器,如果http头设置正确的话,浏览器自动调用客户端的excel应用程序,来显示动态生成的excel电子表格。

接下来就是要创建工作表,创建工作表的方法与创建工作薄的方法几乎一样,同样是通过工厂模式方法获得相应的对象,该方法需要两个参数,一个是工作表的名称,另一个是工作表在工作薄中的位置,参考下面的代码片段:

file://创建excel工作表 
jxl.write.writablesheet ws = wwb.createsheet("test sheet 1", 0);

"这锅也支好了,材料也准备齐全了,可以开始下锅了!",现在要做的只是实例化api所提供的excel基本数据类型,并将它们添加到工作表中就可以了,参考下面的代码片段:

file://1/.添加label对象 
jxl.write.label labelc = new jxl.write.label(0, 0, "this is a label cell"); 
ws.addcell(labelc); 
//添加带有字型formatting的对象 
jxl.write.writablefont wf = new jxl.write.writablefont(writablefont.times, 18, 
writablefont.bold, true); 
jxl.write.writablecellformat wcff = new jxl.write.writablecellformat(wf); 
jxl.write.label labelcf = new jxl.write.label(1, 0, "this is a label cell", wcff); 
ws.addcell(labelcf); 
//添加带有字体颜色formatting的对象 
jxl.write.writablefont wfc = new jxl.write.writablefont(writablefont.arial, 10, 
writablefont.no_bold, false, 
underlinestyle.no_underline, jxl.format.colour.red); 
jxl.write.writablecellformat wcffc = new jxl.write.writablecellformat(wfc); 
jxl.write.label labelcfc = new jxl.write.label(1, 0, "this is a label cell", wcffc); 
ws.addcell(labelcf); 
//2.添加number对象 
jxl.write.number labeln = new jxl.write.number(0, 1, 3.1415926); 
ws.addcell(labeln); 
//添加带有formatting的number对象 
jxl.write.numberformat nf = new jxl.write.numberformat("#.##"); 
jxl.write.writablecellformat wcfn = new jxl.write.writablecellformat(nf); 
jxl.write.number labelnf = new jxl.write.number(1, 1, 3.1415926, wcfn); 
ws.addcell(labelnf); 
//3.添加boolean对象 
jxl.write.boolean labelb = new jxl.write.boolean(0, 2, false); 
ws.addcell(labelb); 
//4.添加datetime对象 
jxl.write.datetime labeldt = new jxl.write.datetime(0, 3, new java.util.date()); 
ws.addcell(labeldt); 
//添加带有formatting的dateformat对象 
jxl.write.dateformat df = new jxl.write.dateformat("dd mm yyyy hh:mm:ss"); 
jxl.write.writablecellformat wcfdf = new jxl.write.writablecellformat(df); 
jxl.write.datetime labeldtf = new jxl.write.datetime(1, 3, new java.util.date(), wcfdf); 
ws.addcell(labeldtf);

这里有两点大家要引起大家的注意。第一点,在构造单元格时,单元格在工作表中的位置就已经确定了。一旦创建后,单元格的位置是不能够变更的,尽管单元格的内容是可以改变的。第二点,单元格的定位是按照下面这样的规律(column, row),而且下标都是从0开始,例如,a1被存储在(0, 0),b1被存储在(1, 0)。

最后,不要忘记关闭打开的excel工作薄对象,以释放占用的内存,参见下面的代码片段:

file://写入exel工作表 
wwb.write(); 
//关闭excel工作薄对象 
wwb.close();

这可能与读取excel文件的操作有少少不同,在关闭excel对象之前,你必须要先调用write()方法,因为先前的操作都是存储在缓存中的,所以要通过该方法将操作的内容保存在文件中。如果你先关闭了excel对象,那么只能得到一张空的工作薄了。

拷贝、更新excel工作薄

接下来简要介绍一下如何更新一个已经存在的工作薄,主要是下面二步操作,第一步是构造只读的excel工作薄,第二步是利用已经创建的excel工作薄创建新的可写入的excel工作薄,参考下面的代码片段:(完整代码见excelmodifying.java)

file://创建只读的excel工作薄的对象 
jxl.workbook rw = jxl.workbook.getworkbook(new file(sourcefile)); 
//创建可写入的excel工作薄对象 
jxl.write.writableworkbook wwb = workbook.createworkbook(new file(targetfile), rw); 
//读取第一张工作表 
jxl.write.writablesheet ws = wwb.getsheet(0); 
//获得第一个单元格对象 
jxl.write.writablecell wc = ws.getwritablecell(0, 0); 
//判断单元格的类型, 做出相应的转化 
if(wc.gettype() == celltype.label) 
{ 
label l = (label)wc; 
l.setstring("the value has been modified."); 
} 
//写入excel对象 
wwb.write(); 
//关闭可写入的excel对象 
wwb.close(); 
//关闭只读的excel对象 
rw.close();

之所以使用这种方式构建excel对象,完全是因为效率的原因,因为上面的示例才是api的主要应用。为了提高性能,在读取工作表时,与数据相关的一些输出信息,所有的格式信息,如:字体、颜色等等,是不被处理的,因为我们的目的是获得行数据的值,既使没有了修饰,也不会对行数据的值产生什么影响。唯一的不利之处就是,在内存中会同时保存两个同样的工作表,这样当工作表体积比较大时,会占用相当大的内存,但现在好像内存的大小并不是什么关键因素了。

一旦获得了可写入的工作表对象,我们就可以对单元格对象进行更新的操作了,在这里我们不必调用api提供的add()方法,因为单元格已经于工作表当中,所以我们只需要调用相应的setxxx()方法,就可以完成更新的操作了。

尽单元格原有的格式化修饰是不能去掉的,我们还是可以将新的单元格修饰加上去,以使单元格的内容以不同的形式表现。

新生成的工作表对象是可写入的,我们除了更新原有的单元格外,还可以添加新的单元格到工作表中,这与示例2的操作是完全一样的。

最后,不要忘记调用write()方法,将更新的内容写入到文件中,然后关闭工作薄对象,这里有两个工作薄对象要关闭,一个是只读的,另外一个是可写入的。

下面是在一个excel表格中创建一个矩阵的简单例子:

import org.apache.poi.hssf.usermodel.*; 
import java.io.fileoutputstream; 

// code run against the jakarta-poi-1.5.0-final-20020506.jar. 
public class poitest { 
static public void main(string[] args) throws exception { 
fileoutputstream fos = new fileoutputstream("foo.xls"); 
hssfworkbook wb = new hssfworkbook(); 
hssfsheet s = wb.createsheet(); 
wb.setsheetname(0, "matrix"); 
for(short i=0; i<50; i++) { 
hssfrow row = s.createrow(i); 
for(short j=0; j<50; j++) { 
hssfcell cell = row.createcell(j); 
cell.setcellvalue(""+i+","+j); 
} 
} 
wb.write(fos); 
fos.close(); 
} 
}

这段代码首先创建一个workbook,从该workbook中得到一个表格、命名,然后继续写入一个50x50的矩阵。最后输出到一个名为foo.xls的excel文件,甚至在apple mac机上也可以打开。

poi项目是java应用的令人兴奋的一步,为用户提供了windows文档集成的新功能,允许java开发人员方便地扩展其产品的功能。

扫描关注微信公众号