服务热线:13616026886

技术文档 欢迎使用技术文档,我们为你提供从新手到专业开发者的所有资源,你也可以通过它日益精进

位置:首页 > 技术文档 > JAVA > 新手入门 > 基础入门 > 查看文档

让poi架起java与office之间的桥梁一


  本文将阐述如何用poi来读取/写入完整的excel文件。
  
  约定:poi项目2.0版现在已经接近正式发行阶段,开发进度迅速,不断有新的功能集成到原有的系统,同时也有对原有系统的修改。
  
  为了保证本文的及时性,本文将按照最近的1.9开发版说明。虽然编译最近的发行版源代码也能正常运行,但现在的代码和2.0的发行版会有一些出入。
  
  一、excel基础
  
  microsoft excel 97文件格式也被称为biff8,最近版本的excel只对该格式作了少量的改动。增加对新格式的支持除了增加项目的复杂性之外,唯一的效果也许只是不得不使每个用户升级代码,没有什么实际的好处。
  
  因此,在下文说明中,凡是提到excel 97格式的地方其实都是指excel从97到xp的格式。
  
  二、hssf概况
  
  poi项目实现的excel 97文件格式称为hssf??也许你已经猜到,hssf是horrible spreadsheet format的缩写,也即“讨厌的电子表格格式”(微软使某些原本简单的事情过分复杂,同时又过分简单地处理了某些原本需要灵活性的事情,让人不胜佩服!)
  
  也许hssf的名字有点滑稽,就本质而言它是一个非常严肃、正规的api。通过hssf,你可以用纯java代码来读取、写入、修改excel文件。
  
  前面一篇文章提到了poifs,那么hssf和poifs又有什么关系呢?就象其他poi的api一样,hssf建立在poifs的基础上,因此在hssf内的有些代码和前文的某些代码很相似。不过,当我们编写基于hssf api的代码时,一般不需要了解poifs api的细节。
  
  hssf为读取操作提供了两类api:usermodel和eventusermodel,即“用户模型”和“事件-用户模型”。前者很好理解,后者比较抽象,但操作效率要高得多。usermodel主要有org.apache.poi.hssf.usermodel和org.apache.poi.hssf.eventusermodel包实现(在hssf的早期版本中,org.apache.poi.hssf.eventusermodel属于eventmodel包)。
  
  usermodel包把excel文件映射成我们熟悉的结构,诸如workbook、sheet、row、cell等,它把整个结构以一组对象的形式保存在内存之中。eventusermodel要求用户熟悉文件格式的底层结构,它的操作风格类似于xml的sax api和awt的事件模型(这就是eventusermodel名称的起源),要掌握窍门才能用好。
  
  另外,eventusermodel的api只提供读取文件的功能,也就是说不能用这个api来修改文件。
  
  三、通过usermodel读取文件
  
  用hssf的usermodel读取文件很简单。首先创建一个inputstream,然后创建一个hssfworkbook:
  
  inputstream myxls = new fileinputstream("workbook.xls"));
  hssfworkbook wb   = new hssfworkbook(myxls);
  
  有了hssfworkbook实例,接下来就可以提取工作表、工作表的行和列,例如:
  
  hssfsheet sheet = wb.getsheetat(0);    // 第一个工作表
  hssfrow row   = sheet.getrow(2);    // 第三行
  hssfcell cell  = row.getcell((short)3); // 第四个单元格
  
  上面这段代码提取出第一个工作表第三行第四单元格。利用单元格对象可以获得它的值,提取单元格的值时请注意它的类型:
  
  if (cell.getcelltype() == hssfcell.cell_type_string) {
  ("单元格是字符串,值是: " + cell.getstringcellvalue());
  } else if (cell.getcelltype() == hssfcell.cell_type_numeric) {
  ("单元格是数字,值是: " + cell.getcellvalue());
  } else () {
  ("单元格的值不是字符串或数值。");
  }
  
  如果搞错了数据类型,程序将遇到异常。特别地,用hssf处理日期数据要小心。excel内部以数值的形式保存日期数据,区别日期数据的唯一办法是通过单元格的格式(如果你曾经在excel中设置过日期格式,应该明白这是什么意思)。
  
  因此,对于包含日期数据的单元格,cell.getcelltype()将返回hssfcell.cell_type_numeric,不过利用工具函数hssfdateutil.iscelldateformatted(cell)可以判断出单元格的值是否为日期。iscelldateformatted函数通过比较单元格的日期和excel的内置日期格式得出结论??可以想象,按照这种判断方法,很多时候iscelldateformatted函数会返回否定的结论,存在一定的误判可能。
  
  本文附录包含了一个在servlet环境中利用hssf创建和返回excel工作簿的实例。
  
  四、通过usermodel写入文件
  
  写入xls文件比读取xls文件还要简单。创建一个hssfworkbook实例,然后在适当的时候创建一个把文件写入磁盘的outputstream,但延迟到处理结束时创建outputstream也可以:
  
  hssfworkbook wb = new hssfworkbook();
  fileoutputstream fileout
  = new fileoutputstream("workbook.xls");
  wb.write(fileout);
  fileout.close();
  
  创建工作表及其内容必须从相应的父对象出发,例如:
  
  hssfsheet sheet = wb.createsheet();
  hssfrow row   = sheet.createrow((short)0);
  hssfcell cell  = row.createcell((short)0);
  cell.setcellvalue(1);
  row.createcell((short)1).setcellvalue(1.2);
  row.createcell((short)2).setcellvalue("一个字符串");
  row.createcell((short)3).setcellvalue(true);
  
  如果要设置单元格的样式,首先要创建一个样式对象,然后把它指定给一个单元格??或者把它指定给多个具有相同样式的单元格,例如,如果excel表格中有一个摘要行,摘要行的数据必须是粗体、斜体,你可以创建一个summaryrowstyle样式对象,然后把这个样式指定给所有摘要行上的单元格。
  
  注意,cellformat和cellstyle对象是工作簿对象的成员,单元格对象只是引用它们。
  ...
  hssfcellstyle style = workbook.createcellstyle();
  style.setdataformat
  (hssfdataformat.getbuiltinformat("($#,##0_);[red]($#,##0)"));
  style.setfillbackgroundcolor(hssfcolor.aqua.index);
  style.setfillpattern(hssfcellstyle.big_spots);
  ...
  somecell.setcellstyle(style);
  someothercell.setcellstyle(style);
  
  版本较新的hssf允许使用数量有限的excel公式。这一功能目前还是“beta级质量”,正式使用之前务必仔细测试。指定公式的方式类如:somecell.setcellformula(sum(a1:a2:);。
  
  当前,公式中已经可以调用所有内建的函数或操作符,但逻辑操作符和函数(例如if函数)除外,这部分功能目前还在开发之中。

扫描关注微信公众号