服务热线:13616026886

技术文档 欢迎使用技术文档,我们为你提供从新手到专业开发者的所有资源,你也可以通过它日益精进

位置:首页 > 技术文档 > JAVA > 新手入门 > 基础入门 > 查看文档

solaris上开发j2ee应用中文问题的解决


  关于jsp和j2ee的中文问题和处理方法,网上已经有很多文章。一般在中文内核的操作系统(如中文nt,windows2000)上,该问题不是很突出,而在其他一些系统(如linux,solaris)中就比较明显了。近日在solaris上开发一个j2ee的应用系统,环境是solaris 2.7+minij2ee+mysql。系统在windows和linux下均没有出现中文处理的问题,但部署到solaris上面后所有中文显示为?。
  后来经过分析,发现原因出在系统编码上。由于安装solaris时默认的系统编码为ascii,因此以默认的系统编码处理字符串时汉字高位信息丢失。下面一段简单的jsp程序说明了这个问题:
  <%@ page contenttype="text/html;charset=gb2312"%>
  <%
  string str=request.getparameter("i");
  //byte[] b=str.getbytes("iso-8859-1");
  byte[] b=str.getbytes();
  out.println(new string(b,"gb2312"));
  %>
  在浏览器中输入foo.jsp?i=中文,结果显示为??。如果将byte[] b=str.getbytes();换成上面注释掉的byte[] b=str.getbytes("iso-8859-1");,则正常显示出“中文”二字。查阅了mysql jdbc的驱动程序,问题相同。
  考虑解决的方法有两个,一个是修改jdbc驱动程序,另一个是将汉字编码成7位,从实现方便的角度选择了后者。不过后者的缺点是字符串长度增加,并且无法直接通过sql工具来修改数据库了。网上有一种汉字编码的方法,是将汉字高位去1,英文则补一个0表示。这种方法有缺陷,因为特定的汉字编码后会出现“'”等sql语句中有歧义的字符,导致sql失败。我摘取了minij2ee中unistring的编码方法,该方法将字节表示为其16进制编码,下面是源代码:
  public string encode()
  {
  try
  {
  stringbuffer sb=new stringbuffer();
  byte[] bytes=m_enc.compareto("")==0?m_str.getbytes():m_str.getbytes(m_enc);
  
  for(int i =0;i<bytes.length;i++)
  {
  char ch;
  ch=character.fordigit((bytes[i]>>4)&0xf,16);
  sb.append(ch);
  ch=character.fordigit(bytes[i]&0xf,16);
  sb.append(ch);
  }
  
  return sb.tostring();
  }
  catch(java.io.unsupportedencodingexception e)
  {
  throw new runtimeexception("unsupported encoding type.");
  }
  }
  
  public void decode(string encodestr)
  {
  stringbuffer sb=new stringbuffer();
  int i=0;
  
  while(i!=encodestr.length())
  {
  sb.append((char)integer.parseint(encodestr.substring(i,i+2),16));
  i+=2;
  }
  
  m_str=new unistring(sb.tostring(),"iso-8859-1").cvt(m_enc);
  }
  使用编码后,问题解决。
  另外提一下,minij2ee最新版本中提供了一个unistring类,解决了在所有操作系统上的中文问题。使用unistring对象,无需关心字符串本身编码,使用时只要调用函数来获得需要的编码即可,如在jsp里调用unistring.gb()即可以以gb2312输出字符串,在数据库存储时调用unistring.iso()即可以以iso-8859-1编码输出字符串,无论在中文内核还是英文内核的操作系统上均通用。

扫描关注微信公众号