这几天有些空闲,就对网络应用(web application)支持中文进行了一次简单的试验,现在总结一下。由于是第一次接触,错误难免,望指正帮助。
试验方法是在数据库中建立一个表格,如student表,然后建立一个网络应用程序,对该表中的数据进行查询与编辑。结构是 jsp――javabean――controller――dao,只用servlet(jsp2.0?)技术。
开发环境是linux(平台缺省编码是utf?8); 网络服务器tomcat5.0.28;数据库是postgresql/mysql。
整个试验的思路是,从客户端(browser)到我的应用程序,再到数据库存取,如果所有过程均采用utf?8编码的话,数据应保持完整性,即不应出现乱码问题。
首先确定数据库支持utf?8编码。利用数据库交互程序,往建好的表中直接写入中文数据,发现一切正常(你甚至不需要规定数据库编码为unicode, 可能是因为我的操作系统的缺省编码是unicode的原故)。
这样看来,出现乱码的主要原因,可能在于应用程序的编写以及客户与服务器数据传输的过程。试验证明,对于从数据库中提取数据时,关键是在有关jsp源文件头部声明应用程序的编码:<%@ page pageencoding="utf-8" %>.因tomcat5在将jsp编译时,其使用的缺省编码并非unicode, 因此就有可能造成数据丢失或错误。
同样,在处理来自客户端的数据输入时,在拿参数之前,也要相应设好数据编码,以避免tomcat用其缺省的编码来对数据流进行解释。试验中采用本站网友提出的办法,即用filter的方式对请求的数据进行编码设定。经此处理后,其他相关源代码中对参数的获取己其他处理等,不需要作任何特别的处理。
其简单源代码如下:
import java.io.ioexception;
import javax.servlet.*;
/**
* a filter to set the coming request encoding to a desired charset.
*/
public class encodingfilter implements filter {
private static string desired_charset = "utf-8";
// gets defined encoding from web.xml
public void init(filterconfig conf) throws servletexception {
desired_charset = conf.getinitparameter("charset");
}
public void dofilter(servletrequest req, servletresponse res, filterchain chain)
throws ioexception, servletexception {
req.setcharacterencoding(desired_charset); // sets request encoding.
chain.dofilter(req, res);
}
public void destroy() {}
}
//----------------------------------------------------------------
//配置文件 "web.xml", showing the declaration of the above filter:
<?xml version="1.0" encoding="iso-8859-1"?>
<web-app xmlns="http://java.sun.com/xml/ns/j2ee"
xmlns:xsi="http://www.w3.org/2001/xmlschema-instance"
xsi:schemalocation="http://java.sun.com/xml/ns/j2ee web-app_2_4.xsd"
version="2.4">
<filter>
<filter-name>character encoding filter</filter-name>
<filter-class>john.control.encodingfilter</filter-class>
<init-param>
<param-name>charset</param-name>
<param-value>utf-8</param-value>
</init-param>
</filter>
<filter-mapping>
<filter-name>character encoding filter</filter-name>
<url-pattern>/*</url-pattern>
</filter-mapping>
......
</web-app>
总结如下:
1:网络应用程序支持中文的主要问题在于有些服务器(servlet container)的缺省编码不是unicode。
2:解决的办法是通过对服务器的配置或在应用程序源代码中,指定希望采用的编码。
3:在应用程序源代码中指定编码,主要在jsp源文件中包括<%@ page pageencoding="utf-8" %>;而处理客户端所传数据时,可利用filter来设定所需的编码。
4:通过统一从客户端到数据库的编码为unicode,如utf?8,同一个网络应用程序可以支持多种语言。
5:改用mysql数据库系统后,应用程序仍然工作良好。
存在问题:
由于好奇,将此网络应用程序部署到windowsxp下进行调试,数据库与服务器均不变(当然是windows版本)。程序运行良好。但由于此windowsxp的缺省编"cp1521”(-:something like that),而并非utf?8, 因此,通过数据库交互程序直接对数据库进行查询,console输出乱码(postresql)。
最后,告诉大家今年听到的一句话:“生活会让你失去自信的”。
闽公网安备 35060202000074号