java内核是unicode的,就连class文件也是,但是很多媒体,包括文件/流的保存方式是使用字节流的。
因此java要对这些字节流经行转化。
char是unicode的,而byte是字节。我们在写jsp页面时可能没注意到jsp作为回显终端,也是byte的,所以在从jsp页面中读取表单和写入数据
(javabean)时要注意页面的编码.
一个传统的解决方案是所有的应用包括页面编码设置\数据库编码设置都设定一致,比如gbk(gbk是gb2312的扩展集,支持的字符要多些).
现在又有个问题了,既然java内核是unicode的编码,那么字符串string lml="我爱金信桥tbs,tbs金信桥爱我"的长度应该是中文字符和英文字符的个数和,即lml.length()==17.
好了,如果我们想截取长度为14的字符串,那么应该:lml.substring(0,13);返回“我爱金信桥tbs,tbs金”.
这没问题吧?
但如果是应用中要求我们截取"固定回显长度"的字符串回显到jsp页面,那应该怎么办呢?所谓“固定回显长度”是指一个区域纯英文能显示x个,纯中文能显示x/2个.假设一个jsp页面中,有个表格,其中一列宽度为13个纯英文字符,我们想显示主题,主题可以为中文或英文.如果我们简单地设定了取前13个字符,那么在英文情况下是没问题的,能正确显示截取的前13个.
但汉字呢?一个汉字要占两个英文的宽度的.所以取了13个汉字就超过了列的宽度,破坏了布局.
那取6个字符好了!
恩,这到是没破坏布局,但你不觉得英文的情况下浪费了一般的宽度么?
哦,那就不好办了,中英文混合的串确实麻烦...
我在做mail系统时,在邮件列表中有一列加上了正文的内容提示(前50个字符,有点类似gmail),内容是可以有中文和英文混合的,所以为了尽量提示多些,不能采
用笨方法:直接取25个字符,保证中文没问题,英文浪费去吧~~~
后来仔细研究了一下,可以这样解决:从字符串转换成byte,然后判断汉字的个数,是汉字就取占两个空,不是汉字就占一个空.这就是为什么一开
始我要提提java中的byte<---->char,o(∩_∩)o...哈哈
注意到这里有个trick,就是如果最后截取的是半个汉字,要丢弃掉!!否则,最后可能出现一个?号.
用法:
string str=myutil.substring(lml,14);
system.out.println(str);
输出:
我爱金信桥tbs,
核心代码如下:
/**
* 判断一个字符是ascill字符还是其它字符(如汉,日,韩文字符)
*
* @param char
* c, 需要判断的字符
* @return boolean, 返回true,ascill字符
*/
public static boolean isletter(char c) {
int k = 0x80;
return c / k == 0 ? true : false;
}
/**
* 得到一个字符串的长度,显示的长度,一个汉字或日韩文长度为2,英文字符长度为1
*
* @param string
* s ,需要得到长度的字符串
* @return int, 得到的字符串长度
*/
public static int length(string s) {
if (s == null)
return 0;
char[] c = s.tochararray();
int len = 0;
for (int i = 0; i < c.length; i++) {
len++;
if (!isletter(c[i])) {
len++;
}
}
return len;
}
/**
* 截取一段字符的长度,不区分中英文,如果数字不正好,则少取一个字符位
*
* @author patriotlml
* @param string
* origin, 原始字符串
* @param int
* len, 截取长度(一个汉字长度按2算的)
* @return string, 返回的字符串
*/
public static string substring(string origin, int len) {
if (origin == null || origin.equals("")||len<1)
return "";
byte[] strbyte = new byte[len];
if (len > myutil.length(origin)){
return origin;}
system.arraycopy(origin.getbytes(), 0, strbyte, 0, len);
int count = 0;
for (int i = 0; i < len; i++) {
int value = (int) strbyte[i];
if (value < 0) {
count++;
}
}
if (count % 2 != 0) {
len = (len == 1) ? ++len : --len;
}
return new string(strbyte, 0, len);
}
|
(t007)