服务热线:13616026886

技术文档 欢迎使用技术文档,我们为你提供从新手到专业开发者的所有资源,你也可以通过它日益精进

位置:首页 > 技术文档 > JAVA > 新手入门 > 基础入门 > 查看文档

java unicode转义字符的小小研究

转义字符
  所有的转义字符都是由 '/' 打头的
  第二个字符
      0-9  :八进制
      u    :是unicode转意,长度固定为6位
      other:则为以下字母中的一个 b,t,n,f,r,",/
            都不满足,则产生一个编译错误。


  当然了,提供八进制也是为了和c语言兼容.

  b,t,n,f,r 则是为控制字符.书上的意思为:描述数据流的发送者希望那些信息如何被格式化或者被表示.

  unicode转义字符非常有趣
  它可以写在代码的任意位置,只要转义后是合法的.
  例如:

  int c=0/u003b
  上面的代码可以编译通过,等同于int c=0; /u003b也就是';'的unicode代码

  上面的例子不能让人很信服,所以特地写了下面这一段代码用来将字符串转换成为unicode字符
  然后你可以将打印出来的代码放置在egghello.java中,然后运行它,结果是让人激动的。


/*
 * author:鸡蛋 date:2004/11/10 字符串转换为unicode
 */
public class asc2unicode {
 private stringbuffer ch;

 private stringbuffer tch;

 asc2unicode(stringbuffer s) {
  ch = s;
  if (ch.length() > 0)
   tch = new stringbuffer(1000);
 }

 void transform() {
  if (ch.length() < 1)
   return;
  for (int i = 0; i < ch.length(); i++) {
   (new integer((int) ch.charat(0))).tostring();
   tch.append(new stringbuffer("//u00"));
   tch.append(new stringbuffer(new string(integer.tohexstring((int) ch
     .charat(i)))));
  }
 }

 stringbuffer getstr() {
  return tch;
 }

 public static void main(string[] argv) {
  asc2unicode au = new asc2unicode(new stringbuffer(new string(
    "public class egghello{"
      + "   public static void main(string[] argv){"
      + "system.out.println(/"hello,world/");" + "}" + "}"
  )
  ));
  au.transform();
  system.out.println(au.getstr());
 }
}


打印如下:
/u0070/u0075/u0062/u006c/u0069/u0063/u0020/u0063/u006c/u0061/u0073/u0073/u0020/u0045/u0067/u0067/u0048/u0065/u006c/u006c/u006f/u007b/u0020/u0020/u0020/u0070/u0075/u0062/u006c/u0069/u0063/u0020/u0073/u0074/u0061/u0074/u0069/u0063/u0020/u0076/u006f/u0069/u0064/u0020/u006d/u0061/u0069/u006e/u0028/u0053/u0074/u0072/u0069/u006e/u0067/u005b/u005d/u0020/u0061/u0072/u0067/u0076/u0029/u007b/u0053/u0079/u0073/u0074/u0065/u006d/u002e/u006f/u0075/u0074/u002e/u0070/u0072/u0069/u006e/u0074/u006c/u006e/u0028/u0022/u0048/u0065/u006c/u006c/u006f/u002c/u0057/u006f/u0072/u006c/u0064/u0022/u0029/u003b/u007d/u007d


  感觉有点像加密的代码一样! 当然那都是掩耳盗铃。。。
  不过初看起来还是比较让人头晕的。

  unicode转义就先研究到这里,喝点水,打会游戏。。。

扫描关注微信公众号