概述
java 语言从诞生的那天起,就非常注重网络编程方面的应用。随着互联网应用的飞速发展,java 的基础类库也不断地对网络相关的 api 进行加强和扩展。在 java se 6 当中,围绕着 http 协议出现了很多实用的新特性:ntlm 认证提供了一种 window 平台下较为安全的认证机制;jdk 当中提供了一个轻量级的 http 服务器;提供了较为完善的 http cookie 管理功能;更为实用的 networkinterface;dns 域名的国际化支持等等。
ntlm 认证
不可避免,网络中有很多资源是被安全域保护起来的。访问这些资源需要对用户的身份进行认证。下面是一个简单的例子:
| import java.net.*; import java.io.*; public class test { public static void main(string[] args) throws exception { url url = new url("http://protected.com"); urlconnection connection = url.openconnection(); inputstream in = connection.getinputstream(); byte[] data = new byte[1024]; while(in.read(data)>0) { //do something for data } in.close(); } } |
当 java 程序试图从一个要求认证的网站读取信息的时候,也就是说,从联系于 http://protected.com 这个 urlconnection 的 inputstream 中 read 数据时,会引发 filenotfoundexception。尽管笔者认为,这个 exception 的类型与实际错误发生的原因实在是相去甚远;但这个错误确实是由网络认证失败所导致的。
要解决这个问题,有两种方法:
其一,是给 urlconnection 设定一个“authentication”属性:
| string credit = username + ":" + password; string encoding = new sun.misc.base64encoder().encode (credit.getbytes()); connection.setrequestproperty ("authorization", "basic " + encoding); |
这里假设 http://protected.com 使用了基本(basic)认证类型。
从上面的例子,我们可以看出,设定 authentication 属性还是比较复杂的:用户必须了解认证方式的细节,才能将用户名/密码以一定的规范给出,然后用特定的编码方式加以编码。java 类库有没有提供一个封装了认证细节,只需要给出用户名/密码的工具呢?
这就是我们要介绍的另一种方法,使用 java.net.authentication 类。
每当遇到网站需要认证的时候,httpurlconnection 都会向 authentication 类询问用户名和密码。
authentication 类不会知道究竟用户应该使用哪个 username/password 那么用户如何向 authentication 类提供自己的用户名和密码呢?
提供一个继承于 authentication 的类,实现 getpasswordauthentication 方法,在 passwordauthentication 中给出用户名和密码:
| class defaultauthenticator extends authenticator { public passwordauthentication getpasswordauthentication () { return new passwordauthentication ("user", "password".tochararray()); } } |
然后,将它设为默认的(全局)authentication:
| authenticator.setdefault (new defaultauthenticator()); |
那么,不同的网站需要不同的用户名/密码又怎么办呢?
authentication 提供了关于认证发起者的足够多的信息,让继承类根据这些信息进行判断,在 getpasswordauthentication 方法中给出了不同的认证信息:
| getrequestinghost() getrequestingport() getrequestingprompt() getrequestingprotocol() getrequestingscheme() getrequestingurl() getrequestingsite() getrequestortype() |
另一件关于 authentication 的重要问题是认证类型。不同的认证类型需要 authentication 执行不同的协议。至 java se 6.0 为止,authentication 支持的认证方式有:
| http basic authentication http digest authentication ntlm http spnego negotiate kerberos ntlm |
这里我们着重介绍 ntlm。
ntlm 是 nt lan manager 的缩写。早期的 smb 协议在网络上明文传输口令,这是很不安全的。微软随后提出了 windowsnt 挑战/响应验证机制,即 ntlm。
ntlm 协议是这样的:
?客户端首先将用户的密码加密成为密码散列;
?客户端向服务器发送自己的用户名,这个用户名是用明文直接传输的;
?服务器产生一个 16 位的随机数字发送给客户端,作为一个 challenge(挑战) ;
?客户端用步骤1得到的密码散列来加密这个 challenge ,然后把这个返回给服务器;
?服务器把用户名、给客户端的 challenge 、客户端返回的 response 这三个东西,发送域控制器 ;
?域控制器用这个用户名在 sam 密码管理库中找到这个用户的密码散列,然后使用这个密码散列来加密 challenge;
?域控制器比较两次加密的 challenge ,如果一样,那么认证成功;
java 6 以前的版本,是不支持 ntlm 认证的。用户若想使用 httpconnection 连接到一个使用有 windows 域保护的网站时,是无法通过 ntlm 认证的。另一种方法,是用户自己用 socket 这样的底层单元实现整个协议过程,这无疑是十分复杂的。
终于,java 6 的 authentication 类提供了对 ntlm 的支持。使用十分方便,就像其他的认证协议一样:
| class defaultauthenticator extends authenticator { private static string username = "username "; private static string domain = "domain "; private static string password = "password "; public passwordauthentication getpasswordauthentication() { string usernamewithdomain = domain + "/ "+username; return (new passwordauthentication(usernamewithdomain, password.tochararray())); } } |
这里,根据 windows 域账户的命名规范,账户名为域名+”/”+域用户名。如果不想每生成 passwordauthentication 时,每次添加域名,可以设定一个系统变量名“http.auth.ntlm.domain“。
java 6 中 authentication 的另一个特性是认证协商。目前的服务器一般同时提供几种认证协议,根据客户端的不同能力,协商出一种认证方式。比如,iis 服务器会同时提供 ntlm with kerberos 和 ntlm 两种认证方式,当客户端不支持 ntlm with kerberos 时,执行 ntlm 认证。
目前,authentication 的默认协商次序是:
gss/spnego -> digest -> ntlm -> basic
那么 kerberos 的位置究竟在哪里呢?
事实上,gss/spnego 以 jaas 为基石,而后者实际上就是使用 kerberos 的。
轻量级 http 服务器
java 6 还提供了一个轻量级的纯 java http 服务器的实现。下面是一个简单的例子:
| public static void main(string[] args) throws exception{ httpserverprovider httpserverprovider = httpserverprovider.provider(); inetsocketaddress addr = new inetsocketaddress(7778); httpserver httpserver = httpserverprovider.createhttpserver(addr, 1); httpserver.createcontext("/myapp/", new myhttphandler()); httpserver.setexecutor(null); httpserver.start(); system.out.println("started"); } static class myhttphandler implements httphandler{ public void handle(httpexchange httpexchange) throws ioexception { string response = "hello world!"; httpexchange.sendresponseheaders(200, response.length()); outputstream out = httpexchange.getresponsebody(); out.write(response.getbytes()); out.close(); } } |
然后,在浏览器中访问 http://localhost:7778/myapp/,我们得到:
图一 浏览器显示 |
首先,httpserver 是从 httpprovider 处得到的,这里我们使用了 jdk 6 提供的实现。用户也可以自行实现一个 httpprovider 和相应的 httpserver 实现。
其次,httpserver 是有上下文(context)的概念的。比如,http://localhost:7778/myapp/ 中“/myapp/”就是相对于 httpserver root 的上下文。对于每个上下文,都有一个 httphandler 来接收 http 请求并给出回答。
最后,在 httphandler 给出具体回答之前,一般先要返回一个 http head。这里使用 httpexchange.sendresponseheaders(int code, int length)。其中 code 是 http 响应的返回值,比如那个著名的 404。length 指的是 response 的长度,以字节为单位。
cookie 管理特性
cookie 是 web 应用当中非常常用的一种技术, 用于储存某些特定的用户信息。虽然,我们不能把一些特别敏感的信息存放在 cookie 里面,但是,cookie 依然可以帮助我们储存一些琐碎的信息,帮助 web 用户在访问网页时获得更好的体验,例如个人的搜索参数,颜色偏好以及上次的访问时间等等。网络程序开发者可以利用 cookie 来创建有状态的网络会话(stateful session)。 cookie 的应用越来越普遍。在 windows 里面,我们可以在“documents and settings”文件夹里面找到ie使用的 cookie,假设用户名为 admin,那么在 admin 文件夹的 cookies 文件夹里面,我们可以看到名为“admin@(domain)”的一些文件,其中的 domain 就是表示创建这些 cookie 文件的网络域, 文件里面就储存着用户的一些信息。
javascript 等脚本语言对 cookie 有着很不错的支持。 .net 里面也有相关的类来支持开发者对 cookie 的管理。 不过,在 java se 6 之前, java一直都没有提供 cookie 管理的功能。在 java se 5 里面, java.net 包里面有一个 cookiehandler 抽象类,不过并没有提供其他具体的实现。到了 java se 6, cookie 相关的管理类在 java 类库里面才得到了实现。有了这些 cookie 相关支持的类,java 开发者可以在服务器端编程中很好的操作 cookie, 更好的支持 http 相关应用,创建有状态的 http 会话。
?用 httpcookie 代表 cookie
java.net.httpcookie 类是 java se 6 新增的一个表示 http cookie 的新类, 其对象可以表示 cookie 的内容, 可以支持所有三种 cookie 规范:
netscape 草案
rfc 2109 - http://www.ietf.org/rfc/rfc2109.txt
rfc 2965 - http://www.ietf.org/rfc/rfc2965.txt
这个类储存了 cookie 的名称,路径,值,协议版本号,是否过期,网络域,最大生命期等等信息。
?用 cookiepolicy 规定 cookie 接受策略
java.net.cookiepolicy 接口可以规定 cookie 的接受策略。 其中唯一的方法用来判断某一特定的 cookie 是否能被某一特定的地址所接受。 这个类内置了 3 个实现的子类。一个类接受所有的 cookie,另一个则拒绝所有,还有一个类则接受所有来自原地址的 cookie。
?用cookiestore 储存 cookie
java.net.cookiestore 接口负责储存和取出 cookie。 当有 http 请求的时候,它便储存那些被接受的 cookie; 当有 http 回应的时候,它便取出相应的 cookie。 另外,当一个 cookie 过期的时候,它还负责自动删去这个 cookie。
?用 cookiemanger/cookiehandler 管理 cookie
java.net.cookiemanager 是整个 cookie 管理机制的核心,它是 cookiehandler 的默认实现子类。下图显示了整个 http cookie 管理机制的结构:
图 2. cookie 管理类的关系 |
一个 cookiemanager 里面有一个 cookiestore 和一个 cookiepolicy,分别负责储存 cookie 和规定策略。用户可以指定两者,也可以使用系统默认的 cookiemanger。
例子
下面这个简单的例子说明了 cookie 相关的管理功能:
| // 创建一个默认的 cookiemanager cookiemanager manager = new cookiemanager(); // 将规则改掉,接受所有的 cookie manager.setcookiepolicy(cookiepolicy.accept_all); // 保存这个定制的 cookiemanager cookiehandler.setdefault(manager); // 接受 http 请求的时候,得到和保存新的 cookie httpcookie cookie = new httpcookie("...(name)...","...(value)..."); manager.getcookiestore().add(uri, cookie); // 使用 cookie 的时候: // 取出 cookiestore cookiestore store = manager.getcookiestore(); // 得到所有的 uri list<uri> uris = store.geturis(); for (uri uri : uris) { // 筛选需要的 uri // 得到属于这个 uri 的所有 cookie list<httpcookie> cookies = store.get(uri); for (httpcookie cookie : cookies) { // 取出了 cookie } } // 或者,取出这个 cookiestore 里面的全部 cookie // 过期的 cookie 将会被自动删除 list<httpcookie> cookies = store.getcookies(); for (httpcookie cookie : cookies) { // 取出了 cookie } |
其他新特性
?networkinterface 的增强
从 java se 1.4 开始,jdk 当中出现了一个网络工具类 java.net.networkinterface,提供了一些网络的实用功能。 在 java se 6 当中,这个工具类得到了很大的加强,新增了很多实用的方法。例如:
public boolean isup()
用来判断网络接口是否启动并运行
public boolean isloopback()
用来判断网络接口是否是环回接口(loopback)
public boolean ispointtopoint()
用来判断网络接口是否是点对点(p2p)网络
public boolean supportsmulticast()
用来判断网络接口是否支持多播
public byte[] gethardwareaddress()
用来得到硬件地址(mac)
public int getmtu()
用来得到最大传输单位(mtu,maximum transmission unit)
public boolean isvirtual()
用来判断网络接口是否是虚拟接口
关于此工具类的具体信息,请参考 java se 6 相应文档(见 参考资源)。
?域名的国际化
在最近的一些 rfc 文档当中,规定 dns 服务器可以解析除开 ascii 以外的编码字符。有一个算法可以在这种情况下做 unicode 与 ascii 码之间的转换,实现域名的国际化。java.net.idn 就是实现这个国际化域名转换的新类,idn 是“国际化域名”的缩写(internationalized domain names)。这个类很简单,主要包括 4 个静态函数,做字符的转换。
结束语
java se 6 有着很多 http 相关的新特性,使得 java se 平台本身对网络编程,尤其是基于 http 协议的因特网编程,有了更加强大的支持。
闽公网安备 35060202000074号