由于linux操作系统的兴起和java语言的日渐成熟,使用java语言实现一个跨平台的、外观一致的下载工具软件已成为可能。网络蚂蚁是大家非常熟知的下载工具软件,我采用java语言实现了类似网络蚂蚁的基本功能的软件jants。本文介绍了一些技术实现要点。
单线程直接获取网络文件
单线程直接获取网络文件的关键点是获取网络文件,以确定基本方法的正确性。它的初始代码的内容比较简单,可以利用http的基本知识进行设计。它的基本原理是:连接网络地址,打开连接并获取输入流,从输入流中读取数据。实现代码(测试过程中使用的)如下:
int data;//从输入流中获取数据
url url=new url("http://www.sohu.com");
//创建连接的地址
httpurlconnection connection=url.openconnection();
//打开连接
int responscode=connection. getresponsecode();
//返回http的响应状态码
inputstream input=connection.getinputstream();
//获取输入流
system.out.println("responsecode:"+responsecode);
while((data=input.read())!=-1)
system.out.println(data);
//将获取的数据打到屏幕显示出来
单线程断点续传
大家常常有这样的体会:下载一个几十兆的文件时突然断线,结果前功尽弃。可以使用断点续传解决这个问题。
基本原理
这里主要介绍一下断点续传的原理。断点续传的原理很简单,只是在http请求上和一般的下载有所不同。
所谓断点续传,也就是要从文件已经下载的地方开始继续下载。所以,在客户端传给web服务器的时候,要多加一条信息――下载的起始位置,且服务器返回的http状态代码也从200转变为206。
上述要点,可以使用java语言中的httpurlconnection类中的setrequestproperty()方法来设置。
断点续传的关键步骤
1.实现提交断点续传下载的起始位置
java的net包中提供了这种功能,代码如下:
url url = new url("http://www.mydomain.com/down.zip";);
httpurlconnection httpconnection=(httpurlconnection) url.openconnection();
//设置断点续传的开始位置
httpconnection.setrequestproperty("range","bytes=10000");
//设置请求信息
httpconnection.setrequestproperty("get","/down.zip http/1.1");
//设置接受信息
httpconnection.setrequestproperty("accept","image/gif,image/x-xbitmap,application/
msword,*/*");
//设置连接信息
httpconnection.setrequestproperty("connection","keep-alive");
//获得输入流
inputstream input = httpconnection.getinputstream();
从输入流中取出的字节流,就是down.zip文件从10000字节开始的字节流。
2.保存获得的字节流到文件中
由于文件的下载涉及到断点续传,因此,在保存文件的时候,需要对文件进行随机读写。特别是在多线程下载的过程中,需要在写文件之前在文件中定位。
在java的io包中的randomaccessfile类可以满足这种设计需求。该类在文件中定位指针时,用到的方法是seek(long)。
操作相当简单。假设从10000字节处开始保存文件,代码如下:
randomaccess osavedfile = new randomaccessfile("down.zip","rw");
//创建随机文件
long npos = 10000;
//定位文件指针到npos位置
osavedfile.seek(npos);
byte[] b = new byte[1024];
int nread;
//从输入流中读入字节流,然后写到文件中
while((nread=input.read(b,0,1024)) > 0)
{ //input为网络输入流
osavedfile.write(b,0,nread);
}
3.保存已经下载的文件的长度值
由于在每次断开连接时都要保存已下载文件的长度,且应进行永久保存,因此将它保存到文件介质中。这里采用的是对象序列化的方法――将要保存的内容序列化到一个临时文件中。代码如下:
long nstart;
//记录已经下载的字节数
file tempfile=new file(“donwzip.tmp”);
//创建临时文件
fileoutputstream file=new fileoutputstream(tempfile);
//创建文件输出流
objectoutputstream serialize=new objectoutputstream(file);
//创建文件序列化流
serialize.writeobject(nstart);//序列化
serialize.flush();
//刷新序列化流
file.close();
//关闭文件输出流
serialize.close();
//关闭序列化流
多线程的断点续传
加入断点续传以后,下载速度还没能得到提高。为防止已下载文件数据的丢失,也为提高网络文件的下载速度,可在其中加入多线程。虽然前两步已经基本实现,似乎再加入多线程时应该比较容易,但是并非如此。在多线程的编程过程中,需要考虑到线程的同步与互斥。由于是多线程进行断点续传,还要考虑记录多个断点位置,且记录断点位置时也要考虑同步互斥等问题。所有这些都使得这一步比较复杂。
同步的考虑
同步的基本思想是避免多个线程访问同一个资源时出现问题。由于多线程对同一个文件资源进行读写,因此,为了避免出现错误,要进行读写控制――即同步。java中使用synchronized实现线程之间的同步。java是面向对象的语言,它的资源是以对象的形式表现的。因此,java同步机制的作用就是力图避免对“对象”的访问冲突。
对需要同步的方法或代码段进行标记以实现同步,需要用到关键字synchronized。系统使用synchronized关键字声明的方法就是为其设置特殊的标记。这个标记起着信号量的作用,每当调用该方法时,java的运行系统都将进行检查,以确认此标记的状态,看相应的代码是否已经被调用执行。如没有执行,系统将把这个内部标记授予调用代码的线程,方法运行结束后,标记被释放。在标记被释放之前,任何其它的对象不得调用此方法。
主要的同步代码如下(在下载数据保存入文件中时使用):
public synchronized int write(byte[] b,int nstart,int len){
int n=-1;
try{
rf.write(b,nstart,len);
//调用另一个类的方法,向文件中写入数据
n=len;
}catch(ioexception ioe){
ioe.printstacktrace();
}
return n;
}
在保存已下载的字节数时,由于多个断点位置在不同的线程中记录,所以必须在所有线程都结束时才能保存。为此,解决的办法是再开出一个线程,用以持续监测是否所有的线程都已经结束。若结束,保存所有的断点位置;否则,继续监测。同样,在文件下载的线程中,需要设置标志位以记录线程是否结束。基本代码如下(在监测线程中使用):
stop=false;
while(!stop){
if(utility.bstop[0] && utility.bstop[1] && utility.bstop[2] && utility.bstop[3] && utility.bstop[4]){
system.out.println("serialize...");
utility.serializeout();
//调用序列化函数以保存断点位置于文件中
javaants.setstopfalse();
javaants.setstarttrue();
stop=true;
}
断点数据的记录
笔者使用的是一个静态数组以记录断点位置。由于有多个断点位置,可采用一个函数进行统一保存:
public static void serializeout(){
try{
file tempfile=new file(gettempfilename()+"."+"tmp");
fileoutputstream file=new fileoutputstream(tempfile);
objectoutputstream serialize=new objectoutputstream(file);
for(int i=0;i<5;i++){
serialize.writeobject(string.valueof(nstart[i]));
serialize.writeobject(string.valueof(nstop[i]));
}
serialize.flush();
file.close();
serialize.close();
}catch(exception e){
system.out.println(e.tostring());
}
}
图形界面
该文件下载系统的图形界面与流行下载软件――网络蚂蚁很相似。图形界面的实现,使用了swing包。限于篇幅,这里不再赘述。jants的图形界面如图1和图2所示。

图1 jants主界面

图1 jants下载过程中的界面
发布
使用jar命令将所有的文件下载系统的.class文件打包为javaants.jar文件,并在其中加入menifest.mf文件,指定main-class。
打包代码: jar cfv *.* javaants.jar
运行代码:javaw -classpath javaants.jar main
闽公网安备 35060202000074号