
看到parser的代码,你会大失所望。原来parser也只是一个空壳子

图中你可以看到经过层层查找的parser只是一个接口而已。
回想一下前面看到生成解析器代码的时候
使用了工厂模式
saxparserfactory factory = saxparserfactory.newinstance();
try {
// set up output stream
out = new outputstreamwriter(system.out, "utf-8");
// parse the input
saxparser saxparser = factory.newsaxparser();
saxparser.parse( new file(argv[0]), handler);
完全由saxparserfactory 这个类来控制产生的parser的类型。我们只是拿来用就可以了。秘密一定藏在里面。

看到代码,发现原来这个工厂自己也是一个虚类,连返回的工厂的实例都是该虚工厂的一个实现而已。
再去看真正的实现org.apache.crimson.jaxp.saxparserfactoryimpl

发现它又wrap了saxparserimpl,可知saxparserimpl是saxparser的一个子类。
继续追踪下去,因为saxparserimpl继承了saxparser,所以它也继承了saxparser的方法。在saxparserimpl体内,并没有发现覆写掉parser方法的地方,所以saxparserimpl的parser也就是saxparser的那个parser,呵呵,是不是有点绕口令的味道?那么怎么我们绕了半天,又回去了呢。再仔细看看saxparser的parser方法

可以看到其实在里面的parser parser这个实例是调用了this.getparser()这个方法来得到的。再看看saxparser里面的getparser方法

是不是有点感觉了? 对了,其实这个方法就是留给继承了saxparser的saxparserimpl来实现的,这样,saxparser的子类就可以自由的改换parser。只要改写掉getparser方法就可以了。
急忙去看saxparserimpl的getparser这个方法

你会发现你又上当了,这里又给出了很暧昧的代码,并不是我们所猜想的那样是一个真正的实现,再仔细看看。 注释里面有这么句话:adapt a sax2 xmlreader into a sax1 parser。
xmlreader,是不是很熟?想想看哪里看到过的?对了,刚刚在saxparser体内wrap的二个类,一个是我们追踪至今的parser,另一个就是xmlreader,原来这个xmlreader才是才是现在在用的sax2解析器,而为了保持对以前系统的兼容才保留了sax1解析器parser,但其实是通过对xmlreader的wrap得到的。只是个adapte而已。
好了,现在可以集中火力去查找xmlreader了。有了刚刚的经验,很容易的,我们发现,和parser一样,xmlreader也是一个接口:


很容易的,我们找到xmlreaderimpl

和里面的parse方法:

可以看到里面选择parse的部分,是根据是否需要validation选择不同的parser的实现。

parser的真面目已经找到啦。
parser2:

validatingparser:

其实,validatingparser也是继承了parser2的一个类而已,再加上了验证合法性的功能。
闽公网安备 35060202000074号