一、 antlr 的主要类:
antlr 中有主要类有两种(其实还有一种 treelexer )
lexer: 文法分析器类。主要用于把读入的字节流根据规则分段。既把长面条根据你要的尺寸切成一段一段:)并不对其作任何修改。
parser: 解析器类。主要用于处理经过 lexer 处理后的各段。一些具体的操作都在这里。
二、 antlr 文法文件形式:
antlr 文件是 *.g 形式,即以 g 为后缀名。
例如: t.g
class p extends parser;
startrule
: n:name
{system.out.println("hi there, "+n.gettext());}
;
class l extends lexer;
// one-or-more letters followed by a newline
name: ( 'a'……'z'|'a'……'z' )+ newline
;
newline
: '/r' '/n' // dos
| '/n' // unix
;
具体成分分析:
1 、总体结构
class p extends parser
class l extends lexer
两行同 java 继承一样, p 继承 parser 类; l 继承 lexer 类。每个 .g 文件只能各有一个。
2 、 lexer 类分析
一般按照
类型名:匹配的具体规则;
的形式构成。是分隔字节流的依据。同时可以看到里面可以互相引用。如本例中的类型名 newline 出现在 new 的匹配规则中。
3 、 parser 类分析
一般按照
起始规则名:
规则实例名:类型名或规则名
{java 语句……; }
;
……
的形式构成。
起始规则名:任意。
规则实例名:就象 java 中“ string s ;”的 s 一样。规则实例名用于在之后的 java 语句中调用。
类型名或规则名:可以是在 lexer 中定义的类型名,也可以是 parser 中定义的规则名。感觉就像是 int 与 integer 的区别。
java 语句:指当满足当前规则时所执行的语句。 antlr 会自动嵌入生成的 java 类中。
三、生成 java 类
1 、从 www.antlr.org 上下载 antlr-x.x.x.jar
2 、配置环境变量: classpath=.;x:/jdk/lib/tools.jar;x:/antlr-x.x.x.jar
3 、在 t.g 所在目录下执行:
java antlr.tool t.g
会在当前目录下生成如下文件:
l.java : lexer 文法分析器 java 类。
p.java : parser 解析器 java 类。
ptokentypes.java : lexer 中定义的类型具体化,供 parser 解析器调用。
ptokentypes.txt :当外部的(如 t2.g )要调用当前的类型或规则时要用到本文件。
四、执行
1 、编写 main 类
import java.io.*;
class main {
public static void main(string[] args) {
try {
l lexer = new l(new datainputstream(system.in));
p parser = new p(lexer);
parser.startrule();
} catch(exception e) {
system.err.println("exception: "+e);
}
2 、执行
c:/> javac *.java
c:/> java main
terence
^z
hi there, terence
c:/>
闽公网安备 35060202000074号