
有多少次您曾经注视着运行中的应用程序,问自己:“它到底在做什么?为什么用了这么长时间呢?” 在这些时刻,您可能会想如果自己在应用程序中构建了更多的监视功能就好了。例如,在服务器应用程序中,能够查看排队等候处理的任务的数量和类型、当前正在处理的任务、过去一分钟或一小时内的吞吐量统计、平均任务处理时间等。这些统计值容易搜集,但是在需要数据的时候,如果没有非侵入性的数据检索机制,那么这些值就不太有用。
可以用许多方式导出操作性数据――可以把周期性统计快照写入日志文件、创建 swing gui、使用内嵌的 http 服务器在 web 页面上显示统计值或者发布可以用来查询应用程序的 web 服务。但是在缺少监视和数据发布基础设施的情况下,多数应用程序开发人员都做不到这些,因此造成对应用程序工作情况的了解要比预期的少很多。
jmx
在 java 5.0 中,类库和和 jvm 提供了一种全面的管理和监视基础设施――jmx。jmx 是一种用来提供可以远程访问的管理接口的标准措施,也是一种向应用程序添加灵活且强大的管理接口的简易方式。被称作受管 bean(mbean)的 jmx 组件,是提供与实体的管理有关的访问器和业务方法的 javabean。每个受管的实体(可能是整个应用程序或应用程序中的服务)实例化一个 mbean 并用可读懂的名称注册它。支持 jmx 的应用程序依赖于 mbeanserver,它充当 mbean 的容器,提供远程访问、命名空间管理和安全服务。在客户端,jconsole 工具可以充当统一的 jmx 客户机。结合两者,对 jmx 的平台支持极大地降低了使应用程序支持外部管理接口所需的工作和努力。
除了提供 mbeanserver 实现,java se 5.0 还提供 jvm 以更方便地了解内存管理、类装入、活动线程、日志和平台配置的状态。多数平台服务的监视和管理在默认情况下都是开启的(性能影响最小),所以只需要连接应用程序与 jmx 客户机即可。图 1 给出了 jconsole jmx 客户机(jdk 的一部分) ,它显示了其中一个内存管理视图――一段时间内的堆使用情况。perform gc 按钮则证明了 jmx 可以提供 除了查看操作统计值之外的初始化操作的功能。
图 1. 用 jconsole 查看堆使用情况 |
传输和安全性
jmx 指定了在 mbeanserver 和 jmx 客户之间通信所使用的协议,协议可以在各种传输机制上运行。可以使用针对本地连接的内置传输,及通过 rmi、socket 或 ssl 的远程传输(可以通过 jmx connector api 创建新的传输)。认证是由传输执行的;本地传输允许用相同的用户 id 连接到运行在本地系统上的 jvm;远程传输可以用口令或证书进行认证。本地传输在 java 6 下默认就是启用的。要在 java 5.0 下启用它,需要在 jvm 启动时定义系统属性 com.sun.management.jmxremote。“monitoring and management using jmx” 这份文档描述了启用和配置传输的配置步骤。
检测 web 服务器
检测应用程序来使用 jmx 很容易。像其他许多远程调用框架(rmi、ejb 和 jax-rpc)一样,jmx 也是基于接口的。要创建管理服务,需要创建指定管理方法的 mbean 接口。然后可以创建一个 mbean 来实现此接口、实例化它及把它注册到 mbeanserver。
清单 1 显示了网络服务(例如 web 服务器)的 mbean 接口。它提供了检索配置信息(例如端口号)和操作性信息(例如服务是否启动)的 getter。它还包含查看和修改可配置参数(例如当前日志级别)的 getter 和 setter,还有调用管理操作(例如 start() 和 stop())的方法。
清单 1. 某个 web 服务器的 mbean 接口
| public interface webservermbean { public int getport(); public string getloglevel(); public void setloglevel(string level); public boolean isstarted(); public void stop(); public void start(); } |
实现 mbean 类通常非常直接明了,因为 mbean 接口要反映现有实体或服务的属性和管理操作。例如,mbean 中的 getloglevel() 和 setloglevel() 方法会直接转给被 web 服务器使用的 logger 上的 getlevel() 和 setlevel() 方法。jmx 做了一些命名限制。例如,mbean 接口名称必须以 mbean 结尾,foombean 接口的 mbean 类必须叫作 foo。(可以用更高级的 jmx 特性――动态 mbean 来去除这个限制。)把 mbean 注册到默认的 mbeanserver 也很容易,如清单 2 所示:
清单 2. 用内置的 jmx 实现注册 mbean
| public class webserver implements webservermbean { ... } ... webserver ws = new webserver(...); mbeanserver server = managementfactory.getplatformmbeanserver(); server.registermbean(ws, new objectname("myapp:type=webserver,name=port 8080")); |
传递给 registermbean() 的 objectname 标识了受管实体。因为预见到指定应用程序可能包含许多受管实体,所以名称包含域(清单 2 中的 “myapp”)和许多标识域中的受管资源的键-值对。“name” 和 “type” 这两个键是常用的,在使用的时候,name 应当在域中所有的同类 mbean 中能够唯一地标识受管实体。也可以指定其他键-值对,而且 jmx api 还包含进行对象名称通配匹配的工具。
创建并注册了 mbean 之后,立即就可以把 jconsole 指向应用程序(在命令行输入 jconsole)并在 “mbeans” 视图中查看它的管理属性和操作。图 2 显示了 jconsole 中针对新 mbean 的 attributes 标签,图 3 显示了 operations 标签。使用反射,jmx 可以指出哪个属性是只读的(started、port),哪个属性是可读写的(loglevel),而且 jconsole 允许修改读写属性。如果读写属性的 setter 抛出异常(例如 illegalargumentexception),jmx 就把异常报告给客户机。
图 2. jconsole 中 mbean 的 attributes 标签 图 3. jconsole 中 mbean 的 operations 标签 |
mbean 中的访问器和操作能够用任何其签名形式的原语类型,以及 string、date 和其他标准库类。也可以使用这些允许的类型的数组和集合。mbean 方法也可以使用其他可以序列化的数据类型,但是这样做会造成互操作性问题,因为类文件也必须对 jmx 客户机可用。(如果使用 rmi 传输,可以使用 rmi 的自动类下载特性完成这项任务。)如果想在管理接口中使用结构化数据类型,还想避免与类可用性相关的互操作性问题,可以使用 jmx 的开放 mbean 特性来表达复合或表格数据。
检测服务器应用程序
在创建管理接口时,某些参数和操作的特点很自然地就表明这些参数和数据应当被包含在内,例如配置参数、操作统计值、调试操作(例如修改日志级别或把应用程序状态导出到文件)、生命周期操作(启动、停止)。检测一个应用程序,让它支持对这些属性和操作的访问,通常相当容易。但是,要从 jmx 获得最大价值,就要在设计时考虑什么数据在运行时对用户和操作员有用。
如果用 jmx 了解服务器应用程序的工作情况,需要一种标识和跟踪工作单元的机制。如果使用标准的 runnable 和 callable 接口描述任务,通过让任务类自描述(例如实现tostring() 方法),可以在任务生命周期内跟踪它们,并提供 mbean 方法来返回等候中、处理中和完成的任务列表。
清单 3 中的 trackingthreadpool 演示的是 threadpoolexecutor 的一个子类,它及时给出正在处理中的是哪些任务,以及已经完成的任务的时间统计值。它通过覆盖 beforeexecute() 和 afterexecute() 挂钩,并提供能检索所搜集数据的 getter,实现这些任务。
清单 3. 搜集处理中的任务和平均的任务时间统计值的线程池类
| public class trackingthreadpool extends threadpoolexecutor { private final map<runnable, boolean> inprogress = new concurrenthashmap<runnable,boolean>(); private final threadlocal<long> starttime = new threadlocal<long>(); private long totaltime; private int totaltasks; public trackingthreadpool(int corepoolsize, int maximumpoolsize, long keepalivetime, timeunit unit, blockingqueue<runnable> workqueue) { super(corepoolsize, maximumpoolsize, keepalivetime, unit, workqueue); } protected void beforeexecute(thread t, runnable r) { super.beforeexecute(t, r); inprogress.put(r, boolean.true); starttime.set(new long(system.currenttimemillis())); } protected void afterexecute(runnable r, throwable t) { long time = system.currenttimemillis() - starttime.get().longvalue(); synchronized (this) { totaltime += time; ++totaltasks; } inprogress.remove(r); super.afterexecute(r, t); } public set<runnable> getinprogresstasks() { return collections.unmodifiableset(inprogress.keyset()); } public synchronized int gettotaltasks() { return totaltasks; } public synchronized double getaveragetasktime() { return (totaltasks == 0) ? 0 : totaltime / totaltasks; } } |
清单 4 中的 threadpoolstatusmbean 显示了 trackingthreadpool 的 mbean 接口,它提供了活动任务、活动线程、完成任务、等候任务的计数,还提供了当前等候执行和正在执行的任务的列表。在管理接口中包含等候和执行任务的列表,让您既可以看到应用程序的工作难度,又可以看到它目前的工作内容。这个特性不仅让您可以洞察应用程序的行为,还能洞察它正在操作的数据集的性质。
清单 4. trackingthreadpool 的 mbean 接口
| public interface threadpoolstatusmbean { public int getactivethreads(); public int getactivetasks(); public int gettotaltasks(); public int getqueuedtasks(); public double getaveragetasktime(); public string[] getactivetasknames(); public string[] getqueuedtasknames(); } |
如果任务的重量级足够,那么甚至可以再进一步,在每个任务提交时都为它注册一个 mbean (然后在任务完成时再取消注册)。然后可以用管理接口查询每个任务的当前状态、运行了多长时间,或者请求取消任务。
清单 5 中的 threadpoolstatus 实现了 threadpoolstatusmbean 接口,它提供了每个访问器的明显实现。与 mbean 实现类中的典型情况一样,每个操作实现起来都很细碎,所以把实现委托给了底层受管对象。在这个示例中,jmx 代码完全独立于受管实体的代码。trackingthreadpool 对于 jmx 一无所知;通过为相关的属性提供管理方法和访问器,它提供了自己的编程管理接口。 还可以选择在实现类中直接实现管理功能(让 trackingthreadpool 实现 trackingthreadpoolmbean 接口),或者单独实现(如清单 4 和 5 所示)。
清单 5. trackingthreadpool 的 mbean 实现
| public class threadpoolstatus implements threadpoolstatusmbean { private final trackingthreadpool pool; public threadpoolstatus(trackingthreadpool pool) { this.pool = pool; } public int getactivethreads() { return pool.getpoolsize(); } public int getactivetasks() { return pool.getactivecount(); } public int gettotaltasks() { return pool.gettotaltasks(); } public int getqueuedtasks() { return pool.getqueue().size(); } public double getaveragetasktime() { return pool.getaveragetasktime(); } public string[] getactivetasknames() { return tostringarray(pool.getinprogresstasks()); } public string[] getqueuedtasknames() { return tostringarray(pool.getqueue()); } private string[] tostringarray(collection<runnable> collection) { arraylist<string> list = new arraylist<string>(); for (runnable r : collection) list.add(r.tostring()); return list.toarray(new string[0]); } } |
为了演示这些类如何提供对应用程序操作的内容的了解,请考虑这样一个 web 搜寻应用程序,它把工作分成两类任务:获取远程页面,对页面进行索引。每个任务分别用清单 6 所示的 fetchtask 或 indextask 描述。可以创建 threadpoolstatus mbean,提供处理这些任务所使用的线程池的管理接口,并把它用 jmx 注册。
清单 6. web 搜寻应用程序中使用的 fetchtask 类
| public class fetchtask implements runnable { private final string name; public fetchtask(string name) { this.name = name; } public string tostring() { return "fetchtask: " + name; } public void run() { /* fetch remote resource */ } } |
当此程序处理每个页面时,可能还会对新任务进行排队以获取这个页面上链接的页面,所以在指定时间内,可能会既有获取任务又有尚未完成的索引任务。能够正确地判断正在处理哪个页面,或者正在等候处理哪个页面,不仅让您可以理解应用程序的性能特征,还可以理解应用程序所操作的数据的特征。
图 4 显示了正在处理 whitehouse.gov 站点的 web 搜寻程序的快照。从图中可以看到已经获取并索引了主页,程序现在的工作是获取和索引直接从该主页链接出的页面。单击 refresh 按钮,可以对应用程序的工作流程进行取样,它可以提供许多关于应用程序工作情况的信息,却不需引入大量日志或者在调试器中运行应用程序。
图 4. web 搜寻应用程序中的活动任务和排队任务 |
结束语
结合平台内的 jmx 支持和 jconsole jmx 客户机可以提供一种向应用程序添加管理和监视功能的轻松方式。即使是没有具体管理需求的应用程序,为它们构建这些功能也会让您对程序的运行及其所处理的数据的性质获得深入了解,而且不需太多的工作和努力。如果应用程序导出管理接口,此接口让您可以查看它操作的内容,那么您就会更加了解它的运行状态――对它是否按预期的方式工作也会更有信心――而不必求助于额外的工具(例如添加日志代码或使用调试器或分析器)。
闽公网安备 35060202000074号