业务逻辑和数据库访问决策
这里有2种完全不同的方法来设计java企业程序,其中一种选择是采用标准ejb2实现途径(approach)。我更愿意称这种方法为重量级实现途径,当你使用重量级实现途径时你需要用会话beans(session bean)和消息驱动 beans(message-driven bean)去实现业务逻辑。你也可以使用daos(data access object)或者实体bean去访问业务逻辑
另外一种选择是使用pojos 和轻量级构架,这种方式我称为pojo实现途径。当使用pojos实现途径时,你的业务逻辑完全由pojo来实现。你可以使用持久型构架又叫做对象/关系映射构架(a.k.a=also know as )例如hibernate 或者 jdo来访问数据库,再用spring aop(面向层面编程)来提供企业服务,比如事务管理和安全。
ejb3由于融合了pojos和其他一些轻量级概念,所以对两者(指轻量级和重考锻揪叮┑那?分不是很清楚。举个例子,pojo中的实体bean既可以再ejb容器内运行,也可以再ejb容器外运行,然而pojos中的会话bean和消息驱动bean仍然有重量级的行为,因为他们只能在ejb容器内部运行。所以,显而易见的,ejb3既是重量级的又有pojo的特性。ejb3中的实体bean是轻量级实现途径中的一部分。
在开发过程中,首要的是从各种各样的设计中选择到底采用重量级实现途径还是采用pojo实现途径。决策可以影响程序的几个方面,包括业务逻辑结构和数据访问机制。为了帮助从两种实现途径中择其一,来看这张典型的企业应用程序结构图,结构图在图示1中,而且在设计过程中就必须判断到底使用那种策略。

figure 1. a typical application architecture and the key business logic and database access design decisions.
程序由网络基本表示层、业务层、持久层组成。网络基本表示层负责http请求和为一般的浏览器客户端、xml和其他的胖体客户端生成html,比如为ajax基本客户端生成html.业务层被表示层调用,用来实现程序业务逻辑。持久层被业务逻辑层用来访问外部数据源,比如数据库和其他程序。
表示层的设计不在本篇文章讨论之内,来看图表的其他部分,我们需要决定业务层结构的接口,这个接口是提供给表示层以及其他客户端的。而且还需要决定怎样访问能供多个程序访问的数据库。我们还必须决定如何处理短期事务处理事务和长期事务处理事务的并发问题。这些加起来一共有5种决策。每种决策都是要设计者来制定,为了能看懂演示图(big picture)要求每个开发者也都了解这些策略。
这些决策直接决定程序业务和表示层设计的特点。当然,还要决定一些其他很重要的决策。比如业务处理(transactions)、安全问题、缓存问题以及如何整合程序,但是关于这些问题通常在其他文献中讨论在图表1中显示的五种决策,每种决策都有多种选择。每种选择根据它要解决的实际问题都有相应的优缺点。后续章节中,你会发现每种决策针对一个或多个领域时,在功能性、易开发性、可维护性和可用性方面有不同的平衡点。尽管我是pojo实现途径的超级大fans,但是仍然需要了解其优缺点,以便于为你的程序做最好的选择下面我们来了解一下每种决策的大纲和其选项。
决策1:组织业务逻辑
现在,很多的注意力都集中在某项技术的优点和缺点,尽管这很重要,但是在本质上你需要了解如何建构你的业务逻辑。如果不考虑如何组织就去写代码是非常简单的。例如,为一个会话bean添加代码要比在域模式(domain model.: an object model of the domain that incorporates both behavior and data.)中判断应该添加那种新特性要简单的多。理论上你仍然需要刻意的为你的软件设计最合适的业务逻辑。毕竟我相信你有过修改别人垃圾结构代码的惨痛经验
关键的决策是:到底应该用面向对象的实现途径还是面向过程的实现途径来实现你的程序。这个不是关于技术的决策,但是你技术上的决策可以潜在的约束你的业务逻辑的组织结构。采用ejb2技术,有利于面向过程设计,然而pojos和轻量级构架可以让你为特殊的程序选择最好的实现途径
采用过程式设计
虽然我是一个面向对象实现途径(指前文的使用pojo和lightframework)的倡导者,但是有些情况下面向对象实现途径有些大材小用,比如你只想实现一个非常简单的业务逻辑。而且,有时候,面向对象实现途径不太可行-―比如,你没有持久层构架来将你的对象映射到数据库中,在这种情况下,更好的方法是编写面向过程的代码,而且采用martin fowler称作事务脚本(transaction script)的设计模式,要比采用面向对象实现途径设计要好,因为你只需要写一个方法来调用事务处理脚本去处理表示层的请求。
采种这种实现途径的一个很重要的特点是,用于实现某种行为的类和数据存储区是分开的。在ejb2的应用程序中,这种方式的业务逻辑和图表2中的设计是非常相似的。这种设计的核心全都集中在ejb或者pojo的行为上,因为他们实现了事务脚本,并且还操作那些 “哑”对象数据(因为他们只拥有很少的行为,大部分都是数据)。因为大部分的行为都集中在少量的大型类上,所以代码会变的很难理解与维护。

figure 2. the structure of a procedural design: large transaction script classes and many small data objects
这种设计具有高面向过程的特性,而且基本不依靠面向对象语言的特性。如果你曾经使用过c或者其他非面向对象语言的话,你应该用过这种设计模式。如果这种模式很适合你的设计的话,用这种模式设计也是一种不错的选择。
这种直观的过程式开发途径,非常的诱人,因为你只需要写代码就好了,不用考虑如何组织你的类文件。但问题是,如果你的业务逻辑非常的复杂,那么你的代码会变的噩梦般的难以维护。所以,除非你要写的程序非常的简单,否则你应该用面向对象设计你的程序,而不要受面向过程的代码的诱惑。
采用面向对象设计
在面向对象设计中,业务逻辑是由对象模型构成的,对象模型是由许多小类组成的关系网。这些类直接体现的是问题域的解决方法,如图3所示,在这种模式中,有些类只有数据,有些类只有行为,但是大多数的则两者都有,这是优秀的类设计的一种特点。

figure 3. the structure of a domain model: small classes that have state and behavior
面向对象设计有许多的好处,包括可以提高可维护性和可延展性。你可以用ejb2的实体bean来实现一个简单的对象模型。但是如果像要获得更多的好处的话,必须要使用pojos技术和轻量级持久层构架――比如hibernate和jdo技术。pojo可以让你开发丰富的模型,这些模型可以拥有继承和回调等特点。而轻量级持久层构架可以让你很简单的从对象模型映射到数据库。
对象模型的另外一个名字是域模型,fowler称这种由面向对象途径来开发的业务逻辑叫做域模型设计模式。(就是类的设计是直接用来解决问题的,则这种设计模式叫做域模型设计模式)
表模型设计模式
我曾经一直用域模型和事务处理脚本模型设计应用程序。但是有一次我听说java企业应用程序可以用第三种途径来实现,这种途径就是fowler所说的表模型设计模式。这种模式比事务处理脚本模式更加的结构化,因为它为数据库中的每个表都写了一个类,而这个类中实现了所有对这个表的操作代码,这个类就是表模型类。(我的解释就是为每个表专门写个类,对表的所有操作,全都由这个类中的方法实现,相当于用一个类模拟的数据库中的表)。和事务处理脚本模式相比,它将数据和行为分别封装到了不同的类中,因为表模型类的实例相当于真实数据库中的数据,这当然要比单独的一条记录要好的多。最后,可维护性成了问题,然而表模型设计模式还是有一些好处的。
决策2:封装业务逻辑
前面几章,我没有提及如何组织业务逻辑。你必须决定业务逻辑有什么样的接口。业务逻辑的接口由一些数据和方法组成,这些数据和方法由表示层来调用。在设计接口时重点需要考虑的是:应该封装哪些业务逻辑的操作,而哪些操作不应该显示给表示层。封装接口可以提高程序的可维护性,因为通过隐藏业务逻辑的操作细节,可以实现修改业务逻辑而不影响表示层。缺点是,你必须为封装业务逻辑而特意的写很多的代码。
你还需要考虑其他重要的问题,比如如何处理事务处理,安全,和远程调用问题。通常这些也是业务逻辑接口要负责的问题。为了保证数据的连贯性,业务层的接口必须保证每个事务处理中的调用都能执行。同样,也要验证调用者是否有权限调用业务方法。业务层接口还要负责处理一些远程客户端的问题。
来考虑一下选项。
ejb session faç;ade
经典的j2ee解决方案是:用ejb来封装业务逻辑-基本的session facade.ejb容器提供事务处理管理,安全,分布式事务处理和远程访问。facade方式可以通过封装业务逻辑来提高程序可维护性。粗糙型(coarse-grained) api通过减少表示层对业务层的访问次数,而提高性能(因为它将对各个业务流程的处理再封装了一次,所以对底层的业务流程来说,它的api是比较粗糙的,这里也许翻译的不好。请大家见谅)。因为减少调用的次数,可以减少对数据库事务处理的次数,还可以提高对象在缓冲区的机会。如果表示层通过远程访问业务层,则这种api还可以减少网络负担。图表4给出了一个ejb-based session facade的例子。

figure 4. encapsulating the business logic with an ejb session faç;ade
在这种设计模式中,表示层也许是通过远程来调用facade(相当于session的一个高级接口),ejb容器从facade中得到这个调用,并验证调用者的权限,然后开始一个业务处理。这个时候facade调用底层的业务对象,而这些业务对象负责实现具体的业务逻辑。等facade返回后,ejb容器提交业务处理或者让该业务处理循环等待。
不幸的是,使用ejb session facade有一些严重的缺点。比如,ejb的会话bean只能在ejb容器中运行,这样就托慢了开发和测试周期。另外,如果用ejb2,则用来向表示层传输数据的数据传输对象的开发和维护就会变的很枯燥而且旷日持久。
pojo facade
对于许多程序来说,更好的实现途径是用pojo facade和aop协作。比如负责管理事务处理、表示层的连接和安全问题的spring 构架。pojo facade对业务层的封装风格和ejb facade很相似,通常也可以用一样的公共方法。而pojo和ejb关键区别是用pojo代替了ejb,用aop提供的服务(例如业务处理管理和安全机制)替代了ejb容器。表5中,显示了用pojo facade的例子。

figure 5. encapsulating the business logic with a pojo faç;ade
表示层调用pojo facade, pojo facade 调用业务对象。和ejb容器截获ejb facade方式一样,aop通过“拦截机”来截获pojo facade,并验证调用者的权限,然后开始提交业务处理或让该业务循环等待。
通过在应用程序服务器外部开发和调试业务逻辑,对pojo facade的开发可以变的很简单,同时还可以获得许多ejb中会话bean的好处,比如声明事务处理和安全。关键是,你可以少写点代码。你可以避免写数据传输对象类,因为pojo facade可以将对象域直接反馈给表示层;你可以使用依赖注射的方式来将应用程序组装起来,而不用在为jndi写查找代码了。
然而,有些时候不能那用pojo facade,比如它不能参与到远程客户端建立的分布式事务处理。
暴露模型域模式
使用facade的一个缺点是你必须写额外的代码,而且负责将对象域返回给表示层的代码很容易出错。如果表示层设法调用某个对象,而业务层却没有提供该对象,也会增加runtime error出现的机会。如果你用jdo , hibernate或者ejb3,则可以避免这种问题,方法是:将模型域(session区域)暴露给表示层,再将相应的对象域(存储对象的区域)返回给表示层,根据表示层在对象域之间的操作关系,持久层来导入相应的对象。(也就是把session区域给表示层,然后分析它需要的对象,再让持久层去加载这些对象)这就是所谓的lazy loading 技术。图表6中显示了表示层自由的访问对象域的设计图。

figure 6. using an exposed domain model
在图表6的设计中,表示层不通过facade而直接调用域对象,spring aop仍然提供服务,例如事务处理管理和安全。
用这种实现途径的一个重要的好处是,业务层不需要知道哪些对象需要调用,也不用知道那些需要返回给表示层。尽管这挺起来很简单,但是你会发现一些缺点。这会增加表示层的复杂度,因为你必须处理对数据库的连接。而且在基于web的应用程序中,事务处理管理也要非常小心,因为在表示层将数据反馈给浏览器之前,事务处理的数据必须保持正确。
决策3:访问数据库
无论你怎样对业务逻辑怎样的组织和封装,最终你还是要从数据库中取数据出来。在经典的j2ee应用程序中,你有2个选择:jdbc――这个需要很多的底层代码;或者实体bean――这个用起来非常困难,而且缺少重要特征。相比来说,使用轻量级构架令人高兴的事情之一就是:你有一些新的而且更有力的方法去访问数据库,而且这种方法可以显著的减少访问数据库的代码。让咱们来进一步研究
直接用jdbc会有什么问题
最近突然出现了对象/关系 映射构架(比如jdo和hibernate) 和sql映射构架(比如ibatis)这些不是凭空出现的。相反,他们是在java 联盟在jdbc屡造挫折之后才出现的。为了了解新构架出现的原因,这里咱们回顾一下直接使用jdbc会出现的问题。在许多程序中直接使用jdbc不是一个好的选择,主要有以下三个原因:。 开发和维护sql非常的困难而且耗费时间――一些开发者发现要写庞大而且复杂的sql语句非常的困难。反映数据库变化的sql语句会变得非常耗时。你必须小心的考虑牺牲可维护性是否值得。。 用sql会使移植性变的很差――因为需要数据库的特殊sql语句。如果一个程序和多个数据库有关系,那么你就要写多个版本的sql语句,这使得可维护性变变成噩梦。。 直接写jdbc代码要会非常耗时,而且容易出错。你必须写很多的样板代码去获得连接,创建和初始化适当的声明,还要用精确的声明去清理连接。而且你还要写代码去将java 对象映射到sql声明。由于要无奈的去写,jdbc代码很容易出错。
如果你的程序必须直接运行sql语句的话,那前面两个问题是无法避免的。有时候为了获得好的性能,必须要全力的写sql语句,包括供应商提供的那些特殊东西。由于许多业务上的原因,持久层可能会产生混乱的sql语句,为了防止这种情况,dba可能要求你的程序来完全控制sql语句的执行。通常,团队买进的关系型数据库过于庞大,以至于应用程序工作时会出现一些和数据库有关的琐碎事务。根据“ibatis in action”的作者说这里会有一种情况出现:“数据库或者sql语句本身存在的时间比程序代码存在的时间还要长,或者同一段sql语句或数据库有多个程序的版本。有些情况下,程序已经用另外一种语言重写了,但是sql语句和数据库却没有太大的改变。” 如果直接使用sql弄的你筋疲力尽,那么很幸运,这里有一种直接执行sql语句的构架,它可比用jdbc要容易多了。当然了,这就是ibatis.
使用ibatis
我开发过的所有企业java应用程序,都是直接执行sql语句的。早期的程序是执行特定的sql语句的,后来是用持久层构架再用少量的sql语句构成的。一开始我直接用jdbc来执行sql语句,但是后来,我经常写一些小的构架去完成jdbc中那些比较无聊的部分。我也用过一段spring的jdbc类,这些类除去了jdbc中的许多样板代码。但是无论是我自己写的构架还是使用spring的类,在java类映射到sql语句的时候都会存在问题,这就是我为什么那么高兴的加入itatis 那边的原因了。
ibatis 不仅将应用程序完全的与“数据库连接”、具体的sql语句隔绝开来,更实现了通过xml描述文档来将javabean 映射到sql语句。它用java bean 内省机制来将“道具bean(bean properties)”映射为相应的数据库语句占位符,而且它可以将resultset后的结果构造为bean.它还可以通过数据库生成主键,自动加载相关的对象、实现缓存和lazy loading.这样,ibatis 就除去了许多执行sql语句带来的苦差。通过编辑xml描述文档和调用少量的ibatis的api,代替了写大量的jdbc底层代码。
使用持久层框架
当然,ibatis不能实现高层开发和维护sql语句,而且缺乏可移植性。为了避免这类问题,你需要用到持久层框架。持久层框架可以将对象域映射到数据库中。它提供了创建,查找,删除对象的api函数。当程序要控制对象时它可以自动的加载相应的对象,还可以在事务处理结束时自动更新数据库。持久层框架通过对象/关系映射机制可以自动的生成sql语句,对象/关系映射机制用xml文档定义了怎样将类映射为表,怎样将数据映射为列(column)和关系是怎样被映射为外键与连接表的。
在持久层构架上ejb也有它的短处:实体bean.ejb2的实体bean有很多的不足,而且开发和测试它会变得非常的枯燥。最后,很少用ejb2的实体bean了。在ejb3中会说明那些问题。
两种最有流行的轻量级持久层构架是jdo和hibernate,前者是sun的标准框架,后者是开源工程。两种框架都可以为pojo类提供持久层事务处理。你可以用pojo类来开发和测试你的业务逻辑,而不用担心持久层的问题,这个时候它会将类映射到数据库中的schema.另外,他们两个都可以在服务器程序外部或者内部,这样可以进一步降低开发难度。用hibernate和jdo来进行开发比用老的ejb2的实体bean要舒服的多。
除了要决定怎样访问数据库外,还要决定如何处理数据库的并行处理问题。下面来看一下,为什么并行处理问题那么重要,同时看一下可实现的选项
决策4:处理数据库事务处理的并行问题
差不多所有的企业应用程序都需要多用户和多个后台进程并行的更新数据库。2个数据库 处理事务同时访问同时访问同一个数据是很正常的,但是这种情况很可能引起数据库中的数据不一致或者引起应用程序的不正常。由于大部分的应用程序都需要处理多个处理事务并行访问同一个数据,则它可以影响到业务和持久层的设计。
无论你是使用ejb还是轻量级构架,你的程序必须可以并行访问共享数据。ejb2要求使用供应商提供的特殊扩充接口来实现并行,然而与此不同的是,jdo和hibernate可以直接支持大部分并行机制。更重要的是,使用jdo和hibernate不仅只配置简单,而且只需要少量的代码就可以实现了。
在这样主要介绍几种“并行更新数据库处理事务”的选项的概要,这些事务处理和用户的输入无关。下一章,我主要介绍一下如何在应用程序级长时间的并行更新数据库处理事务,这种处理事务会与用户输入有关,而且是由一系列的数据库事务处理组成的。
独立数据库事务
有时候对共享数据的并行访问可以简单的依靠数据库本身来实现,数据库可以设置为执行孤立的数据――这只是对数据库而言。如果你对这种概念不熟悉也不要担心,你只要记住:如果应用程序使用完全的孤立事务方式,那么同时执行2个事务的结果和一个接一个的执行是一样的。(也就是说,如果你用孤立事务的方式来访问数据库的话,你同时执行2个事务,就会变成一个接一个的串行执行了。)
这种方法也许听起来非常的简单,但问题是这种处理方式有时候会降低性能,因为如何实现对事务的孤立是由数据库来决定的。为了这个原因,许多应用程序都避免使用它,而采用optimistic或者pessimistic 所锁,这会在下面讲到。
开放式锁定
并行更新数据的一种途径是用开放式锁定。开放式锁定工作原理是通过应用程序来检查数据是否被更新(被其他事务修改造成的)而实现的。一种更普通的实现开放式锁定的方法是在每个表中添加一个“版本列”(version column),对每个表而言,程序每次改变其中一行的时候都会更新这个“版本列”。每个update语句中的where语句会根据上次查询的结果判断这个版本号是不是被更改了。在事务访问数据库中的数据时,程序中可以用preparedstatement.executeupadte()这个函数的返回值来检查行的个数,从而判断是否要继续执行update语句。如果数据中的行已经被其他的事务更新或者删除了,那么程序会让该事务从新访问数据库。
用开放式锁定机制来锁定那些直接执行sql语句的应用程序是非常简单的。但是,用持久层构架(比如jdo和hibernate)实现更容易,因为他们已经提供了开放式锁定机制――在配置选项中。一旦在配置选项中,选中了这种方式,持久层构架会自动的生成sql的update语句来完成版本检查的任务。开放式锁定的名字来源于一种假设的情况,在这种情况下:并发更新的机会非常少,而且程序只能检测、覆盖这些数据而不能防止这种事情的发生。另外一种可选的途径是用保守式锁定,使用他的假设条件是:并发更新肯定会发生,而且必须被禁止。
保守式锁定
对于开放式锁定来说,另外一种途径是使用保守式锁定。当一个事务读取某些行的数据时,他会对这些数据加锁,这样就防止其他的事务访问这些数据了。具体的实现是需要数据库支持的,然而不幸的是,不是所有的数据库都支持保守式锁定。如果你的数据库支持话,那么你的应用程序直接执行sql语句来实现保守式锁定将非常容易。但是,可能你已经猜到了,在程序中用jdo或者hibernate来实现保守式锁定更容易,jdo以配置选项的方式提供了保守式锁定,而hibernage提供了简单的api实现锁定对象。
除了可以处理单个数据库事务并行问题,常常你还需要处理多数据库事务的并行问题。
决策5:在长事务下处理并发访问
独立事务、开放式锁定、和保守式锁定只能用在单个数据库事务上的,然而,许多的程序需要 长时间的 在多个数据库事务之间 读取或者更新 共享数据。比如,有一种情况描述的是 怎样实现 用户编辑命令,这和很多的进程有关,这些进程可能会运行 很长的时间,而且它由 多个数据库事务组成。因为数据可能会被 一个数据库事务 读取,而又被 另外一个数据库事务 修改了,那么程序必须对 共享数据的并发访问 进行不同的处理。这样就必须使用 开放式锁定设计模式或 者保守是锁定设计模式,关于这两种模式会在fowler的 patterns of enterprise application architecutre中详细介绍。
开放式脱机锁定
模式一种选择是开放式锁定机制的扩展,它会从第一次读取数据开始,在编辑进程执行后检查数据是否已经被修改了。例如,你可以在数据库的共享数据的表中使用版本号来实现。在编辑进程开始的时候,程序将版本号存储到会话状态中,然后每次用户要存储数据时,应用程序都要进行检查,保证数据库中的版本号和会话状态中的版本号一致。
因为开放式脱机锁定模式只有在用户进行保存修改过的数据时才可以检测,所以它只有在不成为客户的累赘的时候,才可以很好的运行。但如果情况是:客户必须要撤销几个操作的话,那么就会因为这种锁定模式而非常苦恼,那么更好的一种选择是用保守式脱机锁定。
保守式脱机锁定
模式在编辑进程开始时,保守式脱机锁定方式通过锁定 共享数据,来解决 多个数据库事务 同时更新共享数据的问题,这样,这个编辑进程就可以防止 其他的用户来修改数据了。这种方式和保守式锁定机制一开始描述的很类似,但它是靠程序来实现的,而不是数据库。因为同一时间内,只有有权利编辑共享数据的用户,才有权利去保存这些修改。
闽公网安备 35060202000074号