了解一个良好数据层的应有的特质
java data object(jdo) 标准提供了一个统一的、简单的、在java application object和数据库间透明的接口,它是数据处理的一个革新,在本文中作者将会讨论我们所遇到的持久性数据的处理、特性等问题,最后介绍jdo这种解决方案
数据和计算一样古老,现在随着面对对象语言的兴起,面向对象的数据也变得深入人心起来。目前大多数先进的、重要的应用程序都使用面向对象的数据结构。另一方面 大部分的数据库系统仍然是关系型数据库,虽然面向对象的数据结构对很多应用必不可少,但我们能仍然要考虑很多原有系统的需要
本文讨论的是在传统中间件环境下,比如j2ee中,jdo是如何解决持久性数据的问题。本篇文章是一篇有关jdo的介绍,而并非详细的教程,面向的是应用程序的开发者(熟悉java开发、对象数据库和关系型数据库),而不是jdo的实现设计人员
需要透明的存储层?
以下列举了为什么我们使用面向对象的数据:
1.抛开数据存储的细节,建立简单、明了的面向对象的api来处理数据。我们不关心存储的细节和数据库中内部的数据含义,而是关心数据间的关系、对象含义或其他的一些逻辑。为什么我们要处理数据存储中的低级结构,比如表、列,并来来回回的存取他们,我需要的是更关注复杂逻辑应用中所直接所应用的数据形式
2.我们想要使用即插即用的方式来处理数据:当改变数据库时不需要更改一行代码,甚至也不要修改很多的配置。换句话说,我们需要一个以java object为基础来存取数据的工业标准,就如同象jdbc那样是访问sql数据的工业标准.
3.我们需要即插即用的方式来处理不同的数据视图,也就是说我们可以以最小的改动完成从关系型数据库向面向对象数据库的的转变。听起来不错,但在实际使用使用中,这并不重要。
以上的3个原因需要我们定义一个存储框架来提供对象和关系型数据库之间高级别的java api,这些api的生命周期要长于运行环境(jvm)的生命周期,这样的api应该具备以下的特征:
简易
最少的嵌入
透明,意思是该框架需要隐藏数据库实现
协调一致,简单的api用于保存、取出、更新
支持事务,需要定义出于数据对象的相应事务语义
既支持可管理(服务模式应用),也支持非可管理(单机)的环境
支持必要的附加功能,比如缓冲、查询、主键生成器、map工具
下面,我们来详述这些特征
简易性
简易性之所以被我放在一个这么高的位置,是因为,对开发分布式应用来说已经很复杂了,很多软件项目的失败正是由于它们过于复杂的管理方式。简单不意味着过分简化。只要能满足开发者的工作就可以了
最少的嵌入
每个存储系统总是会嵌入一定的内容到程序代码中,良好的数据层应该最小化这种嵌入,从而提高可移植性
我这里指出的是嵌入是指:
所有需要嵌入程序中的有关存取相关的代码(实现一些存取接口或类似存取的操作),这种嵌入的情况同时也出现一些odbms中(object-oriented database systems),相比rdbms它会少一些,嵌入的多少和不同odbms实现商的实现有关
透明性
数据存储层的透明性概念很简单:所有的应用程序使用与数据库类型无关(数据库类型透明性)、数据库提供商无关(提供商透明性)的统一api。这种特性通过隐藏数据库实现细节大大提高了代码的可维护性和扩展性.比如对操作那些流行的关系型数据库,可以不像jdbc那样编写繁杂的sql语句并记住列的顺序.事实上你都不需要了解sql或任何关系型概念,因为它们都太与数据库的实现相关了,透明性或许是数据层最重要的特性了
统一的、简洁的api
数据存储层api可以归纳为以下的一系列操作
作用于基础类(first-class objects:string,integer 等)的基本crud(create, read,
update, delete)操作
事务管理
应用程序对象和数据对象同一性控制
缓冲管理(比如刷新和释放管理)
查询的创建和执行
下面看一个数据层的api的例子:
public void persist(object obj); // save obj to the data store.
public object load(class c, object pk); // read obj with a given primary key.
public void update(object obj); // update the modified object obj.
public void delete(object obj); // delete obj from the database.
public collection find(query q); // find objects that satisfy conditions of our query.
支持事务
一个良好的数据层需要一些基本的事务功能:开始、提交、回滚事务(start, commit,roll back),这里有一个例子:
// transaction (tx) demarcation.
public void starttx();
public void committx();
public void rollbacktx();
// choose to make a persistent object transient after all.
public void maketransient(object o)
注意:这样的事务功能划分只应用在非管理环境(nonmanaged environments,单机),对可管理环境,内建的事务的管理器通常已经具备了这些功能
可管理环境,例如一个j2ee应用服务器,数据层都会和这些应用服务器的ejb容器和其他一些相应的服务(比如jndi和事务管理器),协同工作
查询
这样的api还必须具备数据的查询能力,它应该是稳定、有效、易用的。这样的api使用java object 而不是sql 表或其他的传统数据表示参数作为自己的行为语言
缓冲管理
缓冲管理主要关系到应用的性能,一个完善的数据层应该提供完整的缓冲功能api,比如锁定级别(locking levels:行锁,整表锁,列锁)、延迟加载(lazy loading:指一开始数据不被加载,在第一次需要时,才加载)、缓冲清除策略(eviction policies: 指如何将过期数据从cache中clean掉,或写回磁盘的策略)
译者注:以上的3点也就是讲述缓冲如何更新数据、如何加载数据,如何把不用的数据从cache中移走
主键生成器
产生标注数据的唯一性标识是一个很普遍的功能,每个数据层都会提供一个拥有各种算法的主键生成器,有关主键的生成已经是一个研究很成熟的问题,有很多主键生成的算法
mapping(映射),对关系型数据库而言
使用关系型数据库,会有数据映射的问题:需要把对象映射成表、映射关系(比如对依赖和引用要映射成表或字段的关联。这点对复杂的对象模型尤为重要.有关对象-关系的模型已经超出了本文的范围,但它很重要,请参考文尾的有关资料
如下的一些附加功能不是数据层所必须的,但他们会简化开发员的一些工作:
图形的映射工具
代码生成器:自动生成ddl(data description
language)来创建数据库表或根据ddl产生相应的java代码和映射文件
主键生成器:支持多算法比如:uuid, high-low, 和 sequence
支持二进制大字段对象(blobs)和文本型大字段对象(clobs)
自我引用关系:比如一个bar对象引用另一个bar对象
支持原始sql语句 :传递sql查询
范例
下面的例子将会显示如何使用数据层的api,加设下面一种情况:一个公司有一个或多个位置,每个位置有一个或多个用户,这样我们来看如下的程序代码:
persistencemanager pm =pmfactory.initialize(..);
company co = new company("mycompany");
location l1 = new location1 ("boston");
location l2 = new location("new york");
// create users.
user u1 = new user("mark");
user u2 = new user("tom");
user u3 = new user("mary");
// add users. a user can only "belong" to one location.
l1.adduser(u1);
l1.adduser(u2);
l2.adduser(u3);
// add locations to the company.
co.addlocation(l1);
co.addlocation(l2);
// and finally, store the whole tree to the database.
pm.persist(c);
另一种情况,你可以这样查询雇员tom:
persistencemanager pm =pmfactory.initialize(...)
collection companiesemployingtoms = pm.find("company.location.user.name = ´tom´");
对于关系型数据库,你必须创建一个mapping文件,如下
<!doctype mapping public ... >
<mapping>
<class name="com.numatica.example.company" identity="companyid" key-generator="sequence">
<cache-type type="count-limited" capacity="5"/>
<description>company</description>
<map-to table="companies"/>
<field name="companyid"type="long">
<sql name="companyid" type="numeric"/>
</field>
<field name="name" type="string">
<sql name="name" type="varchar"/>
</field>
<field name="locations" type="com.numatica.example.location" collection="arraylist">
</field>
</class>
<class name="com.numatica.example.location "identity="locationid"
key-generator="sequence">
<cache-type type="unlimited"/>
<description>locations</description>
<map-to table="locations"/>
<field name="locationid" type="long">
<sql name="locationid" type="numeric"/>
</field>
<field name="name" type="string">
<sql name="name" type="varchar"/>
</field>
<field name="company" type="com.numatica.example.company"required="true">
<sql name="companyid"/>
</field>
</class>
<class name="com.numatica.example.user" identity="userid"
depends="com.numatica.example.location" >
<cache-type type="count-limited" capacity="200"/>
<description>user</description>
<map-to table="users"/>
<field name="userid" type="integer">
<sql name="userid" type="numeric"/>
</field>
<field name="location" type="com.numatica.example.location"required="true">
<sql name="locationid"/>
</field>
<field name="name" type="string">
<sql name="username" type="varchar"/>
</field>
</class>
</mapping>
持久数据层的工作围绕着以下这些方面:
查找相关对象的组
保持应用对象的一致性
管理数据的标识(主键)
按一定的顺序储存每一对象
提供缓冲管理
提供合适的事务范围(我们不想只把对象树的一部分存储起来)
提供用户可选的锁定模式
一般有以下几种解决方案
1.使用jdbc api,自己完成其它的工作
2.使用适合的对象-关系映射工具或者直接使用对象数据库(odbms)
3.使用j2ee中的cmp-ejb(container-managed persistence entity bean)解决方案
4.java data objects (jdo)解决方案
目前还没有一种解决方案对所有的需求都可以适合,所以在我们主要介绍jdo之前,我们先浏览一下其他的几种方案
自己编写中间层代码接口
过去,大部分开发人员使用关系型数据库作数据存储,自己开发数据的连接层应用.这通常离不开2种技术jdbc和sqlj,后者可能应用少一些,它们都需要应用一些sql技术,并且这两种方法都具有数据库相关的不透明性,最后会形成难于维护和不易扩展的代码
一些公司尝试自己开发数据存贮层,但是这种工作复杂庞大,除了大型的专业公司组织,一般的公司又何苦重复这种工作
使用对象-关系映射工具:
o/r工具已经被经常使用了,这种方法也比较成熟了,有很多o/r工具的提供商,业界的领导者是webgain的toplink以及thought公司的cocobase,还有objectmatter的visual business sight framework(vbsf)
虽然大多数o/r映射工具提供了简单一致的api,简化了工作,而且大多数o/r映射工具提供了较少嵌入,vbsf在这方面作的的确很不错,同时它们也提供了一定的透明性,弥补了关系型数据库的一些不足,但是他们都有各自专属的api,不同的提供商间的映射技术区别较大,技术迁移问题很大.而且你还要自阿开发上多加一笔软件许可费用
使用对象数据库:
使用对象数据库甚至还不使用o/r映射工具,如果使用这样的产品你可能会被一个数据库产品锁死,而且数据存贮系统的变换肯定不是件容易的事,再加上几个主要的odbms提供商都宣布会支持即将出现的jdo标准,所以这样方案有待提高
j2ee的 cmp 方案
使用j2ee的 cmp 方案会受制于j2ee规范和应用服务器厂商的限制,在ejb 1.1 cmp规范中就缺少很多的高级关联,新的cmp 2.0规范有很大进步,但ejb在代码维护和性能上还是有不足
jdo方案:标准、开放、透明的应用于java的数据层
现在有两个都以jdo命名的标准:sun的 jdo和castor jdo.
sun的 jdo
sun的 jdo 是由java community process(jcp)制定开发的一套高级别的api规范,以及一个参考实现.在1999.7 jdo规范请求(jsr-12)被通过,并在同一时间发布最终提议草案.除了这里规范外,它还包含了一个参考性的实现范例,它是在2001年第二季度完成的1.0 beta版,它使用一般的文件形式实现存储
规范
sun的 jdo规范定义了一个在应用程序对象和传统数据库间的简单、透明的接口.它已经引起了数据库厂商的兴趣,一些厂商甚至已经开始有所动作,但是由于该标准还在草案阶段,目前只有一两个beta实现,还没有厂商提供完整功能的产品
虽然sun的jdo提供的是透明的存储,但是odmg(object data management group)的数据存储接口和几个主要的odbms提供商还是很大地影响这个规范。比如,映射机制格式(按xml格式定义)脱离了实现提供商而定义自己的格式,这限制了可移植性,在对抗jdo
该规范包含了以下几个方面
含有事务的存储
传统对象和j2ee的交互
基于java表达式的数据查询
参考实现范例
sun的jdo包含了一个使用一般文件功能有限的实现,它允许存储、取出、浏览以及事务性地更新存储实例(无查询功能)
有关sun jdo的第三方的实现可以分成两类
非数据库厂商
solarmetric kodo jdo
prismtech openfusion jdo
tradecity cybersoft´s rexip jdo
主要的数据库厂商
versant judo
gemstone systems
ibm´s informix
poet software
excelon (formerly object design)
castor jdo
castor jdo 是一个有exolab赞助的从1999开始的一个open source 项目,尽管和sun的jdo有一样的名字,但它们并不兼容,但是也相差不大。castor jdo特别专注于关系型数据库,所以并不支持存储类型的透明性。它是open source的,没有使用费用和专有权,但由于它的开发团队相对较小,即使比sun的jdo标准早,但它的优势不会很长了,但castor jdo仍然在解决数据层问题上作出了很多工作,也值得仔细研究
jdo:强壮的数据层
本篇文章提供了有关对象-关系问题的概览、列举了一个良好数据层的特质。当现在还只有很多专属的o/r映射工具的时候,我们更需要一个标准、开放接口的、多厂商支持或开放代码的数据层实现,目前有两个这样的规范sun的jdo 和 castor jdo.
在本系列文章的第2部分,我们将会介绍有关这两种jdo的详细信息:它们如何解决数据层标准性、或者还有没解决的问题。我们还会深入比较jdo和其他一些数据层技术的差别,比如ejb cmp 2.0
about the author
jacek kruszelnicki is president of numatica corporation, an information technology consulting firm providing expertise in information-systems strategy development, analysis, and planning; software development; and training. jacek (pronounced yatsek) received his master´s degree in computer science from northeastern university in boston, mass., and has more than 15 years´ experience delivering maintainable, large-scale, distributed enterprise solutions.
英文原文:persist data with java data objects, part 1
转载自:http://mag.javadigest.net
闽公网安备 35060202000074号