詹姆士·格雷

声明:百科词条人人可编辑,词条创建和修改均免费,绝不存在官方及代理商付费代编,请勿上当受骗。详情

詹姆士·格雷(James Gray),男,1944年生于美国,毕业于加州大学伯克利分校计算机科学系,系获得博士学位。科学家,曾出任VLDB杂志主编。

1998年度的图灵奖授予了声誉卓著的数据库专家詹姆士·格雷 (James Gray)或称吉姆·格雷(JimGray,Jim是James的昵称)。这是图灵奖诞生32年的历史上,继数据库技术的先驱查理士·巴赫曼(Charles W.Bachman,1973)和关系数据库之父埃德加·考特d,1981)之后,第3位因在推动数据库技术的发展中做出重大贡献而获此殊荣的学者。

不幸的是,2007年1月28号,喜欢户外运动的格雷独自驾船在海上消失。很多人为搜寻他做出了很多努力,但人们再也未能见到这位天才。

在IBM期间,他参与和主持过IMS、System R、SQL/DS、DB2等项目的开发,其中除SystemR仅作为研究原型,没有 成为产品外,其他几个都成为IBM在数据库市场上有影响力的产 品。

在Tandem期间,格雷对该公司的主要数 据库产品ENCOM PASS进行了改进与扩充,并参与了系统字典、并行 排杠充壳序影谜、分布式SQL、NonStopSQL等项目的研制工作。

格雷的另一部著作是《TheBenchmark Handlook: for Database and Transaction Processing Systems》,第1版于1991年,第2版于 1993年出版,也是MorganKanfmann出版社出版的。格雷还是该出版社 “数据管理系统丛书”的主编。

在DEC,他仍然主要负责数据库产品的 技术。格雷进入数据库领域时,关系数据库的基本理论已经成熟,但各大公司在关系数据库管理系统(RDBMS)的实现和产品开发中,都遇到愚婆纹了

一系列技术问题,主要是在数据库的规模愈来愈大,数据库的结构愈来愈复杂,又有愈来愈多的用户共享数据库的情况下,如何保障数据的完整性(Integrity)、安全性(Security)、并行性 (Concurrency),以及一旦出现故障后,数据库如何实现从故障中恢复 (Recovery)。这些问题如果不能圆满解决,无论哪个公司的数据库产品都无法进入实用,最终不能被用户所接受。正是在解决这些重大的技术问题整罪凶察,使DBMS成熟并顺葛寒促利进入市场的过程中,格雷以他的聪明才智发挥了十分关键的作用。

目前,各DBMS解决上述问题的主要技术 手段和方法如下: 把对数据库的操作划分为称之事务(transaction)的原子单位, 对1个事务内的操作,实行allornot的方针,即“要么全做,要么全不做”。 用户在对数据库发出操作请求时,系统对有关的不同程度的数据元素(字段、记录或文件)“加锁”(locking);操作完成后再“解锁 ”(unlocking)。 对数据库的任何更新分两阶段提交。 建立系统运行日志(log),以便在出错时与数据库的备份(backup) 一起将数据库恢复到出错前的正常状态。

上述及其他各种方法可总称为“事务处理技术”(transactionprocessingtechnique)。格雷在事务处理技术上的创造性思维和开拓性工作,使他成为该技术领域公认的权威。他的研究成果反映在他发表的一系列论文和研究报告之中,最后结晶为 一部厚厚的专著《Transaction Processing: Conceptsand Techniques》(Morgan Kanfmann Publishers,1993,另一作者为德国斯图加特大学的A.Reuter教授)。事务 处理技术虽然诞生于数据库研究,但对于分布式系统,client/server结构中的数据管理与通信,对于容错和高可靠性系统,同样具有重要的意义。

格雷在数据库学术界十分活跃。国际上 定期或不定期举行的一些重要的数据库学术会议如VLDB,SIGMOD 上,都能见到他的身影,听到他的声音。除了在公司从事研究开发颂多束档外,他还兼职在母校伯克利、斯坦福大学布达佩斯大学从事过教学和讲学活动。1992年,VLDB杂志(TheVLDBjournal)创刊,他出任主编。

数据库技术的发展已经成为先进信息技术的重要组成部分,是现代计算机信息系统和计算机应用系统的基础和核心。数据库技术最初产生于20世纪60年代中期,根据数据模型的发展,可以划分为三个阶段:第一代的网夜局几状、层次数据库系统;第二代的关系数据库系统;第三代的以面向对象模型为主要特征的数据库系统。

代表是1969年IBM公司研制的层次模型的数据库管理系统IMS和70年代美国数据库系统语言协商CODASYL下属数据库任务组DBTG提议的网状模型。层次数据库的数据模型是有根的定向有序树,网状模型对应的是有向图。这两种数据库奠定了现代数据库发展的基础。这两种数据库具有如下共同点:1.支持三级模式(外模式、模式、内模式)。保证数据库系统具有数据与程序的物理独立性和一定的逻辑独立性;2.用存取路径来表示数据之间的联系;3.有独立的数据定义语言;4.导航式的数据操纵语言。

主要特征是支持关系数据模型(数据结构、关系操作、数据完整性)。关系模型具有以下特点:1.关系模型的概念单一,实体和实体之间的连系用关系来表示;2.以关系数学为基础;3.数据的物理存储和存取路径对用户不透明;4.关系数据库语言是非过程化的。

产生于80年代,随着科学技术的不断进步,各个行业领域对数据库技术提出了更多的需求,关系型数据库已经不能完全满足需求,于是产生了第三代数据库。主要有以下特征:1.支持数据管理、对象管理和知识管理;2.保持和继承了第二代数据库系统的技术;3.对其它系统开放,支持数据库语言标准,支持标准网络协议,有良好的可移植性、可连接性、可扩展性和互操作性等。第三代数据库支持多种数据模型(比如关系模型和面向对象的模型),并和诸多新技术相结合(比如分布处理技术、并行计算技术、人工智能技术、多媒体技术、模糊技术),广泛应用于多个领域(商业管理、GIS、计划统计等),由此也衍生出多种新的数据库技术。

分布式数据库允许用户开发的应用程序把多个物理分开的、通过网络互联的数据库当作一个完整的数据库看待。并行数据库通过cluster技术把一个大的事务分散到cluster中的多个节点去执行,提高了数据库的吞吐和容错性。多媒体数据库提供了一系列用来存储图像音频视频对象类型,更好地对多媒体数据进行存储、管理、查询。模糊数据库是存储、组织、管理和操纵模糊数据库的数据库,可以用于模糊知识处理。

随着科学技术的发展,计算机技术不断应用到各行各业,数据存储不断膨胀的需要,对未来的数据库技术将会有更高的要求。