向,这些在DBMS基础上运行的软件有:数据通讯软件、表格软件、数据字典、报表书写、图形系统等。2)数据库设计在数据库管理系统的支持下,按照某企业某组织的需求,设计一个结构良好的,使用方便,效率较高的数据库及其应用系统,是数据库设计的主要任务。在这个领域内,主要研究课题是设计方
法学;数据模型和数据建模方法的研究;数据库设计计算机辅助方法的研究;数据库设计规范和标准的研究,以及数据库设计工具的开发等。3)数据库理论数据库理论研究主要集中与关系的规范化理论、关系型数据库理论、数据库与人工智能结合、数据库与逻辑、逻辑演绎和知识推理等方面,此外,演绎数据库、面向对象数据库、知识库系统的研究都是研究方向。
1.2.2数据库系统介绍一般来说数据库系统由计算机软、硬件资源组成。它实现了有组织地、动态地存储大量关联的数据,方便多用户访问,它与文件系统的重要区别是数据的充分共享、交叉访问及应用的高度独立性。通俗地讲,数据库系统可以把日常一些表格、卡片等数据有组织地集合在一起,输入到计算机,然后通过计算机处理,再按一定要求输出结果。所以,对于数据库来说,主要解决了三个数问题。第一,有效地组织数据这里主要是指对数据进行合理设计,以便计算机存取;第二,
将数据方便地输入到计算机中;第三,根据用户的要求将数据从计算机抽取出来。数据库技术发展到今天,可说是较为成熟,但究竟什么是数据库还未有一个被普遍接受的定义。这里,从不同角度给出的定义或描述,列举几例:1)2)数据库是团体用户的团体数据。数据库是组织、存储、管理数据的仓库。
数据库可以被定义为一个基于某种数据模型存储起来的、为某个特定组织的多种应用服务、并具有尽可能小的冗余度的相关的数据集合。其数据结构独立于使用数据的程序,对数据的增添、修改和检索,由系统进行统一的控制,系统提供的数据模型也有利于将来应用的扩展。我们将以上几种定义概括起来,不难发现一个数据库就是一个可共享的数据集合,用于满足不同的信息需求,并且集合中的数据彼此之间有相互联系。数据库具有以下一些特征。(1)数据共享性;(2)数据一体化和结构化;(3)较少的数据冗余度;(4)数据的独立性;(5)对数据实行集中统一的控制。
部门1
应用程
部门2
应用程
……
应用程
部门n
数据
图1.2.1数据库系统中应用与数据的关系
1.2.3关系型数据库数据模型是按计算机系统的观点对数据建模,用于机器世界。它需要有严格的形式化定义,并且常常会附加上一组限制或规定。一个数据模型是表达(或描述)一个组织内有关实体、事件、活动以及它们之间联系的数据信息。数据库技术中一般有三种传统的数据模型。它们是层次模型、网状模型和关系模型。其中,关系模型是最重要的模型。与层次模型和网状模型相比,关系模型具有多方面的优势。关系型数据库是由美国IBM公司的E.F.Codd提出的,奠定了关系型数据库的理论基础。该数据库是当今世界上最
常用的数据库类型,本论文主要介绍关系型数据库。关系模型就是用表格数据来表示实体和实体间的联系。这种表格就是二维平面表。在层次模型和网状模型中,数据结构中的各节点只保存实体本身的信息,实体间的联系是通过指针来实现的。而在关
系模型中,只有表格没有指针,表格中既存放实体本身的信息,也存放实体间的联系。对应于一个关系模型的所有关系的集合称为关系数据库。关于关系数据库现在总结如下:关系的列称为属性,不同的列有不同的名字,但不同的列出自同一个值域中。同列中的各分量具有相同的数据类型,并在同一值域中。列的次序是任意的,可随意交换。关系的行称为元组,任意两行不能完全相同。元组的每一分量都是不可再分的数据项。行的次序是任意的,可以随意交换。关系有一个主键来唯一标识各个元组。
1.2.4数据库管理系统数据库管理系统DBMS是数据库的核心软件,是数据处理技术各种先进思想的汇集。它的主要功能有:1).数据的存储、获取和修改一个数据库可被许多用户共享。因此,DBMS必须提供多个用户视图,允许用户方便有效地存储、获取和修改他们的数据。2).数据字典数据字典是与一个组织相关数据的所有信息的储藏所。数据字典通常包含数据库完整性定义,安全保密定义,存取路径的定义等。DBMS必须维护一个用户可访问的数据字典,这一服务可由DBMS自身的一个子集提供,或由一个独立的软件包提供。
3).安全机制数据库中的数据必须受到保护,免遭由于意外或误用而引起的破坏。DBMS的安全机制用于控制数据的访问(如用户口令、身份标识、用户级别、存取权限等),并且定义允许用户执行什么样的操作(例如只读或可读可写)。4).数据完整性数据完整性就是数据的正确性、真实性、客观性。且数据失真,其完整性就受到了破坏。DBMS必须提供工具协助用户维护他们的数据的完整性。在DBMS及其软件接口中可设计多种编辑检查和完整性约束。5).并发控制由于一个数据库是由多个用户共享的,两个或更多的用户可能同时试图访问相同数据。如果两个用户并发地试图修改同一数据记录,就有可能产生错误结果,因为两个事务处理会相互干扰。DBMS中必须有防护措施来避免或克服这种干扰。DBMS实现并发控制的基本方法是将被操作的数据进行封锁,封锁单位的大小将会影响到并行度的高低。封锁的单位越大,开销越小,但并行度就越低;反之封锁的单位越小,开销越大,但并行度却越高。因此,在决定封锁单位的大小时,应考虑到开销和并发度这两方面的因素。