数据,这些数据在传统的操作型数据库中很难或不能得到,更确切地说,数据仓库是一种体系结构。数据仓库较之客户关系管理是一个被人熟知的概念,它是1991年美国著名信息工程学家W.H.Inmon博士提出的,将其定义为"数据仓库是支持决策过程的面向主题的、集成的、随时间而改变的、持久的数据集合"。
数据仓库的技术体系结构
·数据获取模块:用于从源文件和源数据库中获取数据,并进行清洁,传输,将它加到数据仓库数据库中。
·数据管理模块:用于管理数据仓库的运行。
·数据传递模块:用于向其他仓库和外部系统中分配数据仓库数据。
·中间件模块:用于向最终用户工具提供访问数据仓库数据库的方法。
·数据访问模块:用于为企业的最终用户提供访问和分析数据仓库数据的工具。
·设计模块:用于设计数据仓库数据库。
·信息目录模块:用于为管理者和用户提供有关存储在数据仓库数据库中的数据的内容和含义信息。
如何建立数据仓库
目前,企业内部的计算机系统相互独立,有的系统的数据规则性(合法性)需要从其它系统中得到认定,各类数据缺乏集成性,作为趋势,数据仓库技术是使这些数据集成起来的最有力的方式之一,数据仓库的建立能在逻辑上实现各类系统互动操作,这就为建设现代化学院奠定基础,也为学院领导层科学决策提供强有力的保证。建立数据仓库的过程中需要以下步骤:
1.对最终业务需求建立数据模型。数据模型的设计不仅仅考虑对最初主题,还要兼顾学院其他管理决策主题的需求和各种数据、报表查询主题的需求。
2.确定主题进行数据建模。根据决策需求确定主题,选择数据源,进行逻辑结构设计。
3.设计数据仓库之数据库。着重于应用于主题开发数据仓库中数据的物理存储结构。
4.定义数据源。根据主题数据模型,选择不同的操作型数据库为数据源。
5.为元数据建立模型。模型确定了进入数据仓库的数据范围,以及与数据有关的规定。完备的元数据,能让用户知道,数据仓库中究竟有什么数据,数据汇总层次和详细程度如何,能提供什么信息,这些信息是如何运算和组织等。
6.从操作型数据库中抽取(Extract)、转换(Transmit)、加载(Load)数据到数据仓库之数据库中。
7.选择数据访问分析工具,用户将使用这些工具访问数据仓库中的存储信息,实现决策支持需求[11]。
数据挖掘技术
随着数据库技术的不断发展及数据库管理系统在各个行业的广泛应用,积累在数据库中的数据量急剧增大,但其中可直接使用的信息量却相对较少。人们一直希望能够对隐藏在这些数据表面的信息,进行多层次分析,以便更好地利用这些数据获得利于商业运作,提高社会竞争力的信息。目前的各种数据库管理系统虽可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规律,这样便造成了一种数据爆炸与知识贫乏并存的现象。据调查,数据收集与存储以每年130%的速度增长,但数据中只有2%的数据被有效地分析。这为数据挖掘的利用提供了广阔的空间。到2004年,应用于电子商务的数据挖掘工具的市场达到10亿美元。
??
??
??
??
大学毕业设计(论文)
I
――
上一篇:
ASP网上答疑系统(论文和程序)
下一篇:
中学班主任工作艺术 班主任班级管理论文