基于!"##的数据挖掘
系统的
设计与实现
叶松云许龙飞(暨南大学信息科技
计算机系,广州AF"%#!)
’DJ),1:*R1IST-7$3B7$C摘要提出一个基于&;!’’应用架构的多层数据挖掘原型系统的
方案,4+5进行系统建模,以采用&;)8)93:6*);*技
术处理客户端应用
程序的开发。给出了数据挖掘中关联规则的<=;,0;,算法以及?@$A决策树算法的实现策略。关键词
&;!’’4+5
数据挖掘
关联规则
分类模式
决策树中图分类号GH#FF
文章编号F""!DU##FD(!""#)"%D"!"FD"A
文献标识码<
$%&;’()*)+,-./%-%)0*0’1)12$*0*3’)’)(45&;0%-6*&;%+1)!"##
7%41)(58)98:1)(2%’((3=*$0I?0J=7*3;6C,3-C3,&;,V-)-4-,83;2,*K,W7)-.XY07AF"%#!)
;<&;0=*>0:>-*Y,2*Y32,2,J71*,D1)K3;B)*)J,-,-.=;0*0*K=32K2*3J:)23B0-*Y3=0=71);&;!’’I;)J3O0;Z,2,-*;0E)B7C3B$GY3=;0*0*K=3,28,27)11KJ0B313B72,-.4+50:T3C*D0;,3-*3B*3CY-010.K0I/)*,0-)1?0J=)-K$GY3C1,3-*)==1,C)E*,0-0IB)*)J,-,-.,2B38310=3BC0-83-,3-*1K72,-.&;)8)93:6*);**3CY-010.K$>-*Y32K2*3J,<=;,0;,)1.0;,*YJ0I)220EC,)*,0-;7132J,-,-.)-B?@$A=322,J,2J32*,J)*3)1.0;,*YJ0IB3C,2,0-*;33C1)22,I,C)*,0-);3;3)1,X3B$?%5@1=+&;:&;!’’,4+5,B)*)J,-,-.,)220C,)*,0-;7132,C1)22,I,C)*,0-,B3C,2,0-*;33
论文介绍了一个基于&;!’’框架的多层数据挖掘(()*)原型系统。利用/)*,0-)1公司的/023工具进行系统的+,-,-.)并使用67-公司的&;)8)93:6*);*4+5面向对象可视化建模,进行客户端应用程序的开发,高了系统的可靠性、重用性提可和可维护性。在数据挖掘原型系统中,实现了关联分析的分<=;,0;,算法、类的>(#决策树算法、?@$A的悲观估计决策树算法和?@$A决策树的消除误差修剪算法(;3B7C3BD3;;0;=;7-E。,-.)为开发其它数据挖掘应用系统提供了一个有价值的实例。
图F
流量也增加了。而且应用的可维护性也是一个
问题。
&;!’’架构
F
&;!’’体系结构与&;)8)93:6*);技术
是&;!’’(&;)8)G+!H1)*I0;J’-*3;=;,23’B,*,0-)由67-公为了解决二层结构缺陷而提出的-层体系结构,把应用系统划分成如下层次:用户接口层,示逻辑层,务逻辑层,即表业基础框架服务层,数据层。基于这种结构的应用程序采用了模型D视图D控制器简模(+0B31DN,3OD?0-*;0113;,称+N?)式。采用这种模式的目的是要把数据(模型)与如何表示信息的部分(视图)分离出来。它们两者之间是由应用业务逻辑(控制器)来控制信息的流向。通过这种模式,能设计出基于三种相互交互的功能组件(就模型、视图、控制器)的应用程序。-层体系结构极大地增强了应用程序设计的灵活性。而67-公司提出的&;!’’平台标准则为解决上述的挑战,它充分利用实现-层体系结构提供了一个简单而统一的标准。了&;)8)的平台独立性、重用性、块化等特点,现基于组可模实件的多层分布式应用。
司(作67-+,C;02K2*3J2,)FLLL年%月推出,为使用&;)8)>-C$在构建企业系统的标准平台和环境。&;!’’企业
网络应用程序架构改进了传统?1,3-*M63;83;结构的缺点,除了降低客户端程序逻辑的复杂性以外,减轻了后台数据库存取的负载,衡了更平整个网络的流量,并可以使用不同生产商的底层企业系统框架实现。&;!’’架构如下图F所示。