企业版(Java 2 Platform , Enterprise Edition)。J2EE的核心是一组技术规范与指南,其中所包含的各类组件、服务架构及技术层次,均有共同的标准及规格,让各种依循J2EE架构的不同平台之间存在良好的兼容性,一方面解决了过去企业后端使用的信息产品彼此之间无法兼容的问题,另一方面使得企业摆脱了内部和外部难以互通的窘境。
J2EE组件和"标准的"Java类的不同点在于:它被装配在一个J2EE应用中,具有固定的格式并遵守J2EE规范,由J2EE服务器对其进行管理。J2EE规范是这样定义J2EE组件的:客户端应用程序和Applet是运行在客户端的组件;Java Servlet和Java Server Pages (JSP) 是运行在服务器端的Web组件;Enterprise Java Bean (EJB )是运行在服务器端的业务组件。
J2EE体系结构提供中间层集成框架用来满足无需太多费用而又需要高可用性、高可靠性以及可扩展性的应用的需求。通过提供统一的开发平台,J2EE降低了开发多层应用的费用和复杂性,同时提供对现有应用程序集成的强有力支持,极大地提高了系统的运行效率和安全性。
J2EE使用多层的分布式应用模型,应用逻辑按功能划分为组件,各个应用组件根据他们所在的层分布在不同的机器上。事实上,SUN设计J2EE的初衷正是为了解决两层模式(Client/Server)的弊端。传统的客户端往往承担了太多的功能,导致客户端比较臃肿,升级很不方便。而J2EE中使用的多层软件模型将原来简单的模型切成几层解耦的独立功能层,每一层完成特定的任务,方便升级系统并更改应用的逻辑[5]。典型的J2EE应用体系结构如图2-1所示:
图2-1 J2EE体系结构图
总体来说,使用J2EE技术开发Web事务系统有以下优点:第一,开发高效,J2EE有完善的开源社区支持,像Spring,Struts这些框架可以大大缩短开发周期;第二,支持不同的操作系统环境,因为Java天生具有"一次编译,随处运行"的特点,基于J2EE开发的应用程序不依赖特定的操作系统、硬件等,也就具有了开发一次就可以在各个平台部署的特点;第三,稳定的高可用性,得益于从Java继承而来的跨平台特性,J2EE系统部署到可靠的操作环境中,一些对系统鲁棒性要求很高的大型商务系统可以选择比Windows更为健壮的Linux操作系统,这是更为理想的选择。
2.3 SQL Server 2005简介
Microsoft SQL Server 2005是一个全面的数据库平台,使用集成的商业智能工具提供了企业级的数据管理方式。Microsoft SQL Server 2005数据库引擎为关系型数据和结构化数据提供了更安全可靠的存储功能,使得用户可以构建和管理用于业务的高可用和高性能的数据应用程序。
SQL Server是由Microsoft开发和推广的关系数据库管理系统(DBMS),它最初是由Microsoft、Sybase、Ashton-Tate三家公司共同开发的,并于1988年推出了第一个在OS/2版本上运行的SQL Server系统。1992年Sybase和Microsoft这两家公司将SQL Server移植到了Windows NT操作系统上,后来Microsoft致力于Windows NT平台的SQL Server的开发,而Sybase则专注于SQL Server在UNIX上的应用[6]。
近年来在Microsoft SQL Server的发展历程中不断更新版本:1996年发布的SQL Server6.5版本,该版本具备了市场所需的速度快、功能强、易使用和价格低等有点;1998年推出了SQL Server7.0版本,该版本再一次对核心数据库引擎进行了重大改写,在操作上更加简单、易用,因此获得了良好的声誉;2000年,发布了SQL Server 2000版本,该版本在可扩缩性和可靠性上有了很大的改进,成为企业级数据库市场中重要的一员;2005年,发布了SQL Server 2005版本,该版本扩展了SQL Server 2000的性能,如在可靠性、可用性、可编程性和易用性等方面做出了重大改进。SQL Server 2005引入了.NET Framework,允许构建.NET SQL Server专有对象,从而使SQL Server数据库具有灵活的功能。
SQL Server 2005的常见版本包括如下四种:
1)个人版(Personal Edition):用于单机系统或客户机;
2) 标准版(Standard Edition):用于小型的工作组或部门;
3)企业版(Enterprise Edition):支持所有的SQL Server 2005特性,可作为大型Web站点、企业OLTP(联机事务处理)以及数据仓库系统等的产品数据库服务器;
4)开发者版(Developer Edition):用于程序员开发应用程序,这些程序需要SQL Server 2005作为数据库存储设备[7]。
2.4 ExtJS简介
ExtJS是一个JavaScript库,功能强大,界面美观,可以使用AJAX, DHTML,DOM等技术来开发网络应用程序。ExtJS可以用来开发富互联网应用(RIA:Rich Internet Applications),主要用于创建前端用户界面,是一个与后台技术无关的前端AJAX框架。因此,可以把ExtJS用在.NET、Java以及PHP等多种开发语言中。
ExtJS最开始基于YUI技术,由开发人员Jack Slocum开发,通过参考Java SWING等机制来组织可视化组件,从UI界面上CSS样式的应用,到数据解析过程中的异常处理,都可算是一款不可多得的JavaScript客户端技术的精品。
ExtJS的组件结构如图2-3所示:
图2-3 ExtJS组件结构图
ExtJS初期仅是对Yahoo! UI的对话框扩展,后来逐渐有了自己的特色,深受技术研发人员的喜爱。发展至今,ExtJS除YUI外还支持包括jQuery、Prototype等多种JS底层库,可以让开发人员自由进行选择[8]。该框架完全基于纯HTML/CSS+JS技术,提供丰富的跨浏览器UI组件,灵活采用JSON/XML数据源开发,使得服务端表示层的负荷真正得以减轻。
2.5开源工具简介
2.4.1 HTTPClient
HTTPClient是Apache Jakarta Common下的子项目,可以用来提供高效的、最新的、功能丰富的支持HTTP协议的客户端编程工具包。
HTTP协议可能是现在Internet上使用得最多、最重要的协议了,越来越多的Java应用程序需要直接通过HTTP协议来访问网络资源。虽然在 JDK的java.net包中已经提供了访问HTTP协议的基本功能,但是对于大部分应用程序来说,JDK库本身提供的功能还不够丰富和灵活。HTTPClient已经应用在很多大型的项目中,比如Apache Jakarta上很著名的另外两个开源项目Cactus和HTMLUnit都使用了HTTPClient。
HTTPClient所提供的主要功能包括:
1) 实现了所有HTTP的方法(GET,POST,PUT,HEAD 等);
2) 支持自动转向;
3) 支持 HTTPS 协议;
4) 支持代理服务器。
2.4.2 HTMLParser
HTMLParser是一个利用纯Java语言编写的进行HTML解析的库,它不依赖于其它的Java库文件,主要用于改造或提取HTML,其特点是能够超高速解析HTML文件,而且不会出错。作为目前最为方便易用的进行HTML解析和信息提取的工具,HTMLParser已经成为了抓取网页数据和改造HTML的内容的首选工具。
HTMLParser主要包含以下两个方面的功能:
1)信息提取功能:
① 文本信息抽取,例如对HTML进行有效信息搜索;
② 链接提取,用于自动给页面的链接文本加上链接的标签;
③ 资源提取,例如对一些图片、声音的资源的处理;
④ 链接检查,用于检查HTML中的链接是否有效;
⑤ 页面内容的监控。
2)信息转换功能:
① 链接重写,用于修改页面中的所有超链接;
② 网页内容拷贝,用于将网页内容保存到本地;
③ 内容检验,可以用来过滤网页上一些令人不愉快的字词;
④ HTML信息清洗,把本来乱七八糟的HTML信息格式化;
⑤ 转成XML格式数据。
2.5本章小结
本章简要介绍了进行本次新闻爬虫系统开发所需要的相关理论和技术,主要包括网络爬虫的定义,爬取策略等理论知识,J2E
上一篇:
数据库大作业_-教务管理系统—华中科技大学
下一篇:
上海电气集团毕业实习报告