【SQL开源代码栏目提醒】:网学会员鉴于大家对SQL开源代码十分关注,论文会员在此为大家搜集整理了“BioEngine:生物大型综合数据库搜索引擎 - 硕士论文”一文,供大家参考学习
上海大学 硕士学位论文BioEngine:生物大型综合数据库搜索引擎 别:硕士 专业:生物化学与分子生物学(生物信息学) 指导教师:王健 20090501I:海大学硕Ij学位论文 摘 要 LSBI是上海生物信息技术研究中心在国家和上海市科教委的支持下 开发的大型综合数据库,目前已包括普通核酸数据库,物种分类数据库, 引物数据库等十余个主题数据库,并能够提供BLAST,MapViewer,SEPPA 等在线服务。
面对数据库中的海量数据,如何提供快速的数据检索服务已 是LSBI在开发中面临的首要
问题。
通过结合美国NCBI的Entrez检索系统,欧洲EMBL.EBI的Eb.eye 等国际上著名生物数据库的检索系统的开发经验。
我们开发了应用于LSBI 的大型综合生物数据库搜索引擎——BioEngine。
BioEngine可以为LSBI的 所有子数据库提供检索服务,并且能够同物种分类数据库中的物种信息将 各子数据库结合起来进行通过物种名的跨库检索。
作为初步的尝试, BioEngine本质上是一个SQL生成器,通过内置的程序逻辑,在一定程度 上能够理解数据库中生物数据的意义及各数据间的相互关系,通过解析用 户输入的检索式并进行整理,生成合理的SQL语句提供给后台的ORACLE 数据库管理系统对数据进行检索。
目前LSBI及BioEngine已经在实际应用 中平稳运行(http://lifecenter.sgst.en)。
为了适应LSBI的不断发展和对现有子数据检索要求的不断完善, BioEngine的设计具有良好的可扩展性,它不需要进行核心代码的修改而是 简单的通过配置和修改XML文件就可以提供对一个数据库的检索服务。
这 样大大减轻了系统开发人员的工作负担,提高了BioEngine的灵活性。
本文首先介绍了本课题的来源、研究背景、目标以及研究意义,然后 简述了BioEngine实现原理和功能,接着介绍了专为配置XML文件开发的 GUI工具。
最后,对BioEngine的设计做了总结,并对它的发展前景做出展 望。
关键词:生物数据库;搜索引擎;数据检索;XML V卜海大学硕:Ij学位论文 ABSTRACT LSBI is a large scale biological database developed by Shanghai Center for Bioinfomation and Technology on the support of the government.By now,it has included a dozen of databases like Nucleotide Database,Taxonomy Database, Primer Database and SO forth.Furthermore,LSBI also has many online services like BLAST,MapViewer,SEPPA.While how to search records efficiently from mass data is a crucial quegion in the development of LSBI. Use the experience of Entrez developed by NCBI USA,Eb-eye developed by EMBL—EBI Europe for reference,we developed a large scale biological database search engine called BioEngine based on LSBI.BioEngine can be used in all databases of LSBI and call search in all databases through species’name combined with Taxnomy Database.As the first version,BioEngine is a system that Can generate SQL.It Can understand the meaning and relation of biological data by its inside logic.BioEngine will parse the keywords and return the logical SQL.LSBI and BioEngine have been worked steadily(http://lifec