本开发的生物数据库。
它的主要任务就是搜集原始的DNA序列数据,然后将它们注释后发布。
这 些数据的提交者大多来自日本的研究人员【引。
作为国际核酸序列数据库 (Imemational Nucleotide Sequence Database,简称:INSD)的成员他们的 数据也与NCBI的GenBank和EBI的EMBL Bank共享。
在DDBJ中安装了 高速关键词检索工具ARSA,它的检索范围包括DDBJ,UniProt等在内的上海人学硕Jj学位论文 23个数据库【91。
各发达国家在生物信息化建设方面已经走在了前面,目前,它们的相关技术比如生物数据库的搜索引擎技术也已经非常完善。
它们的发展模式给我国生物方面的信息化建设提供了很好的经验。
同时,发达国家的成绩也鞭策着我国作为一个大国在生物信息领域必须付出艰苦的努力以与他们保持在同一个水平线上,为我国的生物以及医学研究打下良好的,坚实的基础。
1.3.2国内研究概况 我国在生物信息资源的管理和利用方面还很落后。
北京大学、北京微生物研究所、遗传所和中科院上海生命科学研究院相继建立了EMBL和DDBJ等国际核酸序列数据库的镜像,开发了我国的核酸序列数据库、生物芯片数据库、蛋白质二维凝胶电泳图谱数据库和水稻基因组数据库,一些基因组研究中心也建立了一些自有数据库。
但是我国的生物信息科学数据绝大部分必须存放到NBCI,EBI和DDBJ三个数据库里,才能得到科学界的承认。
美国、欧洲和日本对中国等第三世界国家已经形成了实际上的数据资源的垄断。
这种垄断在一定程度上已经影响到了国内生物信息科学、医学科研及相关产业的发展。
建设国内的大型生物数据库,对建设这种大型生物数据库中的关键技术难题展开研究,成为刻不容缓的重要任务。
上海生物技术研究中心所属的上海生命科学数据中心在国家和上海市科教委的支持下目前正开发一个大型数据库综合网站LSBI(http://lifecemer.sgst.cn)。
基本职能包括生命科学数据的提交、发布和整合,生命科学数据库的开发、维护和更新,生命科学数据分析工具的开发、整合和在线服务。
围绕这三大基本职能,目前生命科学数据中心提供两大类服务:数据/数据库和数据分析软件在线服务。
数据中心开发与数据服务相关的系统包括以核酸为代表的在线/离线提交系统,与国际知名数据库格式兼容的数据提取转换加载系统,BioEngine生命科学数据查询系统,数据查询结果实时下载和FTP下载服务,用户注册和管理系统。
依托这些服务系统,数据中心能够提供普通核酸数据的在线/离线递交,EST数据的离线提交,Trace数据的离线提交,序列数据的查询和下载服务, 4卜海大学顾.I:学位论文物种库加载、查询、分析和统计服务,HotData数据(生物医学文献相关的热点数据)采集、加工、查询和下载服务,以及以血吸虫为代表的生命科学主题数据库与特色数据库开放服务。
数据中心以中心内部课题组的研究开发的生物信息数据分析算法原型和国内外研究单位开发的成熟算法/T具为基础,通过二次开发、包装整合等技术手段,提供了一些在线分析/计算服务。
BLAST服务,能够进行包括人类基因组在内的9个物种的核酸、蛋白质比对服务,以及包括NCBI提供的非冗余核酸库、非冗余蛋白库在内的28个普通生物序列数据库的核酸、蛋白质比对服务。
EST及Contig序列拼接及分析、微生物基因组注释、分子进化及系统发育分析、肽指纹图谱分析、蛋白质组学信息分析、生物芯片数据分析、蛋白质相互作用分析、多蛋白信息分析系统等生命科学数据在线分析平台。
为了保证这两大服务功能的正常服务能力,数据中心还制定了生命科学数据在线递交策略,包括已支持的数据类型的大批量数据递交策略,未支持的数据类型的大批量数据递交流程和应对方案,数据分析软件在线服务的开发流程和服务策略。
此外,还提供了网络服务响应系统、包括用户分级分类管理、访问管理与服务管理在内的后台管理系统等。
通过这些措施,有力的保障了数据中心的对外/对内