【计算机论文全套栏目提醒】:网学会员计算机论文全套为您提供人类新基因的计算机识别、实验验证与功能基因组研究 - 会议论文参考,解决您在人类新基因的计算机识别、实验验证与功能基因组研究 - 会议论文学习中工作中的难题,参考学习。
生命科学研究Life Science Resea rch ·117· 人类新基因的计算机识别、实验验证与 功能基因组研究 · 张德礼1,季梁1,马大龙2,李衍达1 (1.清华大学生物信息学研究所生物信息学教育部重点实验室, 清华大学信息科学技术学院智能技术与系统国家重点实验室,北京100084; 2.北京大学人类疾病基因研究中心,北京100083)〔摘 要〕本研究旨在采用计算机识别法发现具有自主知识产权和重要功能的人类新基因并经实验初步证实。
采用的具体技术路线如下:1)在公共数据库选择感兴趣的EST或cDNA 2)全自动化运行SiClone软件进行EST装配;3)在nr数据库通过比对筛选全新的cDNA contig;4)所筛新cDNA contig的人工拼结和校对;5)ORF及其侧翼区的分析;6)编码蛋白结构与功能,特别是结构域和Motif的电子预测;7)引物设计,RT-PCR实验和cDNA测序;8)进一步实验确认与功能研究。
以PubMed公布基因芯片差显表达cDNA和GenBankEST数据库下栽脾脏、淋巴结和胸腺表达cDNA以及在神威一IV超级计算机上拼接的6万余条Contig cDNA这3类cDNA为基础,均识别到人类新基因。
计算机识别到的800余个编码小分子肽类人类新基因,具有典型基因特点和一定功能结构域,其中23个基因被GenBank接受并被国际人类基因组组织(HUGO)基因命名委员会批准使用了标准化的基因命名符号。
首批选择16个人类新基因用RT—PCR实验和cDNA测序验证,结果均获得预期序列,其中半数基因是具有特定重要功能结构域的基因。
特别是3个人类新基因(RABL3,ZNF362和C170H32)的成功克隆及其小鼠和大鼠同源基因的克隆对促进新基因识别软件的开发可能具有重要的理论意义。
所荻新的人类细胞增殖与分化相关癌基因及转录因子基因RABL3,ZNF362~362,SPRYDl,C170H32和Clorf31等的体内、外功能鉴定在实施中,意外发现,C30d6基因定位于3号染色体NT_005994.II的914449~916853位核苷酸,识别物mRNA长2405 bp,经Northern Blotting证实全长3000 bp多。
该基因0RF位于1742~2326bp,上游同一相位第6密码子为终止码TGA,并且前面还有多个终止码,下游有加尾信号AATAAA和PolyA尾。
该基因ORF起始码上游1714 bp基因组DNA序列,在517~567,561~611和1229~1279区段有可能性分别为80%,97%和88%的3个启动子序列。
在包含17或22氨基酸信号肽的194氨基酸残基核蛋白区段上有上皮细胞生长因子样结构域标签(EGF-like domainsignature),与浸润性B淋巴瘤基因(BAL:B aggressive lymphoma gene)紧密连锁。
将C30ff6基因该区段(194氨基酸肽段)真核重组质粒注射入7~8周龄雄性Balb/e小鼠(体重约25克)后腿横纹肌后14 d,发现病理组织学观察具有明显的脾脏与淋巴结淋巴细胞反应性增生,主要是大量T淋巴细胞,B淋巴细胞与巨噬细胞增生;在胸腺皮质,胸腺细胞增多;在肺支气管粘膜下,淋巴细胞和白细胞增多;在小肠粘膜下,襻氏小体分泌旺盛,分泌颗粒增多。
29只7~8周龄雄性Balb/e小鼠(体重约25 g),只有3只注射含该区段C30rf6基因的真核重组质粒,20只注射可能使脾脏与淋巴结免疫细胞产生增生反应的其它基因真核重组质粒,6只阴性对照组Balb/c 4、鼠注射空载体质粒或生理盐水。
结果发现,注射C30r{6基因真核重组质粒的3只小鼠全部出现强烈一致的脾脏与