生物信息学作业(一)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

生物信息学实验作业一

1、了解NCBI、DDBJ、EMBL上网的方法自学各网站相关介绍。答:(1)、NCBI: (National Center of Biotechnology Information,简称NCBI)美国国立生物技术信息中心。其主页为:。NCBI 是在NIH的国立医学图书馆(NLM)的一个分支。NLM是因为它在创立和维护生物信息学数据库方面的经验被选择的,而且这可以建立一个内部的关于计算分子生物学的研究计划。NCBI的任务是发展新的信息学技术来帮助对那些控制健康和疾病的基本分子和遗传过程的理解。

NCBI有一个多学科的研究小组包括计算机科学家,分子生物学家,数学家,生物化学家,实验物理学家,和结构生物学家,集中于计算分子生物学的基本的和应用的研究。他们一起用数学和计算的方法研究在分子水平上的基本的生物医学问题。这些问题包括基因的组织,序列的分析,和结构的预测。

在1992年10月,NCBI承担起对GenBank DNA序列数据库的责任。NCBI 受过分子生物学高级训练的工作人员通过来自各个实验室递交的序列和同国际核酸序列数据库(EMBL和DDBJ)交换数据建立起数据库。同美国专利和商标局的安排使得专利的序列信息也被整合。

BLAST是一个NCBI开发的序列相似搜索程序,还可作为鉴别基因和遗传特点的手段。BLAST能够在小于15秒的时间内对整个DNA数据库执行序列搜索。NCBI提供的附加的软件工具有:开放阅读框寻觅器(ORF Finder),电子PCR,和序列提交工具,Sequin和BankIt。所有的NCBI数据库和软件工具可以从WWW 或FTP来获得。NCBI还有E-mail服务器,提供用文本搜索或序列相似搜索访问数据库一种可选方法。

主要任务:(1)建立关于分子生物学,生物化学,和遗传学知识的存储和分析的自动系统(2)实行关于用于分析生物学重要分子和复合物的结

构和功能的基于计算机的信息处理的,先进方法的研究(3)加速生物技术研究者和医药治疗人员对数据库和软件的使用。(4)全世界范围内的生物技术信息收集的合作努力。

教育和训练:NCBI通过赞助会议,研讨会,和系列演讲来培养在应用于分子生物学和遗传学的计算机领域的科学交流。一个科学访问学者项目已经成立,来培养同外部科学家的合作。作为NIH内部的部分研究项目,也提供博士后工作位置。

(2)、DDBJ: (DNA Data Bank of Japan,简称DDBJ)日本DNA数据库。其主页www.ddbj.nig.ac.jp/。其于1984年建立,是世界三大DNA 数据库之一。DDBJ 开发了SQmateh工具,用来搜索基因或蛋白质中短的碱基或氨基酸序列区域,并建立了简便且易操作的SOAP(simple object aeeess protoco1)服务器。它的数据主要通过Sakura和MST工具来完成。与NCBI,EBM共同构成DNA三大数据库,这三大数据中心各自收集序列数据,并通过网络每天进行数据交换。近来三大数据库合作的项目主要包括TPA(tird pannotation)、CON(struct)或CON(tig)和XML数据交换格式的建立。TPA是一种基于已有数据库中的核酸序列产生的注释数据,它的格式与传统的GenBank一样,只是包含了“TPA”标签。CON(struct)或CON(tig)用于存储一些片段的拼接信息,这些片段是序列长度大于350 000 bp的核酸被分割而产生的,但这种长度限制在2004年6月就被取消。DDBJ主要向研究者收集DNA序列信息并赋予其数据存取号,信息来源主要是日本的研究机构,亦接受其他国家呈递的序列,数据库通过WWW环球网,匿名FTP,e-mail或Gopher方式为广大研究人员服务。

(3)、EMBL: (The European Molecular Biology Laboratory,简称EMBL)欧洲分子生物学实验室。其主页为: 。EMBL于1974年由欧洲14个国家加上亚洲的以色列共同发起建立,现在由欧洲30个成员国政府支持组成,目的在于促进欧洲国家之间的合作来发展分子生物学的基础研究和改进仪器设备、教育工作等。分7个部分:结构、分化、物理仪器、生化仪器、生物仪

器、计算机和应用数学。包括一个位于德国Heidelberg的核心实验室,及三个位于德国Hamburg,法国Grenoble及英国Hinxton的研究分部。

EMBL的研究主要集中在以下几个方面:

1. 生化实验技术质谱分析(Mass Spectrometry)等。

2.细胞生物学(Cell Biology),研究细胞膜上蛋白和脂肪的分布,包括膜运输、微管网络、细胞核及细胞周期,焦点是Rab蛋白。

3.细胞生物物理(Cell Biophysics),重点是理论创新和实际应用的研究,尤其是光学显微镜的完善使用。

4.分化(Differentiation),集中研究果蝇的早期发育。

5.基因表达(Gene Expression),研究基因到蛋白质信息传递的过程,尤其是核糖体合成在整个细胞生命过程中的重要作用。

6.结构生物学(Structure Biology),在过去9年中建立了cDNA测序技术、生物计算、蛋白工程、晶体学、电子显微镜(EM)及核磁共振(VMR),研究肌肉巨型蛋白分子Titin。

7.Grenoble研究分部,主要研究蛋白质合成过程,尤其揭示了G-蛋白-鸟苷酸交换因子偶联物的结构。

8.Hamburg研究分部,有关长期的分子生物学国际合作研究历史,着重于结构生物学研究,如光学测量系统、晶体学、X-线吸收光谱及小角散射。9.Hinxton研究分部EBI(European Bioinformatics Institute,欧洲生物信息学研究所),重点是与世界上其他分子生物学数据库进行合作研究,最主要的有EMBL核酸序列数据库,于1980年开始建立,随后参予了与日内瓦大学共同进行的SWISS-PROT的建设。在SWISS-PROT与EMBL核苷酸序列库之间的数据转移的基础上,产生了新的数据库TREMBL(Translation from EMBL),即使核苷酸序列库的核苷酸序列自动翻译成SWISS-PROT蛋白序列库中的蛋白序列。

相关文档
最新文档