生物信息学网址(全)电子教案

生物信息学网址(全)电子教案
生物信息学网址(全)电子教案

生物信息学网站网址

(全)

生物信息学网站

分子生物学数据库综合目录

1. SRS序列查询系统(分子生物学数据库网络浏览器) http://www.embl-heidelberg.ed/srs5/

2. 分子生物学数据库及服务器概览

https://www.360docs.net/doc/604745278.html,/people/pkarp/mimbd/rsmith.html

3. BioMedNet图书馆 https://www.360docs.net/doc/604745278.html,

4. DBGET数据库链接 http://www.genome.ad.jp/dbget/dbget.links.html

5. 哈佛基因组研究数据库与精选服务器 https://www.360docs.net/doc/604745278.html,

6. 约翰. 霍普金斯大学(Johns Hopkins University) OWL网络服器

https://www.360docs.net/doc/604745278.html,/Dan/proteins/owl.html

7. 生物网络服务器索引,USCS

https://www.360docs.net/doc/604745278.html,/network/science/biology/index.html

8. 分子生物学数据库列表(LiMB) gopher://https://www.360docs.net/doc/604745278.html,/11/molbio/other

9. 病毒学的WWW服务器,UW-Madison

https://www.360docs.net/doc/604745278.html,/Welcome.html

10. UK MRC 人类基组图谱计划研究中心 https://www.360docs.net/doc/604745278.html,/

11. 生物学家和生物化学家的WWW资源

http://www.yk.rim.pr.jp/~aisoai/index.html

12. 其他生物网络服务器的链接 https://www.360docs.net/doc/604745278.html,/biolinks.html

13. 分子模型服务器与数据库

https://www.360docs.net/doc/604745278.html,/lap/rsccom/dab/ind006links.html

14. EMBO实际结构数据库 http://xray.bmc.uu.se/embo/structdb/links.html

15. 蛋白质科学家的网络资源

https://www.360docs.net/doc/604745278.html,/protein/ProSciDocs/WWWResources.html

16. ExPASy分子生物学服务器 http://expasy.hcuge.ch/cgi-bin/listdoc

17. 抗体研究网页 https://www.360docs.net/doc/604745278.html,

18. 生物信息网址 http://biochem.kaist.ac.kr/bioinformatics.html

19. 乔治.梅森大学(George Mason University)的生物信息学与计算分子生物学专业 https://www.360docs.net/doc/604745278.html,/~michaels/Bioinformatics/

20. INFOBIOGEN数据库目录 https://www.360docs.net/doc/604745278.html,biogen.fr/services/dbcat/

21. 国家生物技术信息研究室 https://www.360docs.net/doc/604745278.html,/data/data.html

22. 人类基因组计划情报 https://www.360docs.net/doc/604745278.html,/TechResources/Human_Genome

23. 生物学软件及数据库档案 https://www.360docs.net/doc/604745278.html,/Dan/software/biol-links.html

24. 蛋白质组研究:功能基因组学的新前沿(著作目录)

http://expasy.hcuge.ch/ch2d/LivreTOC.html

序列与结构数据库

一.主要的公共序列数据库

1. EMBL WWW服务器 http://www.EMBL-heidelberg.ed/Services/index.html

2. Genbank 数据库查询形式(得到Genbank的一个记录)

https://www.360docs.net/doc/604745278.html,/genbank/query_form.html

3. 蛋白质结构数据库WWW服务器(得到一PDB结构) https://www.360docs.net/doc/604745278.html,

4. 欧洲生物信息学研究中心(EBI) https://www.360docs.net/doc/604745278.html,/

5. EBI产业支持 https://www.360docs.net/doc/604745278.html,/

6. SWISS-PROT(蛋白质序列库) http://www.expasy.ch/sprot/sprot-top.html

7. 大分子结构数据库 https://www.360docs.net/doc/604745278.html,/cgi-

bin/membersl/shwtoc.pl?J:mms

8. Molecules R Us(搜索及观察一蛋白质分子)

https://www.360docs.net/doc/604745278.html,/modeling/net_services.html

9. PIR国际蛋白质序列数据库 https://www.360docs.net/doc/604745278.html,/Dan/proteins/pir.html

10. SCOP(蛋白质的结构分类),MRC http://scop.mrc-

https://www.360docs.net/doc/604745278.html,/scop/data/scop.l.html

11. 洛斯阿拉莫斯的HIV分子免疫数据库 http://hiv-

https://www.360docs.net/doc/604745278.html,/immuno/index.html

12. TIGR数据库 https://www.360docs.net/doc/604745278.html,/tdb/tdb.html

13. NCBI WWW Entrez浏览器 https://www.360docs.net/doc/604745278.html,/Entrez/index.html

14. 剑桥结构数据库(小分子有机的及有机金属的结晶结构)

https://www.360docs.net/doc/604745278.html,

15. 基因本体论坛 https://www.360docs.net/doc/604745278.html,/GO/

二. 专业数据库

1. ANU生物信息学超媒体服务(病毒数据库、分类及病毒的命名法)

https://www.360docs.net/doc/604745278.html,.au/

2. O-GLYCBASE(O联糖基化蛋白质的修订数据库)

http://www.cbs.dtu.dk/OGLYCBASE/cbsoglycbase.html

3. 基因组序列数据序(GSDB)(已注释的DNA序列的关系数据序)

https://www.360docs.net/doc/604745278.html,

4. EBI蛋白质拓扑图 https://www.360docs.net/doc/604745278.html,/tops/Serverintermed.html

5. 酶及新陈代谢途径数据库(EMP) https://www.360docs.net/doc/604745278.html,/

6. 大肠杆菌数据库收集(ECDC)(大肠杆菌K12的DNA序列汇编)

http://susi.bio.uni-giessen.de/ecdc.html

7. EcoCyc(大肠杆菌基因及其新陈代谢的百科全书)

https://www.360docs.net/doc/604745278.html,/ecocyc/ecocyc.html

8. Eddy实验室的snoRNA数据库 https://www.360docs.net/doc/604745278.html,/snoRNAdb/

9. GenproEc(大肠杆菌基因及蛋白质) https://www.360docs.net/doc/604745278.html,/html/ecoli.html

10. NRSub(枯草芽胞杆菌的非冗余数据库) http://pbil.univ-

lyonl.fr/nrsub/nrsub.html

11. YPD(酿酒酵母蛋白质) https://www.360docs.net/doc/604745278.html,/YPDhome.html

12. 酵母基因组数据库 https://www.360docs.net/doc/604745278.html,/Saccharomyces/

13. LISTA、LISTA-HOP及LISTA-HON(酵母同源数据库汇编)

https://www.360docs.net/doc/604745278.html,/

14. MPDB(分子探针数据库)

http://www.biotech.est.unige.it/interlab/mpdb.html

15. tRNA序列及tRNA基因序列汇编 http://www.uni-

bayreuth.de/departments/biochemie/trna/index/html

16. 贝勒医学院(Baylor College of Medicine)的小RNA数据库

https://www.360docs.net/doc/604745278.html,/dbs/SRPDB/SRPDB.html

17. SRPDB(信号识别粒子数据库)

https://www.360docs.net/doc/604745278.html,/dbs/SRPDB/SRPDB.html

18. RDP(核糖体数据库计划) https://www.360docs.net/doc/604745278.html,/

19. 小核糖体亚蛋白RNA结构 http://rrna.uia.ac.be/ssu/index.html

20. 大核糖体亚蛋白RNA结构 http://rrna.uia.ac.be/lsu/index.html

21. RNA修饰数据库 https://www.360docs.net/doc/604745278.html,/RNAmods/

22. 16SMDB及23SMDB(16S和23S核糖体RNA突变数据库)

https://www.360docs.net/doc/604745278.html,/Departments/Biology/Databases/RNA.html

23. SWISS-2DPAGE(二维凝胶电泳数据库) http://expasy.hcuge.ch/ch2d/ch2d-top.html

24. PRINTS

https://www.360docs.net/doc/604745278.html,/bsm/dbbrowser/PRINTS/PRINTS.html

25. KabatMan(抗体结构及序列信息数据库) https://www.360docs.net/doc/604745278.html,/abs

26. ALIGN(蛋白质序列比对一览)

https://www.360docs.net/doc/604745278.html,/bsm/dbbrowser/ALIGN/ALIGN.html

27. CATH(蛋白质结构分类系统) https://www.360docs.net/doc/604745278.html,/bsm/cath

28. ProDom(蛋白质域数据库) http://protein.toulouse.inra.fr/

29. Blocks数据库(蛋白质分类系统) https://www.360docs.net/doc/604745278.html,/

30. HSSP(按同源性导出的蛋白质二级结构数据库) http://www.sander.embl-heidelberg.de/hssp/

31. FSSP(基于结构比对的蛋白质折叠分类)

https://www.360docs.net/doc/604745278.html,/dali/fssp/fssp.html

32. SBASE蛋白质域(已注释的蛋白质序列片断)

http://www.icgeb.trieste.it/~sbasessrv/

33. TransTerm(翻译控制信号数据库) https://www.360docs.net/doc/604745278.html,/Transterm.html

34. GRBase(参与基因调控的蛋白质的相关信息数据库)

https://www.360docs.net/doc/604745278.html,/~regulate/trevgrb.html

35. REBASE(限制性内切酶和甲基化酶数据库) https://www.360docs.net/doc/604745278.html,/rebase/

36. RNaseP数据库 https://www.360docs.net/doc/604745278.html,/RNaseP/home.html

37. REGULONDB(大肠杆菌转录调控数据库)

http://www.cifn.unam.mx/Computational_Biology/regulondb/

38. TRANSFAC(转录因子及其DNA结合位点数据库) http://transfac.gbf.de/

39. MHCPEP(MHC结合肽数据库) https://www.360docs.net/doc/604745278.html,.au/mhcpep/

40. ATCC(美国菌种保藏中心) https://www.360docs.net/doc/604745278.html,/

41. 高度保守的核蛋白序列的组蛋白序列数据库

https://www.360docs.net/doc/604745278.html,/Baxevani/HISTONES

42. 3Dee(蛋白质结构域定义数据库) https://www.360docs.net/doc/604745278.html,/servers/3Dee.html

43. InterPro(蛋白质域以及功能位点的完整资源)

https://www.360docs.net/doc/604745278.html,/interpro/

序列相似性搜索

1. EBI序列相似性研究网页 https://www.360docs.net/doc/604745278.html,/searches/searches.html

2. NCBI: BLAST注释 https://www.360docs.net/doc/604745278.html,/BLAST

3. EMBL的BLITZ ULTRA快速搜索

https://www.360docs.net/doc/604745278.html,/searches/blitz_input.html

生物信息学软件及使用概述

生物信息学软件及使 刘吉平 liujiping@https://www.360docs.net/doc/604745278.html, 用概述 生 物秀-专心做生物! w w w .b b i o o .c o m

生物信息学是一门新兴的交叉学生物信息学的概念: 科,它将数学和计算机知识应用于生物学,以获取、加工、存储、分类、检索与分析生物大分子的信息,从而理解这些信息的生物学意义。 生 物秀-专心做生物! w w w .b b i o o .c o m

分析和处理实验数据和公共数据,生物信息学软件主要功能 1.2.提示、指导、替代实验操作,利用对实验数据的分析所得的结论设计下一阶段的实验 3.实验数据的自动化管理 4.寻找、预测新基因及其结构、功能 5.蛋白质高级结构及功能预测(三维建模,目前研究的焦点和难点) 生 物秀-专心做生物! w w w .b b i o o .c o m

功能1. 分析和处理实验数据和公共数据,加快研究进度,缩短科研时间 ?核酸:序列同源性比较,分子进化树构建,结构信息分析,包括基元(Motif)、酶切点、重复片断、碱基组成和分布、开放阅读框(ORF ),蛋白编码区(CDS )及外显子预测、RNA 二级结构预测、DNA 片段的拼接; ?蛋白:序列同源性比较,结构信息分析(包括Motif ,限制酶切点,内部重复序列的查找,氨基酸残基组成及其亲水性及疏水性分析),等电点及二级结构预测等等; ?本地序列与公共序列的联接,成果扩大。 生 物秀-专心做生物! w w w .b b i o o .c o m

Antheprot 5.0 Dot Plot 点阵图 Dot plot 点阵图能够揭示多个局部相似性的复杂关系 生 物秀-专心做生物! w w w .b b i o o .c o m

生物信息学课后题及答案-推荐下载

生物信息学课后习题及答案 (由10级生技一、二班课代表整理) 一、绪论 1.你认为,什么是生物信息学? 采用信息科学技术,借助数学、生物学的理论、方法,对各种生物信息(包括核酸、蛋 白质等)的收集、加工、储存、分析、解释的一门学科。2.你认为生物信息学有什么用?对你的生活、研究有影响吗?(1)主要用于: 在基因组分析方面:生物序列相似性比较及其数据库搜索、基因预测、基因组进化和分 子进化、蛋白质结构预测等 在医药方面:新药物设计、基因芯片疾病快速诊断、流行病学研究:SARS 、人类基因组计划、基因组计划:基因芯片。 (2)指导研究和实验方案,减少操作性实验的量;验证实验结果;为实验结果提供更多的支持数据等材料。 3.人类基因组计划与生物信息学有什么关系? 人类基因组计划的实施,促进了测序技术的迅猛发展,从而使实验数据和可利用信息急剧增加,信息的管理和分析成为基因组计划的一项重要的工作 。而这些数据信息的管理、分析、解释和使用促使了生物信息学的产生和迅速发展。 4简述人类基因组研究计划的历程。 通过国际合作,用15年时间(1990-2005)至少投入30亿美元,构建详细的人类基因组遗传图和物理图,确定人类DNA 的全部核苷酸序列,定位约10万基因,并对其他生物进行类似研究。 1990,人类基因组计划正式启动。 1996,完成人类基因组计划的遗传作图,启动模式生物基因组计划。 1998完成人类基因组计划的物理作图,开始人类基因组的大规模测序。Celera 公司加入,与公共领域竞争启动水稻基因组计划。 1999,第五届国际公共领域人类基因组测序会议,加快测序速度。 2000,Celera 公司宣布完成果蝇基因组测序,国际公共领域宣布完成第一个植物基因组——拟南芥全基因组的测序工作。 2001,人类基因组“中国卷”的绘制工作宣告完成。 2003,中、美、日、德、法、英等6国科学家宣布人类基因组序列图绘制成功,人类基因组计划的.目标全部实现。2004,人类基因组完成图公布。 2.我国自主知识产权的主要基因组测序计划有哪些?水稻(2002),家鸡(2004),家蚕(2007),家猪(2012),大熊猫(2010) 2.第一章 、管路敷设技术通过管线不仅可以解决吊顶层配置不规范高中资料试卷问题,而且可保障各类管路习题到位。在管路敷设过程中,要加强看护关于管路高中资料试卷连接管口处理高中资料试卷弯扁度固定盒位置保护层防腐跨接地线弯曲半径标高等,要求技术交底。管线敷设技术包含线槽、管架等多项方式,为解决高中语文电气课件中管壁薄、接口不严等问题,合理利用管线敷设技术。线缆敷设原则:在分线盒处,当不同电压回路交叉时,应采用金属隔板进行隔开处理;同一线槽内,强电回路须同时切断习题电源,线缆敷设完毕,要进行检查和检测处理。、电气课件中调试对全部高中资料试卷电气设备,在安装过程中以及安装结束后进行 高中资料试卷调整试验;通电检查所有设备高中资料试卷相互作用与相互关系,根据生产工艺高中资料试卷要求,对电气设备进行空载与带负荷下高中资料试卷调控试验;对设备进行调整使其在正常工况下与过度工作下都可以正常工作;对于继电保护进行整核对定值,审核与校对图纸,编写复杂设备与装置高中资料试卷调试方案,编写重要设备高中资料试卷试验方案以及系统启动方案;对整套启动过程中高中资料试卷电气设备进行调试工作并且进行过关运行高中资料试卷技术指导。对于调试过程中高中资料试卷技术问题,作为调试人员,需要在事前掌握图纸资料、设备制造厂家出具高中资料试卷试验报告与相关技术资料,并且了解现场设备高中资料试卷布置情况与有关高中资料试卷电气系统接线等情况,然后根据规范与规程规定,制定设备调试高中资料试卷方案。 、电气设备调试高中资料试卷技术电力保护装置调试技术,电力保护高中资料试卷配置技术是指机组在进行继电保护高中资料试卷总体配置时,需要在最大限度内来确保机组高中资料试卷安全,并且尽可能地缩小故障高中资料试卷破坏范围,或者对某些异常高中资料试卷工况进行自动处理,尤其要避免错误高中资料试卷保护装置动作,并且拒绝动作,来避免不必要高中资料试卷突然停机。因此,电力高中资料试卷保护装置调试技术,要求电力保护装置做到准确灵活。对于差动保护装置高中资料试卷调试技术是指发电机一变压器组在发生内部故障时,需要进行外部电源高中资料试卷切除从而采用高中资料试卷主要保护装置。

基因组学与生物信息学教案

《基因组学与生物信息学》教案 授课专业:生物学大类各专业 课程名称:基因组学与生物信息学 主讲教师:夏庆友程道军赵萍徐汉福

课程说明 一、课程名称:基因组学与生物信息学 二、总课时数:36学时(理论27学时实验9学时) 三、先修课程:遗传学、分子生物学、基因工程 四、使用教材: 杨金水. 基因组学. 北京:高等教育出版社,2002. 张成岗. 贺福初, 生物信息学方法与实践. 北京:科学出版社,2002. 五、教学参考书: T.A.布朗著,袁建刚译著,基因组(2rd版),北京:科学出版社,2006. 沈桂芳,丁仁瑞,走向后基因组时代的分子生物学,杭州:浙江教育出版社,2005. 罗静初译,生物信息学概论,北京:北京大学出版社,2002. 六、考核方式:考查 七、教案编写说明: 教案又称课时授课计划,是任课教师的教学实施方案。任课教师应遵循专业教学计划制订的培养目标,以教学大纲为依据,在熟悉教材、了解学生的基础上,结合教学实践经验,提前编写设计好每门课程每个章、节或主题的全部教学活动。教案可以按每堂课(指同一主题连续1~2节课)设计编写。教案编写说明如下: 1、编号:按施教的顺序标明序号。 2、教学课型表示所授课程的类型,请在相应课型栏内选择打“√”。 3、题目:标明章、节或主题。 4、教学内容:是授课的核心。将授课的内容按逻辑层次,有序设计编排,必要时标以“*”、“#”“?” 符号分别表示重点、难点或疑点。 5、教学方式既教学方法,如讲授、讨论、示教、指导等。教学手段指教科书、板书、多媒体、模型、 标本、挂图、音像等教学工具。 6、讨论、思考题和作业:提出若干问题以供讨论,或作为课后复习时思考,亦可要求学生作为作业 来完成,以供考核之用。 7、参考书目:列出参考书籍、有关资料。 8、日期的填写系指本堂课授课的时间。

大基因组大数据与生物信息学英文及翻译

Big Genomic Data in Bioinformatics Cloud Abstract The achievement of Human Genome project has led to the proliferation of genomic sequencing data. This along with the next generation sequencing has helped to reduce the cost of sequencing, which has further increased the demand of analysis of this large genomic data. This data set and its processing has aided medical researches. Thus, we require expertise to deal with biological big data. The concept of cloud computing and big data technologies such as the Apache Hadoop project, are hereby needed to store, handle and analyse this data. Because, these technologies provide distributed and parallelized data processing and are efficient to analyse even petabyte (PB) scale data sets. However, there are some demerits too which may include need of larger time to transfer data and lesser network bandwidth, majorly. 人类基因组计划的实现导致基因组测序数据的增殖。这与下一代测序一起有助于降低测序的成本,这进一步增加了对这种大基因组数据的分析的需求。该数据集及其处理有助于医学研究。 因此,我们需要专门知识来处理生物大数据。因此,需要云计算和大数据技术(例如Apache Hadoop项目)的概念来存储,处理和分析这些数据。因为,这些技术提供分布式和并行化的数据处理,并且能够有效地分析甚至PB级的数据集。然而,也有一些缺点,可能包括需要更大的时间来传输数据和更小的网络带宽,主要。 Introduction The introduction of next generation sequencing has given unrivalled levels of sequence data. So, the modern biology is incurring challenges in the field of data management and analysis. A single human's DNA comprises around 3 billion base pairs (bp) representing approximately 100 gigabytes (GB) of data. Bioinformatics is encountering difficulty in storage and analysis of such data. Moore's Law infers that computers double in speed and half in size every 18 months. And reports say that the biological data will accumulate at even faster pace [1]. Sequencing a human genome has decreased in cost from $1 million in 2007 to $1 thousand in 2012. With this falling cost of sequencing and after the completion of the Human Genome project in 2003, inundate of biological sequence data was generated. Sequencing and cataloguing genetic information has increased many folds (as can be observed from the GenBank database of NCBI). Various medical research institutes like the National Cancer Institute are continuously targeting on sequencing of a million genomes for the understanding of biological pathways and genomic variations to predict the cause of the disease. Given, the whole genome of a tumour and a matching normal tissue sample consumes 0.1 T B of compressed data, then one million genomes will require 0.1 million TB, i.e. 103 PB (petabyte) [2]. The explosion of Biology's data (the scale of the data exceeds a single machine) has made it more expensive to store, process and analyse compared to its generation. This has stimulated the use of cloud to avoid large capital infrastructure and maintenance costs. In fact, it needs deviation from the common structured data (row-column organisation) to a semi-structured or unstructured data. And there is a need to develop applications that execute in parallel on distributed data sets. With the effective use of big data in the healthcare sector, a

基因组学与生物信息学课后作业

基因组学与生物信息学课后作业2016/2/23 名词解释 1 基因组:基因组是指生物体内遗传信息的集合,是某个特定物种细胞内全部DNA分子的总和 2 基因组学:是一门新兴的学科,是在全基因组范围内研究基因的结构、功能、组成及进化的科学,包括多个分支学科 3 C值:指一个单倍体基因组中DNA的总和,一个特定的物种具有其特征性的C值 4 基因家族:来自于一个共同的祖先基因,由基因重复及其突变产生。序列相似,功能相近。 5 假基因:来源于功能基因,但以失去活性的DNA序列,有沉默的假基因,也有可转录的假基因 6 人类基因组计划:旨在为30多亿碱基对构成的人类基因组精确测序,发现所有人类基因并搞清其在染色体上的位置,破译人类全部遗传信息 问答题

简述真核生物染色体与原核生物染色体的差别。 答:真核生物基因组都由分散的长链线性DNA分子组成,每个DNA分子都与蛋白质结合组成染色体;原核生物基因组有2种独立结构的遗传物质,一种为拟核里的染色质,一种为质粒 另外,真核生物基因组含大量非编码序列(高度重复序列,多位于着丝粒、端粒)、断裂基因,而原核生物大部分基因都可以编码 名词解释 突变:基因组小区段范围内DNA分子发生的突然的、可遗传的变异现象。 重组:指基因组中大范围区段发生重新组合。 同源重组:指发生在非姐妹染色单体(sister chromatin) 之间或同一染色体上含有同源序列的DNA分子之间或分子之内的重新组合 转座:一段DNA片段或其拷贝从染色体的一个位置转移到另一位置,并在插入位点两侧产生一对短的正向重复序列 基因重复:含有基因的DNA片段发生重复,可能因同源重组作用出错而发生,或是因为反转录转座与整个染色体发生重复所导致 比较基因组学:在基因组水平上研究不同物种和品系之间在基因组结构与功能方面的亲缘关系及其内在联系的一门新兴交叉学科

生物信息学复习资料全

一、名词解释(31个) 1.生物信息学:广义:应用信息科学的方法和技术,研究生物体系和生物过程 息的存贮、信息的涵和信息的传递,研究和分析生物体细胞、组织、器官的生理、病理、药理过程中的各种生物信息,或者也可以说成是生命科学中的信息科学。狭义:应用信息科学的理论、方法和技术,管理、分析和利用生物分子数据。 2.二级数据库:对原始生物分子数据进行整理、分类的结果,是在一级数据库、 实验数据和理论分析的基础上针对特定的应用目标而建立的。 3.多序列比对:研究的是多个序列的共性。序列的多重比对可用来搜索基因组 序列的功能区域,也可用于研究一组蛋白质之间的进化关系。 4.系统发育分析:是研究物种进化和系统分类的一种方法,其常用一种类似树 状分支的图形来概括各种(类)生物之间的亲缘关系,这种树状分支的图形称为系统发育树。 5.直系同源:如果由于进化压力来维持特定模体的话,模体中的组成蛋白应该 是进化保守的并且在其他物种中具有直系同源性。 指的是不同物种之间的同源性,例如蛋白质的同源性,DNA序列的同源性。(来自百度) 6.旁系(并系)同源:是那些在一定物种中的来源于基因复制的蛋白,可能会 进化出新的与原来有关的功能。用来描述在同一物种由于基因复制而分离的同源基因。(来自百度) 7.FASTA序列格式:将一个DNA或者蛋白质序列表示为一个带有一些标记的 核苷酸或氨基酸字符串。 8.开放阅读框(ORF):是结构基因的正常核苷酸序列,从起始密码子到终止 密码子的阅读框可编码完整的多肽链,其间不存在使翻译中断的终止密码子。(来自百度) 9.结构域:大分子蛋白质的三级结构常可分割成一个或数个球状或纤维状的区 域,折叠得较为紧密,各行其功能,称为结构域。 10.空位罚分:序列比对分析时为了反映核酸或氨基酸的插入或缺失等而插入空 位并进行罚分,以控制空位插入的合理性。(来自百度) 11.表达序列标签:通过从cDNA文库中随机挑选的克隆进行测序所获得的部分 cDNA的3’或5’端序列。(来自文献) 12.Gene Ontology 协会: 13.HMM 隐马尔可夫模型:将核苷酸序列看成一个随机序列,DNA序列的编 码部分与非编码部分在核苷酸的选用频率上对应着不同的Markov模型。14.一级数据库:数据库中的数据直接来源于实验获得的原始数据,只经过简单 的归类整理和注释 15.序列一致性:指同源DNA顺序的同一碱基位置的相同的碱基成员, 或者蛋 白质的同一氨基酸位置的相同的氨基酸成员, 可用百分比表示。 16.序列相似性:指同源蛋白质的氨基酸序列中一致性氨基酸和可取代氨基酸所 占的比例。 17.Blastn:是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将 同所查序列作一对一地核酸序列比对。(来自百度) 18.Blastp:是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐 一地同每条所查序列作一对一的序列比对。(来自百度)

高通量测序生物信息学分析(内部极品资料,初学者必看)

基因组测序基础知识 ㈠De Novo测序也叫从头测序,是首次对一个物种的基因组进行测序,用生物信息学的分析方法对测序所得序列进行组装,从而获得该物种的基因组序列图谱。 目前国际上通用的基因组De Novo测序方法有三种: 1. 用Illumina Solexa GA IIx 测序仪直接测序; 2. 用Roche GS FLX Titanium直接完成全基因组测序; 3. 用ABI 3730 或Roche GS FLX Titanium测序,搭建骨架,再用Illumina Solexa GA IIx 进行深度测序,完成基因组拼接。 采用De Novo测序有助于研究者了解未知物种的个体全基因组序列、鉴定新基因组中全部的结构和功能元件,并且将这些信息在基因组水平上进行集成和展示、可以预测新的功能基因及进行比较基因组学研究,为后续的相关研究奠定基础。 实验流程: 公司服务内容 1.基本服务:DNA样品检测;测序文库构建;高通量测序;数据基本分析(Base calling,去接头, 去污染);序列组装达到精细图标准 2.定制服务:基因组注释及功能注释;比较基因组及分子进化分析,数据库搭建;基因组信息展 示平台搭建 1.基因组De Novo测序对DNA样品有什么要求?

(1) 对于细菌真菌,样品来源一定要单一菌落无污染,否则会严重影响测序结果的质量。基因组完整无降解(23 kb以上), OD值在1.8~2.0 之间;样品浓度大于30 ng/μl;每次样品制备需要10 μg样品,如果需要多次制备样品,则需要样品总量=制备样品次数*10 μg。 (2) 对于植物,样品来源要求是黑暗无菌条件下培养的黄化苗或组培样品,最好为纯合或单倍体。基因组完整无降解(23 kb以上),OD值在1.8~2.0 之间;样品浓度大于30 ng/μl;样品总量不小于500 μg,详细要求参见项目合同附件。 (3) 对于动物,样品来源应选用肌肉,血等脂肪含量少的部位,同一个体取样,最好为纯合。基因组完整无降解(23 kb以上),OD值在1.8~2.0 之间;样品浓度大于30 ng/μl;样品总量不小于500 μg,详细要求参见项目合同附件。 (4) 基因组De Novo组装完毕后需要构建BAC或Fosmid文库进行测序验证,用于BAC 或Fosmid文库构建的样品需要保证跟De Novo测序样本同一来源。 2. De Novo有几种测序方式 目前3种测序技术 Roche 454,Solexa和ABI SOLID均有单端测序和双端测序两种方式。在基因组De Novo测序过程中,Roche 454的单端测序读长可以达到400 bp,经常用于基因组骨架的组装,而Solexa和ABI SOLID双端测序可以用于组装scaffolds和填补gap。下面以solexa 为例,对单端测序(Single-read)和双端测序(Paired-end和Mate-pair)进行介绍。Single-read、Paired-end和Mate-pair主要区别在测序文库的构建方法上。 单端测序(Single-read)首先将DNA样本进行片段化处理形成200-500bp的片段,引物序列连接到DNA片段的一端,然后末端加上接头,将片段固定在flow cell上生成DNA簇,上机测序单端读取序列(图1)。 Paired-end方法是指在构建待测DNA文库时在两端的接头上都加上测序引物结合位点,在第一轮测序完成后,去除第一轮测序的模板链,用对读测序模块(Paired-End Module)引导互补链在原位置再生和扩增,以达到第二轮测序所用的模板量,进行第二轮互补链的合成测序(图2)。 图1 Single-read文库构建方法图2 Paired-end文库构建方法

生物信息学名词解释

1.计算生物信息学(Computational Bioinformatics)是生命科学与计算机科学、数理科学、化学等领域相互交叉而形成的一门新兴学科,以生物数据作为研究对象,研究理论模型和计算方法,开发分析工具,进而达到揭示这些数据蕴含的生物学意义的目的。 2.油包水PCR (Emulsion PCR) : 1) DNA片段和捕获磁珠混合; 2) 矿物油和水相的剧烈震荡产生油包水环境; 3) DNA片段在油包水环境中扩增;4) 破油并富集有效扩增磁珠。 3.双碱基编码技术:在测序过程中对每个碱基判读两遍,从而减少原始数据错误,提供内在的校对功能。代表测序方法:solid 测序。 4.焦磷酸测序法:焦磷酸测序技术是由4种酶催化的同一反应体系中的酶级联化学发光反应,适于对已知的短序列的测序分析,其可重复性和精确性能与SangerDNA测序法相媲美,而速度却大大的提高。焦磷酸测序技术不需要凝胶电泳,也不需要对DNA样品进行任何特殊形式的标记和染色,具备同时对大量样品进行测序分析的能力。在单核苷酸多态性、病原微生物快速鉴定、病因学和法医鉴定研究等方面有着越来越广泛的应用。例如:454测序仪 :用蛋白质序列查找核苷酸序列。 :STS是序列标记位点(sequence-tagged site)的缩写,是指染色体上位置已定的、核苷酸序列已知的、且在基因组中只有一份拷贝的DNA短片断,一般长200bp -500bp。它可用PCR方法加以验证。将不同的STS依照它们在染色体上的位置依次排列构建的图为STS图。在基因组作图和测序研究时,当各个实验室发表其DNA测序数据或构建成的物理图时,可用STS来加以鉴定和验证,并确定这些测序的DNA片段在染色体上的位置;还有利于汇集分析各实验室发表的数据和资料,保证作图和测序的准确性。 :表达序列标签技术(EST,Expressed Sequence Tags)EST技术直接起源于人类基因组计划。 :生物信息学数据库。UniGene试图通过计算机程序对GeneBank中的序列数据进行适当处理,剔除冗余部分,将同一基因的序列,包括EST序列片段搜集到一起,以便研究基因的转录图谱。UniGene除了包括人的基因外,也包括小鼠、大鼠等其它模式生物的基因。 :开放阅读框(ORF,open reading frame )是基因序列的一部分,包含一段可以编码蛋白的碱基序列,不能被终止子打断。编码一个蛋白质的外显子连接成为一个连续的ORF。 10.分子钟检验:只有分子钟的,没听过分子钟检验。一种关于分子进化的假说,认为两个物种的同源基因之间的差异程度与它们的共同祖先的存在时间(即两者的分歧时间)有一定的数量关系

浅谈生物信息学在生物方面的应用

浅谈生物信息学在生物方面的应用 生物信息学(bioinformaLics)是以核酸和蛋白质等生物大分子数据库及其相关的图书、文献、资料为主要对象,以数学、信息学、计算机科学为主要手段,对浩如烟海的原始数据和原始资料进行存储、管理、注释、加工,使之成为具有明确生物意义的生物信息。并通过对生物信息的查询、搜索、比较、分析,从中获得基因的编码、凋控、遗传、突变等知识;研究核酸和蛋白质等生物大分子的结构、功能及其相互关系;研究它们在生物体内的物质代谢、能量转移、信息传导等生命活动中的作用机制。 从生物信息学研究的具体内容上看,生物信息学可以用于序列分类、相似性搜索、DNA 序列编码区识别、分子结构与功能预测、进化过程的构建等方面的计算工具已成为变态反应研究工作的重要组成部分。针对核酸序列的分析就是在核酸序列中寻找过敏原基因,找出基因的位置和功能位点的位置,以及标记已知的序列模式等过程。针对蛋白质序列的分析,可以预测出蛋白质的许多物理特性,包括等电点分子量、酶切特性、疏水性、电荷分布等以及蛋白质二级结构预测,三维结构预测等。 生物信息学中的主要方法有:序列比对,结构比对,蛋白质结构的预测,构造分子进化树,聚类等。基因芯片是基因表达谱数据的重要来源。目前生物信息学在基因芯片中的应用主要体现在三个方面。 1、确定芯片检测目标。利用生物信息学方法,查询生物分子信息数据库,取得相应的序列数据,通过序列比对,找出特征序列,作为芯片设计的参照序列。 2、芯片设计。主要包括两个方面,即探针的设计和探针在芯片上的布局,必须根据具体的芯片功能、芯片制备技术采用不同的设计方法。 3、实验数据管理与分析。对基因芯片杂交图像处理,给出实验结果,并运用生物信息学方法对实验进行可靠性分析,得到基因序列变异结果或基因表达分析结果。尽可能将实验结果及分析结果存放在数据库中,将基因芯片数据与公共数据库进行链接,利用数据挖掘方法,揭示各种数据之间的关系。 生物信息学在人类基因组计划中也具有重要的作用。 大规模测序是基因组研究的最基本任务,它的每一个环节都与信息分析紧密相关。目前,从测序仪的光密度采样与分析、碱基读出、载体标识与去除、拼接与组装、填补序列间隙,到重复序列标识、读框预测和基因标注的每一步都是紧密依赖基因组信息学的软件和数据库的。特别是拼接和填补序列间隙更需要把实验设计和信息分析时刻联系在一起.拼接与组装中的难点是处理重复序列,这在含有约30%重复序列的人类基因组中显得尤其突出。 人类基因组的工作草图即将完成,因此发现新基因就成了当务之急。使用基因组信息学的方法通过超大规模计算是发现新基因的重要手段,可以说大部分新基因是靠理论方法预测出来的。比如啤酒酵母完整基因组(约1300万bp)所包含6千多个基因,大约60%是通过信息分析得到的。 当人类基因找到之后,自然要解决的问题是:不同人种间基因有什么差别;正常人和病人基因又有什么差别。”这就是通常所说的SNPs(单核苷酸多态性)。构建SNPs及其相关数据库是基因组研究走向应用的重要步骤。1998年国际已开展了以EST为主发现新Spps 的研究。在我国开展中华民族SNPs研究也是至重要的。总之,生物信息学不仅将赋予人们各种基础研究的重要成果,也会带来巨大的经济效益和社会效益。在未来的几年中DNA 序列数据将以意想不到的速度增长,这更离不开利用生物信息学进行各类数据的分析和解释,研制有效利用和管理数据新工具。生物信息学在功能基因组学同样具有重要的应用目前应用最多的是同源序列比较、模式识别以及蛋白结构预测。所谓同源序列,是指从某一共同祖先经趋异进化而形成的不同序列。利用数据库搜索找出未知核酸或蛋白的同源序列,是序列分析的基础[lol。如利用BLASTn和BLASTx两种软件分别进行核苷酸和氨基

生物信息学在基因组学中的应用_沈春修

作者简介沈春修(1979-),男,湖南溆浦人,硕士,助教,从事水稻遗传 育种与抗病分子机制方面的研究。 收稿日期 2007!04!01 基因的研究是指在许多基因同时存在的基础上对多个基因同时进行研究,分析各自与它们之间的结构与功能的相互关系。因而它至少涉及3个相关领域:结构基因组———主要关心DNA碱基序列水平上的基因结构;比较基因组———寻找种内、种属间产生基因结构差异的分子基础,以期获取与目的性状相关的基因;功能基因组———着重研究基因与其表达产物及功能活性的调控关系。结构基因组是其他领域的基础,比较基因组为功能基因组研究提供等位基因,蛋白质组则是在蛋白质水平上分析基因表达的功能基因组研究的派生分枝。生物信息学是在前面三者研究的基础上,获取、整理、综合分析提取大量已有复杂生物数据的新学科,对相关学科的研究有很大的推动作用。 1生物信息学在结构基因组中的应用 随着化学分析方法的改进,DNA测序水平的提高,科 研成本的降低,已开始对多种模式生物进行基因组全序列的测序。如拟南芥和水稻的全基因组测序,将来会有越来越多的重要作物基因组被全测序。因而,今后的工作重点将是基因组中信息的分析与鉴定,对植物抗性基因来说,是分析鉴定其组织结构及其相关调控序列的鉴定。结构基因组的研究对抗性基因的研究有许多指导意义。 在现在已知的许多种已克隆的抗性基因(不含Hm1和 Hm2)中,分析其序列结构,都含有或部分含有核苷酸结合 位点(NBS),富含亮氨酸重复(LRR),跨膜结构域(TM)以及丝氨酸-苏氨酸激酶(STK)保守序列。根据已知抗性基因都含有NBS序列的特征,从测序结果中可预测某一生物中含有与抗性基因有关的基因数目有多少[1]。在拟南芥与水稻测序的过程中,发现许多与抗性有关的NBS序列。在已测序的拟南芥67Mb中(相当于大于50%的拟南芥基因组序列),有120个可预见的基因产物与植物抗性基因的NBS结构相似[2]。假设剩余的另外50%未知基因也按这样的比例分布,那么拟南芥中将有200个左右的基因与抗性有关。在这些与抗性有关的200个基因中,它们要么是编码信号传导的组分,要么是编码抗微生物的蛋白,这些基因序列的总长度大约占拟南芥总基因数的1%。而在水稻中,通过对重叠的BAC克隆末端序列分析(占全部水稻基因的5%)来看,大约有750 ̄1500个基因具有编码NBS的能力[3-5]。 从已知抗性基因的定位结果来看,NBS序列在拟南芥基因组中倾向于成簇排列。测序结果也表明,植物中的抗性基因一般与抗性基因的多种同源共生序列在一起,共同组成 高度重复区域,这种区域统称为基因簇。Rpp5基因簇包含 8 ̄10个同源序列,散布在90kb的区域上,并且被蛋白激酶 的假基因与反向转座子等隔开。Cf!4/9基因簇由5个抗性基因同源序列组成,散布在36kb的区域内,Cf!4/9的同源序列被Lox基因隔开,成为高度重复区域。Pto基因簇包含5个同源序列,分布在60kb的区域内,这其中的Prf基因编码NBS!LRR,对Pto基因的功能是必需的。Dm3基因是目前已知的最大的抗性基因,至少由24个抗性基因同源序列组成,横跨3.5Mb。因而,随着更多模式植物的全基因组测序的完成,人们可以从基因组测序信息中直接读出有用数据,分析寻找抗性基因的组织结构特征与分布规律。 2生物信息学在比较基因组学中的应用 随着多种生物的全基因组测序完成,有越来越多的数 据可以直接利用。首先,通过比较多种属植物抗性基因的定位特点,发现抗性基因大多定位在较不稳定的区域,其区域的结构不很保守,如拟南芥的抗性基因RPM1的同源序列在感病表型的植株上丢失[6]。进一步研究发现,抗性基因的位置要么是端粒区域,要么是接近着丝粒区域。例如,通过原位荧光杂交分析得知:莴苣的两抗性基因分别定位在端粒区域与接近着丝粒区域,高粱Rpg1基因位于端粒区域,番茄的Mi基因位于异染色质的着丝粒边缘[7]。第2,通过测序分析,可以确定基因成簇的模式与范围,通过比较种属间亲缘关系,来预测某一功能相似的基因在其他物种中的位置。进而根据已克隆的抗性基因间的相似性,可以采用适当的引物进行PCR扩增获得抗性基因的候选序列,而且这些候选序列的片段均可定位到已知的抗性基因的位置上[8]。从现在公开的数据中,比较多种NBS基因的相似性,用PCR获得了130个候选抗性基因,此数据将继续增长。第3,比较基因组的另一作用在于可以区分同源区域与同源共生区域。这对本身就位于同源共生区域的抗性基因家族可能困难,但是抗性基因相关序列的种间比较结果显示:同源区域比同源共生区域更加相似。这提示:物种为了赶上病原菌的变化步伐而采取快速进化来抵抗随时间而变化的病原群体。通过分析拟南芥的RPm1基因侧翼序列也得到这样的结论。第4,比较基因组学也可对某特定等位基因的变化的分子基础进行研究[9]。至今,只有极少数通过同源重组,实现蛋白质结构域的域置换试验成功。这些结果显示NBS!LRR编码基因的LRR区域是非常重要的,但它不是专一性的唯一决定簇。随着测序效率的提高,将建立抗性基因相关序列的数据库,这些序列信息可作为基因步行试验的模板,为克隆新的抗性基因提供极大的帮助。第5,比较基因组作图表明,染色体上的DNA标记排列具有共线性[10]。如小麦的基 生物信息学在基因组学中的应用 沈春修 (宜春学院,江西宜春336000) 摘要随着计算机科学、物理学、数学等与生命科学的相互渗透和交叉,生物信息学愈来愈显示出其重要性,尤其是在抗病基因的研究中。笔者从结构基因组、比较基因组、功能基因组与生物信息学等方面论述了生物信息学在基因组学中的应用。关键词抗性基因;结构基因组;比较基因组;功能基因组;生物信息学 中图分类号Q78文献标识码A文章编号0517-6611(2007)20-06054-02 安徽农业科学,JournalofAnhuiAgri.Sci.2007,35(20):6054-6055,6057责任编辑王淼责任校对王淼

人类基因组计划和生物信息学

人类基因组计划和生物信息学 徐新来 安道昌 王 芷3 李 青 付红波 (中国生物工程中心 北京100081)(3中国科技信息研究所 北京100038) 提要:介绍人类基因组计划和生物信息学,阐述了两者的关系,提出了在人类基因组计划中发展生物信息学的策略。 一、引 言 人类基因组计划(H um an Genom e P ro 2ject ,H GP )是美国在1990年提出实施的一项大科学计划,在世界各国引起了很大反响。计划的提出旨在对人类基因组3×109 个脱氧核苷酸对进行作图和测序,进而解读和破译生老病死以及语言、记忆和疾病发生的遗传信息。而生物信息学是集生物学、数学、信息学、计算机科学一体化的一门新的学科。早在H GP 提出时就预示到生物信息学的重要性,当时就成立了有42位著名专家组成的生物信息学任务组。随着人类基因组计划的进展,基因组的数据和信息大量,迅速地增加,信息的收集、储存、分发、分析的管理越来越显得紧迫和重要。利用数学模式和计算机处理数据的功能来处理和分析大量增加的人类基因组信息的结果,使人类基因组计划和生物信息学紧紧地结合起来了,而且随着两者的紧密结合和互相渗透,人类基因组计划的前进步伐会大大加快,从而提前完成计划,为人类造福。 二、从人类基因组计划看 生物信息学 美国在1990年率先提出H GP ,计划用15年时间,投入30亿美元,完成人类全部24条染色体的3×109脱氧核苷酸对(bp )的序列测定,主要任务包括作图(遗传图谱、物理图谱的建立)、测序和基因识别。其中还包括模式生物(如大肠杆菌、酵母、线虫、小鼠等)基因组的作图和测序,以及信息系统的建立。 遗传图谱、物理图谱的建立是测序的必要条件;遗传图谱是根据遗传连锁标志之间的重组频率来确定它们的距离,遗传图谱的建立为基因识别和完成基因定位创造了条件。物理图谱是以核苷酸的长度为单位绘制而成,详细描述染色体上界标间的距离,主要是编码蛋白质的外显子和排序DNA 克隆库组成,这些DNA 分子克隆库相互交错、重叠。人类基因组全部DNA 序列的测定是H GP 的核心部分;随着遗 传和物理图谱的完成和即将完成,测序就成为今后重中之重的工作。而大规模测序技术的改进及分析大片段DNA 序列的生物信息技术的进步,对完成人类基因组全部核苷酸顺序测定起着决定性作用。测序的完成依赖物理图谱上的排序的DNA 片段分子克隆,这些分子图谱通常是在较短的时间由一个研究组从单一分离群体中获得的,为了充分利用所有资料信息,要对其全部标记的同时进行分析,这种分析涉及十分庞杂和巨大的计算,手工无法完成。基因识别是H GP 的重要内容之一;目的是要识别全部人类的基因,即基因组在生命活动中发生转录表达的DNA 片段,并对其结构进行研究。目前常采用的有二种方法:一是从基因组顺序中识别那些转录表达的DNA 片段;二是从c D 2 NA 文库中挑取并克隆。两种方法都必须依靠生物信息学的帮助即信息系统的建立;前者需要对基因组进行分析,后者要对基因文库进行分析,甚至还要进行分类分型,建立二级库,才能有效地挑取到所需要的DNA 分子克隆。模式生物基因组在H GP 中占有重要的位置;模 — 06—高技术通讯 1998181

生物信息学主要内容和发展前景

生物信息学主要内容和发展前景 学生:xxx (x学院xxxx班,学号xxxxxxxxxxx) 摘要:21世纪是生命科学的世纪,伴随着人类基因组计划的胜利完成,人类基因组以及其它模式生物基因组计划的全面实施,使分子生物数据以爆炸性速度增长。及时、充分、有效地利用网络上不断增长的生物信息数据库资源,已经成为生命科学和生物技术研究开发的必要手段,从而诞生了生物信息学。 关键字:生物信息学;产生;研究内容;展现状;前景 随着生物科学技术的迅猛发展,生物信息数据资源的增长呈现爆炸之势,同时计算机运算能力的提高和国际互联网络的发展使得对大规模数据的贮存、处理和传输成为可能,为了快捷方便地对已知生物学信息进行科学的组织、有效的管理和进一步分析利用,一门由生命科学和信息科学等多学科相结合特别是由分子生物学与计算机信息处理技术紧密结合而形成的交叉学科——生物信息学(Bioinformatics)应运而生,并大大推动了相关研究的开展,被誉为“解读生命天书的慧眼”。 一、生物信息学的产生 21世纪是生命科学的世纪,伴随着人类基因组计划的胜利完成,与此同时,诸如大肠杆菌、结核杆菌、啤酒酵母、线虫、果蝇、小鼠、拟南芥、水稻、玉米等等其它一些模式生物的基因组计划也都相继完成或正在顺利进行。人类基因组以及其它模式生物基因组计划的全面实施,使分子生物数据以爆炸性速度增长。在计算机科学领域,按照摩尔定律飞速前进的计算机硬件,以及逐步受到各国政府重视的信息高速公路计划的实施,为生物信息资源的研究和应用带来了福音。及时、充分、有效地利用网络上不断增长的生物信息数据库资源,已经成为生命科学和生物技术研究开发的必要手段,从而诞生了生物信息学。 二、生物信息学研究内容 (一)序列比对 比较两个或两个以上符号序列的相似性或不相似性。序列比对是生物信息学的基础。两个序列的比对现在已有较成熟的动态规划算法,以及在此基础上编写的比对软件包BALST和FASTA,可以免费下载使用。这些软件在数据库查询和搜索中有重要的应用。有时两个序列总体并不很相似,但某些局部片断相似性很高。Smith-Waterman算法是解决局部比对的好算法,缺点是速度较慢。两个以上序

生物信息学常用工具

常用DNA和蛋白质序列数据分析工具: ●序列比对工具: a)BLAST: ●网络比对,包括基础的Blast比对、参数、特殊Blast如PSI-Blast、Blast2 等; ●本地比对,包括程序下载、安装、数据库的下载及格式化、Blast程序的 运行等。 b)多序列比对ClustalX(Windows系统) 包括程序下载、安装、及程序的运行、结果的输入输出等。 ●真核生物基因结构的预测: a)基因可读框的识别: Genescan; CpG岛、转录终止信号和启动子区域预测; CpGPlot; POLYAH; PromoterScan; b)基因密码子偏好性: CodonW; c)采用mRNA序列预测基因: Spidey; d)ASTD数据库 ●分子进化遗传分析工具 ●MEGA;

●Phylip; ●蛋白质结构和功能预测 a)一级结构 ProtParam蛋白质序列理化参数检索; ProtScale蛋白质疏水性分析; COILS卷曲螺旋预测; b)二级结构 PredictProtein蛋白质结构预测; PSIPRED不同蛋白质结构预测方法; c)InterProScan: 模式和序列谱研究 Prosite:蛋白质结构域、家族和功能为点数据库; Pfam:蛋白质家族比对和HMM数据库; BLOCK:模块搜索数据库; SMART:简单模块架构搜索工具; TMHMM:跨膜结构预测工具; d)三级结构 Swiss-Model Workspace: 同源建模的网络综合服务器; Phyre:线串法预测蛋白质折叠; HMMSTR/Rosetta:从头预测蛋白质结构; Swiss-PdbViewer:分子建模和可视化工具; 序列模体的识别和解析; MEME程序包; ●蛋白质谱数据分析

相关文档
最新文档