蛋白质结构预测和序列分析软件
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
蛋白质结构预测和序列分析软件2010-05-08 20:40
转载自布丁布果
最终编辑布丁布果
4月18日
蛋白质数据库及蛋白质序列分析第一节、蛋白质数据库介绍一、蛋白质一级数据库
主要蛋白质序列数据库的网址SWISS-PROT
或
ml
TrEMBL
PIR
ww
MIPS
Protein Sequences
JIPID
Protein Sequence Database 已经和
ExPASy
三、蛋白质二级结构预测网站
(数据库)
4
始建于
SIB
基于对蛋白质家族中同源序列多重序列比对得
到的保守区域,这些区域通常与生物学功能相
关。
数据库包括两个数据库文件:数据文件
Prosite
Prosite
/prosite
5
of Proteins)
蛋白质二级结构构象参数数据库
DSSP
http://www.cmbi.kun.nl/gv/dssp
6
Proteins)
蛋白质家族数据库
FSSP
/dall/fssp
7
Structure of Proteins)
同源蛋白质数据库
HSSP
http://www.cmbi.kun.nl/gv/hssp
在前面已经述说过了。
第二节、蛋白质序列分析方法
一、多序列比对
双序列比对是序列分析的基础。
基因家族的成组的序列来说,
列之间的关系,
征。
学模式方面起着相当重要的作用。
多序列比对有时用来区分一组序列之间的差异,但其主要用于描述一组序列之间的相似性关系,以便对一个基因家族的特征有一个简明扼要的了解。
立在某个数学或生物学模型之上。
因此,正如我们不能对双序列比对的结果得出“正确或错误”的简单结论一样,
结果也没有绝对正确和绝对错误之分,
为所使用的模型在多大程度上反映了序列之间的相似性关系以及它们的生物学特征。
我们称比对前序列中残基的位置为绝对位置。序列Ⅰ的第
Ⅰ3
相应地,
位置。
而每个残基的绝对位置不同,
的序列。
绝对位置是序列本身固有的属性,
前的位置,而相对位置则是经过比对后的位置,也就比对过程赋予它的属性。
算法复杂性
多序列比对的计算量相当可观,
以下技术的复杂性。
间和内存空间与这两个序列的长度有关,
正比于这两个序列长度的乘积,用
示。其中
比对则可以理解为将双序列比对的两维空间扩展到三维,即在原有二维平面上增加一条坐标轴。这样算法复杂性就变成了
中
这类方法中最常用的就是和Doolittle 多维的动态规划矩阵来进行序列的比对不太现
实,式算法,以降低运算复杂度。Clustal 化相关性这一假设。列进行两两比对并计算它们的相似性分数值,后根据相似性分数值将它们分成若干组,组之间进行比对,性分数值继续分组比对,直到得到最终比对结
果。比对,的一部分,数据。),、
可以看看PRINTS 数据库关于TRANSFERRIN 的比对信息, PRINTS 数据库在自动比对的基础上进行了手工编辑,查寻PRINTS 数据库中关于
TRANSFERRIN 这一类的比对信息,结果可以用模体(motif )形式显示也可以用点击链接调用JAVA APPLET 进行图形显示,下图是关于TRANSFERRIN 序列比对的局部图形,可见PRINTS 数据库中TRANSFERRIN 一类由更多的序列比对形成。
据库也可以试试,如可用
质序列库
(/bsm/dbbrowser/OWL/ owl_blast.html)