蛋白质分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

WPDB
Cn3D
http://www.n cbi.nlm.nih.g ov/Structure/ CN3D/cn3d.s html
四) 分析膜蛋白质
膜蛋白种类 膜镶嵌蛋白质 膜附着蛋白质
预测蛋白质的跨膜区 ExPASy 主页选择Post-translational modification and topology prediction 在“Topology prediction”栏目选择“SOSUI”分 析工具 在SOSUI主页选择分析“SOSUI”分析软件
多序列对位排列结果
点击“Optional output formats”中的“clustalw (aln)获得文本格式的排列结果
第五讲
蛋白质性质和结构分析
蛋白质性质和结构分析
序列相似的蛋白质具有相似的三维结构
不同蛋白质中相同的结构域(domain)具有相 似的功能
分析蛋白质的功能
一级结构:氨基酸的排列顺序
2. 分析糖链连接点
糖链连接方式 O-连接:丝氨酸、苏氨酸、羟赖氨酸的羟 基 N-连接:天门冬酰氨的酰氨基
分析方法(1):分析O-连接糖蛋白
ExPASy 主页选择 Post-translational modification and topology prediction
在“Post-translational modification”栏目选择 “NetOGlyc” 软件分析O-连接糖链的连接位点
的周期较长。 近年发展起来的多维核磁共振方法可以直接测定蛋白质在溶液中的构象,但是由 于对样品的需要量大、纯度要求高,被测定的蛋白质的分子量一般不超过20000 Da等原因,也受到很大限制。
截至2008年6月,与迅速增长的庞大基因组核酸数据相反,已知三级结构的蛋白数量还 不到6万个。(来自蛋白结构数据PDB的统计)
分析基因或蛋白质的功能
2008-3-17
9
1. 多序列对位排列分析 (multiple sequence alignment)
两条以上序列的对位排列分析 反转录转座子的反转录酶序列片段
核苷酸序列或氨基酸序列 可以发现保守的结构域(重要功能位点?) 多序列排列时允许插入空位
ClustalW:目前公认的的最好的进行 Multiple sequence alignment 的方法之一 Internet 上的许多网站具有ClustalW分析软件 可以下载
在SOSUI:Submit a protein sequence网页粘贴序列
分析结果
其它分析软件
DAS:分析原核生物蛋白质的跨膜结构
Tmpred:分析蛋白质的跨膜结构和在膜上 的方向
(五)分析蛋白质的翻译后修饰 1.分析信号肽及其剪切位点 信号肽序列的特征 20-35 个氨基酸 富含疏水氨基酸的片段
引物设计要点
• 可能的错误引发位点决定于引物序列组成与模板序列组成 的相似性,相似性高则错误引发率高,错误引发的引发率 一般不要高过100,最好没有错误引发位点,如此可以保证 不出非目的产物的假带。 • 引物二聚体及发夹结构的能量一般不要超过 4.5,否则容易 产生引物二聚体带而且会降低引物浓度从而导致 PCR 正常 反应不能进行。 • 对引物的修饰一般是增加酶切位点,应参考载体的限制酶 识别序列确定,常常对上下游引物修饰的序列选用不同限 制酶的识别序列,以有利于以后的工作。
对要分析的序列的输入格式有要求,FASTA (Pearson)格式 >sequence 1 ATTGCAGTTCGCA …… >sequence 2 ATAGCACATCGCA… …
分析方法(举例) 在Swiss Institute Bioinformatics(SIB)的EXPSY 分析主页(http://www.expasy.ch)的“Tools and software package” 栏目中点击“Alignment” 在“Alignment” 网页的Sequence alignment- Multiple-CLUSTALW栏目中选择“My Hits”网 站 在ClustalW网页粘贴序列,点击“align”
关于引物的自动搜索和评价分析
• 推荐使用自动搜索软件:
Primer Premier 5.0
• 推荐使用引物评价软件:
Oligo 5/6
OLIGO 5.0 PCR 引物设计
第四讲
多序列对位排列分析
主要应用于分析基因或蛋白质的进化 通过分析多个基因或蛋白质序列之间的同源性 确定它们在进化上的关系 分析基因家族中新成员的翻译起始位点和内含 子(预测的氨基酸序列的对位排列分析)
3. 分析蛋白质的重复序列 在“Primary structure analysis”栏目选择“REP”分析 软件 在REP主页粘贴序列,点击 “Search for repeats”
分析结果
2. 分析蛋白质的疏水性 ExPASy 主页选择 Primary structure analysis
在“Primary structure analysis”栏目选择 “ProtScale”分析软件 在ProtScale主页粘贴序列、选择分析方法 蛋白质的亲水和疏水性分析结果,有图形 (1、2)显示的分析结果
蛋白质亚单位之间的结合结构
二级和三级结构之间的结构 在“Primary structure analysis”
栏目选择“Paircoil”分析软件
在Paircoil主页粘贴序列
分析结果(文字和图)
(三) 分析蛋白质的三级结构 1. 根据已知蛋白质结构推测未知蛋白质结构
BLAST 检索
在蛋白质结构数据库(PDB) 中检索同源蛋白质的结构
蛋白质的三维构象,也称空间结构或高级结构,是指蛋白质分子中原子和基团在 三维空间上的排列、分布及肽链的走向。高级结构是蛋白质表现其生物功能或活 性所必须的。 X射线晶体学方法是至今为止研究蛋白质结构最有效的方法,所能达到的精度是
任何其他方法所不能比拟的,它的缺点是蛋白质的晶体难以培养,晶体结构测定
同源建模法预测蛋白质三级结构一般由四步完成:
从待测蛋白质序列出发,搜索蛋白质结构数据库(如PDB,SWISS-PROT等), 得到许多相似序列(同源序列),选定其中一个(或几个)作为待测蛋白质序列 的模板; 待测蛋白质序列与选定的模板进行再次比对,插入各种可能的空位使两者的保守 位置尽量对齐; 建模:调整待测蛋白序列中主链各个原子的位置,产生与模板相同或相似的空间 结构,待测蛋白质空间结构模型; 利用能量最小化原理,使待测蛋白质侧链基团处于能量最小的位置。
在NetOGlyc网页粘贴序列 分析结果
• 引物所对应模板序列的Tm值最好在72℃左右,当然由 于模板序列本身的组成决定其Tm值可能偏低或偏高, 可根据具体情况灵活运用。
引物设计要点
• ΔG值反映了引物与模板结合的强弱程度,也是一个重 要的引物评价指标,一般情况下,在 Oligo 5.0 软件的 ΔG值窗口中,引物的ΔG值最好呈正弦曲线形状,即5’ 端和中间部分ΔG值较高,而3’端ΔG值相对较低,且不 要超过9(ΔG值为负值,这里取绝对值),如此则有利 于正确引发反应而可防止错误引发。分析其原理,引 物与模板应具有较高的结合能量,这样有利于引物与 模板序列的整合,因此 5’ 端与中间段的 ΔG 值应较高, 而3’端ΔG值影响DNA聚合酶对模板DNA的解链,过高 则不利于这一步骤。
(二) 分析蛋白质的二级结构
二级结构:主要是氢键维持的结构 • -螺旋(-helix) • -折叠(-sheet) • 弯(turn)
1. 预测蛋白质的-螺旋和-折叠结构
ExPASy 主页选择 Secondary structure prediction
在“Secondary structure prediction”栏目选择 “nnPredict”分析软件
SWISS-MODEL 蛋白质结构预测
SWISS-MODEL利用同源建模的方法实现对一段未知序列的三级结构的预测。该服务创 建于1993年,开创了自动建模的先河,并且它是讫今为止应用最广泛的免费服务之一。 http://swissmodel.expasy.org//SWISS-MODEL.html
Βιβλιοθήκη Baidu
First Approach mode(简捷模式)
这种模式提供一个简捷的用户介面:用户只需要输入一条氨基酸序列,服务器就会自动
选择合适的模板。如果一条模板与提交的目标序列相似度大于25%,建模程序就会自动开 始运行,结果以Email形式返回。
常用观看蛋白三级结构的软件
RasMol
http://www .openrasm ol.org/
在nnPredict主页选择分析结构种类、粘贴序列
分析结果
2. 预测蛋白质的其它二级结构 在“Secondary structure prediction”栏目选择 “SOPMA”分析软件
在SOPMA主页选择分析结构种类、粘贴序列
-螺旋、栅栏和其它二级结构,有图形显 示的分析结果
3. 预测蛋白质的coiled coil位点 由2-4个-螺旋组成
2. 通过分子建模(molecular modeling) 分析蛋白质三维结构
分析复杂
适用于专业人员 ExPASy 主页选择 tertiary structure tools
在“tertiary structure prediction ”栏 目选择一个分析工具,email服务
蛋白质高级结构的预测
引物设计要点
• 一般引物的长度为 16-23bp ,常用的长度为 18-21bp , 过长或过短都不合适。 • 引物3’端的碱基一般不用A,因为A在错误引发位点的 引发效率相对比较高,而其它三种碱基的错误引发效 率相对小一些。 • 引物的 GC 含量一般为 45-55% ,过高或过低都不利于 引发反应。上下游引物的GC含量不能相差太大。
至少有一个带正电荷的氨基酸
ExPASy 主页选择 Post-translational modification and topology prediction
在“Post-translational modification”栏目选择 “SignalIP”分析软件 在SignalIP网页选择物种参照和分析方法,粘贴 序列 分析结果
分子量(molecular weight, Mw) 疏水性(hydrophobicity) 其它
1. 分析蛋白质的pI、Mw、氨基酸组成 ExPASy 主页选择 Primary structure analysis 在“Primary structure analysis”栏目选择 “ProtParam”分析软件 在ProtParam主页粘贴序列进行分析 蛋白质的 pI、Mw、氨基酸组成、消光系数、 半衰期、稳定系数等
PCR 引物设计
引物设计的原则
首先引物要跟模板紧密结合; 其次引物与引物之间不能有稳定的二聚 体或发夹结构存在;
最后引物不能在别的非目的位点引起高
效DNA聚合反应(即错配)。
引物设计需要考虑的因素
围绕这几条基本原则,设计引物需要考虑 诸多因素,如: • 引物长度(primer length), • 产物长度(product length), • 序列Tm值 (melting temperature), • ΔG值(internal stability), • 引物二聚体及发夹结构(duplex formation and hairpin), • 错误引发位点(false priming site), • 引物及产物GC含量(composition),有 时还要对引物进行修饰,如增加限制酶切点, 引进突变等。
二级结构:主要由氢键维系的结构(α-helix、 β-sheet等)
三级结构:二级结构进一步折叠形成的结构域 许多生物信息学网站具有分析蛋白质性质和结 构的软件 2008-3-17
15
(一) 分析蛋白质的一级结构 一级结构:蛋白质的氨基酸序列
分析内容
蛋白质的氨基酸组成
等电点(pI)
相关文档
最新文档