生物信息学论文完结版

生物信息学论文完结版
生物信息学论文完结版

生物信息学论文

学院:生命科学技术学院

专业:生物科学

班级:2013级

老师:高亚梅

学生:蔡欣月

学号:20134083003

链孢霉GH5-1及GH6-3基因生物信息学分析蔡欣月(黑龙江八一农垦大学,生命科学技术学院,2013级生物科学专业,黑龙江省,大庆市)

【摘要】目的:分析和预测链孢霉菌GH5-1和GH6-3基因及其编码蛋白质的结构和特征。方法:利用NCBI、CBS和ExPASy网站中的各种信息分析工具,并结合VectorNTIsuite8.0生物信息分析软件包,分析预测链孢霉菌GH5-1和GH6-3基因并预测该基因编码蛋白结构的特征和功能。结果:GH5-1基因全长2006bp,编码区具有390个氨基酸,在GenBank同源序列中,其与endoglucanase 3 [Neurospora crassa OR74A]基因氨基酸序列一致性达到100%,且有GH5-1保守域。GH5-1蛋白相对分子量预测为41907.4,理论等电点为5.14。预测GH5-1编码蛋白α螺旋(H ) 、β折叠(E )、无规则卷(L )的比例分别是16.92%、33.85%、49.23%,2个GTPase结构域。GH5-1蛋白为亲水蛋白,无跨膜区,有信号肽。GH6-3基因全长1914bp,编码区具有419个氨基酸,在GenBank同源序列中,其与exoglucanase 3 [Neurospora crassa OR74A]基因氨基酸序列一致性达到100%,且有GH6-3保守域。GH6-3蛋白相对分子量预测为44839.3,理论等电点为6.51。预测GH6-3编码蛋白α螺旋(H ) 、β折叠(E )、无规则卷(L )的比例分别是29.59%、16.71%、53.75%,1个GTPase结构域。GH6-3蛋白为亲水蛋白,有跨膜区,无信号肽。结论:成功预测GH5-1和GH6-3基因及其编码蛋白生化及其结构特征,为下一步对其进行克隆和表达奠定基础。

【关键词】链孢霉菌;糖基水解酶家族5(GH5-1);糖基水解酶家族6(GH6-3)生物信息学

链孢霉菌又称脉孢菌、串珠菌、红色面包菌,俗称红霉菌,是食用菌生产中重要的竞争性杂菌之一。其广泛分布在自然界土壤中和和禾本科植物上,尤其在玉米芯上极易发生[1]。通过空气、土壤、腐烂植物、谷物等进行传播、在食用菌生产中,链孢菌和绿菌是生产中最常见的病原菌。链孢霉在高温高湿条件下最易发生,是夏季食用菌生产中危害严重的病原菌,该病原菌生活力强、生长迅速、繁殖快、分生孢子多、易传播,几乎会感染所有熟料栽培的食用菌,并且一旦感染很难彻底消灭,给生产造成较大的经济损失,严重危害所有食用菌的母种、原种、栽培种,以及香菇、木耳、银耳、银耳、灵芝等熟料菌简[2]。目前链孢霉菌的全基因组序列已经获得,但有关其蛋白和基因的各类研究仍为数较少,本文通过对链孢霉GH5-1和GH6-3基因及编码蛋白质进行生物信息学分析,分析其基本生化及结构特征,为下一步对其进行克隆表达和应用奠定基础。

一、材料与方法

1.1材料

通过ExPASy 数据库的UniProtKB(https://www.360docs.net/doc/d91608322.html,或https://www.360docs.net/doc/d91608322.html,/uniprot)获得链孢霉菌的GH5-1与GH6-3基因序列。GH5-1基因编号为NCU00762,NCBI的登录号为XM_959066.2,其他物种的GH5-1的氨基酸序列均来自Genbank,登录号见表1。GH6-3基因编号为NCU09680,NCBI的登录号为XM_952322.2,其他物种的GH6-3的氨基酸序列均来自Genbank,登录号见表2。

1.2方法

利用美国国家生物技术信息中心(NCBI,https://www.360docs.net/doc/d91608322.html,)的基本局部比对搜索工具(BLAST,https://www.360docs.net/doc/d91608322.html,/blast/),运用Blastx完成基因同源性分析。

应用ORF finder(https://www.360docs.net/doc/d91608322.html,/gorf/orfig.cgi)寻找其开放读码框,并推导出可编码蛋白序列。

利用保守结构域(https://www.360docs.net/doc/d91608322.html,/Structure/cdd/wrpsb.cgi)分析预测其保守域。

通过瑞士生物信息学研究所的蛋白分析专家系统(ExPASy,https://www.360docs.net/doc/d91608322.html,)所提供的蛋白组学和分析工具:Protparam、Proscale程序分析GH5-1及GH6-3蛋白氨基酸组成、相对分子质量、等电点等基本理化性质;TMHMM程序预测GH5-1及GH6-3的跨膜区;SignalP程序预测GH5-1及GH6-3蛋白的信号肽,

GOR超链接分析GH5-1及GH6-3的二级结构,SWISS-MODEL通过二级结构比对和折叠,模拟蛋白质的空间构象。

利用SMART(http://smart.embl-heidelberg.de/)分析预测其结构域。

二、结果

2.1GH5-1及GH6-3基因序列的分析

BLASTx分析结果表明,GH5-1与多个物种的GH5基因同源,其中与endoglucanase 3 [Neurospora crassa OR74A]的同源性最高,一致性达100%,相似度达58%(图1)。ORF Finder获得其开放阅读框编码氨基酸序列,该基因全长2006bp,编码区为678?—1850bp,编码390个氨基酸,起始密码子ATG,终止密码子TAA (图2)。CCD分析发现有GH5-1保守域。

图1 GH5-1基因BLASTx同源性分析

图2 GH5-1基因开放阅读框分析

BLASTx分析结果表明,GH6-3与多个物种的GH6基因同源,其中与exoglucanase 3 [Neurospora crassa OR74A]的同源性最高,一致性达100%,相似性达65%(图3)。ORF Finder获得其开放阅读框编码氨基酸序列,该基因全长1914bp,编码区为22—1281bp,编码419个氨基酸,起始密码子ATG,终止密码子TAA (图4)。CCD分析发现有GH6-3保守域。

图3 GH6-3基因BLASTx同源性分析

图4 GH6-3基因开放阅读框分析

2.2GH5-1及GH6-3编码蛋白的特征分析

2.2.1蛋白质的基本参数

GH5-1蛋白相对分子量预测为41907.4,理论等电点为5.14,脂肪系数为65.90。在溶液中的不稳定系数是19.02,为稳定蛋白。当蛋氨酸在N端时,可预测其在哺乳动物网织红细胞(体外)中,半衰期均30小时,在酵母(体内)中,半衰期大于20小时,在大肠杆菌(体内)中,大于10小时。氨基酸的组合物(图5),原子组成(图6)。带负电荷的残基总数28,带正电荷的残基总数22。当蛋白浓度为1g/L,所有的半胱氨酸残基形成半胱氨酸时,吸光指数(ABS)为2.653,在水中280nm摩尔消光指数为111185;所有的半胱氨酸残基不形成半胱氨酸时,吸光指数(ABS)则为2.644,在水溶液中280nm摩尔消光指数。总的亲水性平均疏水性指数(grand average of hydropathieity)为-0.192,预测为亲水蛋白。

为110810

图5 GH5-1基因的氨基酸组成

GH6-3蛋白相对分子量预测为44839.3,理论等电点为6.51,脂肪系数为80.19。在溶液中的不稳定系数是34.75,为稳定蛋白。当蛋氨酸在N端时,可预测其在哺乳动物网织红细胞(体外)中,半衰期均30小时,在酵母(体内)中,半衰期大于20小时,在大肠杆菌(体内)中,大于10小时。氨基酸的组合物(图7),原子组成(图8)。带负电荷的残基总数40,带正电荷的残基总数38。当蛋白浓度为1g/L,所有的半胱氨酸残基形成半胱氨酸时,吸光指数(ABS)为1.485,在水中280nm摩尔消光指数为66600;所有的半胱氨酸残基不形成半胱氨酸时,吸光指数(ABS)则为1.480,在水溶液中280nm摩尔消光指数为66350。总的亲水性平均疏水性指数(grand average of hydropathieity)为-0.207,预测为亲水蛋白。

2.2.2疏水性分析、跨膜区分析、信号肽分析

TMHMM预测GH5-1蛋白,提示并无跨膜区,位于膜外(图9)。Proscale分析疏水性,结果也提示GH5-1为亲水蛋白(图10)。SignalP分析提示GH5-1有信号肽(图11)。

图9 GH5-1蛋白跨膜区分析

图7 GH6-3基因氨基酸组成

图8 GH6-3基因原子组成

图10 GH5-1蛋白亲水性分析图11 GH5-1蛋白信号肽分析

TMHMM预测GH6-3蛋白,提示有跨膜区,位于膜内(图12)。Proscale分析疏水性,结果也提示GH5-1为亲水蛋白(图13)。SignalP分析提示GH6-3无信号肽(图14)。

图12 GH6-3蛋白跨膜区分析

2.2.3 二三级结构与结构域

SMART预测GH5-1蛋白可能存在2个小GTPase结构域(图15),GOR预测GH5-1编码蛋白二级结构中螺旋(H)、折叠(E)、无规则卷(L)的比例分别为16.92%、33.85%、49.23%,以无规则卷为主(图16)。SWISS-MODEL模拟GH5-1三维结构,应用vector NTI suite 软件包D molecule viewer显示蛋白质三维结构(图17)。

图15 GH5-1蛋白结构域

图16 GH5-1编码蛋白二级结构

图13 GH6-3蛋白亲水性分析图14 GH6-3蛋白信号肽分

图17 GH5-1蛋白三维结构预测

SMART预测可能存在1个小GTPase结构域(图18),GOR预测GH6-3编码蛋白二级结构中螺旋(H)、折叠(E)、无规则卷(L)的比例分别为29.59%、16.71%、53.75%,以无规则卷为主(图19)。SWISS-MODEL 模拟GH6-3三维结构,应用vector NTI suite 软件包D molecule viewer显示蛋白质三维结构(图20)。

图18 GH6-3蛋白结构域

图19 GH6-3编码蛋白二级结构

图20 GH6-3蛋白三维结构预测

三、讨论

木质纤维素是地球上资源最丰富,对环境友好,潜力巨大的可再生资源,通过生物方法对纤维素进行降解转化是纤维素利用的一种绿色环保的方法。但在纤维素的生物转化过程中,纤维素酶的使用占成本的比例较高,也是木质纤维素大规模利用的主要瓶颈之一,因此需要快速、高效地筛选纤维素酶特别是来自极端环境生物的纤维素酶,以寻求酶活高,热稳定性好,能适应极端pH环境的纤维素酶。纤维素酶是多组分酶,包

括内切葡聚糖酶,外切葡聚糖酶和β-葡萄糖苷酶,纤维素的水解是这三个组分协同作用的结果。其中内切葡聚糖酶作用于纤维素降解的第一步而尤为关键[3]。

内切葡聚糖酶最早发现于赐牛的消化液中,之后对来源于真菌和细菌的内切葡聚糖酶进行了深入的研究,且发现内切葡聚糖酶多数来源于细菌。内切葡聚糖酶(EC 3. 2.1.4)又称为接甲基纤维素酶、Q酶等,分子量大小在23-146 kDa之间。内切葡聚糖酶主要作用于纤维素的非结晶区,随机水解卩-1,4-糖苷键,将长链的纤维素截短,对纤维素的整体降解起到了重要作用[4].所以利用基因工程的方法,通过内切葡聚糖酶与外切葡聚糖酶或葡聚糖苷酶的复配协同作用,可以有效地降解结晶纤维素[4]在纤维素酶系中,内切葡聚糖酶作为首先作用于纤维素的第一个酶而尤为重要。内切葡聚糖酶作为纤维素酶的组分之一,也是典型的模块化酶。纤维素结合域(CBM)通过增加纤维素酶在底物表面的浓度,进而提高酶的活性[5]。

自发现纤维素酶以来,纤维素酶得到了广泛的认识和挖掘,也受到很多行业的关注。纤维素酶的用途非常广泛,在食品发酵、动物饲料、造纸业、洗涤工业、制药业和污染处理等各个领域均有应用。此外,内切葡聚糖酶在增加果汁产量,啤酒过滤,石油幵采,洗漆剂工业,改善烘焙产品和动物词料的营养质量方面,扮演着十分重要的角色[6]。根据纤维素酶的作用效果,其应用可以分为两类:一,降解植物细胞壁中的纤维素,释放细胞内的糖、蛋白质或其他功能性物质;二,水解纤维素产生葡萄糖。比较成功的例子是纤维素酶在洗潘剂工业中的应用,R本将碱性的纤维素酶加入洗涤剂中制成了高效洗洚粉剂,获得了巨大的经济效益[7]。近几年来,在畜牧业中,纤维素酶作为被添加到饲料添加剂中以提高动物对饲料的利用率,纤维素酶对草料和青贮的预处理及在谷物脱壳等方面也得到了广泛应用,作用效果明显。而在生物质能的开发利用中,用纤维素酶降解转化是木质纤维素是一种绿色环保的方法,已得到了广泛的认可,但由于纤维素酶的使用成本较高,还有待新的研究发现[8]。

参考文献

[1]朱富春.食用菌链孢霉的发生特点、原因与综合防治方法[J].食药用菌,2013,02:126-128.

[2]林娓娓,王瑞娟,李玉,周峰,于海龙,郭倩.食用菌生产中链孢霉生物防治研究[A].中国菌物学会(MycologicalSocietyofChina).2010年中国菌物学会学术年会论文摘要集[C].中国菌物学会(MycologicalSocietyofChina):,2010:2.

[3]石润润. 内切葡聚糖酶的酶库构建和酶学特性研究[D].华东理工大学,2013.

[4]乔宇,毛爰军,何永志.里氏木霉内切p-葡聚糖酶II基因在毕赤酵母中的表达及酶学性质研究.菌物学报.2004, 23(3): 388-396

[5]Gashaw M, Rajni HK. Bo M. Fusion of carbohydrate binding modules from Thermotoga necipolitcma with a family 10 xylanase from Bacillus halodurcms S7. Extremophiles.2007. 11(1): 169-177

[6]Parry NJ, Beever DE,Owen E,Nerinckx W, Claeyssens M, Van Beeumen J, Bhat MK. Biochemical characterization and mode of action of a thermostable endoglucanase purified from Thermoascus aurantiacus. Archives of Biochemistry and Biophysics. 2002,404(2): 243-253

[7]王亮,尚会建,杨立彦,郑学明.纤维素酶的应用研究进展.河北工业科技.2010,27(6):441-443

[8]石润润. 内切葡聚糖酶的酶库构建和酶学特性研究[D].华东理工大学,2013.

相关主题
相关文档
最新文档