盐芥ThNHX1基因的生物信息学分析
第1期参考文献:
[1]伍昌胜,黄亚东,边银丙.黑木耳不同交配型的单倍体菌株
RAPD /BSA 分析[J ].华中农业大学学报,2004,23(1):131-134.[2]宋小亚,肖
扬,边丙银.ISSR 分子标记技术在黑木耳单核体
遗传分析中的应用[J ].菌物学报,2007,26(4):528-533.[3]马富英,罗信昌.28SrDNA PCR-RFLP 分析在侧耳属系统发育研究中的应用[J ].华中农业大学学报,2002,21(6):201-205.
[4]
ZHAO W G ,MIAO X ,ZANG B.Construction of fingerprint-ing and genetic diversity of mulberry cultivars in China by
ISSR markers [J ].Acta Genetica Sinica ,2006,33(9):851-860.[5]
MARYAM S ,SRIVASTAVA P S.Analysis of genetic diversi-ty through AFLP ,SAMPL ,ISSR and RAPD markers in Tribulus terrestris ,a medicinal herb [J ].Plant Cell ,2008,27:519-528.[6]
HE X H ,LI Y Z ,TANG Z P.Genetic analysis of 23man-go cultivar collection in guangxi province revealed by ISSR [J ].Molecular Plant Breeding ,2005,3(6):829-834.
(责任编辑王珞)
第48卷第1期2009
年
1
月湖北农业科学
H ubei A gricultural S ciences
Vol.48No.1Jan .,2009
收稿日期:2008-10-08
基金项目:南京晓庄学院科研项目(2008NXY10)
作者简介:周梅仙(1960-),女,讲师,江苏宜兴人,(电话)025-86178273(电子信箱)zhoumeixian6890@https://www.360docs.net/doc/32318499.html, 。
盐芥(Thellungiella halophila )是一种盐生植物,与拟南芥的遗传特性、生活特性相似,均具有植株矮小、自花传粉、种子多、生长周期短、基因组小、易于转化的特点[1]。盐芥具有很强的抗低温、抗干旱和耐盐的能力,它可以在500mmol NaCl 中生长[1]。现在甜土植物拟南芥全基因组序列已经完成,而盐芥
EST 序列与拟南芥基因序列有90%的同源性[2]。盐
芥在cDNA 水平和氨基酸水平上与拟南芥分别有
90%和95%的同源性,因此,可以方便地将拟南芥的
很多信息(基因、蛋白质数据库以及突变体系等)移至盐芥耐盐性的分子生物学研究内。
高盐环境是影响植物生长和发育的主要环境因子之一。为了能够适应高盐环境,植物在进化过程中,演化出三种机制来阻止过多的Na +在胞液中
盐芥ThNHX1基因的生物信息学分析
周梅仙
(南京晓庄学院生命科学系,南京
211171)
摘要:利用相关的生物信息学软件分析了盐芥ThNHX1基因编码蛋白的氨基酸组成、等电点、结构域、特征位点、二级结构等蛋白质性质,并与3种甜土植物蛋白做了对比。结果表明,盐芥ThNHX1基因编码蛋白的分子式为C 2790H 4328N 690O 760S 25,属于稳定蛋白;二级结构主要是以无规则卷曲和α-螺旋为主。在所分析的指标中,盐芥ThNHX1与3种甜土植物的NHX1相比,存在着一定的差异。关键词:盐芥;ThNHX1基因;生物信息学;甜土植物中图分类号:Q949.748.3;Q753
文献标识码:A
文章编号:0439-8114(2009)01-0019-04
Bioinformatic Analysis of ThNHX1Gene from Thellungiella halophila
ZH OU Mei-xian
(Department of Life Science ,Nanjing Xiaozhuang College ,Nanjing 211171,China )
Abstract :The character istics of ThNHX1gene and its protein such as the constitution of amino acid ,equipotential ,do-main ,characteristic spots ,secondary structure in Thellungiella halophila were analyzed by a series of bioinformatics software.The results showed that this protein was stable ,and the formula was C 2790H 4328N 690O 760S 25.The secondary structure was primari-ly composed of random coil and alpha helix.There some difference between ThNHX1in Thellungiella halophila and three glycophytes in salt-sensitive plants.
Key words :Thellungiella halophila ;ThNHX1gene ;bioinformatics ;glycophytes
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
湖北农业科学2009年
的积累[1,3,4],即Na+的外排、Na+的区域化和植物细胞对Na+的选择性吸收。其中Na+的外排和液泡内Na+区域化主要依赖于质膜和液泡膜上的Na+/H+逆向转运蛋白来完成。Na+/H+逆向转运蛋白在动物、植物、藻类、酵母和细菌中都有发现。目前,已经克隆的植物液泡膜Na+/H+逆向转运蛋白基因有拟南芥(Arabidopsis thaliana)的AtNHX1[5]、碱蓬(Suaeda maritima)的SsNHX1[6]、玉米(Zea mays)的ZmNHX[7]等。因此,盐芥是一种很有前景的植物耐盐模式系统,现在已被很多实验室用于植物抗逆生理生化机制的研究。我们利用生物信息学的方法研究ThN-HX1的一级结构、二级结构并与拟南芥ThNHX1基因的序列进行了比对,从而对该基因的理化性质、结构特征和功能等进行预测和分析,以期为ThN-HX1基因的深人研究提供参考和理论依据。
1材料与方法
数据资料来源于National Center for Biotech-nology Information(NCBI)核酸及蛋白质数据库中已注册的NHX1的核酸序列及其对应的氨基酸序列,包括盐芥(Thellungiella halophila,DQ995339)、拟南芥(Arabidopsis thaliana,NM_122597)、水稻(Oryza sativa品种Japonica cultivar-group,NM_001067106)、小麦(Triticum aestivum,AY040245)。利用生物信息学数据库和互联网上的软件进行分析,用Protparam[8]分析NHX1编码蛋白的氨基酸序列组成、分子量、等电点等理化性质;在NCBI[9]对其保守结构域进行分析;用GOR4[10]预测其二级结构;用Protfun[11,12]分析蛋白质功能。所用主要分析软件的网址如下:Protparam:http://www.expasy.ch/tools/protparam.html.
GOR4:http://npsa-pbil.ibcp.fr:80/cgi-bin/npsa_automat.pl?page=npsa_gor4.html.
Protfun:http://www.cbs.dtu.dk/services/ProtFun/
NCBI:http://www.ncbi.nlm.nih.gov.
2结果与分析
2.1盐芥ThNHX1基因编码的氨基酸序列的分析该cDNA全长2045bp。通过NCBI网站的ORF Finder工具分析,推测该基因包括1638bp的开放读码框(open reading frame,ORF),42个碱基的5′非翻译区(5′-untranslated region or5′-UTR),365个碱基的3′非翻译区(3′-untranslated region or 3′-UTR),编码1个545个氨基酸的多肽。
在NCBI对其保守结构域分析的结果如图1所示。NhaP结构域是Na+/H+和K+/H+无机离子逆向转运蛋白的保守结构域;Na_H_Exchanger是Na+/H+交换体家族。Na+/H+逆向转运蛋白是维持细胞所需物质交换的最适pH最关键的逆向转运蛋白。逆向转运蛋白的分子机理目前还不太清楚。这些逆向转运蛋白在氨基末端含有10~12个跨膜区域,在羧基末端有一个大的细胞质区域。M3~M12跨膜区域与家族其他成员是一样的。M6和M7区域是高度保守的。所以,推测这些区域参与了钠离子和氢离子的转运。KefB是细胞膜一部分,是K+转运系统。PRK05326是K+/H+逆向转运蛋白。COG3263是NhaP的一种类型,该逆向转运蛋白具有一个独特的C末端区域。
2.2盐芥ThNHX1基因编码蛋白的理化性质用ProtParam分析软件对盐芥ThNHX1编码蛋白的理化性质进行预测,推测该蛋白的分子式为C2790H4328N690O760S25,分子量是60498.7Da,等电点PI 6.94;理论推导其半衰期分别为:30h(体外,哺乳动物的网织红细胞内);20h(体内,酵母细胞内);10h (体内,大肠杆菌)。不稳定参数是34.82,属于稳定蛋白。该基因编码的氨基酸如图2所示:含Leu(L)最多,占13.2%;不含Asx(B)、Glx(Z)、Xaa(X)。总的带正电残基(Arg+Lys)为40,负电残基(Asp+Glu)为41。总的亲水性平均系数为0.471,预测该蛋白属于疏水性蛋白。
表1显示,盐芥ThNHX1的特殊氨基酸组成与3种甜土植物的比较表明,除小麦以外,不同植物NHX1的分子量、酸性和碱性氨基酸的比例、极性氨基酸的比例、疏水性氨基酸的比例基本一致;含量最丰富的氨基酸基本均为Leu、Ser、Phe、Val、Thr;均属稳定类蛋白质。不同植物NHX1理论等电点PI 存在一定的差异,盐芥与拟南芥NHX1的PI比较图1盐芥ThNHX1基因结构域1100200300400500545图2盐芥ThNHX1基因编码氨基酸组成
14.0
12.0
10.0
8.0
6.0
4.0
2.0
0.0
百
分
比
/
%
AlaArgAsnAspCysGlnGluGlyHisIleLeuLysMetPheProSerThrTrpTyrVal
氨基酸
3.5%
7.0%
3.7%
4.8%
1.1%
2.0%
2.8%
6.2%
2.8%
6.6%
13.2%
3.9%
3.5%
8.3%
3.5%
8.6%
7.6%
1.1%
2.6%
7.7%
20
第1期
接近,分别为6.94和6.73;水稻和小麦NHX1的PI 比较接近,分别为8.67和8.13。盐芥与拟南芥NHX1在各指数上都比较接近,这与它们之间的亲缘关系相近是吻合的。
2.3盐芥ThNHX1蛋白的二级结构
应用GOR法分析盐芥ThNHX1蛋白的二级结构,结果见图3。分析表明,在该氨基酸序列中,共有α-螺旋(Alpha helix)176处,占总二级结构的32.29%;延伸链(Extended strand)126处,占总二级结构的23.12%;无规则卷曲(Random coil)243处,占总二级结构的44.59%。
通过物种间的比较发现,盐芥ThNHX1的二级结构与其他3个物种的存在一定的差异,但差异并不大(表2)。在盐芥ThNHX1蛋白中,α-螺旋分别比拟南芥和小麦多24和25个,比水稻少7个;延伸链比小麦和水稻分别多9和2个,比拟南芥少6个;无规则卷曲比水稻多15个,比拟南芥、小麦分别少11、35个。说明盐芥ThNHX1蛋白在空间结构上与拟南芥、水稻、小麦相比发生了一定的变异。
2.4盐芥ThNHX1蛋白质的结构分析和功能分类ProtFun预测ThNHX1基因编码的蛋白含有2个N-糖基化位点(53,296);2个O-糖基化位点(535,543);24个磷酸化位点(6,17,19,21,77,252,336,338,340,348,378,460,478,493,515,533,253,304,305,343,465,535,152,292);12个跨膜位点(12putative TM helices at positions,24~46,55~72,87~104,116~138,153~172,179~201,221~243,270~292,307~324,345~367,387~406,419~441)。
ProtFun预测ThNHX1蛋白的功能分类如图4箭头所示,推测该蛋白的功能可能是转运结合体(Transport and binding),进一步预测该基因编码蛋白是转运蛋白(Transporter)。
3小结与讨论
本文利用ProtParam对盐芥ThNHX1编码蛋白的理化性质进行了预测,推测该蛋白的分子式为C2790H4328N690O760S25,分子量是60498.7Da,等电点PI 6.94。盐芥ThNHX1的特殊氨基酸组成与3种甜土植物的比较表明,大部分指数基本一致。盐芥与拟南芥NHX1在各指数上都比较接近,这与它们之间的亲缘关系相近是吻合的。对其保守结构域的分析表明,盐芥ThNHX1具有NhaP结构域,NhaP结构域是Na+/H+和K+/H+无机离子逆向转运蛋白的保守结构域。
应用GOR法分析盐芥ThNHX1的二级结构结
图3ThNHX1蛋白的二级结构
表2不同植物NHX1基因的二级结构分析
α-螺旋
延伸链
无规则卷曲
总数
个
176
126
243
比例
%
32.29
23.12
44.59
总数
个
152
132
254
比例
%
28.25
24.54
47.21
总数
个
183
124
228
比例
%
34.21
23.18
42.62
总数
个
151
117
278
比例
%
27.66
21.43
50.92
盐芥拟南芥水稻小麦
表1不同植物NHX1基因的核酸序列及对应氨基酸序列的组成成分、理化性质分析
项目
盐芥拟南芥水稻小麦
GeneBank
登录号
DQ995339
NM_122597
NM_001067106
AY040245
开放阅
读框
bp
1638
1617
1608
1641
编码的
氨基酸
总数
545
538
535
546
分子量
Da
60498.7
59513.4
59070.3
59704.3
理论等
电点
PI
6.94
6.73
8.67
8.13
含量最丰富的氨基酸/%
Leu13.2
Leu13.2
Leu12.9
Leu13.4
Ser8.6
Ser8.9
Ser9.0
Ile8.6
Phe8.3
Phe7.8
Phe8.0
Val8.4
Val7.7
Val7.8
Val7.5
Phe8.1
Thr7.3
Thr7.6
Thr7.5
Ser7.9
碱性氨
基酸比例
%
10.2
9.6
9.8
8.9
酸性氨
基酸比例
%
7.6%
7.2
6.4
6.6
疏水性氨
基酸比例
%
50.9
50.1
51.4
53.5
极性氨
基酸比例
%
43.1
42.1
41.3
38.8
34.82
32.71
35.58
31.03
属于稳定蛋白
属于稳定蛋白
属于稳定蛋白
属于稳定蛋白
蛋白质不稳
定性指数/%
周梅仙:盐芥ThNHX1基因的生物信息学分析21
湖北农业科学2009年
图4ThNHX1蛋白的功能分类
(责任编辑王珞)
果表明,ThNHX1的二级结构以无规则卷曲和α-螺旋为主。通过物种间比较发现,盐芥ThNHX1二级结构与其他3个物种的有一定的差异,说明盐芥
ThNHX1蛋白在空间结构上与拟南芥、水稻、小麦的
相比发生了一定的变异。
采用蛋白质序列进行后续分析十分重要,即使两条DNA 序列之间具有67%的相关性,但是在蛋白质水平上仍可获得100%的一致性。显然,使用蛋白质序列进行后续分析更能够发现该研究对象的生物学意义,因为蛋白质水平之间具有25%的同源性就可提示其功能的相似性,但是在DNA 水平则需要40%以上的一致性[10]。应用生物信息学方法对已知NHX1序列进行比对、分析,从而对其结构和功能进行推断和预测,这可以为我们在开展试验研究前提供尽可能多的信息,从而为选择合适的试验方法提供理论参考,为进一步对该基因的功能研究
提供线索。
参考文献:
[1]JIAN-KANG ZHU.Plant salt tolerance [J ].T rends in Plant Science ,2001,6(2):66-71.
[2]
TAJI T ,SEKI M ,SATOU M ,et al.Comparative genomics in salt tolerance between Arabidopsis and Arabidopsis-related halophyte salt cress using Arabidopsis microarray [J ].Plant Physiol.,2004,135:1697-1709.
[3]BLUMWALD E ,AHARON G S.,APSE M P .Sodium transport
in
plant
cells
[J ].
Biochim Biophys Acta ,
2000,1465:140-151.[4]
SHI H Z ,QUINTERO F J ,PARDO J M ,et al.The putative plasma membrane Na +/H +antiporter SOS1controls long-dis-tance Na +transport in plants [J ].The Plant Cell ,2002,14:465-477.
[5]GAXIOLA R A ,RAO R.,SHERMAN A ,et al.The Ara -biopsis thaliana proton transporters ,AtNhx1and Avp1,can function in cation detoxification in yeast [J ].Proc Natl Acad Sci USA ,1999,6:1480-1485.
[6]MA X L ,ZHANG Q ,SHI H Z ,et al.Molecular cloning and different expression of a vaculor Na +/H +antiporter gene in Suaeda salsa under salt stress [J ].Biologa Plantarum ,2004,48:219-225.
[7]ZORB C ,NOLL A ,KARL S ,et al.Molecular characteriza-tion of Na +/H +antiporters (ZmNHX )of maize (Zea mays L.)and their expression under salt stress [J ].Journal of Plant P hysiology ,2005,162:55-66.
[8]GASTEIGER E.,HOOGLAND C ,GATTIKER A ,et al.Pro-tein Identification and Analysis Tools on the ExPASy Server [A ].JOHN M ,WALKER O.The Proteomics Protocols
Handbook [M ].Humana Press ,2005.571-607.
[9]
MARCHLER-BAUER A ,BRYANT S H.CD-Search :Protein domain annotations on the fly [J ].Nucleic Acids Res ,2004,32(W ):327-331.
[10]GARNIER J ,GIBRAT J F ,ROBSON B.GOR secondary structure prediction method version IV Methods in Enzymolo-gy [J ].R F Doolittle Ed ,1996,266:540-553.
[11]JENSEN L J ,GUPTA R ,BLOM N ,et al.Ab initio pre-diction of human orphan protein function from post-transla-tional modifications and localization features [J ].J Mol Biol ,2002,319:1257-1265.
[12]JENSEN L J ,ST 覸RFELDT H H ,BORUNAK S.P rediction of human protein function according to gene ontology cate-gories [J ].Bioinformatics ,2003,19:635-642.
22