拟南芥及水稻转录因子MADS密码子的偏好性比较

拟南芥及水稻转录因子MADS密码子的偏好性比较
拟南芥及水稻转录因子MADS密码子的偏好性比较

浙江大学学报(农业与生命科学版) 

31(5):513~517,2005Journal of Zhejiang U niversity (Agric 1&Life Sci 1)

文章编号:100829209(2005)0520513205

收稿日期:2005201229

基金项目:国家自然科学基金(39870421);浙江省重点研究项目基金(2003C22007);浙江省“04206"工程水稻品种改良项目.

作者简介:李娟(1979—

),女,山东省济南人,从事基因组学方面的研究.通讯作者:薛庆中,男,教授,博士生导师,从事植物遗传育种,基因组学方面的研究.E 2mail :qzhxue @hot https://www.360docs.net/doc/f116319796.html,.

拟南芥及水稻转录因子MADS 密码子的偏好性比较

李娟1,薛庆中1,2

(1.浙江大学沃森基因组科学院,浙江杭州310008;21浙江大学农学系,浙江杭州310029)

摘 要:大多数与花发育相关的功能基因属于MADS 基因家族.应用CodonW 的因子分析表明,拟南芥MADS 转录因子家族偏好使用A 、U 结尾的密码子,而水稻MADS 转录因子家族偏好使用G 、C 结尾的密码子.同时通过氨基酸序列的多重比对,表明密码子偏好性与氨基酸序列及二级结构之间存在关联,证实了不同的密码子编码的氨基酸位于蛋白质二级结构的特定位置.关 键 词:水稻;拟南芥;密码子偏性;转录因子;AU 含量中图分类号:S511 文献标识码:A

L I J uan 1,XU E Qing 2zhong 1,2(1.J ones D.W atson I nstitute of Genome Science ,Zhej iang Universit y ,H angz hou 310008,China ;2.Dept of A g ronom y ,Zhej iang Universit y ,H angz hou 310029,China )

Comparison of MADS transcriptional factor on codon bias in arabidopsis and rice.Journal of Zhejiang University (Agric 1&Life Sci 1),2005,31(5):5132517

Abstract :Most of the flower development 2related f unctional genes are belong to MADS transcription factors families.Through the factorial correspondence analysis (FCA )of CodonW ,we can find out that MADS transcriptional factors in Arabidopsis prefer to A 2ending and U 2ending codons ,while that in rice prefer to G 2ending and C 2ending codons.By using the ClustalX for searching the relation between the bias of the codons and second structure of the MADS ,we confirm that the amino acids coding by different codons are on the special position of the second structure of the proteins.K ey w ords :rice ;arabidopsis ;codon usage bias ;transcriptional factors ;AU content

转录因子是指那些专一性地结合于DNA

特定序列上,能激活或/和抑制其它基因转录的蛋白质.根据DNA 结合功能域结构,他们主要分为:b HL H (碱基性螺旋2环2螺旋)、bZIP (碱性亮氨酸拉链)、homeodomain 蛋白、MADS 2box 蛋白、zinc 2finger 蛋白、Myb 蛋白、A P2/EREBP 蛋白、HSF 蛋白、HM G 蛋白和A T hook 蛋白等[1]. 植物MADS 基因是一个序列特异的调节

基因家族.和其他真核生物转录因子一样

MADS 蛋白由MADS (M )、Intervening (I )、Keratin 2like (K )和C 2terminal (C )等结构域组成,属于结构域蛋白.大多数花发育相关功能基因属于MADS 因子家族[2,3],被子植物的大部分MADS 基因参与花发育的调控[4].不仅在花器官原基分化期表达,在植物其它部位也有表达,且某些MADS 2box 在烟草花粉发育全过程中持续表达[5].同时,MADS 2box 基因家族还

浙江大学学报(农业与生命科学版)

可能与雄性不育和育性恢复有关[6].因此, MADS2box基因对于高等植物花的发育具有重要意义.

植物基因中不同密码子的出现频率明显不同,同一种氨基酸的不同密码子比率也有差异.禾本科作物基因中同义密码子使用偏性的形成与转录相关突变和翻译水平上的选择有关[7].密码子的使用还与基因编码结构和功能及基因表达有密切的联系[8].但有关转录因子密码子使用及其与基因功能的关系却鲜有报道.本文分别对拟南芥和水稻MADS核苷酸CDS序列密码子偏性及其ORF产物水平进行比较分析,并对MADS的氨基酸序列进行多重比对,试图阐明MADS转录因子家族的密码子用法特点,为进一步研究密码子偏性与氨基酸序列的关系提供信息.

1 材料与方法

1.1 序列数据

由(https://www.360docs.net/doc/f116319796.html,)网站下载得到拟南芥转录因子MADS的CDS序列107条(2004年12月9日).由(http://ricetfdb.bio. uni2potsdam.de/)网站下载得到水稻转录因子MADS的CDS序列68条(2004年12月12日).为计算密码子的平均相对性,及分析数据的精确性,我们利用PERL程序在这两个数据中随机提取注释较好的编码序列进行分析.然后用DNAstar中的Editseq软件对拟南芥和水稻的CDS序列进行整理,寻找ORF序列,按照Editseq的参数,翻译成氨基酸序列,统计各个MADS的CDS序列中A、U、G、C含量.

1.2 密码子使用频率的计算

为避免序列中不同氨基酸含量所造成的偏差,按照Chiapello的方法计算59个密码子中的每种同义密码子的相对使用频率.若某氨基酸在DNA序列中出现N次,并且两个同义密码子1和2分别出现A和B次,则其相对频率分别是A/N和B/N.

1.3 因子相关性分析(FCA)

为检验序列之间密码子使用上的不同,用CodonW软件对随机的编码序列FCA分析产生密码子偏性使用的相关数据.利用行列所建立的图形同时对基因及转录因子两组数据进行分析,比较他们在多维空间的位置.

用PERL程序对所得数据分类整理,并用Excel对整理后的数据作散点图分析.分别从拟南芥和水稻Edit seq翻译得到的氨基酸序列中随机取得10条序列,用ClustalX程序做多序列比对.

2 结果与分析

2.1 拟南芥和水稻中MADS转录因子的密码子碱基组成

拟南芥和水稻转录因子MADS的编码序列中密码子第1、第2和第3各个位点的AU 含量列于表1.由表1可见,在拟南芥中,A、U 含量顺序由大到小分别为第2(6514%)、第3 (5513%)和第1(5119%).而水稻中,却为第2 (5815%)、第1(4113%)和第3(2915%).这两种作物中,密码子第2位A、U含量均为最高,所不同的是A、U最低含量,拟南芥出现在第1位置,而水稻中却是第3位置.同时从总体上比较,拟南芥MADS转录因子家族A、U平均含量(5715%)高于水稻(4311%).

由表2可知,水稻的MADS转录因子较偏好使用G、C结尾的密码子,如:GCC、U GC、GA G、AUC、CUC、CC G和GU G等.拟南芥的MADS转录因子较偏好使用A、U结尾的密码

表1 拟南芥和水稻中MADS转录因子密码子位点的AU含量

Table1 AU composition at each position of codons of arabidopsis and rice MADS transcriptional factors 生物序列数第1位点第2位点第3位点平均Arabidopsis1075119%6514%5513%57140% Rice684113%5815%2915%43108%

注:密码子第1、第2和第3位置的A、U含量是由PERL程序计算得出.而总体上A、U含量是由DANstar统计得到.

415第31卷 

李娟,薛庆中:拟南芥及水稻转录因子MADS密码子的偏好性比较

表2 拟南芥和水稻MADS转录因子中59个退化密码子(degerated codons)的平均相对频率Table2 Average relative frequence of t he59degerated codons for arabidopsis and rice MADS transcriptional factors 氨基酸密码子水稻MADS拟南芥MADS氨基酸密码子水稻MADS拟南芥MADS

A GCA0115701257N AAU013601496

A GCC0135201172P CCA0125501305

A GCG0132201164P CCC0121901107

A GCU0116901408P CCG0133701173

C U GC0171801389P CCU011901414

C U GU0128201611Q CAA0132501609

D GAC0159601307Q CA G0167501391

D GAU0140401693R CGA010*******

E GAA0126301471R CGC0126901059

E GA G0173701529R CGG01210106

F UUU0120801551R CGU010*******

F UUC0179201449R A GA0110601358

G GGA011430133R A GG0130501259

G GGC0146301123S UCA0112901181

G GGG0124701169S UCC0127301142

G GGU0114701378S UCG011201103

H CAC0158901318S UCU0111401296

H CAU0141101682S A GC01280113

I AUA0120701228S A GU010*******

I AUC0153101382T ACA0119201279

I AUU012620139T ACC0133501231

K AAA0117801426T ACG0128601169 K AA G0182201574T ACU0118601321 L CU G0129401108V GUA010******* L CUU0113601266V GUC0136701226 L UUA010*******V GU G0141901267 L UU G0111801207V GUU0115701382 L CUA010*******Y UAC0171501441 L CUC0133801187Y UAU0128501559 N AAC016401504

注:表中黑体字表示使用频率最高的密码子.

子,如:GCU、U GU、GAU、GGU、A GA、和CAA等.不过,拟南芥和水稻中也有偏好性一致的氨基酸,即:谷氨酸、赖氨酸和天冬氨酸,他们分别偏好使用GA G、AA G及AAC.

以MADS家族59个密码子第3位的A、C、G、U的平均相对频率作比较,水稻以C结尾的密码子出现次数最多(12个),占6617%,其次是G(6个)占3313%,未出现A和U结尾的密码子.而拟南芥MADS家族结尾的密码子主要是U为13个,占7212%.其余3种结尾的密码子A、G、C出现概率相差不大,分别是2、2、1.由此可见,双子叶植物拟南芥和单子叶植物水稻的MADS转录因子对密码子的选择有很大的差别.

212 拟南芥和水稻MADS转录因子密码子的使用

MADS转录因子FCA1,2两轴的分析结果表明,水稻MADS转录因子中,A、U结尾的密码子与G、C结尾的密码子明显分开,G、C结尾密码子距离中心较近,G、C含量相对较高(图1).而拟南芥MADS转录因子中,A、U结尾的密码子几乎都集中在中心附近,G、C结尾密码子却较为分散.表明较偏好使用A、U结尾的密码子.

515

 第5期

浙江大学学报(农业与生命科学版

)

图1 拟南芥和水稻MADS 转录因子的FCA 分析

Fig.1 FCA analysis of MADS transcriptional factors

213 拟南芥和水稻MADS 转录因子结构域的

序列比对

图2结果显示,拟南芥和水稻MADS 结构域多位于N 端,具有一致的氨基酸序列为M 2R (2)7I (2)5R (2)2T (2)2KRR 2G L 2KA (2)5LC (图2).其中最保守的是两个强碱性残基(K 、R )和一个疏水性残基(L ),且有3个MADS 磷酸化位

点,即丝氨酸残基(S ),它们在20%~35%(427/20)序列中被其它残基取代.而在MADS 蛋白的下游I 结构域有31~35个氨基酸,其保守性较差.K 结构域虽然是植物转录因子的所特有结构,在动物和真菌中缺乏,但是其保守性也较差.C 结构域位于MADS 的C 端,不仅长度变化很大,且保守性也极差(本图未显示)

.

图2 水稻和拟南芥MADS 氨基酸多序列联配

Fig.2 Alignment of t he deduced amino acid sequences of rice and arabidopsis MADS

3 讨 论

业已报道,G +C 含量在其同义密码子使

用偏性的产生方面占有较大的优势,其密码子使用偏性产生主要与转录水平上的突变有关[10].MADS 属于拟南芥和水稻转录因子家族中较大的一个家族.对MADS 转录因子家族CDS 序列的CodonW 与Edit seq 分析发现,拟南芥中偏好使用以A 、U 结尾的密码子,且在整个CDS 序列中A +U 含量也远远大于G +

C.相反,水稻中A +U 含量明显低于G +C.由

此推测,基因编码区碱基组分(G +C )含量似乎对同义密码子的偏性发生影响.这一点也存在于其它生物中,但影响程度不同,如:普通小麦、大麦、玉米等禾本科植物中G +C 含量与密码子偏性指标呈高度正相关;而烟草却呈显著负相关,相关系数较小. 同义密码子的使用究竟是由突变偏性或翻译选择产生,还是两者共同作用产生,迄今结论不甚一致[11].笔者对MADS 随机序列的翻译

6

15第31卷 

李娟,薛庆中:拟南芥及水稻转录因子MADS密码子的偏好性比较

机制研究发现,拟南芥和水稻的ORF序列的密码子使用不同,但这些序列翻译后保守结构域的氨基酸组成仍基本上一致,暗示在MADS 中与翻译选择有一定的关联.这与Wong等的结果吻合[7],他指出禾本科作物在5π2U TR和编码区连接的地方,存在着G/C梯度、密码子偏性及氨基酸使用偏性.笔者还发现,拟南芥和水稻谷氨酸、赖氨酸及天冬氨酸都偏好使用相同的密码子,暗示不同的氨基酸组成对密码子的使用也有一定的影响.

mRNA中稀有密码子的使用与蛋白质结构域的连接区和规则二级结构单元连接区有关,翻译速率在连接区会降低[12],密码子使用可能对蛋白质二级结构的形成有影响[13~15]. Oresic[16]等发现,AAC编码的Asn一般位于β2折叠的C末端,而GAU编码的Asp多数位于α2螺旋的N端.基因密码子的使用与基因表达的生理功能有着密切的联系[8,9].Adxdubei[13,14]发现L EU、VAL、G L Y、PRO、G L U、P H E、IL E、SER、T HR等9种氨基酸的同义密码子之间在二级结构的分布上有显著差异,从而得出简并密码子的第三位带有蛋白质三维结构信息的结论.不同三级结构蛋白质的编码基因分成不同的类,而具有相似三级结构蛋白的编码基因则大致聚集在同一类中,从而证明基因密码子偏性与蛋白质三级结构间具有密切的相关性[17].虽然本文对MADS的随机序列做了多重序列比对,每条MADS的氨基酸序列都是以A T G 编码的Met开头,但是关于MADS基因密码子偏好使用对其MADS保守结构域的影响及其蛋白质所携带信息的影响还有待进一步研究.

R eferences:

[1] Schwechheimer C,Bevan MW.The regulation of

transcription factor activity in plant s[J].T rends Plant

Sci,1998,3:3782382.

[2] Coen E S,Meyeromitz E M.The war of t he whorl:

genetic interaction cont rolling flower development[J].

N ature,1991,353:31237.

[3] Meyerowitz Schnable P S,Wise R P.The molecular

basis of cytoplasmic male sterility and fertility

restoration[J].T rends in Plant Science,1998,31:

752180.

[4] Riechmann J L,Meyerowitz E M.MADA domain

proteins in plant development[J].Biol Chem,1997,

378:107921101.

[5] XU Shu2hua(徐树华),Cytology observe on uni2

nucleate and bi2nucleate stage ant hers development s in

hl2china15rice[J].Journal of Wuh an U niversity

(N atural Science Edition)(武汉大学学报自然科学版),

1979(2):79284.(in Chinese)

[6] SUN Qing2ping,WAN G Li,YE Ping,et al(孙清萍,

汪莉,易平,等),Expression analysis of mads2box

gene family on uni2nucleate and bi2nucleate stage

ant hers on hl2cms system[J].Journal of Wuh an

Botanical R esearch(武汉植物学研究),2002,20(5):

3252328.(in Chinese)

[7] Wong G K S,Wang J,Tao L,et https://www.360docs.net/doc/f116319796.html,positional

gradient s in gramineae genes[J].G enome R es,2002,12:

8512856.

[8] Helene C,Frederique L,Michel C,et al.Codon usage

and gene function are related in sequences of

A rabi dopsis t haliana[J].G ene,1998,209:

GC12GC38.

[9] Richard J,Lin K,Tan T.A functional significance for

codon t hird basers[J].G ene,2000,245:2912298. [10] Liu Q P,Tan J,Xue Q Z.Synonymous codon usage

bias in rice cultivar93211(Ory z a sativa L.ssp.indica)

[J].Acta G enetica Sinica,2003,30(4):3352340. [11] Sharp P M,Stenico M,Peden J F,et al.Codon usage:

mutational bias,translational selection,or bot h?[J].

Biochem Soc T rans,1993,21:8352841.

[12] Tngnaraj T and Azros P,Ribesome2mediated

transcriptional factor and protein domain organization

[J],Pration Science,1996,5:159421612.

[13] Adxdubei,I A,Adzhubei,A A.Krasheninoikov,I

A,et al.Non2random usage of degenerate codons id

related to protein t hree2dimensional structure[J].

FEBS Lett,1996,399:78282.

[14] Adxdubei I A,Adxbubei A A.ISSD version 2.0:

taxonomic range extended[J].Nucleic Acids R es,

1999,27:2682271.

[15] Xie T,Ding D F.The relationship between

synonymous codon usage and protein structure[J].

FEBS Lett,1998,434:91296.

[16] Oresic M,Shalloway D,Specific correlations between

relative synonymous codon usage and protein secondary

structure[J].Journal of Moiecular Riology,1998,281:

31248.

[17] GU Wan2jun,MA Jian2ming,ZHOU Tong,et al(顾

万君,马建民,周童,等).Codon usage in genes coding

for proteins wit h different tertiary structures[J].Acta

Biophysica Sinica(生物物理学报),2002,3(18):80286.

(in Chinese)

715

 第5期

转录调节位点和转录因子数据库介绍_张光亚

10生物学通报2005年第40卷第11期 2003年即Watson和Crick发表DNA双螺旋结构50周年,宣布了人类基因组计划的完成,与此同时,其他许多生物的基因组计划已完成或在进行中,在此过程中产生的大量数据库对科学研究的深远影响是以前任何人未曾预料到的。然而遗憾的是,许多生物学家、化学家和物理学家对这些数据库的使用甚至去何处寻找这些数据库都只有一个比较模糊的概念。 基因转录是遗传信息传递过程中第一个具有高度选择性的环节,近20年来对基因转录调节的研究一直是基因分子生物学的研究中心和热点,因此亦产生了大量很有价值的数据库资源,对这些数据库的了解将为进一步研究带来极大便利,本文对其中一些数据库进行简要介绍。 1DBTSS DBTSS(DataBaseofTranscriptionalStartSites)由东京大学人类基因组中心维护,网址:http://dbtss.hgc.jp。最初该数据库收集用实验方法得到的人类基因的TSS(TranscriptionalStartSites,转录起始位点)数据。对转录起始位点(TSS)的确切了解具有非常重要的意义,可更准确的预测翻译起始位点;可用于搜索决定TSS的核苷酸序列,而且可更精确地分析上游调控区域(启动子)。自2002年发布第一版以来已作了多次更新。目前包含的克隆数为190964个,含盖了11234个基因,在SNP数据库中显示了人类基因中的SNP位点,而且现在含包含了鼠等其他生物的相关数据。DBTSS最新的版本为3.0。 在该最新的版本中,还新增了人和鼠可能同源的启动子,目前可以显示3324个基因的启动子,通过本地的比对软件LALIGN可以图的形式显示相似的序列元件。另一个新的功能是可进行与已知转录因子结合位点相似的部位的定位,这些存贮在TRANSFAC(http://transfac.gbf.de/TRANSFAC/index.html)数据库中,免费用于研究,但TRANSFAC专业版是商业版本。 DBTSS对匿名登录的用户是免费的,该网站要求用户在使用前注册,用户注册后即可使用。主页分为2个区域,一个介绍网站的部分信息和用户注册,另一区域为用户操作区,该区约分为10个部分,可分别进行物种和数据库的选择、BLAST、SNP以及TF(转录因子)结合部位搜索等部分。后者的使用可以见网页中的Help部分,里面有比较详细的介绍。DBTSS还提供了丰富的与其他相关网站的链接,如上文提到的TRANSFAC数据库、真核生物启动子数据库(Eukaryot-icPromoterDatabase,http://www.epd.isb-sib.ch/)以及人类和其他生物cDNA全长数据库等。 2JASPAR JASPAR是有注释的、高质量的多细胞真核生物转录因子结合部位的开放数据库。网址http://jaspar.cgb.ki.se。所有序列均来源于通过实验方法证实能结合转录因子,而且通过严格的筛选,通过筛选后的序列再通过模体(motif)识别软件ANN-Spec进行联配。ANN-Spec利用人工神经网络和吉布斯(Gibbs)取样算法寻找特征序列模式。联配后的序列再利用生物学知识进行注释。 目前该数据库收录了111个序列模式(profiles),目前仅限于多细胞真核生物。通过主页界面,用户可进行下列操作:1)浏览转录因子(TF)结合的序列模式;2)通过标识符(identifier)和注解(annotation)搜索序列模式;3)将用户提交的序列模式与数据库中的进行比较;4)利用选定的转录因子搜索特定的核苷酸序列,用户可到ConSite服务器(http://www.phylofoot.org/consite)进行更复杂的查询。JASPAR数据库所有内容可到主页下载。 与相似领域数据库相比,JASPAR具有很明显优势:1)它是一个非冗余可靠的转录因子结合部位序列模式;2)数据的获取不受限制;3)功能强大且有相关的软件工具使用。JASPAR与TRANSFAC(一流的TF数据库)有较明显的差异,后者收录的数据更广泛,但包含不少冗余信息且序列模式的质量参差不齐,是商业数据库,只有一部分是可以免费使用。用户在使用过程中会发现二者的差异,这主要是由于二者对数据的收集是相互独立的。另外该数据库还提供了相关的链接:如MatInspector检测转录因子结合部位,网址http://transfac.gbf.de/programs/matinspector/;TESS转录元件搜索系统,网址http://www.cbil.upenn.edu/tess/。 转录调节位点和转录因子数据库介绍! 张光亚!!方柏山 (华侨大学生物工程与技术系福建泉州362021) 摘要转录水平的调控是基因表达最重要的调控水平之一,对转录调节位点和转录因子的研究具有重要意义。介绍了DBTSS、JASPAR、PRODORIC和TRRD等相关数据库及其特征、内容和使用。 关键词转录调节位点转录因子数据库生物信息学 !基金项目:国务院侨办科研基金资助项目(05QZR06) !!通讯作者

密码子使用偏好性参数汇总

研究密码子偏好性常用的参数 1、相对同义密码子使用度(Relativ e Synonymous Codon Usage, RSCU ) 是指对于某一特定的密码子在编码对应氨基酸的同义密码子间的相对概率,它去除了氨基酸组成对密码子使用的影响。如果密码子的使用没有偏好性,该密码子的RSCU值等于1,当某一密码子的RSCU值大于1时,代表该密码子为使用相对较多的密码子,反之亦然。第i个氨基酸的第j个密码子的相对同义密码子使用度值的计算公式如下: 公式中, X ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为1~6) 。研究中通常先利用高表达基因的RSCU值建立参考表格。 2、密码子适应指数(Codon Adaptation Index, CAI) 可以根据已知高表达基因的序列来估计未知基因密码子使用的偏好性程度。CAI的值在0~1之间, 如果越高则表明该基因的密码子使用偏好性越强。CAI 值一般用来预测种内基因的表达水平( 但目前的研究发现对于单细胞生物比较适用, 而在哺乳动物中并不能用来表示基因表达水平), 又可以用来预测外源基因的表达水平。 w ij(The relative adaptiveness of a codon): 密码子相对适应度 上式中RSCU imax、X imax分别指编码第i个氨基酸的使用频率最高的密码子的RSCU值和X值 L是指基因中所使用的密码子数。 3、密码子偏好参数(Codon Preference Parameter, CPP) CPP的变化范围为0 ~ 18, 越接近18表示密码子被非随机使用的程度越高。它对于基因编码区域总的碱基组成不敏感, 适于比较基因间或物种间密码子使用偏性的大小。 x ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为2~6, n i= 1 的情况被排除) 4、有效密码子数(Effective Number of Codon, ENC) ENC值的范围在20~ 61之间, 越靠近20偏性越强。此值是描述密码子使用偏离随机选择的

植物转录因子及转录调控数据与分析平台

植物转录因子及转录调控数据与分析平台 PlantTFDB:植物转录因子数据库 URL: https://www.360docs.net/doc/f116319796.html, 包含资源:植物转录因子的家族分类规则、基因组转录因子全谱、丰富的注释、转录因子结合图谱(binding motifs)、转录因子预测、系统发生树等 涉及物种:包含拟南芥、水稻、杨树、大豆、玉米、小麦等165个物种。 PlantRegMap:植物转录调控数据与分析平台 URL: https://www.360docs.net/doc/f116319796.html, 包含资源:植物转录调控元件、植物转录调控网络、转录因子结合位点预测、转录调控预测与富集分析、GO富集分析、上游调控因子富集分析等。 涉及物种:包含拟南芥、水稻、杨树、大豆、玉米、小麦等156个物种。 ATRM: 拟南芥转录调控网络及其结构和演化分析 URL: https://www.360docs.net/doc/f116319796.html, 包含资源:基于文本挖掘和人工校验的拟南芥转录调控网络、植物转录调控网络的结构和演化特征 涉及物种:拟南芥 植物转录因子及转录调控数据与分析平台(导航页) 我们致力于为广大科研人员提供一个关于植物转录因子和转录调控、集数据和分析于一体的高质量平台,为研究和理解植物转录调控系统保驾护航。 植物转录因子数据库(PlantTFDB) 一套完整的植物转录因子分类规则 覆盖绿色植物各大分支的转录因子全谱 丰富的功能和演化注释 基因组范围的高质量转录因子结合矩阵(156个物种) 在线转录因子预测平台 植物转录调控数据与分析平台(PlantRegMap) 基于高通量实验(ChIP-seq和DNase-seq)和比较基因组方法鉴定的多种转录调控元件 基于转录因子结合矩阵和转录调控元件推测的转录调控网络 涉及165物种的GO注释 一套植物转录调控预测与分析工具,包括转录因子结合位点预测、转录调控预测与富集分析、GO富集分析及上游调控因子富集分析等 拟南芥转录调控网络及其结构和演化特征(ATRM) 基于文本挖掘和人工校验的拟南芥转录调控网络 植物转录调控网络的结构和演化特征

转录因子的定义及其作用方式

转录因子是一种具有特殊结构、行使调控基因表达功能的蛋白质分子,也称为反式作用因子。植物中的转录因子分为二种,一种是非特异性转录因子,它们非选择性地调控基因的转录表达,如大麦(Hordeum vulgare) 中的HvCBF2 (C-repeat/DRE binding factor 2) (Xue et al., 2003)。还有一种称为特异型转录因子,它们能够选择性调控某种或某些基因的转录表达。典型的转录因子含有DNA 结合区(DNA-binding domain)、转录调控区(activation domain)、寡聚化位点(oligomerization site) 以及核定位信号(nuclear localization signal) 等功能区域。这些功能区域决定转录因子的功能和特性(Liu et al., 1999)。DNA结合区带共性的结构主要有:1)HTH 和HLH 结构:由两段α-螺旋夹一段β-折叠构成,α-螺旋与β-折叠之间通过β-转角或成环连接,即螺旋-转角-螺旋结构和螺旋-环-螺旋结构。2)锌指结构:多见于TFIII A 和类固醇激素受体中,由一段富含半胱氨酸的多肽链构成。每四个半光氨酸残基或组氨酸残基螯合一分子Zn2+ ,其余约12-13 个残基则呈指样突出,刚好能嵌入DNA 双螺旋的大沟中而与之相结合。3)亮氨酸拉链结构:多见于真核生物DNA 结合蛋白的 C 端,与癌基因表达调控有关。由两段α - 螺旋平行排列构成,其α - 螺旋中存在每隔7 个残基规律性排列的亮氨酸残基,亮氨酸侧链交替排列而呈拉链状,两条肽链呈钳状与DNA 相结合。 同一家族的转录因子之间的区别主要在转录调控区。转录调控区包括转录激活区(transcription activation domain) 和转录抑制区(transcription repression domain) 二种。近年来,转录的激活区被深入研究。它们一般包含DNA结合区之外的30-100个氨基酸残基,有时一个转录因子包含不止一个转录激活区。如控制植物储藏蛋白基因表达的VP1和PvALF转录因子,它们的N-末端酸性氨基酸保守序列都具有转录激活能力,与酵母转录因子GCN4和病毒转录因子的VP16的酸性氨基酸转录激活区有较高同源性(Bobb et al., 1996)。典型的植物转录因子激活区一般富含酸性氨基酸、脯氨酸或谷氨酰胺等,如GBF (G-box binding factor) 含有的GCB盒(GBF conserved box) 激活结构域(lunwen114 and Bevan, 1998)。 转录抑制区也是转录因子调控表达的重要位点,但是对其作用机理研究尚不深入。可能的作用方式有三种:1)与启动子的调控位点结合,阻止其它转录因子的结合;2)作用于其它转录因子,抑制其它因子的作用;3)通过改变DNA的高级结构阻止转录的发生。 转录因子必须在核内作用,才能起到调控表达的目的。因此,转录因子上的核定位序列是其重要的组成部分。一般一个或多个核定位序列在转录因子中不规则分布,同时也存在不含核定位序列的转录因子,它们通过结合到其它转录因子上进入细胞核。核定位序列一般是转录因子中富含精氨酸和赖氨酸残基的区段。目前,水稻中的GT-2、西红柿中的HSFA1-2、玉米的O2和碗豆的PS-IAA4和6等转录因子中的核定位序列都已被鉴定(Boulikas, 1994; Dehesh et al., 1995; Lyck et al., 1997; Varagona et al., 1992; Abel and Theologis, 1995)。 绝大多数转录因子结合DNA前需通过蛋白质-蛋白质相互作用形成二聚体或多聚体。所谓二聚体化就是指两分子单体通过一定的结构域结合成二聚体,它是转录因子结合DNA时最常见的形式。由同种分子形成的二聚体称同二聚体,异种分子间形成的二聚体称异二聚体。这种多聚体的形成是转录因子上的寡聚化位点

转录因子

转录因子 ? 1 简介 ? 2 方法 ? 3 转录因子 转录因子-简介 基因转录有正调控和负调控之分。如细菌基因的负调控机制是当一种阻遏蛋白(repressor protein)结合在受调控的基因上时,基因不表达;而从靶基因上去除阻遏蛋白后,RNA聚合酶识别受调控基因的启动子,使基因得以表达,这是正调控。这种阻遏蛋白是反式作用因子。 转录因子(transcription factor)是起正调控作用的反式作用因子。转录因子是转录起始过程中RNA聚合酶所需的辅助因子。真核生物基因在无转录因子时处于不表达状态,RNA聚合酶自身无法启动基因转录,只有当转录因子(蛋白质)结合在其识别的DNA序列上后,基因才开始表达。 转录因子的结合位点(transcription factor binding site,TFBS)是转录因子调节基因表达时,与mRNA结合的区域。按照常识,转录因子(transcription factor,TF)的结合位点一般应该分布在基因的前端,但是,新的研究发现,人21和22号染色体上,只有22%的转录因子结合位点分布在蛋白编码基因的5'端。 转录因子-方法 这篇文章的试验方法是,通过高密度的寡核苷酸芯片,反映出人21和22号染色体的几乎所有的非重复序列,通过这种芯片,检测三种转录因子,Sp1、 cMyc、和p53的结合位点。结果表明,每种转录因子都有大量的TFBS与之结合。然而,只有22%的转录因子结合位点分布在蛋白编码基因的5'端, 36%的TFBS分布在蛋白编码基因的中部或3'端,并且这36%的TFBS常常和基因组中的非蛋白编码RNA分布在一起。这暗示,在人的基因组中,不仅包含蛋白编码基因,也包含数量相当的非编码基因(noncoding genes),他们都受常见的转录因子所调控。 真核生物在转录时往往需要多种蛋白质因子的协助。一种蛋白质是不是转录机构的一部分往往是通过体外系统看它是否是转录起始所必须的。一般可将这些转录所需的蛋白质分为三大类: (1)RNA聚合酶的亚基,它们是转录必须的,但并不对某一启动子有特异性。 (2)某些转录因子能与RNA聚合酶结合形成起始复合物,但不组成游离聚合酶的

转录因子包括什么主要的功能结构域

转录因子包括什么主要的功能结构域?其主要的结构特点与功能是什么? 作为蛋白质的转录因子从功能上分析其结构可包含有不同区域:①DNA结合域(DNA binding domain),多由60-100个氨基酸残基组成的几个亚区组成;②转录激活域(activating domain),常由30-100氨基酸残基组成,这结构域有富含酸性氨基酸、富含谷氨酰胺、富含脯氨酸等不同种类,一酸性结构域最多见; ③连接区,即连接上两个结构域的部分。不与DNA直接结合的转录因子没有DNA 结合域,但能通过转录激活域直接或间接作用与转录复合体而影响转录效率。 与DNA结合的转录因子大多以二聚体形式起作用,与DNA结合的功能域常见有以几种: ①螺旋-转角-螺旋(helix-turn-helix,HTH)及螺旋-环-螺旋(helix-loop-helix,HLH) 这类结构至少有两个α螺旋其间由短肽段形成的转角或环连接,两个这样的motif结构以二聚体形式相连,距离正好相当于DNA一个螺距(3.4nm),两个α螺旋刚好分别嵌入DNA的深沟。 ②锌指(zinc finger)其结构如图所示,每个重复的“指”状结构约含23个氨基酸残基,锌以4个配价键与4个半胱氨酸、或2个半胱氨酸和2个组氨酸相结合。整个蛋白质分子可有2-9个这样的锌指重复单位。每一个单位可以其指部伸入DNA双螺旋的深沟,接触5个核苷酸。例如与GC盒结合的转录因子SP1 中就有连续的3个锌指重复结构。 ③碱性-亮氨酸拉链(basic leucine zipper,bZIP)这结构的特点是蛋白质分子的肽链上每隔6个氨基酸就有一个亮氨酸残基,结果就导致这些亮氨酸残基都在α螺旋的同一个方向出现。两个相同的结构的两排亮氨酸残基就能以疏水键结合成二聚体,这二聚体的另一端的肽段富含碱性氨基酸残基,借其正电荷与DNA 双螺旋链上带负电荷的磷酸基团结合。若不形成二聚体则对DNA的亲和结合力明显降低。在肝脏、小肠上皮、脂肪细胞和某些脑细胞中有称为C/EBP家族的一大类蛋白质能够与CAAT盒和病毒增强子结合,其特征就是能形成bZIP二聚体结构。

拟南芥及水稻转录因子MADS密码子的偏好性比较

浙江大学学报(农业与生命科学版)  31(5):513~517,2005Journal of Zhejiang U niversity (Agric 1&Life Sci 1) 文章编号:100829209(2005)0520513205 收稿日期:2005201229 基金项目:国家自然科学基金(39870421);浙江省重点研究项目基金(2003C22007);浙江省“04206"工程水稻品种改良项目. 作者简介:李娟(1979— ),女,山东省济南人,从事基因组学方面的研究.通讯作者:薛庆中,男,教授,博士生导师,从事植物遗传育种,基因组学方面的研究.E 2mail :qzhxue @hot https://www.360docs.net/doc/f116319796.html,. 拟南芥及水稻转录因子MADS 密码子的偏好性比较 李娟1,薛庆中1,2 (1.浙江大学沃森基因组科学院,浙江杭州310008;21浙江大学农学系,浙江杭州310029) 摘 要:大多数与花发育相关的功能基因属于MADS 基因家族.应用CodonW 的因子分析表明,拟南芥MADS 转录因子家族偏好使用A 、U 结尾的密码子,而水稻MADS 转录因子家族偏好使用G 、C 结尾的密码子.同时通过氨基酸序列的多重比对,表明密码子偏好性与氨基酸序列及二级结构之间存在关联,证实了不同的密码子编码的氨基酸位于蛋白质二级结构的特定位置.关 键 词:水稻;拟南芥;密码子偏性;转录因子;AU 含量中图分类号:S511 文献标识码:A L I J uan 1,XU E Qing 2zhong 1,2(1.J ones D.W atson I nstitute of Genome Science ,Zhej iang Universit y ,H angz hou 310008,China ;2.Dept of A g ronom y ,Zhej iang Universit y ,H angz hou 310029,China ) Comparison of MADS transcriptional factor on codon bias in arabidopsis and rice.Journal of Zhejiang University (Agric 1&Life Sci 1),2005,31(5):5132517 Abstract :Most of the flower development 2related f unctional genes are belong to MADS transcription factors families.Through the factorial correspondence analysis (FCA )of CodonW ,we can find out that MADS transcriptional factors in Arabidopsis prefer to A 2ending and U 2ending codons ,while that in rice prefer to G 2ending and C 2ending codons.By using the ClustalX for searching the relation between the bias of the codons and second structure of the MADS ,we confirm that the amino acids coding by different codons are on the special position of the second structure of the proteins.K ey w ords :rice ;arabidopsis ;codon usage bias ;transcriptional factors ;AU content 转录因子是指那些专一性地结合于DNA 特定序列上,能激活或/和抑制其它基因转录的蛋白质.根据DNA 结合功能域结构,他们主要分为:b HL H (碱基性螺旋2环2螺旋)、bZIP (碱性亮氨酸拉链)、homeodomain 蛋白、MADS 2box 蛋白、zinc 2finger 蛋白、Myb 蛋白、A P2/EREBP 蛋白、HSF 蛋白、HM G 蛋白和A T hook 蛋白等[1]. 植物MADS 基因是一个序列特异的调节 基因家族.和其他真核生物转录因子一样 MADS 蛋白由MADS (M )、Intervening (I )、Keratin 2like (K )和C 2terminal (C )等结构域组成,属于结构域蛋白.大多数花发育相关功能基因属于MADS 因子家族[2,3],被子植物的大部分MADS 基因参与花发育的调控[4].不仅在花器官原基分化期表达,在植物其它部位也有表达,且某些MADS 2box 在烟草花粉发育全过程中持续表达[5].同时,MADS 2box 基因家族还

ER对雌激素共调节因子NFAT3的转录调节

目的:NFAT (Nuclear factor of activated T-cell )家族在人体生理和病理过程中发挥着重要的作用,但是对NFAT3的转录调节因子却知之甚少。通过本室前期的实验,我们了解到NFAT3可以调节ER (Estrogen Receptors )的转录活性,因此,反过来,我们检测了ER 对NFAT3转录活性的影响。 方法:通过活性实验、点突变实验及RNA 干扰实验,验证ER 、雌激素及NFAT 激活剂PMA+ION 对NFAT3转录活性的影响,并通过免疫共沉淀(Co-immunoprecipitation ,Co-IP )实验检测ER 与NFAT3的相互作用,通过染色质免疫共沉淀(CHIP )实验确定ER α能否被募集到IL-2启动子上,并用核质分离实验,揭示ER α在细胞内对NFAT3定位的影响。 结果: 1. 在293T 及MDA-MB-453细胞中,ERs 可以抑制NFAT3的转录活性。 2. IP 实验证实,NFAT3和ERs 在体内存在相互作用,并且该作用不受NFAT 激活剂PMA+ION 的影响。 3. 敲低293T 细胞中的内源NFAT3后,ER α对NFAT-LUC 活性的抑制作用基 本消除,证实ER α对NFAT-LUC 报告基因的抑制需要NFAT3的参与。 4. 在分别敲低MCF-7细胞中的内源性ER α和ER β后,NFAT3的转录活性都大 幅增强。 5. 构建了两个ER α雌激素结合位点突变体,与野生型ER α相比,两个突变体 对NFAT3活性的抑制依然存在,而在加入雌激素后,对NFAT3的进一步抑制被消除,证实雌激素对NFAT3转录活性的抑制依赖ER 的活性。 6. AKT 和MAPK 重现了ER α磷酸化位点突变体ER α(S167A )和ER α(S118A ) 对NFAT3转录活性的影响。 7. CHIP 实验证实,加入ER α后,NFAT3与其靶基因IL-2启动子的结合增强, 而加入PMA+ION 后,能进一步促进该结合。 8. 通过核质分离实验发现ER α促使NFAT3入核,并且加入PMA+ION 后, NFAT3的表达增强。 结论:ER α是NFAT3的一个转录调控因子,ER α对NFAT3的转录调节受到雌激素和PMA+ION 的影响。对受NFAT3影响的多种免疫疾病、神经性疾病、心血管疾病和癌症的研究和治疗提供了新的线索。 关键词:ER ,NFAT3,相互作用,磷酸化,转录活性 致谢:该工作得到国家自然科学基金(30530320,30625035,30500191),973计划 P2-44 ER 对雌激素共调节因子NFAT3的转录调节 秦玺,王晓辉,杨智洪,丁丽华,徐小洁,程龙,牛畅,孙慧伟,张浩,叶棋浓 军事医学科学院生物工程研究所,北京市海淀区太平路27号院工作区北楼2121,100850 (xiba315@https://www.360docs.net/doc/f116319796.html,)

密码子偏好性与异源蛋白表达

密码子偏性与异源蛋白表达 原文:Claes Gustafsson, et al. TRENDS in Biotechnology, 2004,22(7): 346-353. https://www.360docs.net/doc/f116319796.html,/corp/images/MS102504CG.pdf 翻译:zhxm409511 在1977年,当Genetech的科学家和他们的科研合作伙伴首次利用细菌生产出人类蛋白(生长激素释放抑制因子)时[1],蛋白的异源表达在整个生物技术产业中发挥着关键的角色。那时,仅知道生长激素释放抑制因子的氨基酸序列,还不知如何从人的基因组中克隆该基因,因此,Genetech小组采用数条寡核苷酸合成了14个密码子长的生长激素释放抑制因子基因。Itakura和同事们设计这些寡核苷酸时遵循了三条标准[1]。首先,优先使用MS2噬菌体偏爱的密码子——尽管当时对大肠杆菌的基因组DNA序列还知之甚少,却已刚刚完成了MS2噬菌体的测序,并认为该噬菌体的序列能够代表大肠杆菌高表达基因所使用的密码子。其次,消除寡核苷酸不必要的分子内和分子间配对,因为这可能影响基因合成。第三,避免那些先是富含GC随后是富含AT的序列,当时认为这种序列可能会导致转录终止。结果,利用这条合成的基因首次制生产出来了具有功能活性的多肽。 25年后的今天,大多数基因克隆自cDNA文库或直接利用聚合酶链反应(PCR)从相应的基因组中扩增获得。要尽量避免从头合成基因,因为这样做需要消耗大量的财力和人力[2]。尽管基于PCR的克隆被广泛使用,但很多情况下它还是不及所描述的那样快捷和容易。它经常需要一些不易得到的模板(对于具有内含子的生物,需要cDNA模板),此外还需要进行PCR条件的优化,需要对PCR产物进行测序,如果PCR引入了任何的配对错误,还经常需要通过定点突变进行修复。然而,当扩增出的基因克隆入表达载体后,真正有趣的事情就发生了:经常是没有蛋白表达或表达水平很低。人们已经进行了大量的研究,以提高克隆基因的表达水平,包括优化宿主的生长条件,建立新的宿主系,改用新的宿主,和无细胞系统[3]。尽管这些方法都取得了一些进展,但它们都是围绕一个最根本问题进行的:一种生物所采用的编码蛋白的DNA序列经常不同于另外一种生物在编码该蛋白时所采用的DNA序列。 为什么不同的生物会偏爱不同的密码子? 遗传密码采用61组三连核苷酸(密码子)编码20种氨基酸,采用3个密码子终止翻译。因此每个氨基酸利用1个(Met和Trp)至6个(Arg,Leu,和Ser)同义密码子编码。这些密码子在核糖体中被互补的tRNAs阅读,而这些tRNAs已经事先携带了相应的氨基酸。密码子的兼并性使得同一蛋白可采用多种不同的核苷酸序列编码。对于两种不同的生物,或对于同一生物的高表达和低表达基因,有时甚至在同一个操纵子内部,对不同密码

转录因子

转录因子 基因转录有正调控和负调控之分。如细菌基因的负调控机制是当一种阻遏蛋白(repressor protein)结合在受调控的基因上时,基因不表达;而从靶基因上去除阻遏蛋白后,RNA聚合酶识别受调控基因的启动子,使基因得以表达,这是正调控。这种阻遏蛋白是反式作用因子。而顺式作用因子则指的是基因上与反式作用因子结合的对基因表达起调控作用的基因序列。 转录因子(transcription factor)是起正调控作用的反式作用因子。转录因子是转录起始过程中RNA聚合酶所需的辅助因子。真核生物基因在无转录因子时处于不表达状态,RNA聚合酶自身无法启动基因转录,只有当转录因子(蛋白质)结合在其识别的DNA序列上后,基因才开始表达。 转录因子的结合位点(transcription factor binding site,TFBS)是转录因子调节基因表达时,与mRNA结合的区域。按照常识,转录因子(transcription factor,TF)的结合位点一般应该分布在基因的前端,但是,新的研究发现,人21和22号染色体上,只有22%的转录因子结合位点分布在蛋白编码基因的5'端。 真核生物在转录时往往需要多种蛋白质因子的协助。一种蛋白质是不是转录机构的一部分往往是通过体外系统看它是否是转录起始所必须的。一般可将这些转录所需的蛋白质分为三大类: (1)RNA聚合酶的亚基,它们是转录必须的,但并不对某一启动子有特异性。 (2)某些转录因子能与RNA聚合酶结合形成起始复合物,但不组成游离聚合酶的成分。这些因子可能是所有启动子起始转录所必须的。但亦可能仅是譬如说转录终止所必须的。但是,在这一类因子中,要严格区分开哪些是R NA聚合酶的亚基,哪些仅是辅助因子,是很困难的。 (3)某些转录因子仅与其靶启动子中的特异顺序结合。如果这些顺序存在于启动子中,则这些顺序因子是一般转录机构的一部分。如果这些顺序仅存在于某些种类的启动子中,则识别这些顺序的因子也只是在这些特异启动子上起始转录必须的。 黑腹果蝇的RNA聚合酶需要至少两个转录因子方能在体外起始转录。其中一个是B因子,它与含TATA盒的部位结合。人的因子TFⅡD亦和类似的部位结合。同样,CTF(CAAT结合因子)则与腺病毒的主要晚期启动子中与CAAT盒同源的部位相结合。结合在上游区的另一个转录因子是USF(亦称MLTF),则可以识别腺病毒晚期启动子中靠近-55的顺序。转录因子Sp1则能和GC盒相结合。在SC40启动子中有多个GC盒,位于-70到-110之间。它们均能和Sp1相结合。然而含有GC盒的不同的DNA顺序与Sp1的亲和力却各不相同。可见GC盒两侧的顺序对Sp1-GC盒的结合究竟如何能影响转录。有时候需要几个转录因子才能起始转录。例如胞苷激酶的启动子需要S p1与GC盒结合和CTF与CAAT盒结合;腺病毒晚期启动子需要TFⅡD与TATA盒结合和USF与其邻近部位相结合。以上所述的因子是一般转录都需要的,似乎并没有什么调节功能。另一些转录因子则可以调控一组特殊基因的转录。热休克基因就是一个很好的例子。真核生物的热休克基因在转录起始点的上游15bp处有一个共同顺序。H STF因子仅在热休克细胞中有活性。它与包括热休克共同顺序在内的一段DNA相结合,所以这个因子的激活可以引起约包括20个基因的一组基因起始转录。在这里,转录因子和RNA聚合酶Ⅱ之间关系很类似细菌的σ因子与核心酶之间的关系。 转录因子是一种具有特殊结构、行使调控基因表达功能的蛋白质分子,也称为反式作用因子。植物中的转录因子分为二种,一种是非特异性转录因子,它们非选择性地调控基因的转录表达,如大麦(Hordeum vulgare) 中的HvCBF2 (C-repeat/DRE binding factor 2) (Xue et al., 2003)。还有一种称为特异型转录因子,它们能够选择性调控某种或某些基因的转录表达。典型的转录因子含有DNA结合区(DNA-binding domain)、转录调控区(acti vation domain)、寡聚化位点(oligomerization site) 以及核定位信号(nuclear localization signal) 等功能区域。这些功能区域决定转录因子的功能和特性(Liu et al., 1999)。DNA结合区带共性的结构主要有:1)HTH 和HL H 结构:由两段α-螺旋夹一段β-折叠构成,α-螺旋与β-折叠之间通过β-转角或成环连接,即螺旋-转角-螺旋结构和螺旋-环-螺旋结构。2)锌指结构:多见于TFIII A 和类固醇激素受体中,由一段富含半胱氨酸的多肽链构成。每四个半光氨酸残基或组氨酸残基螯合一分子Zn2+ ,其余约12-13 个残基则呈指样突出,刚好能嵌入DNA 双螺旋的大沟中而与之相结合。3)亮氨酸拉链结构:多见于真核生物DNA 结合蛋白的 C 端,与癌基因表达调控有关。由两段α - 螺旋平行排列构成,其α - 螺旋中存在每隔7 个残基规律性排列的亮氨酸残基,亮氨酸侧链交替排列而呈拉链状,两条肽链呈钳状与DNA 相结合。

转录因子正文

转录因子 摘要:随着众多生物基因组计划的完成及其蛋白质组学研究的不断深入,人类步入了系统生物学时代。基因组计划的完成提供了大量的DNA内在信息,解析出基因组中可能存在的全部基因的阅读框架,因此,接下来研究基因的表达调控特别是转录调控就显得非常迫切。另一方面,蛋白组学研究的突飞猛进给我们描绘出了细胞的蛋白质表达谱和网络谱,接下来研究蛋白质与蛋白质,蛋白质与DNA的相互作用将成为现在及以后相当长一段时间内的研究主题。有生物学家认为,21世纪对人类最具有挑战性的生物学主题就是“基因的全基因组调控”和”细胞的全蛋白质的生理功能”这两大难题。 然而,转录因子是可与基因调控序列结合并调控基因转录的一类核蛋白,研究转录因子就是研究转录调控的分子机制,研究一种或一类特定的蛋白质分子与DNA的结合特性,研究与DNA结合的蛋白质分子是怎样调控基因转录等问题。转录因子的研究实际上已构成上述两大生物学难题的一个交叉点,因此,对转录因子的深入研究已是一件极其迫切而且重要的课题。 DNA转录及转录因子 定义 转录:是指以DNA为模板,在RNA聚合酶的作用下合成mRNA,将遗传信息从DNA分子上转移到mRNA分子上,这一过程成为转录。真核生物DNA的转录在细胞核中进行,原核生物的转录在细胞质的核质区

内进行。 转录单元 转录单元是一段以启动子开始至终止子结束的DNA序列。 转录起始(transcription initiation):转录因子通过识别基因启动子上的特异顺式元件并募集多种蛋白质因子,形成具有RNA聚合酶活性的转录起始复合体,从转录起始位点启动转录的过程。 转录终止子(transcription terminator):基因编码区下游使RNA聚合酶终止mRNA合成的密码子,是一种位于poly(A)位点下游,长度在几百碱基以内的结构。 终止子可分为两类。一类不依赖于蛋白质辅因子就能实现终止作用。另一类则依赖蛋白辅因子才能实现终止作用。这种蛋白质辅因子称为释放因子,通常又称ρ因子 转录因子:能够结合在某基因上游特异核苷酸序列上的蛋白质,活化后从胞质转位至胞核,通过识别和结合基因启动子区的顺式作用元件,启动和调控基因表达。 转录因子是转录起始过程中RNA聚合酶所需的辅助因子。真核生物基因在无转录因子时处于不表达状态,RNA聚合酶自身无法启动基因转录,只有当转录因子(蛋白质)结合在其识别的DNA序列上后,基因才开始表达。转录因子是结合在某基因上游特异核苷酸序列上的蛋白质,这些蛋白质能调控该基因的转录。转录因子可以调控核糖核酸聚合酶(RNA聚合酶)与DNA模板的结合。转录因子不单与DNA序列上的启动子结合,也可以和其它转录因子形成-转录因子聚合体,来影

转录因子SP1对肿瘤转移的调控

转录因子Sp1对肿瘤转移的调控 闫隆鑫1,刘波1*,任海军2* 摘要转录因子SP1(transcription factor Sp1,SP1)在人体细胞中普遍表达并参与调控细胞增殖、凋亡及胚胎发育等生理活动。实验证实SP1在肿瘤细胞中存在异常表达,并积极调控肺癌、胃癌、乳腺癌等肿瘤的转移、恶变,但对其参与肿瘤细胞转移的机制,尤其在不同细胞系中,SP1的表达量及蛋白修饰,对肿瘤转移各阶段的影响,还不甚明确。本文整理了近期关于SP1参与调控肿瘤转移的研究及SP1的协同调控因子,藉此探究SP1在肿瘤监测及治疗中的发展方向。 关键词:转录因子SP1; 肿瘤; 转移 0 引言 肿瘤细胞的转移意味着肿瘤恶性程度增加,大部分肿瘤患者在临床确诊时已经存在肿瘤转移,常规治疗死亡率极高;而一旦诊断为肿瘤,由于不能确定其是否转移,往往会接受过度治疗,因此有关肿瘤细胞转移活性的检测是肿瘤治疗的关键。良性肿瘤发展为转移性肿瘤至少包括四个相互关联的过程:肿瘤细胞表面黏附分子减少,肿瘤间粘附能力下降;原细胞间基质分解,并在肿瘤细胞诱导下重建适宜肿瘤生长的基质;肿瘤细胞变形并生长出伪足,通过血管、淋巴管迁移到特定的侵入点;肿瘤细胞分裂增殖,在新区域生成血管,成为肿瘤组织[1]。转录调控因子参与调控相关蛋白的表达,往往存在异常表达的情况,在肿瘤转移过程中起到至关重要的调控作用。因此对肿瘤中转录调控因子的检测,能够在早期判断肿瘤转移的情况并对肿瘤转移的活性加以抑制。 SP1是人体细胞中广泛存在的转录调控因子,属于Sp/KLF锌指家族,通常作为主要的GC盒转录激活因子参与调控目标基因的表达。SP1的羧基端含有三个锌指结构,能够特异性结合DNA启动子的GC盒;SP1蛋白中段为其活化区,参与调控目的基因表达以及与其他转录调控因子的结合[2];氨基端有一蛋白水解位点,能够引起泛素化诱导的SP1分解[3]。SP1在结合到目的基因启动子的同时,可以招募其他调控因子及SP1本身参与表达调控,因而与DNA的结合能力、转录调控区活性以及SP1在细胞内的含量对SP1参与的调控有重要的意义[4, 5]。SP1在肿瘤初期大量积累并积极调控肿瘤发展的各个阶段[6],过表达的SP1参与诱导肿瘤增殖、凋亡,但对肿瘤转移的调控,不同肿瘤细胞系对SP1过表达有着不同 基金项目:大连市卫生局医学研究课题(WSJ/KJC-01-JL-01);中央高校基本科研业务费(DUT15LK16); 作者单位:1.大连理工大学生物医学工程系,辽宁省大连市,116024;2.大连市友谊医院普外科,辽宁省大连市,116100; 通信作者:任海军,E-mail:renhaijun369@https://www.360docs.net/doc/f116319796.html,; 刘波,E-mail: lbo@https://www.360docs.net/doc/f116319796.html,; 作者简介:(1996-),男,本科,在读本科生,主要研究方向生物医学工程

转录因子WRKY的同义密码子使用偏好性分析

拟南芥和水稻转录因子WRKY的同义密码子使用偏好性分析 生物科学2004级何瑞 指导老师刘汉梅讲师 摘要:本文首次对拟南芥和水稻WRKY基因家族的密码子用法进行了分析,发现两个物种WRKY基因的碱基组成明显不同,水稻的密码子在第一、二、三位GC含量都明显高于拟南芥,且第三位差异最大。不同物种的WRKY基因存在共同的进化趋势,即基因GC3s 逐步增大。对应性分析结果显示,拟南芥WRKY基因的密码子使用偏性受碱基组成等多种因素共同作用,水稻主要受碱基组成和基因表达水平两个因素的影响。最后确定了拟南芥和水稻WRKY基因家族的最优密码子,分别为11个和27个。研究结果为深入开展其进化、表达调控机制和提高该基因家族新成员预测的准确性等提供了重要的理论依据。 关键词:WRKY基因,密码字偏好性,GC含量,Enc Synonymous Codon Bias of WRKY Gene Family in Aribidopsis and Rice HE Rui Biological Science,Grade 2004 Directed by LIU Han-mei (instructor) Abstract: WRKY gene family were firstly analyzed on the codon bias in Arabidopsis and Rice. The components of nitrogenous bases in the two species are obviously different: the GC content at the fist, second and third position of Rice are significantly higher than those of Aribidopsis, that discrepancy at the third position is the most marked. Meanwhile, as WRKY gene family is evolving, G-ending and C-ending codons of both Aribidopsis and Rice are good for the genes evolution. According to Correspondence Analysis, the codon usage of WRKY gene in Aribidopsis is affected by many factors, such as the components of nitrogenous bases. But the components of nitrogenous bases and the gene expression level are two primary factors in Rice. The numbers of the optimal codon in Arabidopsis and Rice are 11 and 27. The results of the the research provide the accuracy of important theoretical basis of forecasts for its evolution, regulation of gene expression and adding the gene family members. Keywords: WRKY Gene,Codon bias,GC content,Enc 蛋白质中的氨基酸序列是由mRNA中核苷酸序列决定的。mRNA上连续相邻的核苷酸以3个为一体,即三联体密码子,进行翻译时,识别与其对应的tRNA,正确的译出遗

转录因子

转录因子 转录因子是细胞的蛋白质哨兵,它决定DNA 中众多基因中的某些特定基因在给定的时间内转录为mRNA 。细菌里面含有200~300种转录因子,而动物细胞包约含1000种。通过使DNA 和基本转录装置联系起来,转录因子决定了细胞的蛋白质结构。作为初级控制者,它们在细胞内浓度很低。其浓度很大程度上取决于具体的蛋白质、细胞类型和环境因素,根据经验法则,它的在浓度在n 摩尔(nM)浓度范围,细菌的每个细胞有1~1000个转录因子,在哺乳动物细胞中约有36 10~10个。通常,低浓度转录因子只控制少数基因,高浓度的则相反。 转录因子激活DNA 转录 拓展:在分子生物学中,转录因子(Transcription factor )是指能够结合在某基因上游特异核苷酸序列上的蛋白质,这些蛋白质能调控其基因的转录。转录因子可以调控核糖核酸聚合酶(RNA 聚合酶,或叫RNA 合成酶)与DNA 模板的结合。转录因子一般有不同的功能区域,如DNA 结合结构域与效应结构域。转录因子不单与基因上游的启动子区域结合,也可以和其它转录因子形成转录因子复合体来影响基因的转录。 转录因子的调节是一个十分复杂的过程, 因为它取决于很多因素,其中最明显的是其他的DNA 结合蛋白(包括转录因RNA 聚合酶 转因录 子

子等)以及局部的染色体结构. 早期的体外实验认为DNA序列决定转录因子的装配顺序,但愈来愈多的证据显示转录的激活取决于大量的转录因子的相互作用。目前表观遗传学似乎对转录激活也扮演重要角色。 通常每个细胞只含大约10个四聚体,大多数转录因子有相似或者更高的浓度为每nM几十个或上百个。有趣的是,DNA非特定的吸引力使90%的乳糖抑制体被吸附在DNA周围,只有少数的溶解在细胞质内。这引发了一个重要的问题:与如此少量的随机波动是如何被生物细胞控制的?例如,如果这些转录因子是完全随机的,在细胞分裂时,如此少量的的转录因子可能使某些子细胞完全不含转录因子。 更多的的努力被投向了一直以来研究最多的蛋白质,如p53 ——一种出现在近50%的癌症中的转录因子。正如其他许多蛋白质一样,它的名字起源于它的最初表征凝胶,p53蛋白的分子量为53kDa。现在我们已经知道它的质量为43.7kDa,它缓慢的移动速度是笨重的脯氨酸残基造成的,但它的名字p53还是保留了下来。这些转录因子促使细胞程序性死亡来防止其继续增殖,抑制肿瘤的生长。它有自己的特征浓度约100 nM。转录因子通过与来自受体信号相互作用,来改变它们与DNA的结合属性,从而调整转录信息。癌细胞中DNA的变异改变p53与它控制的下游基因的结合属性,从而阻止细胞死亡,导致细胞不可控增殖。 肿瘤蛋白p53——P53与DNA结合

相关文档
最新文档