基因组非编码序列的功能-北京生命科学研究所
基因组测序及功能解析

基因组测序及功能解析基因组测序是指对一个生物体的全部基因组(包括DNA和RNA序列)进行测序的过程。
随着高通量测序技术的发展,基因组测序已经成为当前生命科学研究中的重要手段之一。
本文将介绍基因组测序的原理和流程,并进一步探讨基因组功能解析的方法与应用。
一、基因组测序原理和流程1. 基因组测序的原理基因组测序主要基于DNA的测序技术,早期采用的是Sanger测序方法,而现在广泛应用的则是下一代测序(Next-generation Sequencing,简称NGS)技术。
NGS技术的核心原理是通过将基因组中的DNA进行分段、扩增和测序反应,然后再通过高通量测序仪进行快速并行测序,最终得到DNA序列数据。
2. 基因组测序的流程基因组测序的流程包括样本准备、DNA提取、文库构建、测序和序列数据分析等步骤。
首先,需要从生物体中提取DNA样本,然后对DNA进行文库构建,包括DNA断裂、添加识别引物和文库扩增等步骤。
接下来,将文库进行测序反应,并使用高通量测序仪对测序片段进行测序。
最后,利用生物信息学分析软件对测序数据进行质控、比对、拼接和注释等步骤,得到最终的基因组测序结果。
二、基因组功能解析的方法1. 基因注释基因注释是对基因组测序结果进行分析和解读的过程,主要目的是确定测序数据中的基因组区域以及基因区域中的基因和功能元件的位置。
常用的基因注释方法包括:基因识别、转录本注释、功能注释、非编码RNA注释等。
这些方法的综合应用可以揭示基因组和基因功能的相关信息。
2. 转录组学分析转录组学分析是通过对DNA的模板转录产生RNA,并对转录产物进行分析,从而了解基因的表达水平和调控机制。
常用的转录组学分析方法包括RNA-Seq和微阵列。
RNA-Seq可以全面检测所有转录产物的拷贝数,从而揭示全局基因表达情况;而微阵列则通过测量RNA与DNA的杂交程度来定量检测RNA的表达情况。
3. 蛋白质组学分析蛋白质组学分析是对生物体内蛋白质的组成、结构和功能等进行研究的一门学科。
非编码RNA的研究进展及其生物学功能

非编码RNA的研究进展及其生物学功能近年来,随着基因组测序以及实验技术的不断发展,越来越多的非编码RNA被发现并引起了科学家们的重视。
非编码RNA是指那些不参与蛋白质合成过程、无开放阅读框的RNA分子,如转录启动子、小核RNA、长非编码RNA等。
这些短小精悍的RNA分子,为生命科学研究提供了新范式,并逐渐被证实其在许多生物学过程中发挥了极为重要的作用。
一、非编码RNA的研究进展非编码RNA的研究始于20世纪70年代,当时的科学家们在研究tRNA等小核RNA过程中发现一些不属于已知类别的RNA分子,并将之称为小RNA,但其在生物学过程中的作用仍不明确。
随着生物技术的不断进步,越来越多种类的非编码RNA被发现,如小的siRNA,microRNA,长的lncRNA,snRNA,snoRNA等。
至今还有大量的未知RNA分子等待去发掘。
最近一项发表在Cell杂志上的研究表明,在人类的基因组中,长的非编码RNA数量约为编码RNA的四倍,而对于其他生物类群,如果蝇、鼠、小鼠,这个比例甚至更高。
另外,米面包属真菌中,非编码RNA甚至占据了RNA总量的80%以上。
由此可见,非编码RNA的数量及种类是非常丰富的,但对于他们的生物学功能的认识还远远不够。
二、非编码RNA的生物学功能早期的研究发现,一些小核RNA的主要功能是参与基因转录过程,如转录启动子与剪接小核RNA(snRNA),这些小核RNA能够与DNA及RNA各种启动以及剪接相关因子结合,从而协同完成生物体内mRNA剪接等过程。
siRNA和miRNA具有不同的特点,它们功能异常多元,例如:杀死-virusRNA;下调基因表达;对基因体轮廓权重贡献;提升基因表达。
在植物中,小的RNAs还能够通过基因组重构的方式而导致新基因的形成。
而长的非编码RNA在短时间内取得了长足的进展,分析结果表明,他们的功能和效果异常多样,并具备多种生物学活性,可以涉及细胞增殖,凋亡、衰老,以及调控基因转录、表达等过程。
非编码RNA的功能与作用机制

非编码RNA的功能与作用机制随着基因组学的飞速发展,越来越多的研究表明,非编码RNA (non-coding RNA)在生物体内具有丰富的功能和作用机制。
本文将从非编码RNA的类型、功能、作用机制三个方面,深入探讨非编码RNA在生命活动中的重要作用。
一、非编码RNA的类型非编码RNA包括转录RNAs(transcriptional RNAs)和转录后修饰RNAs(posttranscriptional RNAs)两类,其中,转录RNAs 包括piwi-interacting RNAs(piRNAs)、small nuclear RNAs (snRNAs)、small nucleolar RNAs(snoRNAs)、small interfering RNAs(siRNAs)等。
转录后修饰RNAs则包括microRNAs(miRNAs)、long non-coding RNAs(lncRNAs)、circRNAs等。
1. piRNAs:piRNAs可与线粒体DNA、质粒DNA和逆转录转录病毒RNA等相互作用,参与调节基因转录和表达,维持基因组的稳定性。
2. snRNAs:snRNAs可结合到mRNA前体上,形成剪接体,参与mRNA的剪接和加工。
3. snoRNAs:snoRNAs通过形成称为小核糖核蛋白颗粒(small nucleolar ribonucleoprotein particles, snoRNPs)的复合物,对rRNA 的剪接和加工进行调控。
4. siRNAs:siRNAs可与mRNA相互作用,抑制mRNA的翻译和转录过程,从而达到基因调控的目的。
5. miRNAs:miRNAs可将mRNA的翻译或降解,参与调节基因转录和表达、细胞增殖和分化等生物过程。
6. lncRNAs:lncRNAs是长度超过200nt的RNA分子,在基因转录过程中形成,参与调控基因转录和表达、染色质修饰等生物过程。
基因非编码区对基因表达调控的作用研究

基因非编码区对基因表达调控的作用研究基因是生命活动中最基本、最重要的物质基础,不仅决定个体的性状和特征,还对许多疾病的发生发展起着关键作用。
基因由外显子和内含子组成,其中外显子编码蛋白质,内含子则是DNA序列中的“垃圾”,长期以来被认为是没有什么功能的。
然而,近年来随着生命科学技术的不断发展,科学家们逐渐发现,基因内含子所在的非编码区也具有广泛的调控作用,能够影响整个基因的表达过程。
名为“转录因子”的蛋白质,是基因表达的主要调控因素。
一般来说,转录因子通过与基因组DNA特定的结合位点及其他辅助蛋白质结合,将基因表达的等级调控到特定水平。
而近年来的研究表明,非编码区所包含的多种RNA分子,也能够通过与蛋白质或DNA分子相互作用,参与到基因表达调控中来。
例如,已知调控基因表达的RNA分子中,存在一种名为“长链非编码RNA”的物质,又称为“lncRNA”。
这种RNA 分子长度较长,通常超过200个核苷酸,被认为是一种新型的转录调控因子。
研究表明,lncRNA能够结合到特定的蛋白质上,从而影响基因的转录或翻译等环节,进而影响整个基因表达过程。
例如,一项研究发现,某些lncRNA块能够与修饰植物基因的特定酶结合,通过改变基因组DNA的化学结构,从而调节基因表达的水平,促进植物生长发育。
此外,非编码区中还存在一种名为“微小RNA”的物质,又称“miRNA”。
他是一种比lncRNA更短的RNA分子,通常只有20-30个核苷酸。
miRNA 能够与基因组DNA或特定蛋白质结合,调节基因的转录和翻译,从而实现对基因表达的调控。
例如,某些miRNA能够与细胞内的特定酶结合,抑制其对特定外显子的剪切作用,进而影响基因的表达,促进细胞分化或再生等生命过程。
此外,还有很多其他类型的RNA分子被认为能够参与到基因表达调控的过程中,但是目前还不十分清楚它们的具体作用。
基于以上的研究结果,也有科学家提出了一种新的“紫外线伤害-转录因子-非编码RNA”模型,用于解释光和化学损伤是如何通过非编码RNA介导调节基因表达的。
非编码RNA在基因表达中的作用机制

非编码RNA在基因表达中的作用机制近几年来,伴随技术的飞速发展,RNA(核糖核酸)的研究也日趋深入。
在这其中,非编码RNA(non-coding RNA,ncRNA)备受关注,因为其在基因表达中发挥着重要的作用。
本文将从基本概念、分类、作用机制等方面进行阐述,并试图揭示其对生命科学研究的深远意义。
一、基本概念在探究ncRNA的作用机制前,有必要首先了解其基本概念。
ncRNA是一类由DNA转录出来的RNA,与经典mRNA不同的是,它们不参与编码蛋白质的过程,而是扮演着调控蛋白质表达的角色。
ncRNA并不是一种独立的RNA,而是在传统的rRNA(核糖体RNA)和tRNA(转移RNA)等基础上发展出来的,可以分为长链ncRNA和短链ncRNA两类,长链ncRNA又可分为lncRNA和circRNA两个亚类。
二、作用机制ncRNA具有的调控作用涉及到多个环节,接下来将具体探究这些环节及其机制。
1.转录调节ncRNA通过影响基因的转录过程,达到对蛋白质表达的调控。
一些长链ncRNA能够与DNA序列形成双螺旋结构,从而影响RNA聚合酶的结合和转录过程;而一些短链ncRNA则可以通过靶向转录因子、修改染色质和DNA甲基化来影响基因表达。
2.剪切调节在成熟的mRNA序列合成过程中,经常伴随着RNA剪切的过程,ncRNA也可以通过影响RNA剪切过程来调控mRNA的表达。
一些lncRNA可通过影响特定剪接体的活性或特定靶标的交互而影响剪切调节,从而影响信使RNA的表达。
3.调节翻译后修饰由于ncRNA与蛋白质相关的进程大多发生在翻译后修饰阶段,因此ncRNA也可以在此过程中发挥重要作用。
例如,一些长度较短的ncRNA可以在翻译后阶段介导或调节翻译后修饰反应,如靶向RNA的甲基化和脱甲基化过程。
4.废旧物的概念有研究表明,局部废物RNA(如rRNA哑变体和剪切变体)也会在基因表达调控中发挥作用。
这些可能无处进一步翻译为蛋白质的RNA分子被称为“废品RNA”,它们可以干扰RNA在携带信息方面的功能,从而调节基因表达。
非编码RNA在基因调控中的作用

非编码RNA在基因调控中的作用一、前言从很早开始,人们已经知道RNA是DNA信息的转录产物,但长期以来人们一直认为RNA主要是作为蛋白质合成中的中介分子,直到1994年人们才慢慢地意识到RNA还能起到一个重要的作用,即:基因调控。
而在基因调控中,非编码RNA(non-coding RNA)更是展示了它的重要性。
二、基因调控的定义和分类基因调控(gene regulation)是指细胞对基因进行调整、组合和表达,使得细胞在不同时期和环境下,都能产生合适的分子和细胞结构以维持生物体内平衡。
基因调控可分为转录前调控和转录后调控。
1. 转录前调控:是指在基因转录过程中,调控转录因子的结合和启动子的置换,从而影响结构基因的转录。
2. 转录后调控:是指对RNA转录后的加工和稳定性进行调控,影响RNA的翻译和降解等过程。
三、非编码RNA在基因调控中的作用目前发现的非编码RNA主要有长链非编码RNA(long non-coding RNA,lncRNA)、微小RNA(miRNA)和piwiRNA等。
下面分别介绍它们在基因调控中的作用。
1. 长链非编码RNA(lncRNA)长链非编码RNA是指长度大于200 nt而不能翻译成蛋白质的RNA分子。
它们广泛存在于人类和其他生物体内,能参与多种生物过程,如细胞分化、凋亡、增殖和肿瘤进程等。
长链非编码RNA可以调控基因的转录和翻译,并与转录因子、染色质和DNA 序列等相互作用发挥作用,因此在核质转录调控中具有重要意义。
2. 微小RNA(miRNA)微小RNA是指一种长度约为21-25 nt、不能翻译为蛋白质的RNA分子,它们能针对靶基因的mRNA序列,在翻译前或后通过亚基辅助其他蛋白酶调控靶基因mRNA的翻译和降解,并对基因表达起到负向调控的效果。
因此,微小RNA在调控组织发育、生长、代谢和免疫等生理过程中都起着至关重要的作用。
3. piwiRNApiwiRNA是一类长度为24-31 nt的小RNA分子,主要表达在生殖细胞中,能调控胚胎干细胞,基因转录,剪切、剪接和拼合,并维持基因组的稳定性,基因编码的RNA的转录后和翻译的调控等方面具有重要作用。
生命体内各种非编码RNA的功能研究

生命体内各种非编码RNA的功能研究在生命科学领域中,RNA(核糖核酸)不仅是DNA(脱氧核糖核酸)的重要分子,而且还有着许多功能。
在RNA中,编码RNA(mRNA)会被转录成蛋白质,而非编码RNA(ncRNA)则不会转录成蛋白质,但仍然可以在细胞内发挥重要的功能。
具体而言,ncRNA包括rRNA(核糖体RNA)、tRNA(转移RNA)、snoRNA(小核仁RNA)、snRNA(小核RNA)、mRNA的结合RNA(mRNA-binding RNA)、piRNA(PIWI-interacting RNA)等。
近年来,随着对生命科学的深入研究,对ncRNA的研究也日益受到关注。
ncRNA的发现不仅有助于我们更好地了解基因组、细胞以及生命本身的运作方式,同时也可以为疾病的治疗提供重要的线索。
在ncRNA中,piRNA是一个重要的研究方向。
piRNA是存在于精子母细胞和卵母细胞中的非编码RNA,它们通常具有26~31个核苷酸,与蛋白质PIWI形成复合物,并参与到染色体重塑、转录后基因沉默、细胞分裂等生物过程中。
近年来的研究表明,piRNA可能与肿瘤的发生有关,因此对piRNA的研究有助于我们更好地理解肿瘤形成过程及其机制。
此外,ncRNA还参与到一些药物治疗中。
例如,在肺癌治疗中,药物卡培他滨可以抑制miRNA(微小RNA)的表达,从而抑制癌细胞的增殖。
另外,miRNA-29在肝纤维化治疗中有良好的应用前景。
依托蓝牌控释复合物是一种针对miRNA-122的靶向药物,已经在美国获得了临床批准。
总而言之,ncRNA已经成为生命科学领域中不可忽视的一部分。
它在细胞内具有广泛的功能,对细胞的生长发育、衰老及各种生物过程起着重要的作用。
我们相信,在未来的科学研究中,ncRNA将会有更广泛的应用,为人类健康事业、医学科技等领域的发展做出更大的贡献。
生命科学领域中的功能基因组学研究

生命科学领域中的功能基因组学研究随着生命科学的不断发展,人们对基因组和生物功能的理解越来越深入。
在这一领域中,一个新兴的研究方向是功能基因组学。
这项研究涉及到对基因组中的所有功能元件包括调控元件、蛋白质编码基因和非编码RNA等进行系统的研究和解析。
本文将简要介绍功能基因组学的概念,方法和应用。
一、功能基因组学的概念和方法功能基因组学是基因组学的一种扩展形式,其主要研究对象是基因组中的功能元件及其相互作用。
这些功能元件包括不同的调控元件,例如启动子、增强子、转录因子结合位点、核小体定位序列以及染色质高级结构中的各种序列。
同时,功能基因组学也研究RNA的多种特性和调节作用,包括mRNA、非编码RNA和微小RNA。
这些功能元件可以深入我们对基因组中基因表达调控和功能的理解,可以对疾病的分子机制和药物开发提供帮助。
为了实现这个目标,功能基因组学的研究方法包括很多实验和计算生物学技术。
首先,研究人员需要设计不同的实验来检测基因组中的功能元件,例如对转录因子或RNA的结合位置进行特异性的染色质免疫共沉淀实验或对染色质的开放程度进行DNA甲基化分析等。
同时,计算生物学技术也是不可或缺的。
例如,通过机器学习方法分析众多基因组学数据并预测新的功能元件,或采用高通量测序技术进行全基因组分析、双原型对比分析、表观遗传学检测等。
二、功能基因组学的应用功能基因组学研究成果广泛应用于生物学、医学和药学的各个领域。
1. 生物学在生物学研究中,功能基因组学的最主要的应用之一是研究某些生命过程的基因调控机制。
例如,对于胚胎发育和器官发育中的分子调节机制的深入了解可以为生物技术和医学应用提供基础数据。
此外,功能基因组学还可以用于生物进化和物种起源方面的研究。
例如,研究人员可以在基因组中鉴定一些高度保守的功能序列,从而了解两个物种之间的演化关系。
2. 医学在医学上,功能基因组学已成为了解常见和复杂疾病的分子机制的重要工具。
例如,在肺癌的研究中,高通量测序技术可以帮助研究人员分析DNA的变异和RNA的表达模式,进而预测哪些基因或调节元件与肺癌的发生和发展相关。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
兴趣小组活动总结研究小组成员:叶涛、梅坤荣、高冠男、殷毅、叶瑞强、林珑辅导老师:杜立林博士、朱冰博士、戚益军博士、马力耕博士一引子基因组学课程期末考试的最后一道论述题,是“请根据自己的理解,总结基因组非编码区可能的功能”,。
当时回忆起Watson主编的《Molecular Biology of the Gene》中说,3200Mb 人类基因组里,除了48Mb是基因外,还有intron、UTR、pseudogene、microsatellite、transposon 以及编码miRNA的序列,便如是作答。
这道题,引起了我对基因组非编码区功能的极大兴趣:为什么物种越往高等进化,基因组非编码序列的比例就越高?为什么仅仅两万八千左右个基因,就能决定人类作为万物之灵长的地位,可这个数目并不比果蝇多多少啊?什么决定了人类的智力,关键在于基因序列还是所谓的“j unk DNA”?玉米的基因组比水稻大很多,但也未见得玉米就比水稻高等,那么是什么决定了基因组的大小呢?这些问题时常浮现在我脑中,正好借晓东所长提出的“兴趣小组”活动,通过跟组员的讨论、与PI的交流,希望产生一些思维碰撞的灵感。
这一系列文章,是我对“兴趣小组”活动的全面总结,一部分是流水账般的记叙小组讨论,一部分是跟PI讨论的收获,还有一些是我们自己mental exercise的过程,包括提出的假设、可能的实验手段和存在的瓶颈,最后是组员的一些感想。
值得一提的是,虽然我们小组人数不多,但指导老师是最多的,这给我们提供了更多与PI交流的机会。
最后说明一下,我们所说的“non-coding DNA”,是指不编码蛋白的基因组DNA序列。
二组员和最初的几次讨论我们小组的题目是“基因组非编码序列的功能”,先描述一下各位组员吧。
梅坤荣,华科生物信息专业。
我觉得她最强的地方是,不论组员之间意见多么分歧,抑或是思路不太清晰,她都能帮我们理清头绪,首先做什么,接着做什么,并提出大家都容易接受的方案。
高冠男,山东大学,一个说话声音不大的女生,对non-coding DNA在个体发育中的调控作用十分感兴趣。
记得每次讨论的时候,都很认真的记笔记,提出的问题往往能反映出她活跃的思考。
殷毅,北师大,在以前的实验室做了一年关于microRNA的实验训练,相当能提问,从她的提问中,能感觉出她读过各个方面的论文,有很广泛的知识背景,此外对非编码区编码的microRNA很感兴趣。
叶瑞强,武汉大学。
人称“小强”,一个相当粗犷的山东汉子,对自己的人生道路有很明确的把握,他永远不会拒绝需要帮助的人。
他的实验经历很丰富,是能花100%精力做好一件事的人。
此外,篮球、乒乓球、排球……他样样精通,要打球,找他准没错。
林珑,安徽大学。
说话语速挺快,做事很有热情的女生。
最初的几次,主要讨论了从什么角度研究non-coding DNA,有人希望把精力主要放在non-coding DNA的进化问题上,还有人提议把焦点集中在non-coding RNA上,也有人提议将non-coding DNA分为卫星/微卫星序列、转座子、假基因、内含子等不同特点的类别进行讨论。
总之,没有统一的意见,我们决定找指导老师讨论后,再做决定。
三与PI的讨论杜立林老师的研究方向主要是,以裂殖酵母为实验材料研究DNA双链断裂。
他向我们介绍了“The ENCODE Project”,难以置信的是,研究表明整个基因组,包括DNA的两条链,都会被转录。
他还提到,河豚的全基因组测序并不是因为作为模式生物来研究,而是因为它比其他脊椎动物基因组小很多,所谓的“垃圾DNA”很少,可能成为研究如何在含较少non-coding DNA情况下,基因组是如何复制的模型。
他让我们意识到,基因组不同层次的包装,似乎也存在着某种密码,例如某些位置相对固定的核小体所需的核小体定位信号。
他同时提到了一个新的概念“染色体脆性位点”,实际上脆性位点会在正常条件下发生双链断裂,造成基因组的不稳定性。
那么为什么经过长期的进化,这些位点没有经过选择压力被淘汰呢?杜立林老师认为,同一段序列可能需要同时执行多种功能,为了执行某些更重要的功能,这些位点必须同时具有“脆性”。
我们从马力耕老师体会了用分类的方法、进化的思想,研究问题的思路;从戚益军老师了解到,可以用研究一个基因的方法来研究microRNA的功能;从朱冰老师很多“搞笑”的故事中,想象了基因组在细胞核中可能存在的三维空间结构。
这些讨论,让我们逐渐认识到基因组提供的是多维的信息,除了已知层面的信息外,基因组还具有很多隐含的信息,鉴于高等生物基因组中90%以上由non-coding DNA组成,或许这些隐含信息正是蕴含在貌似“垃圾”的non-coding DNA中的。
四我们的一些设想首先,我们把基因组的信息分为了三个层次:隐含信息、序列水平的信息、调控水平的信息。
隐含信息包括核小体定位信号等蕴含着决定基因组高级结构的信息中,我们几乎可以肯定这种信息的存在,但我们对这些信息的表现形式不太明了,这主要受实验条件的限制。
序列水平的信息,包括例如染色体脆性位点等具有序列和位置特异性的位点。
调控水平的信息主要包括各种non-coding RNA的调控作用。
我们有两个很初步的设想:(一)核小体定位信号作为选择压力的基因组大小决定:基因组就像是一个巨大的图书馆,大约每200bp一个核小体,因此核小体就像是一种标签。
部分核小体的位置是相对固定的,这些核小体定位信号就存在与基因组中。
为了解释同一进化水平生物基因组大小的差异,例如为什么玉米比水稻基因组大很多,我们选择核小体定位信号作为一种选择压力,当基因组序列不足以提供所有需要定位的核小体信号时,基因组功能便不能得到有效执行,具有进化上的劣势,将在进化过程中被淘汰。
在这种时候,有两种选择,一是基因组的扩大,以满足所需的核小体定位信息,可能当DNA序列增加时,用来定义基因组空间结构的保守位置核小体数目增加,于是进入的一种选择趋于增大的基因组的进化方向;另一种选择是基因组的缩小,通过减少DNA序列,减少对保守位置核小体的需求,进入一种选择趋于减小的基因组的进化方向。
最终,达到基因组大小与核小体定位所需信息的一种平衡。
这个设想,其实是基于基因组信息并不是随大小的增加而线性增加的,于是存在了多个基因组信息与基因组大小的平衡状态。
对于这个进化上的设想,难以找到可行的试验方法进行验证,只能做“理想实验”,从逻辑上考察其合理性。
(二)染色体的程序性断裂:基因组的断裂对细胞具有很大危害,而且对细胞来说,染色体特定位点的断裂比随机断裂更加具有可控性。
我们的设想是细胞存在一种机制介导染色体程序性断裂。
由于从酵母到人,都具有染色体脆性位点,我们推测染色体程序性断裂的机制可能是保守的,因此选择便于培养、生长快速、容易观察的裂殖酵母为实验材料。
将含有已知脆性位点的序列和荧光报告基因整合到酵母基因组合适区域,当脆性位点发生断裂,显微镜下将观察到酵母发出荧光。
我们预计野生型酵母,脆性位点自发断裂具有较稳定的断裂几率。
诱变剂处理酵母,在不同环境压力和化合物处理条件下,筛选脆性位点自发断裂显著降低的突变体,定位发生突变的DNA区域,如果编码一种蛋白,可使用免疫共沉淀等研究蛋白质与蛋白质相互作用的方法找到可能存在的介导染色体程序性断裂的复合物中的其他组分。
五小组成员活动感想高冠男:多年来,研究者们对人类基因组的关注主要集中在编码蛋白质的基因和蛋白质本身。
随着人类基因组计划的完成和哺乳类转录组数据的不断积累,揭示出人类和其他高级真核生物的遗传物质只有极小一部分编码蛋白质,而超过97﹪的转录产物是功能多样的RNA分子,即非编码RNA(non-coding RNA,ncRNA)。
绝大部分非编码序列以高度重复序列的形式存在,如卫星、小卫星、微卫星、长散布元件、短散布元件等;内含子、3'不译区作为结构基因的一部分被一同转录;RNA基因转录具有明确功能的RNA分子;顺式作用元件是目前已知的具有重要调控功能的非编码序列;非编码序列的存在与真核生物基因表达调控密切相关;目前非编码序列的研究已引起广泛的科学关注,利用数理方法研究其遗传信息的储存方式及运作规律是十分重要的研究领域。
非编码序列的起源问题是一个引起众多关注的问题。
关于这一问题有着很多不同的猜测,如病毒起源和基因duplication起源等,但是并没有得到明确的证据。
对于是怎样一个过程造成了这些可能是外源或者内源的插入的多余基因变成了有用的基因。
如串联重复序列是指1~200个碱基左右的核心重复单位,以头尾相串联的方式重复多次所组成的重复序列。
它广泛存在于真核生物和一些原核生物的基因组中,并表现出种属、碱基组成等的特异性。
在基因组整体水平上,各种优势的重复序列类型不同。
即使在同一重复序列类型内部,不同重复拷贝类别(如AT、AC等)在基因组中的存在也表现出很大的差异。
同时,这些重复序列类型和各重复拷贝类别在同一物种的不同染色体间,以及基因的编码区和非编码区间也表现种属和碱基组成差异。
这些差异显示了重复序列起源和进化的复杂性,可能涉及到多种机制和因素,并与生物功能密切相关。
通过序列保守性的比对与功能分析,发现保守性与功能的重要性无关,在序列上不保守的区域可能会有着相同的功能,这些功能可能是非常重要的。
基因组的大部分都会被转录为RNA,但是相当的部分转录水平很低,但是不能排除这些转录子都是有功能的。
生物信息学与计算机应用在这一领域起到了重大作用,但是很遗憾缺乏这方面的人才。
我们通过讨论发现,兴趣很好找,但是一旦想要从兴趣中挖掘出一个切实可行的project确实是难上加难。
要从两个方面考虑,第一是是否有研究意义,这决定了是否能申请到足够的经费。
另一方面是从本身的可实施性考虑,是否能够在实验室的条件下解决。
两者缺少了哪一个都会使这一目标成为失败的。
叶瑞强:非编码序列,即所谓的有功能蛋白质的DNA序列。
现在已经有越来越多的人认同它们不是,或者不仅仅是我们曾经认为的“JUNKDNA”的观点。
垃圾可以理解为“无用的”,人类基因组工程确定了大约两千多个与蛋白质制造有关的基因,而其余的基因片段被认为是由所谓的没有功能的“垃圾”DNA片段组成的。
我认为造成这种观点的原因主要有三个:第一,非编码序列有很多都是重复的、冗余的、结构简单的等特征,很难将它们和复杂的功能联系到一起;第二,由于当时研究水平的限制,没有确切的证据能够表明它是有用的;第三,因为几乎所有具体的生理机能都要由蛋白质来完成,所以认为不编码蛋白质的DNA应该是没有用的也是正常的。
但是,现在已经发现了很多非编码区域内的调控序列,它们能帮助基因开启和关闭以调控基因的表达,于是涌现了很多如操纵子、增强子,绝缘子等新的概念,当然也包括目前研究的比较火热的miRNA,这些发现可以基本排除完全否定非编码序列的观点。