未知基因验证
获得未知基因的方法

染色体步移技术(Genome walking):这是一项重要的分子生物学研究技术,使用这种技术可以有效获取与已知序列相邻的未知序列。
染色体步移技术主要有以下几方面的应用:①根据已知的基因或分子标记连续步移,获取人、动物和植物的重要调控基因,可以用于研究结构基因的表达调控。
如分离克隆启动子并对其功能进行研究;②步查获取新物种中基因的非保守区域,从而获得完整的基因序列;③鉴定T-DNA或转座子的插入位点,鉴定基因枪转基因法等转基因技术所导致的外源基因的插入位点等;④用于染色体测序工作中的空隙填补,获得完整的基因组序列;⑤用于人工染色体PAC、YAC和BAC的片段搭接。
对于基因组测序已经完成的少数物种(如人、小鼠、线虫、水稻、拟南芥等)来说,可以轻松地从数据库中找到某物种已知序列的侧翼序列。
但是,对于大多数生物而言,在不了解它们的基因组序列以前,想要知道一个已知区域两侧的DNA序列,只能采用染色体步移技术。
常用的方法有:1. 反向pCR(reverse PCR):其基本点是用适当内切酶裂解核心区外分子,使这些酶切片段自身连接形成环状分子,从而将边侧区域转化为内部区域。
用与核心区末端同源的引物,但其3’端趄向未知区域,可以进步用pCR扩增环中的未知区域。
反向pCR程序目前,反向pCR所扩增的片段的大小实际上限为3-4kb。
在许多情况下,首先需要进行Southern杂交来确定内切酶用以产生大小适于环化及反向pCR的片段的末端片段。
能裂解核心区的内切酶使反向pCR只能扩增引物所定模板(依赖于引物)的上游或上游区,而不裂解核心区的酶则使两上边侧序列都扩增,并带有由内切酶和环化类型决定的接点。
对于扩增左翼或右翼序列,初试时最好靠近识别上个碱基位位的酶,并已知在核心区有其方便的裂解位点。
如果用反向pCR 从含有大量不同的克隆片段的同一载体中探测杂交探针,建议事先在载体中引入合适的酶切位点。
用T4连接酶在稀DNA浓度下环化更容易形成单环。
生物信息学中的基因序列分析与预测

生物信息学中的基因序列分析与预测生物信息学是一门综合学科,它将计算机科学、数学和统计学等技术应用于生物学领域。
基因序列分析与预测是生物信息学中的重要研究领域之一,它涉及到对基因序列的分析、注释和预测。
基因序列是生物体内以DNA或RNA形式存在的遗传信息。
通过对基因序列的分析,我们可以了解基因的功能和结构,进而深入研究生物体的生理过程和疾病发生机理。
基因序列的注释则是对基因序列进行功能和结构的解读和标记,在基因组学研究和生物学研究中起到关键作用。
基因序列的预测是通过生物信息学技术对未知基因序列进行功能和结构的预测。
在基因组学研究中,大量基因序列还没有被准确注释,因此基因序列的预测对于深入研究生物体的特征和功能非常重要。
基因序列预测可以通过多种算法和技术来实现,其中最常用的方法包括序列比对、开放阅读框(ORF)预测、蛋白质结构预测等。
序列比对是基因序列分析的基本方法之一,它通过比较待分析序列与已知序列数据库中的序列进行比较,从而找到相似的区域和序列特征。
根据比对结果,可以判断待分析序列与已知序列的亲缘关系、功能和结构等信息。
开放阅读框(ORF)预测是对基因序列中的蛋白编码区域进行预测。
开放阅读框是指在核苷酸序列中没有起始密码子和终止密码子的连续核苷酸序列。
通过使用启动子预测算法和终止密码子识别算法,可以准确地预测基因序列中的开放阅读框,进而推断蛋白编码区域的位置和功能。
蛋白质结构预测是预测待分析基因序列所编码的蛋白质的三维结构。
蛋白质的结构对于其功能和相互作用非常关键,因此准确地预测蛋白质结构对于研究蛋白质的功能和疾病发生机制具有重要意义。
蛋白质结构预测方法主要分为比较模型和折叠模型两种,通过比对已知结构的同源蛋白质,或者通过物理化学规则和算法,可以预测待分析蛋白质的结构。
在生物信息学中,基因序列分析与预测常常是多领域合作的结果,涉及到计算机科学、生物学、数学和统计学等多学科的知识与技术的融合。
随着高通量测序技术的不断发展,我们可以获取到大量的基因序列数据,这为基因序列分析与预测提供了更多的机会和挑战。
微生物生理学(王海洪)6细菌结构基因的鉴定副本

中断杂交实验:将接合中的细菌按不同时间取样,并将样品放
入搅拌器内猛烈搅拌,以打断细菌的接合管,终止接合。由于接 合时间不同,不同长度的细菌染色体(基因组)从供体转移到受 体,分析受体的基因型即可知细菌染色体的基因转移顺序,以确 定细菌染色体上基因位置(包括基因顺序和距离)
Hfr a+b+c+d+e+ Strs×F-a-b-c-d-eStrr
大肠杆菌JP1111为烯脂酰ACP还原酶基因(fabI)温度敏感突变菌 株钟处,trpC基 因位于28.38分钟处。 有一菌株CAG18455为trpC::Tn10,四环素 抗性。 以EPI300 fabI(Ts) trpC次亚克隆,得到fabV。
经典模式细菌基因鉴定
主要包括大肠杆菌、鼠伤寒沙门氏菌、枯草芽孢杆菌
通过基因定位鉴定未知基因(以大肠杆菌为例) 基因定位意义 确定发现的基因为新的基因。
邻近的基因可能为新基因提供一些功能和调节方面的信
息。 基因遗传图位的知识可能为以后的遗传操作提供帮助。
接合与基因定位
F质粒的特性
大肠杆菌的致育因子,为 100kb质粒 其上主要有转移区、复制区和 插入序列三个区域 根据携带F质粒的情况,大肠 杆菌分四种:F-、F+、F’ 和Hfr
大肠杆菌基因组有两个编码长链脂酰ACP合成酶的基因:fabB和 fabB。而在茄科雷尔氏菌基因组有4个与大肠杆菌fabF同源的基因, 1个与fabB同源的基因。
细菌未知基因的鉴定:遗传互补
以鉴定霍乱弧菌烯脂酰ACP还原酶基因(fabV)为例: 使用福斯载体(fosmid)和专一C1FOS
具有一般质粒、F因子和λ噬菌体 的三重特性。 携带有F因子单拷贝复制子,可调 控的高拷贝复制子和λ噬菌体的 cos位点。 像一般柯斯载体一样可进行体外重组和包装,感染大肠杆菌宿主 菌后可像F因子一样以单拷贝存在,在诱导条件下可增加拷贝。 宿主菌:EPI300 专一性地与pCC1FOS匹配,诱导时能提供高拷贝复制子复制所 需的TrfA蛋白。 EPI300的改造 EPI300为烯脂酰ACP还原酶原养型菌株,不宜直接用于筛选霍乱 弧菌烯脂酰ACP还原酶基因。
测序实验报告

测序实验报告测序实验报告序言近年来,随着生物技术的不断发展,基因测序技术已经成为生物学研究和医学诊断的重要手段之一。
本篇文章将介绍一项基因测序实验的过程和结果,旨在展示该技术在生物学领域的应用。
实验目的本次实验的目的是对一种未知细菌的基因组进行测序,以了解其基因组结构和功能,为进一步研究提供依据。
实验步骤1. 样品准备:从培养基中取出待测细菌样品,进行细菌培养和提取DNA。
2. DNA纯化:通过离心和酶处理等步骤,将提取到的DNA纯化。
3. DNA片段构建:将纯化后的DNA进行打断,得到一系列短小的DNA片段。
4. 连接接头:在DNA片段的两端连接上适当的接头序列,以便后续扩增和测序。
5. 扩增:利用聚合酶链式反应(PCR)技术,对连接好的DNA片段进行扩增,得到大量的DNA模板。
6. 准备测序样品:将扩增得到的DNA模板进行纯化和浓缩,得到适合测序的样品。
7. 测序:将样品送入高通量测序仪中进行测序,获得大量的测序数据。
实验结果通过测序仪获得的原始数据需要进行一系列的数据处理和分析,才能得到有用的信息。
首先,对原始数据进行质量控制,去除低质量的碱基,减少测序误差。
然后,将清洗后的数据与已知基因组数据库进行比对,以确定待测细菌的亲缘关系和物种分类。
接下来,对测序数据进行组装,将碎片化的DNA片段拼接成连续的序列,得到待测细菌的基因组序列。
最后,对基因组序列进行注释,识别出其中的基因、调控元件和重要功能区域。
讨论与结论通过本次实验,我们成功地对一种未知细菌的基因组进行了测序,并获得了该细菌的基因组序列。
通过对基因组序列的分析和注释,我们发现该细菌拥有多个重要的代谢途径和抗生素抗性基因。
这些发现为进一步研究该细菌的生物学特性和致病机制提供了重要线索。
总结基因测序技术的发展使得我们能够深入研究生物体的基因组结构和功能。
本次实验展示了基因测序的整个过程,从样品准备到数据分析,再到结果解读。
通过测序实验,我们不仅可以了解未知生物的基因组信息,还可以揭示其潜在的生物学特性和重要功能。
人类基因组中的功能未知基因的鉴定与研究

人类基因组中的功能未知基因的鉴定与研究随着生物学和基因学的快速发展,我们对于人类基因组的了解越来越深入。
但是,仍有很多基因即使被测序也无法确定它们的功能。
这些基因被称为功能未知基因。
尽管这些基因的功能不清楚,但它们可能对人体健康和疾病发展有着重要的作用。
因此,鉴定和研究这些功能未知基因变得至关重要。
一、鉴定功能未知基因功能未知基因的鉴定通常是通过生物信息学方法进行的。
首先,研究人员需要对人类基因组进行测序,然后将测序的信息与已知功能的基因进行比对。
如果一个基因没有与已知功能的基因匹配,那么这个基因就被认为是未知功能的基因。
然而,这种方法只能鉴定一部分功能未知基因。
因为许多基因在不同组织和细胞中都有不同的表达方式和不同的功能,所以只有在特定条件下才能发现它们的作用。
因此,在鉴定未知功能的基因时需要使用多种方法,例如基因表达谱分析、蛋白质互作网络分析和大规模基因消失实验等。
二、功能未知基因的作用虽然我们尚未完全理解功能未知基因的作用,但已有一些研究表明,这些基因可能与许多生物过程相关。
例如,这些基因可能与细胞增殖、分化和凋亡等过程有关。
此外,它们也可能参与免疫系统、神经系统和代谢的调节。
最近,一些研究还发现了一些功能未知基因与肿瘤发展有关。
这些基因可能参与了肿瘤细胞的增殖、转移和侵袭等过程。
因此,对这些基因的鉴定和研究可能有助于发现新的治疗靶点。
三、研究功能未知基因的挑战尽管在鉴定和分析功能未知基因的方面已经取得了一些进展,但仍存在许多挑战。
一个主要的挑战是如何确定这些基因的功能。
传统上,我们会通过基因敲除或过表达来研究基因的功能。
但这种方法对于功能未知基因并不总是有效,因为这些基因可能在特定条件下才会被表达或发挥作用。
因此,我们需要开发新的技术和方法来研究这些基因的生物学功能。
此外,目前生物信息学技术的不断进步和基因组测序的价格下降使得测序数据不断积累和扩大。
大量的数据使得生物学研究变得愈加复杂,需要用到更为精细的算法和模型来提取和分析数据,因此我们需要不断更新我们的研究方法和技术。
基因追踪的原理和应用

基因追踪的原理和应用概述基因追踪是指通过分析DNA序列的变异来追踪个体间的遗传关系或者追溯个体的祖先来源。
利用基因追踪技术可以揭示人类起源、人类迁徙历史、家族关系以及遗传性疾病等重要信息。
本文将介绍基因追踪的原理和一些典型的应用。
基因追踪的原理基因追踪的原理是基于DNA的遗传规律。
DNA是构成基因的分子,在不同的个体中存在着一定数量的变异,这些变异被称为单核苷酸多态性(SNP)。
通过比较不同个体的SNP分布,可以确定个体间的遗传关系或者追溯个体的祖先来源。
基因追踪的过程通常包括以下几个步骤:1.采集样本:采集被测个体的DNA样本,可以是血液、口腔拭子或其他组织。
2.提取DNA:通过化学方法从样本中提取DNA。
3.序列测定:使用高通量测序技术对DNA序列进行测定,得到个体的基因组信息。
4.SNP分析:比较不同个体的SNP分布,寻找共同的变异位点,确定个体间的遗传关系。
5.数据分析和解读:通过数据分析算法和数据库比对,对测序数据进行解读和验证。
基因追踪的应用人类起源研究基因追踪技术在人类起源研究中发挥着重要的作用。
通过比较不同地理区域的人群的基因组序列,可以分析人类的迁徙历史和人类群体之间的遗传联系。
例如,研究发现亚洲人和非洲人的基因组差异较大,支持了人类起源于非洲的观点。
此外,还可以通过研究古人类化石上的DNA,揭示出人类进化的线索。
家族关系识别基因追踪技术可以用于识别家族关系,例如确定父母与子女之间的血缘关系、寻找长时间失散的亲人等。
通过比较家族成员间的DNA序列,可以找到共有的SNP位点,进而确定他们的亲缘关系。
犯罪侦查基因追踪技术在犯罪侦查中也有广泛的应用。
当犯罪现场留有嫌疑人的DNA 样本时,可以通过与嫌疑人的DNA比对,确认嫌疑人的身份。
此外,在罪案中未知身份的遗体或者遗骨的化验中,也可以利用基因追踪技术进行身份鉴定。
遗传性疾病研究基因追踪技术对于遗传性疾病研究也非常重要。
通过比较患者和健康人群的基因组序列,可以发现与遗传性疾病相关的变异位点,有助于诊断和治疗相关疾病。
判断基因的位置的方法

常染色上
仅位于X染色体上
位于X-Y同源区段 位于细胞质中
一、判断基因位于常染色体还是X染色体上
1、基因的显隐性未知
方法:正交、反交实验
1)若基因常染色体上
正交: P AA(♀) × aa(♂) F1 Aa 反交: P AA(♂) × aa(♀) F1 Aa
正反交实验结果相同, 则基因位于常染色体上
2)若仅位于X染色体 P : X AY × X aX a ↓ F1 XAXa X aY
结论: 若子代不论雌雄均为显性,则基因在X-Y的同源区段上; 若子代雌为显、雄为隐,则基因在X染色体上。
三、判断基因位于常染色体上还是X-Y的同源区段
方法:隐性(雌) ×显性杂合(雄)
1)若位于X-Y同源区段 P : X AY a × X aX a
2)若位于常染色体 P: aa × Aa
F1
X AX a
↓
X aY a
F1
Aa
↓
aa
结论: 若子代性状与性别无关,则基因在常染色体上; 若子代性状与性别有关,则基因在X-Y的同源区段上。
四、判断基因位于细胞核还是细胞质中
方法:正交、反交实验
A.若两组杂交结果相同,则该基因 位于细胞核内的常染色体上。 正交:♀aa×♂AA→Aa 反交:♀AA×♂aa→Aa
2)若基因X体上
正交: 反交: P XAXA(♀) × XaY(♂) P XAY(♂)×XaXa(♀) F1 XAXa XAY F1 XAXa XaY
正反交实验结果不同, 则基因位于X染色体上
用相对性状的个体(纯合体)做正交、反交实验
结论: 正反交实验结果相同,则基因位于常染色体上; 正反交实验结果不同,则基因位于X染色体上。
确定未知蛋白的方法

确定未知蛋白的方法
要确定一个未知蛋白,科学家们通常会采用一系列实验和技术来鉴定其结构和
功能。
下面是几种常用的方法:
1. 基因测序:通过测定蛋白质编码基因的DNA序列,可以确定其可能的氨基
酸序列。
这可以为后续的研究提供重要的线索。
2. 蛋白质表达和纯化:将未知蛋白质的基因转化到合适的宿主表达系统中,然
后通过蛋白质纯化技术获得高纯度的蛋白质样品。
这样可以进一步对蛋白质进行分析和研究。
3. 质谱分析:质谱技术可以用来确定蛋白质的分子量、氨基酸序列和修饰情况。
通过与已知蛋白质的数据库比对,可以推断未知蛋白的可能身份。
4. 核磁共振(NMR):NMR技术可以提供蛋白质的三维结构信息。
通过分析
蛋白质在不同条件下的核磁共振谱图,可以确定其结构和构象。
5. X射线晶体学:将纯化的蛋白质样品结晶,并通过X射线衍射技术得到衍射图像。
通过解析衍射图像,科学家们可以确定蛋白质的精确三维结构。
6. 功能鉴定:通过一系列生化实验和功能分析,科学家们可以确定蛋白质的生
物学功能和相互作用伙伴。
这可以通过酶活测定、结合实验、细胞功能分析等方法来实现。
总体而言,确定未知蛋白的方法是多种多样的,通常需要结合多种技术手段进
行综合分析。
这些方法的综合应用可以帮助科学家们更好地理解蛋白质的结构和功能,推动相关领域的研究和发展。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
现在,研究人员开发出一种在酵母中分析这种基因功能的新方法。
研究人员用一种可热诱导的“Degron”来标记一个目标蛋白,标记物使得该蛋白在37摄氏度易发生蛋白水解,而且,当一个重要蛋白在活体中被破坏时,可对由该蛋白功能损失所产生的结果进行判别。
研究人员采用这种方法来筛选细胞周期演进中的缺陷,在酵母中识别出三种DNA复制因子。
双链RNA对基因表达的抑制及其应用细胞中存在的绝大多数RNA分子都是单链的,在遗传信息传递及蛋白质合成过程中发挥作用。
DsRNA通常是感染细胞的病毒在复制过程中RNA合成的中间产物或一些DNA序列两条互补链转录产物相互结合的副产物。
早期的研究揭示dsRNA会通过干扰素途径诱导产生一种蛋白激酶从而抑制被感染细胞中的蛋白质合成,但并不清楚dsRNA如何影响受感染细胞的正常基因表达及其功能。
RNAi(RNA interference)是指外源性双链RNA(dsRNA)能抑制细胞内与其序列同源的基因的表达,在进化上,这可能是生物调控基因表达及抵御病毒侵染或转座子诱导DNA突变的一种共有的生理机制。
自1998年Fire证明RNAi可被应用于研究线虫基因的功能以来,已取得了巨大的进展。
尤其是在人类及小鼠基因组计划相继完成,研究的重心已从大规模测序阶段转移到功能基因组的背景下,我们面临的是如何诠释这些遗传信息、如何将这些序列信息与生物学功能关联起来。
而RNAi为我们研究未知功能的基因提供了新的反向遗传学手段,同时在人类基因治疗方面具有潜在的应用价值。
在未知功能基因的研究中,常用的反向遗传学手段包括基于同源重组的基因敲除及利用负链RNA与同源mRNA通过碱基互补结合,从而阻止其翻译或触发降解机制的反义RNA抑制两种手段,并都已成功地应用于一些功能基因的研究。
但这两种方法都不能完全满足日益增长的研究需求。
如,基因敲除能从根本上消除目标基因的活性,是经典的反向遗传学手段,但由于常规的基因敲除试验需要:(1)构建含突变位点的目标基因载体;(2)导入胚胎干细胞(ES)细胞;(3)筛选含重组构件的ES细胞;(4)将上述ES细胞注入囊胚腔;(5)通过嵌合体F1代自交以产生带突变纯合体的F2代,这往往需要几个月的时间,不利于在短期内研究数量较多的未知功能基因。
同时,若希望一次性敲除两个或多个基因,对于基因敲除也是一大难题。
此外,若希望研究某一突变致死基因在特定胚胎发育阶段的功能,基因敲除可能也无法满足研究的需求,因为胚胎可能在早期就因为缺失此基因而死亡。
在某些制造基因敲除动物模型十分困难或因伦理学原因根本就不可能进行的物种中(如大型动物及人),基因敲除也无法应用。
对于反义RNA抑制手段,虽然应用于果蝇中已取得了较好的效果,但在爪蟾(Xenopus)、斑马鱼(Zebrafish)及小鼠胚胎中反义RNA不能稳定可靠地降低目标基因(例如Mos,Plat)的表达。
同时,由于反义RNA技术对内源性基因表达的抑制较弱,往往产生过渡性的表型,这也妨碍了我们对目标基因功能的准确判断。
RNAi可以有效地弥补基因敲除与反义RNA抑制的不足。
由于RNAi作用比反义RNA技术更有效,更持久;比基因敲除更省时,可在短期内对多个基因进行研究(如探讨与果蝇已知序列染色体上所有开放阅读框相关联的表型);通过导入多种dsRNA,可以研究一系列基因的功能及他们之间的相互关系,特别是研究母源性mRNA对卵母细胞及胚胎后继发育的影响具有其他方法无法比拟的优势,因此具有广阔的应用前景。
最近,Elbashir使用21 bp dsRNA避免了干扰素引起的细胞非特异性应激反应,实现了在一系列哺乳类细胞系中,包括人类Hela及胚胎性肾细胞系293中dsRNA对特定基因表达的抑制作用,进一步扩大了RNAi的应用范围,并为利用dsRNA进行基因治疗提供了实验依据。
尽管许多基因RNAi的表型与其基因敲除后的表型吻合得很好,但RNAi并不适用于所有的基因,如dsRNA对一些在神经细胞中发挥功能的基因抑制作用不明显。
同时,dsRNA会抑制细胞内所有具序列同源性的基因表达,因此与RNAi相关联的表型可能反映了一个基因家族中几个高度相关的基因缺失所导致的共同表型,而不仅仅是某一个特定的基因。
此外,一些不相关基因也有可能因为局部序列的相似性而成为dsRNA的抑制作用对象。
但上述问题都可以通过合理的dsRNA 设计加以克服。
此外,虽然dsRNA能有效抑制目标基因的表达,但必须意识到dsRNA的抑制作用是在转录后水平上实现的,并不是完全的。
因此,RNAi作用后,一些基因依然可能保持低水平的基因表达。
在研究未知基因的功能时必须考虑到RNAi的这些特点。
问题与展望dsRNA能特异性抑制同源基因表达的发现引起了越来越多研究者的兴趣。
目前对于RNAi的作用机制已有了较深入的认识,但依然有许多方面尚不明了,如介导降解mRNA的核糖核蛋白复合物(RNP)的构成及其行使功能的机制,rde-1和rde-4在dsRNA降解及小片段dsRNA传递到RNP过程中如何行使其功能,及推测中的螺旋酶尚未得到鉴定等等。
然而,这并不妨碍RNAi成为研究线虫功能基因组的有力手段之一,并已被越来越多的实验室应用于未知基因功能的研究。
当前,人类的基因组计划已完成,而另一个重要的模式动物--小鼠基因组计划也即将完成,RNAi 无疑可以在这些物种的大规模功能基因组的研究中发挥重要的作用。
目前越来越多的基因测序工作已完成,接下来的问题是这些基因的功能是什么、不同的基因参与了哪些细胞内不同的生命过程、基因表达的调控、基因与基因产物之间的相互作用、以及相同的基因在不同的细胞内或者疾病和治疗状态下表达水平等等。
因此,在人类基因组项目后,转录组的研究迅速受到科学家的青睐。
转录组学(transcriptomics)就是在基因组学后新兴的一门学科,即研究细胞在某一功能状态下所含mRNA的类型与拷贝数。
以DNA为模板合成RNA的转录过程是基因表达的第一步,也是基因表达调控的关键环节。
所谓基因表达,是指基因携带的遗传信息转变为可辨别的表型的整个过程。
转录组就是转录后的所有mRNA的总称。
与基因组不同的是,转录组的定义中包含了时间和空间的限定。
同一细胞在不同的生长时期及生长环境下,其基因表达情况是不完全相同的。
人类基因组包含有30亿个碱基对,其中大约只有5万个基因转录成mRNA分子,转录后的mRNA能被翻译生成蛋白质的也只占整个转录组的40%左右。
通常,同一种组织表达几乎相同的一套基因以区别于其他组织,如:脑组织或心肌组织等分别只表达全部基因中不同的30%而显示出组织的特异性。
转录组谱可以提供什么条件下什么基因表达的信息,并据此推断相应未知基因的功能,揭示特定调节基因的作用机制。
通过这种基于基因表达谱的分子标签,不仅可以辨别细胞的表型归属,还可以用于疾病的诊断。
例如:阿尔茨海默病(Alzheimer′s diseases, AD)中,出现神经原纤维缠结的大脑神经细胞基因表达谱就有别于正常神经元,当病理形态学尚未出现纤维缠结时,这种表达谱的差异即可以作为分子标志直接对该病进行诊断。
同样对那些临床表现不明显或者缺乏诊断金标准的疾病也具有诊断意义,如自闭症。
目前对自闭症的诊断要靠长达十多个小时的临床评估才能做出判断。
基础研究证实自闭症不是由单一基因引起,而很可能是由一组不稳定的基因造成的一种多基因病变,通过比对正常人群和患者的转录组差异,筛选出与疾病相关的具有诊断意义的特异性表达差异,一旦这种特异的差异表达谱被建立,就可以用于自闭症的诊断,以便能更早地,甚至可以在出现自闭症临床表现之前就对疾病进行诊断,并及早开始干预治疗。
转录组的研究应用于临床的的另一个例子是可以将表面上看似相同的病症分为多个亚型,尤其是对原发性恶性肿瘤,通过转录组差异表达谱的建立,可以详细描绘出患者的生存期以及对药物的反应等等。
目前用于转录组数据获得和分析的方法主要有基于杂交技术的芯片技术包括cDNA芯片和寡聚核苷酸芯片,基于序列分析的基因表达系列分析SAGE (serial analysis of gene expression,SAGE)和大规模平行信号测序系统MPSS(massively parallel signature sequencing,MPSS)。
1991年Affymetrix公司在Southern blot 基础上,开发出世界上第一块寡核苷酸基因芯片,自此微阵列技术(基因芯片)得到迅速发展和广泛应用,已成为功能基因组研究中最主要的技术手段。
但是芯片无法同时大量地分析组织或细胞内基因组表达的状况,而且由于芯片技术需要准备基因探针,所以可能漏掉那些未知的、表达丰度不高的、可能是很重要的调节基因。
SAGE是近年来发展的以测序为基础的分析特定组织或细胞类型中基因群体表达状态的一项技术。
其显著特点是快速高效地、接近完整地获得基因组的表达信息。
SAGE 可以定量分析已知基因及未知基因表达情况,在疾病组织、癌细胞等差异表达谱的研究中,SAGE可以帮助获得完整转录组学图谱、发现新的基因及其功能、作用机制和通路等信息。
MPSS是对SAGE的改进,它能在短时间内检测细胞或组织内全部基因的表达情况,是功能基因组研究的有效工具。
因其需要配套的软硬件较为昂贵,目前国内外的相关应用报道不多。
MPSS技术对于致病基因的识别、揭示基因在疾病中的作用、分析药物的药效等都非常有价值,该技术的发展将在基因组功能方面及其相关领域研究中发挥巨大的作用。
功能基因筛选的基本策略功能基因筛选研究的基本策略包括: (1) 通过表达谱差异分析、生物信息学分析和基因克隆等途径获得候选基因; (2) 对候选基因进行功能评价(identification of function ,可在基因组、转录、蛋白质组和代谢产物等水平进行); (3) 基因功能确证(validation of function); (4) 决定开发战略。
获得候选基因的研究路线之一是通过正常和疾病组织的表达谱差异分析(expression profiling of normal and diseased tissues) 获得疾病的相关基因,进一步进行基因功能的筛选研究。
该筛选策略与疾病过程密切相关,较多地应用于新药及治疗靶点的发现。
确定候选功能基因获得候选基因的另一研究路线是通过生物信息学分析( bioinformatic analysis) 预测、选定基因序列、克隆获得候选基因,进一步进行基因功能的筛选研究。
该研究策略筛选范围广,多用于新基因的功能探索研究。
用于生物信息学分析的数据资料,主要来源于DNA 芯片技术和其他相关技术测定的基因表达信息。
通过与已知基因或蛋白质序列的分析、比较,可以确定候选研究基因序列长度,提供该未知基因产物信号转导通路、细胞结构蛋白类型和细胞定位等预测信息。