关于在人类基因组中检测结构变异计算方法的综述
人类表观遗传学相关基因变异的鉴定

人类表观遗传学相关基因变异的鉴定在人类的基因组中,有一种非常重要的遗传信息是表观遗传信息,它不仅决定了个体在生长发育过程中的表现型,同时也对后代的基因遗传产生影响。
表观遗传学研究的是这种非编码信息的遗传规律和发生机制,它的研究成果对于解决人类遗传疾病、环境和遗传因素交互影响等多个方面具有重要意义。
在表观遗传学领域的研究中,基因变异的鉴定是其中重要的一环。
通过对特定基因序列的变异检测,可以为临床医学、人口遗传学和环境卫生学等领域提供基础数据。
人类基因组包含约30亿个碱基对,其中在编码蛋白质的基因区域中,变异的检测和鉴定已经具有了一定的技术成熟度。
但是表观遗传信息与疾病的关联较为复杂,目前仍然存在许多挑战之处。
以下从基因变异的检测方法、研究典型的表观遗传信息关联的疾病以及进行基因变异鉴定的意义等方面来探讨这一问题。
一、基因变异的检测方法1. 基于DNA甲基化的测序技术DNA甲基化是表观遗传信息传递的主要方式之一。
目前,基于DNA甲基化的测序技术已经成为了表观遗传学研究的重要手段之一。
该技术能够高通量检测基因组特定区域的甲基化变异,从而达到表观遗传变异的检测和鉴定的目的。
2. DNA甲基化芯片技术与基于测序技术的DNA甲基化检测相比,DNA甲基化芯片技术可以同时检测数以万计个基因的DNA甲基化状态。
该技术具有高通量、精确度高、操作简便等特点,因此被广泛应用于农业、环境和医学等领域。
3. 免疫表观遗传学方法免疫表观遗传学方法是一种通过抗体检测和鉴定蛋白质与DNA的某些修饰关系的方法。
与传统的基因鉴定技术不同,这种方法可以直接鉴定DNA是否与某些蛋白质发生了交互作用,从而进一步反映表观遗传信息的变异情况。
二、表观遗传信息与疾病关联的研究1. 肿瘤疾病肿瘤疾病是人类面临的一个重要健康问题,表观遗传学在肿瘤的研究中发挥了重要的作用。
良性或恶性肿瘤细胞对DNA甲基化变异、组蛋白修饰等表观遗传信息的改变非常敏感,因此特定的表观遗传变异与肿瘤的发生和发展之间存在着紧密的关系。
面向下一代测序技术的结构变异检测算法综述

t a g e s a n d d i s a d v a n t a g e s o f d i f e r e n t a l g o r i t h ms .A n d f i n a l l y i t d i s c u s s e d t h e c u r r e n t p r o b l e ms t o b e s o l v e d a n d t h e f u t u r e d i r e c —
t i o n s .
Ke y wo r d s :n e x t g e n e r a t i o n s e q u e n c i n g t e c h n o l o y ;s g t uc r t u r a l v a r i a n t ;c o p y n u mb e r v a ia r n t
近年来 的研究 表明人类 基 因组 存在 大量 的遗传 变异 ,研
序列的 比对并开发相应的检测算法 , 使不 同类 型的结 构变异的 检测以及变异大小 、 位置 等信息 的确定成为 可能。随着去 干人
me t h o d a n d s e q u e n c e a s s e mb l y me t h o d ,a n a l y z e d t h e i r c o r e i d e a a n d c h a r a c t e r i s t i c s ,d e s c r i b e d t h e a p p l i c a b l e s c o p e s ,a d v a n —
生物基因组学的计算方法和算法

生物基因组学的计算方法和算法生物基因组学是一门研究生命体系基因组结构和功能的学科,是当今生物学、医学、农学、生态学等领域中的热点之一。
生物基因组学需要处理大量的序列数据和生物信息数据,因此计算方法和算法在其研究中具有重要作用。
本文将从计算方法和算法两个方面论述生物基因组学中的计算问题。
一、计算方法计算方法是指在生物基因组学中处理数据的常规方法。
首先,生物基因组学的研究数据主要分为两类:基因组序列和生物信息数据。
基因组序列是指整个生物个体的基因组DNA序列,生物信息数据则是从基因组序列中提炼出来的、具有特定含义的信息。
在处理这些数据时,常用的计算方法包括以下几个方面:1. 序列比对序列比对是指将两个DNA或蛋白质序列进行比较,找到它们之间的共同点和差异点。
比对通常是通过计算两个序列之间的匹配率和错配率来进行的。
序列比对是生物基因组学研究中最基本的计算方法之一,其结果可以用来预测基因结构、鉴定物种和进行系统发育分析等。
2. 基因预测基因预测是指通过对DNA序列的分析,预测准确的基因结构和功能。
基因预测常采用特定的软件工具和算法,利用序列等特征指标进行计算。
常见的基因预测工具包括Glimmer、GeneMark、Augustus等。
3. 基因组注释基因组注释是指对已知基因和未知基因的分析和注释。
这一过程包括基因预测、基因结构修正、功能预测等多个步骤。
基因组注释的结果对于研究基因功能、探究基因进化等很有帮助。
4. 基因表达分析基因表达分析是指通过对组织或细胞表达的基因进行分析,了解基因功能和信号传导途径。
常用的基因表达分析工具包括Cufflinks、DESeq2、edgeR等。
二、算法除了常规的计算方法外,生物基因组学研究中还有很多需要高级算法来进行计算和分析的问题。
这些算法主要用于解决大规模数据、复杂数据和多维数据等方面的问题,具体包括以下几个方面:1. 基于机器学习的分析机器学习是指通过自动构建模型和从数据中学习知识来实现预测或决策的一种方法。
基因组学研究中的计算方法及其应用

基因组学研究中的计算方法及其应用基因组学是生命科学中的一个重要领域,它研究的是整个生物体的基因组结构、组成和功能,探究基因与表型之间的关系。
随着科学技术的发展,基因组学研究日益深入,而计算方法作为基因组学研究的重要工具,也得到了越来越多的应用。
一、基因组学研究中的计算方法基因组学研究中的计算方法主要包括以下几个方面:1.序列数据分析基因组DNA序列是研究基因组学的重要数据。
而分析DNA序列数据则是了解基因组结构、功能、进化、与疾病关系等方面的关键。
在这方面,计算方法发挥着重要的作用。
其中的算法包括比对、拼接、装配、注释、功能预测和序列优化等。
例如,比对算法旨在将不同的DNA序列与一参考基因组相匹配,以便分析其差异和相似性,从而揭示不同种类之间的进化关系。
2.基因组注释基因组注释是对基因组DNA序列进行标记,注释出其中的基因、转录本、蛋白质等功能小分子。
同时,还包括对序列起始位点的定义、顺序号的标定、顺序定向的确定、转座子元件位置的注释等。
注释的结果有助于研究基因组结构、生物生命周期、疾病与基因之间的关系等方面。
3.结构变异检测基因组数据分析还包括结构变异检测方面的研究。
结构变异是指基因组DNA序列中与普通参考基因组不一致的部分,它与一些人类疾病的发生有关。
因此,研究结构变异以及确定与疾病相关的变异是基因组学研究的重要方向之一。
4.基因功能预测基因的功能预测是指根据基因序列分析,推断出基因在细胞生命周期和功能的参与程度。
通过分析基因组DNA序列中的穿孔位点、转录调控元件和重要基因序列,可以了解基因对细胞生物学、生理学、免疫学和病理学等方面的调控作用。
二、基因组学研究中计算方法的应用计算方法在基因组学中的应用包括以下几个方面:1.疾病基因组学研究基因组数据分析为疾病基因组学研究提供了重要的方法。
通过对单核苷酸多态性、结构变异和基因功能相关的标记进行分析,找到与疾病相关的基因、专家的关联以及某些基因突变与疾病发展和进展的相关性。
高变基因计算方法

高变基因计算方法基因变异是生物进化中的重要现象,对科学研究、医学诊断和疾病治疗有着深远的影响。
高变基因指的是那些在种群中具有较高变异频率的基因。
本文将详细介绍高变基因的计算方法,以帮助研究人员更好地理解基因变异的机制。
一、高变基因的定义及意义高变基因是指在基因组中变异频率较高的基因,它们在生物进化、适应性变化以及疾病发生中起着关键作用。
研究高变基因有助于揭示生物的遗传多样性、适应机制以及疾病易感性与治疗靶点。
二、高变基因计算方法1.基于序列比对的方法(1)多序列比对:将多个基因序列进行比对,找出保守区域和变异区域。
(2)同义替换率(Synonymous Substitution Rate, dS)和非同义替换率(Non-synonymous Substitution Rate, dN):计算基因编码区序列的替换率,分析基因在进化过程中的自然选择压力。
(3)变异频率分析:统计基因序列中各个位点的变异频率,筛选出高变基因。
2.基于群体遗传学的方法(1)单倍型分析:通过分析基因的单倍型结构,找出在群体中频率较高的单倍型,从而确定高变基因。
(2)连锁不平衡分析:检测基因座之间的连锁关系,分析基因变异在群体中的传播。
(3)群体遗传结构分析:利用群体遗传学方法,如结构分析、主成分分析等,研究基因在群体中的分布和变异。
3.基于机器学习的方法(1)支持向量机(Support Vector Machine, SVM):通过训练样本数据,构建分类器,识别高变基因。
(2)随机森林(Random Forest):利用集成学习方法,对基因变异进行分类,筛选高变基因。
(3)深度学习:通过构建神经网络模型,自动提取基因序列特征,识别高变基因。
三、总结高变基因计算方法的研究对于揭示生物进化、适应机制和疾病发生具有重要意义。
研究人员可以根据实际需求,选择合适的计算方法,为基因研究提供有力支持。
人类遗传基因组变异的研究进展

人类遗传基因组变异的研究进展一、人类遗传基因组变异简介人类基因组包括了20,000-25,000个基因,它们编码了制造蛋白质的指南。
一个基因的变异可能会造成蛋白质的不同形态或缺失,这可能会影响个体的生长发育和健康特征。
人类的遗传基因组变异通常包括DNA单核苷酸变异、DNA复制数变异、染色体结构变异和基因重组等多种类型。
二、DNA单核苷酸变异DNA单核苷酸变异(Single Nucleotide Polymorphisms,SNPs)是人群中常见的变异类型。
SNPs通常被广泛用于大规模遗传关联研究,这种研究方式可以探讨SNPs和个体特征或疾病之间的关系。
SNPs的研究也是研究人类基因组多样性的一个重要方面。
三、DNA复制数变异DNA复制数变异(Copy Number Variations,CNVs)是人类基因组的一个重要方面。
CNVs是指在同一基因区域内,基因拷贝数量的不同。
CNVs在很大程度上可以影响基因的表达。
CNVs可以通过分析微阵列或基因测序数据来鉴定。
CNVs在人类中的研究起源于桥本甲状腺炎的研究,后来发现CNVs可能与许多其他疾病如自闭症和肥胖症有关。
四、染色体结构变异染色体结构变异(Structural Variants,SVs)包括插入、缺少、倒位、转座和交叉互换等不同类型。
SVs通常可以通过对DNA序列进行比对或在基因测序数据中进行计算来鉴定。
SVs对个体的影响可能是抑制基因的表达,也可能会改变基因的功能,促进疾病的发生。
五、基因重组基因重组(Genetic Recombination)是指自然条件下DNA单链断裂、交叉并连和回复,从而改变了个体基因组中的顺序。
基因重组通常是在减数分裂期发生的,每个单倍体基因组都由其父母各一份染色体贡献而来。
基因重组是产生基因多样性的一个重要手段。
六、结论人类基因组中的各种变异类型是一个广泛而复杂的研究领域。
遗传基因组变异研究对于探讨人类进化、基因多样性和疾病发生等方面具有重要意义。
基因组结构性变异检测的方法及DNA-seq(转载)

基因组结构性变异检测的⽅法及DNA-seq(转载)⼈类基因组中的变异和⼈类的演化、疾病风险等⽅⾯都有着密切的联系。
当前⼆代短读长⾼通量测序技术(NGS),虽然能够让测序成本⼤⼤降低,但这种短读长的测序⽅法也给基因组的变异检测(特别是结构性变异检测)带来了不⼩的挑战。
SNP和Indel⼤家应该都见得⽐较多了,因此在这篇⽂章⾥我将主要讨论常见结构性变异的检测⽅法和有关软件以及它们的⼀些优缺点。
变异的分类在开始之前,有必要先梳理⼀下⼈类基因组上的变异种类,按照⽬前业界的看法可以分为如下三个⼤类:单碱基变异,即单核苷酸多态性(SNP),最常见也最简单的⼀种基因组变异形式;很短的Insertion 和 Deletion,也常被我们合并起来称为Indel。
主要指在基因组某个位置上发⽣较短长度的线性⽚段插⼊或者删除的现象。
强调线性的原因是,这⾥的插⼊和删除是有前后顺序的与下述的结构性变异不同。
Indel长度通常在50bp以下,更多时候甚⾄是不超过10bp,这个长度范围内的序列变化可以通过Smith-Waterman 的局部⽐对算法来准确获得,并且也能够在⽬前短读长的测序数据中较好地检测出来;基因组结构性变异(Structure Variantions,简称SVs),这篇⽂章的重点,通常就是指基因组上⼤长度的序列变化和位置关系变化。
类型很多,包括长度在50bp以上的长⽚段序列插⼊或者删除(Big Indel)、串联重复(Tandem repeate)、染⾊体倒位(Inversion)、染⾊体内部或染⾊体之间的序列易位(Translocation)、拷贝数变异(CNV)以及形式更为复杂的嵌合性变异。
图1. 结构性变异的不同种类值得⼀提的是,研究⼈员对基因组的结构性变异发⽣兴趣,主要还是由于在研究中发现:SVs对基因组的影响⽐起SNP更⼤,⼀旦发⽣往往会给⽣命体带来重⼤影响,⽐如导致出⽣缺陷、癌症等;有研究发现,基因组上的SVs⽐起SNP⽽⾔,更能代表⼈类群体的多样性特征;稀有且相同的⼀些结构性变异往往和疾病(包括癌症)的发⽣相互关联甚⾄还是其直接的致病诱因。
人类基因组的研究报告

人类基因组的研究报告摘要:本研究报告旨在总结人类基因组的研究进展,并探讨其在生物医学领域的应用。
首先介绍了人类基因组的基本概念和研究方法,然后讨论了人类基因组的结构与功能,以及与疾病相关的基因变异。
最后,探讨了人类基因组研究对于个性化医学和基因治疗的潜在影响。
一、引言人类基因组是指人类体细胞中包含的所有基因的集合。
自2001年完成人类基因组计划以来,人类基因组研究取得了显著进展,为我们深入了解人类遗传信息和疾病发生机制提供了重要依据。
二、人类基因组的研究方法1. 基因组测序技术:包括Sanger测序、高通量测序和第三代测序技术,为人类基因组的研究提供了高效、准确的手段。
2. 生物信息学分析:通过对基因组序列进行比对、注释和功能预测,揭示了人类基因组的结构和功能。
三、人类基因组的结构与功能1. 基因组大小和复杂性:人类基因组大小约为3.2亿个碱基对,其中只有约2%编码蛋白质。
2. 基因和非编码RNA:人类基因组中包含了数万个编码蛋白质的基因,以及大量的非编码RNA,这些RNA在基因调控和疾病发生中发挥重要作用。
3. 基因组结构变异:包括染色体数目异常、染色体重排和基因重复等,这些结构变异与遗传疾病的发生密切相关。
四、与疾病相关的基因变异1. 单基因遗传病:由单个基因突变引起的遗传病,如囊性纤维化和遗传性失聪等。
2. 复杂性疾病:由多个基因和环境因素相互作用引起的疾病,如糖尿病和癌症等。
人类基因组研究揭示了复杂性疾病的遗传基础,为疾病的预测、诊断和治疗提供了新的思路。
五、人类基因组的应用前景1. 个性化医学:通过对个体基因组的分析,实现疾病风险评估、药物反应预测和个体化治疗。
2. 基因治疗:利用基因编辑和基因传递技术,纠正基因突变引起的遗传病,为疾病治疗开辟了新途径。
3. 其他应用领域:如人类起源和进化研究、法医学和人类行为遗传学等。
六、结论人类基因组的研究为我们深入了解人类遗传信息和疾病发生机制提供了重要依据。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关于在人类基因组中检测结构变异计算方法的综述【摘要】结构变异是基因的重排列,它对于进化有显著的贡献,在人类中自然变异通常涉及到基因相关的疾病。
细胞压力过大,错误的重组机制能够导致基因序列大量不同的结构变异,传统的显微镜与阵列碱基方法常被用于检测大的变异或者是重复序列变异。
下一代基因测序海森理论的启用对于在人类基因组中检测各种类型的结构变异都有空前的准确性。
事实上,一个显著的挑战在于发展中的各种计算方法是否有能力在生成的模拟数据上检测出结构变异,在过去的几年中,基于在实验数据中获得四种不同类别的数据类发明了很多检测工具,这四种数据类分别是:成对碱基读取,读取深度,分裂碱基读取,组合序列。
【关键词】结构变异;重复序列变异;下一代基因测序;检测算法;成对碱基读取;读取深度;分裂碱基读取;重测序技术;集合1.引言结构变异描述了基因变异对于基因结构的影响,尽管人类基因变异最有可能引起的原因是单碱基变异,但是在人类基因组中蛋白显性与结构变异的相关性远远高于单碱基变异。
结构变异发生的范围可以从几个bp(碱基的基本单位)到整个染色体。
结构变异对于人种的多样性与疾病的发生有显著的影响,并且在任何的基因学研究中是非常重要的。
结构体变异研究对于检测大变异,比如非整倍性变异与用微复制方法重组染色体有一定的局限性。
对于阵列碱基法,目前来说序列碱基法更容易解决检测小的微型的结构变异。
下一代测序技术理论上能用前所未有的速度够识别出所有类型的结构变异,几种不同的方法在检测数据中显著的变异中都各有优点与不足。
然而这些方法需要大量的计算分析,大量的算法在过滤数据上由显著的进展,与参考基因组或者其他样列做对比发现有相近的结构变异。
在这里我将介绍结构变异在人类与其他物种上的效果,组合机制的不同导致变异信息的不同,最终产生不同的结构变异。
随后,我将给出一个能够被用于检测结构变异所有方法的一个概述并提供目前可提供基于下一代测序技术用于检测人类基因组结构变异的计算工具的一个概述。
2.结构变异2.1 结构变异的重要性在人类基因组结构变异现在已知能够比单碱基覆盖更多的核苷酸,成百上千的结构变异产生于基因组上,有些变异跨染色体,打断基因中某些有规律的元素,但是这些变异对于蛋白表达通常没有影响,但是也能引起碱基数量变化,基因分裂,新融合基因,新的调整机制。
新的但碱基变异形成与不同的调整机制都取决于变异碱基的位置。
尽管很多的结构变异不在编码区,它们仍然引入了大量的遗传因子和表型变异,不仅仅在人类中存在这一现象,在各个物种间都有。
考虑到结构变异对于表达的影响,结构变异的发生对于自然选择与进化也有着显著的影响。
事实上,结构变异在新物种的进化上与变异物种的进化上都有很大的关联,在植物与灵长类动物上有很多这样的例子,同样人类的一些特殊基因上也有这样的例子。
下面将展示与人类由饮食引起的基因进化,还有取决于结构变异的疾病基因。
大量与疾病有关的结构变异是结构变异中的典型,变异影响基因的表达或者影响编码序列都会产生广泛而大量的基因疾病。
俩个展示罕见和普通结构变异与疾病之间关系的模型已经被提出,第一个模型描述了在人类中罕见与常见的变异引起的疾病并收集了大量关于各种先天性疾病,神经性疾病,肿瘤类疾病的信息。
第二个模型关注人口中普遍存在的变异,特别是拷贝数量变异的家族基因,尽管收集信息时病情的复杂程度会影响模型的敏感性,特别是免疫系统的疾病。
例如这个模型中的HIV,疟疾,还有多种多样的免疫疾病。
尽管在俩个模型中能够发现很多的例子,但这些例子在由结构变异引起的人类疾病中也是不全面的。
这个问题归咎于我们对于普通变异与罕见变异的定义过于简单化。
然而,有一点是非常明确的就是检测结构变异对于人类疾病的调查有很深远的影响,无论在诊断上还是在疾病的治疗上。
除了在疾病中扮演的重要角色,结构变异在人类普通日常功能上也很重要。
类别转换重组的过程就依赖于结构变异对自身的刺激。
这个过程对于抗原刺激使多种繁殖B细胞成熟时很重要的,同样对于人类免疫系统的完善也至关重要。
对于结构变异的研究也告诉了我们关于遗传的机制。
在过去的几年中对于制造结构变异的需求以及结构变异在遗传机制中扮演的角色都变得显著。
然而,重要的是在各个研究领域中识别结构变异的正确率问题。
2.2 引起结构变异的原因我们首先考虑的是结构变异产生的随机性,在特殊情况下结构变异的形式,特殊环境的影响还有细胞压力触发的结构变异。
各种各样的压力源如:碱基复制,转录,或者细胞氧化再或者基因自身的重组都会触发结构变异。
这些压力源也会导致DNA断裂与敏感处DNA复制失控从而导致结构变异,特殊的序列对于结构变异更加敏感是源于他们自己的结构,以及相关联的蛋白与基因序列层次的改变。
此外,功能基因重组涉及到免疫系统中的蛋白会产生迷失目标的效果,从而导致DNA链双项断裂。
在DNA链中随后而来的错误配对与错误重组会引发结构变异,从而对蛋白的定位或者在俩个指定位置间的近似定位产生错误,最后影响了基因的表达。
例如,非同源碱基末端重接的重组机制非常易于产生DNA双链断裂,单个的双链断裂对于DNA的自我修复能力来说是很容易修复的,但是如果在同一个染色体中有俩个双链断裂,会引起染色体中产生备用链。
交替尾部链接机制是和基因重组有关而又不同的一种重组机制,然而这种重组机制的精确性目前来说我们还不知道,等位基因重组机制修复DNA双链断裂是用一个模板序列相对应无差错的修复。
然而这种修复机制的缺陷在于它能够导致非等位的基因重组。
基于这个事实,非等位序列经常出现大量重复区域,假基因,以及多余复制碱基等因素导致的结构变异。
另外基于非同源末端重接的重组机制下的复制,转录也被认为是产生结构变异的主要原因,而这俩个原因还会引起染色体混乱重组。
现有几个模型的存在来解释这种结构变异的产生。
微同源序列断裂修复模型指出单个DNA链断裂,然后复制到任何一个相近似的DNA单链,随后复制区域聚合,复制模板交换从而产生了染色体的混乱重组。
还有一个相近的模型叫做锚点丢失与模版转换模型,模型中复制区域的锚点模版转换,听起来和上一个相似但是这个模型的转换是在DNA链没有断裂的情况下完成的。
最后染色体内部和外部的非同源碱基碎片随机重组这一现象被称为染色体碎裂。
在这个模型中一个或多个染色体被碎裂,然后随机融合。
辐射和其它一些都可以引起大范围的染色体断裂。
2.3 结构变异的类型结构变异可以以很多种形式发生,在这些形式中我们可以分为拷贝数量变异(CNV)与拷贝均衡变异。
拷贝均衡变异包含反转变异与移位变异。
拷贝数量变异包括删除,插入,复制。
插入涉及一个新的序列或者异变碱基。
新的序列的插入或者异变碱基的插入可能是由于碱基移位或者序列复制引起的。
复制可能引起一系列串联的复制。
碱基的复制分割点可能在附近的DNA源上,或者穿插于附近的合并的DNA进行复制。
这个事件可能发生在染色体的内部。
但是也有可能发生在不同的染色体间。
从而导致染色体内部变异。
结构变异的大小通常超过50bp或者1000bp。
然而除了单碱基变异之外的任何变异都可以引起结构体变异。
我们讨论的一些形式的变异通常发生在1bp到50bp之间,通常被称为非单碱基基因变异。
当然,一些变异的发生不单纯是一种类型,而是混合了多种类型。
比如说反转序列碎片中可能同时包含一个删除类型的变异与插入类型的变异,或者其他类型的组合。
所有变异形式中检测最不容易的是由染色体之间的重组导致的变异,额外还有,一条染色体上发生的删除而恰恰这条染色体其他位置上还有一个大小一样的插入,这导致很难发现变异的位置。
然而不是所有形式的变异都可以检测出发生位置能变异的大小。
准确的识别出结构变异需要全面的认知我们研究基因上的所有结构变异。
检测变异类型的能力涉及不同变异类型,有的类型比较容易检测出,有的则复杂一些。
我们将在下面进行讨论。
3.检测结构变异像上面提到的那样,结构变异在大小上有很大的不同,比较大的结构变异被认为是微复制变异,它们可以被传统的细胞遗传技术所检测出,细胞遗传技术包括基因技术,比如说染色体核型技术,染色体绘画型技术。
这些技术仍然被广泛应用,这些方法能够检测出大部分类型的几兆碱基大小的结构变异与非整倍体结构变异,基于这些技术上的提高仍在继续,为结构变异的检测问题的解决与灵敏度的提高都有待加强。
对于检测小的亚微观的结构变异,这些结构变异都有高分解度与高灵敏度,更多的新分子将在检测中被用到。
这些方法无论在矩阵碱基或者是序列碱基中都被称为经典。
用这些方法识别结构变异通常都用实验基因与参考基因组或者其他的样本基因组进行对比,来从他们的不同中来推断变异,下面,我将简要的介绍矩阵碱基与序列碱基法。
(1)矩阵碱基法阵列原来是为了检测RNA表达分析而发明的,但是现在被应用在了一个更加广泛的范围上,包括检测结构变异。
微矩阵碱基方法依靠在载玻片上识别微矩阵碎片,这些碎片用于固定基因中作为杂交试验基因的目标基因。
尽管序列碱基法对于检测拷贝数量变异更加符合成本效益而且更流行,但是临床诊断上主要还是用微矩阵法进行筛查。
用微矩阵法检测拷贝数量变异通常用俩种阵列,杂交基因比较阵列与单碱基突变阵列。
近来的一些检测平台,以及一些公司开发的市场像Agilent,Illumina,Roche和Affymetrix。
这些检测机构能够在一个基因碎片上检测出成千上万个探针,现在新发明的一些阵列变得更加灵敏更加实用。
(2)杂交基因比较阵列杂交基因比较阵列平台可被用于在目标基因上俩个杂交荧光标记样本的相关单碱基变异的检测。
实验的DNA是DNA碎片并且预先进行荧光标记。
用不同的荧光染料标记,例如在不同的样本用绿色和红色进行标记,检测每种荧光的量就能知道实验用DNA中每个样本的数量大小。
这对应用已知参考样本进行时很重要,比如一个样本中增加而另一个样本中发生了等量的缺失,再没有荧光标记之前是无法被检测出的。
为了精确的识别结构变异,正规的来说我们通常都要知道实验样本所在DNA的GC含量,还有燃料是否失衡。
第一个杂交基因比较阵列实验是用于一段大的插入的人造细菌染色体。
把人造细菌染色体作为目标,在目标中可以检测范围在100kb大小的单碱基变异甚至范围更大的变异。
目前用于检测单碱基变异的寡核苷酸只能检测几千个碱基大小的单碱基变异。
杂交基因比较阵列有一个比较大的优势是可以提供常用阵列,这些阵列可以像平台一样的被使用。
杂交基因平台可以达到一个相当高的检测率,特别是用于普通问题的检测。
(3)单碱基突变阵列单碱基突变阵列原本是被设计用于检测单个碱基的多态性,但是目前已经适应单碱基变异的检测。
有一点与杂交基因比较阵列有些相似,单碱基突变阵列也是依靠目标DNA的杂交。
然而仅仅测试样本是杂交的,而且不需要杂交的参考样本。