一代测序、高通量测序等各种测序相关概念介绍
一代二代三代测序原理

一代二代三代测序原理一代测序原理:一代测序技术也被称为Sanger测序技术,是人类基因组序列测定的里程碑。
这种测序技术通过DNA链延伸反应(dideoxy chaintermination reaction)定序。
该技术基于以下原理:1.DNA合成时,短链上的dNTPs(脱氧核苷三磷酸盐)与DNA聚合酶结合,并添加到扩增链的3'末端。
2.在DNA链延伸反应中,四种不同的dNTPs被添加到反应体系中。
3. 此反应体系中含有小量的标记性的dNTPs,如荧光标记的ddNTPs (二碱基脱氧核苷酸盐)。
这些标记性ddNTPs会引发链终止,因此DNA的合成会停止在特定的位置。
4.在终止合成后,反应体系中所有DNA分子被分离出来,并通过高效液相色谱法(HPLC)或凝胶电泳法进行分离。
5. 分离后,根据不同的ddNTP标记,可以知道DNA每个位置上的碱基是什么。
二代测序原理:二代测序技术是一种高通量测序方法,包括Illumina的Solexa测序、Roche的454测序和Ion Torrent的Ion Proton等。
这些技术基于以下原理:1.首先,DNA样本必须被剪成短片段,并与适配器序列连接。
适配器序列可以在扩增中参与引物的结合。
2.在PCR扩增过程中,适配器序列连接的DNA片段会大量复制形成聚集,形成簇。
3.簇内的DNA片段会结合荧光标记为碱基。
4.然后,DNA链会被分离,暴露于荧光标记的碱基。
5. 再次用过量的单核苷酸引发链延伸反应,反应中使用荧光标记的ddNTPs(二碱基脱氧核苷酸盐)。
6.测序器通过扫描荧光信号来确定每个位置的碱基。
三代测序原理:三代测序技术又称为单分子测序技术,包括Pacific Biosciences (PacBio)的SMRT(Single-Molecule Real-Time)测序、Oxford Nanopore Technologies的Nanopore测序等。
这些技术基于以下原理:1. 单分子测序技术将DNA放入微小环境中,例如纳米孔(nanopore)。
一代,二代,三代测序原理

一代测序一般指Sanger测序,是上世纪70年代由sanger和Coulson开创的DNA双脱氧链终止法测序,当初几 十个国家花了几十亿刀完成的人类基因组计划就是使用的改良版sanger测序。
Sanger测序一次可以读取600-1000bp的碱基,准确性十分之高,至今仍是正确性的金标准。该技术在当下依 然被广泛应用,比如构建载体做克隆,基因敲除等实验都可以用到。但其通量实在太低,导致在很多情况 下成本太高,难以广泛应用。
二代测序
二代测序技术,又称为Next Generation Sequencing(NGS)技术,高通量测序技术, 是为了改进一代测序通量过低的问题而出现的。刚面世时主要包括Roche公司的454技 术、ABI公司的Solid技术和Illumina公司的Solexa技术。这三种技术都极大的提高了测 序的通量,大大降低了测序成本和周期。
➢ 二代测序和一代测序最大的不同点在于其边合成边测序技术。
二代测序
二代测序
测序流动槽(flowcell): 每个槽都有共价交联的两种oligo(P5和P7),分别与两 端的接头互补。DNA聚合酶
P5 P7
桥式PCR合成另一条链
NaOH解开双链
NaOH解开双链 后模板链被洗掉
二代测序
流动槽加入引物 Rd1 SP、DNA 聚合酶、荧光标 记的dNTP,对 第一条链测序
三代测序
SMRT Cell含有纳米级的零模波导孔,每个ZMW都能够包含一个DNA聚合酶及一条DNA样品链进行单分子测序, 并实时检测插入碱基的荧光信号。ZMW是一个直径只有10~50 nm的孔,当激光打在ZMW底部时,只能照亮很小 的区域,DNA聚合酶就被固定在这个区域。只有在这个区域内,碱基携带的荧光基团被激活从而被检测到,大幅 地降低了背景荧光干扰。
高通量测序,名词解释

高通量测序基础知识汇总一代测序技术:即传统的Sanger测序法,Sanger法是根据核苷酸在待定序列模板上的引物点开始,随机在某一个特定的碱基处终止,并且在每个碱基后面进行荧光标记,产生以A、T、C、G结束的四组不同长度的一系列核苷酸,每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP)。
由于ddNTP缺乏延伸所需要的3-OH 基团,使延长的寡聚核苷酸选择性地在G、A、T或C处终止,使反应得到一组长几百至几千碱基的链终止产物。
它们具有共同的起始点,但终止在不同的的核苷酸上,可通过高分辨率变性凝胶电泳分离大小不同的片段,通过检测得到DNA碱基序列。
二代测序技术:next generation sequencing(NGS)又称为高通量测序技术,与传统测序相比,二代测序技术可以一次对几十万到几百万条核酸分子同时进行序列测定,从而使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序(Deep sequencing)。
NGS主要的平台有Roche(454 &454+),Illumina(HiSeq 2000/2500、GA IIx、MiSeq),ABI SOLiD等。
基因:Gene,是遗传的物质基础,是DNA或RNA分子上具有遗传信息的特定核苷酸序列。
基因通过复制把遗传信息传递给下一代,使后代出现与亲代相似的性状。
DNA:Deoxyribonucleic acid,脱氧核糖核酸,一个脱氧核苷酸分子由三部分组成:含氮碱基、脱氧核糖、磷酸。
脱氧核糖核酸通过3',5'-磷酸二酯键按一定的顺序彼此相连构成长链,即DNA链,DNA链上特定的核苷酸序列包含有生物的遗传信息,是绝大部分生物遗传信息的载体。
RNA:Ribonucleic Acid,,核糖核酸,一个核糖核苷酸分子由碱基,核糖和磷酸构成。
一代测序二代测序以及三代测序的优缺点及应用对比

一代测序二代测序以及三代测序的优缺点及应用对比一代测序(Sanger测序)是最早的测序技术,使用DNA聚合酶扩增特定区域的DNA片段,并通过合成带有不同碱基的荧光标记引物进行测序。
一代测序的优点是高可靠性和准确性,能够得到较长的读长,适用于小规模的基因组测序和位点测序。
不过,一代测序存在的缺点是昂贵、耗时且无法进行高通量测序,适用于较小规模的实验。
二代测序(高通量测序)是目前最为常用的测序技术,如Illumina和Ion Torrent等商业平台。
二代测序基于串联的扩增反应,DNA模板被分成数百万小片段,每个片段通过扩增、聚合和测序步骤进行处理。
二代测序具有高通量、较低的成本和快速的测序速度等优点,能够同时测序多个样本。
缺点是读长比较短,通常为几百个碱基对。
二代测序主要应用于全基因组测序、转录组测序、表观基因组测序等大规模测序项目。
三代测序(单分子测序)是较新的测序技术,如PacBio和Oxford Nanopore等商业平台。
三代测序通过直接测量单个DNA分子的顺序来进行测序,不需要扩增反应。
三代测序的优点是具有极长的读长,可以达到几十万个碱基对,能够测序重复序列和大的结构变异。
缺点是较高的错误率和较低的测序准确性。
三代测序主要应用于长读长测序、基因组组装和变异检测等需要长reads的研究。
总结起来,一代测序适用于小规模的实验,提供高质量的数据,但成本昂贵和耗时。
二代测序适用于大规模的测序项目,具有快速、高通量和较低的成本等优点,但读长较短。
三代测序适用于长读长测序和大结构变异的分析,但错误率较高。
根据研究需求选择合适的测序技术,或者结合多种技术来获得更全面的基因组信息。
DNA测序技术发展史一代二代三代测序技术简要原理及比较

DNA测序技术发展史一代二代三代测序技术简要原理及比较一、一代测序技术一代测序技术最早出现于1977年,由Sanger和Gilbert等人开发。
其原理基于DNA链延伸,即通过将DNA链合成过程中加入少量的dideoxy核苷酸(ddNTP),使得DNA链延伸在一些特定位置停止,并通过凝胶电泳分析停止位置来确定每个核苷酸的顺序。
一代测序技术的特点是:1.准确性较高,可以达到99.99%的准确率。
2.读长较短,一般为500至1000个碱基。
3.测序过程复杂,需要进行多次扩增和凝胶电泳分析,耗时较长。
二、二代测序技术二代测序技术的发展始于2005年,它采用大规模并行的方式进行测序,实现了高通量测序。
主要的二代测序技术包括454测序、illumina测序和Ion Torrent测序。
454测序技术采用循环化学法,通过将DNA片段固定在微小的载体上,然后进行多次扩增和测序,最后通过压缩气体冲击来释放碱基,从而实现测序。
illumina测序技术采用桥式扩增法,通过将DNA固定在玻璃芯片上的小孔中,并用荧光标记核苷酸进行扩增和测序,最后通过激光扫描来检测荧光信号。
Ion Torrent测序技术是一种基于半导体芯片原理的测序技术,通过检测氢离子的释放来确定DNA序列。
二代测序技术的特点是:1.高通量:可以同时测序数百万甚至数十亿个片段。
2.快速:通常只需几个小时到几天的时间完成测序。
3.读长较短:大部分二代测序技术的读长在100至1000个碱基之间。
4.相对较低的测序准确率:一般在99%左右。
三、三代测序技术三代测序技术是指第三代测序技术,它的发展始于2024年。
三代测序技术主要包括单分子测序和纳米孔测序。
单分子测序技术(如PacBio和Nanopore)通过将DNA片段转化为单分子,然后通过观察单分子的扩增和测序来获得DNA序列。
纳米孔测序技术则是将DNA分子引入纳米孔中,通过纳米孔内的电信号变化来确定碱基对的序列。
高通量测序 名词解释

高通量测序基础知识汇总一代测序技术:即传统的Sanger测序法,Sanger法是根据核苷酸在待定序列模板上的引物点开始,随机在某一个特定的碱基处终止,并且在每个碱基后面进行荧光标记,产生以A、T、C、G结束的四组不同长度的一系列核苷酸,每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP)。
由于ddNTP缺乏延伸所需要的3-OH 基团,使延长的寡聚核苷酸选择性地在G、A、T或C处终止,使反应得到一组长几百至几千碱基的链终止产物。
它们具有共同的起始点,但终止在不同的的核苷酸上,可通过高分辨率变性凝胶电泳分离大小不同的片段,通过检测得到DNA碱基序列。
二代测序技术:next generation sequencing(NGS)又称为高通量测序技术,与传统测序相比,二代测序技术可以一次对几十万到几百万条核酸分子同时进行序列测定,从而使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序(Deep sequencing)。
NGS主要的平台有Roche(454 & 454+),Illumina(HiSeq 2000/2500、GA IIx、MiSeq),ABI SOLiD等。
基因:Gene,是遗传的物质基础,是DNA或RNA分子上具有遗传信息的特定核苷酸序列。
基因通过复制把遗传信息传递给下一代,使后代出现与亲代相似的性状。
DNA:Deoxyribonucleic acid,脱氧核糖核酸,一个脱氧核苷酸分子由三部分组成:含氮碱基、脱氧核糖、磷酸。
脱氧核糖核酸通过3',5'-磷酸二酯键按一定的顺序彼此相连构成长链,即DNA链,DNA链上特定的核苷酸序列包含有生物的遗传信息,是绝大部分生物遗传信息的载体。
RNA:Ribonucleic Acid,,核糖核酸,一个核糖核苷酸分子由碱基,核糖和磷酸构成。
一、二、三代测序技术

一代、二代、三代测序技术第一代测序技术-Sanger链终止法一代测序技术是20世纪70年代中期由Fred Sanger及其同事首先发明。
其基本原理是,聚丙烯酰胺凝胶电泳能够把长度只差一个核苷酸的单链DNA分子区分开来。
一代测序实验的起始材料是均一的单链DNA分子。
第一步是短寡聚核苷酸在每个分子的相同位置上退火,然后该寡聚核苷酸就充当引物来合成与模板互补的新的DNA链。
用双脱氧核苷酸作为链终止试剂(双脱氧核苷酸在脱氧核糖上没有聚合酶延伸链所需要的3-OH基团,所以可被用作链终止试剂)通过聚合酶的引物延伸产生一系列大小不同的分子后再进行分离的方法。
测序引物与单链DNA模板分子结合后,DNA聚合酶用dNTP延伸引物。
延伸反应分四组进行,每一组分别用四种ddNTP(双脱氧核苷酸)中的一种来进行终止,再用PAGE分析四组样品。
从得到的PAGE胶上可以读出我们需要的序列。
第二代测序技术-大规模平行测序大规模平行测序平台(massively parallel DNA sequencing platform)的出现不仅令DNA测序费用降到了以前的百分之一,还让基因组测序这项以前专属于大型测序中心的“特权”能够被众多研究人员分享。
新一代DNA测序技术有助于人们以更低廉的价格,更全面、更深入地分析基因组、转录组及蛋白质之间交互作用组的各项数据。
市面上出现了很多新一代测序仪产品,例如美国Roche Applied Science公司的454基因组测序仪、美国Illumina公司和英国Solexatechnology公司合作开发的Illumina测序仪、美国Applied Biosystems公司的SOLiD测序仪。
Illumina/Solexa Genome Analyzer测序的基本原理是边合成边测序。
在Sanger等测序方法的基础上,通过技术创新,用不同颜色的荧光标记四种不同的dNTP,当DNA聚合酶合成互补链时,每添加一种dNTP就会释放出不同的荧光,根据捕捉的荧光信号并经过特定的计算机软件处理,从而获得待测DNA的序列信息。
第一代dna测序技术名词解释

第一代dna测序技术名词解释第一代DNA测序技术是指在1970年代末至2000年代初开发的DNA测序方法。
下面是一些常见的第一代DNA测序技术及其解释:1. Sanger测序:由Frederick Sanger于1977年发明的测序方法。
通过将DNA链延伸反应分为四个反应管,每个管中只加入一种特定的ddNTP(二氢基链终止核苷酸),从而在DNA合成中引入特定的终止位置。
通过将四个反应管中的DNA片段分别分离并进行电泳分析,可以确定DNA的顺序。
2. Maxam-Gilbert测序:由Allan Maxam和Walter Gilbert于1977年发明的测序方法。
该方法通过将DNA链分割成多个片段,并在每个片段上引入特定的化学修饰(如酶消化、酸酐化、碱性断裂等),然后通过电泳分析来确定DNA序列。
3. Pyrosequencing(火花测序):由Pl Nyrén和Mostafa Ronaghi 于1996年发明的测序方法。
该方法利用DNA合成过程中释放的焦磷酸(PPi)被硫酸供体和火花酶催化分解产生反应,在特定的荧光探针存在下,通过检测荧光信号的强弱来确定DNA序列。
4. Dideoxy chain termination sequencing(链终止测序):是Sanger测序方法的常用名。
通过在DNA合成过程中引入链终止核苷酸(ddNTP),从而限制新合成链的延伸,然后利用电泳分析来确定DNA序列。
5. Gel electrophoresis(凝胶电泳):是一种将DNA片段按照大小进行分离的常用技术。
在第一代DNA测序中,通过在聚丙烯酰胺凝胶中进行电泳,根据DNA片段的大小差异来确定DNA序列。
这些第一代DNA测序技术为后续的高通量测序技术的发展奠定了基础,虽然在吞吐量和成本效益上存在一些局限性,但仍然是基因组学和生物学研究中的重要工具。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
什么是高通量测序?高通量测序技术(High-throughput sequencing,HTS)是对传统Sanger测序(称为一代测序技术)革命性的改变, 一次对几十万到几百万条核酸分子进行序列测定, 因此在有些文献中称其为下一代测序技术(next generation sequencing,NGS )足见其划时代的改变, 同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能, 所以又被称为深度测序(Deep sequencing)。
什么是Sanger法测序(一代测序)Sanger法测序利用一种DNA聚合酶来延伸结合在待定序列模板上的引物。
直到掺入一种链终止核苷酸为止。
每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP)。
由于ddNTP缺乏延伸所需要的3-OH基团,使延长的寡聚核苷酸选择性地在G、A、T或C处终止。
终止点由反应中相应的双脱氧而定。
每一种dNTPs和ddNTPs的相对浓度可以调整,使反应得到一组长几百至几千碱基的链终止产物。
它们具有共同的起始点,但终止在不同的的核苷酸上,可通过高分辨率变性凝胶电泳分离大小不同的片段,凝胶处理后可用X-光胶片放射自显影或非同位素标记进行检测。
什么是基因组重测序(Genome Re-sequencing)全基因组重测序是对基因组序列已知的个体进行基因组测序,并在个体或群体水平上进行差异性分析的方法。
随着基因组测序成本的不断降低,人类疾病的致病突变研究由外显子区域扩大到全基因组范围。
通过构建不同长度的插入片段文库和短序列、双末端测序相结合的策略进行高通量测序,实现在全基因组水平上检测疾病关联的常见、低频、甚至是罕见的突变位点,以及结构变异等,具有重大的科研和产业价值。
什么是de novo测序de novo测序也称为从头测序:其不需要任何现有的序列资料就可以对某个物种进行测序,利用生物信息学分析手段对序列进行拼接,组装,从而获得该物种的基因组图谱。
获得一个物种的全基因组序列是加快对此物种了解的重要捷径。
随着新一代测序技术的飞速发展,基因组测序所需的成本和时间较传统技术都大大降低,大规模基因组测序渐入佳境,基因组学研究也迎来新的发展契机和革命性突破。
利用新一代高通量、高效率测序技术以及强大的生物信息分析能力,可以高效、低成本地测定并分析所有生物的基因组序列。
什么是外显子测序(whole exon sequencing)外显子组测序是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进行高通量测序的基因组分析方法。
外显子测序相对于基因组重测序成本较低,对研究已知基因的SNP、Indel等具有较大的优势,但无法研究基因组结构变异如染色体断裂重组等。
什么是mRNA测序(RNA-seq)转录组学(transcriptomics)是在基因组学后新兴的一门学科,即研究特定细胞在某一功能状态下所能转录出来的所有RNA(包括mRNA和非编码RNA)的类型与拷贝数。
Illumina提供的mRNA测序技术可在整个mRNA领域进行各种相关研究和新的发现。
mRNA测序不对引物或探针进行设计,可自由提供关于转录的客观和权威信息。
研究人员仅需要一次试验即可快速生成完整的poly-A尾的RNA 完整序列信息,并分析基因表达、cSNP、全新的转录、全新异构体、剪接位点、等位基因特异性表达和罕见转录等最全面的转录组信息。
简单的样品制备和数据分析软件支持在所有物种中的mRNA测序研究。
什么是small RNA测序Small RNA(micro RNAs、siRNAs和 pi RNAs)是生命活动重要的调控因子,在基因表达调控、生物个体发育、代谢及疾病的发生等生理过程中起着重要的作用。
Illumina能够对细胞或者组织中的全部Small RNA进行深度测序及定量分析等研究。
实验时首先将18-30 nt范围的Small RNA从总RNA中分离出来,两端分别加上特定接头后体外反转录做成cDNA再做进一步处理后,利用测序仪对DNA 片段进行单向末端直接测序。
通过Illumina对Small RNA大规模测序分析,可以从中获得物种全基因组水平的miRNA图谱,实现包括新miRNA分子的挖掘,其作用靶基因的预测和鉴定、样品间差异表达分析、miRNAs聚类和表达谱分析等科学应用。
什么是miRNA测序成熟的microRNA(miRNA)是17~24nt的单链非编码RNA分子,通过与mRNA相互作用影响目标mRNA的稳定性及翻译,最终诱导基因沉默,调控着基因表达、细胞生长、发育等生物学过程。
基于第二代测序技术的microRNA测序,可以一次性获得数百万条microRNA序列,能够快速鉴定出不同组织、不同发育阶段、不同疾病状态下已知和未知的microRNA及其表达差异,为研究microRNA对细胞进程的作用及其生物学影响提供了有力工具。
什么是Chip-seq染色质免疫共沉淀技术(ChromatinImmunoprecipitation,ChIP)也称结合位点分析法,是研究体内蛋白质与DNA相互作用的有力工具,通常用于转录因子结合位点或组蛋白特异性修饰位点的研究。
将ChIP与第二代测序技术相结合的ChIP-Seq技术,能够高效地在全基因组范围内检测与组蛋白、转录因子等互作的DNA区段。
C hIP-Seq的原理是:首先通过染色质免疫共沉淀技术(ChIP)特异性地富集目的蛋白结合的DNA片段,并对其进行纯化与文库构建;然后对富集得到的DNA片段进行高通量测序。
研究人员通过将获得的数百万条序列标签精确定位到基因组上,从而获得全基因组范围内与组蛋白、转录因子等互作的DNA区段信息。
什么是CHIRP-SeqC HIRP-Seq( Chromatin Isolation by RNA Purification )是一种检测与RNA绑定的DNA和蛋白的高通量测序方法。
方法是通过设计生物素或链霉亲和素探针,把目标RNA拉下来以后,与其共同作用的DNA染色体片段就会附在到磁珠上,最后把染色体片段做高通量测序,这样会得到该RNA能够结合到在基因组的哪些区域,但由于蛋白测序技术不够成熟,无法知道与该RNA结合的蛋白。
什么是RIP-seqRNA Immunoprecipitation是研究细胞内RNA与蛋白结合情况的技术,是了解转录后调控网络动态过程的有力工具,能帮助我们发现miRNA的调节靶点。
这种技术运用针对目标蛋白的抗体把相应的RNA-蛋白复合物沉淀下来,然后经过分离纯化就可以对结合在复合物上的RNA进行测序分析。
RIP可以看成是普遍使用的染色质免疫沉淀ChIP技术的类似应用,但由于研究对象是RNA-蛋白复合物而不是DNA-蛋白复合物,RIP实验的优化条件与ChIP实验不太相同(如复合物不需要固定,RIP反应体系中的试剂和抗体绝对不能含有RNA酶,抗体需经RIP实验验证等等)。
RIP技术下游结合microarray技术被称为RIP-Chip,帮助我们更高通量地了解癌症以及其它疾病整体水平的RNA变化。
什么是CLIP-seqC LIP-seq,又称为HITS-CLIP,即紫外交联免疫沉淀结合高通量测序(crosslinking-immunprecipitation and high-throughput sequencing), 是一项在全基因组水平揭示RNA分子与RNA结合蛋白相互作用的革命性技术。
其主要原理是基于RNA分子与RNA结合蛋白在紫外照射下发生耦联,以RNA结合蛋白的特异性抗体将RNA-蛋白质复合体沉淀之后,回收其中的RNA片段,经添加接头、RT-PCR等步骤,对这些分子进行高通量测序,再经生物信息学的分析和处理、总结,挖掘出其特定规律,从而深入揭示RNA结合蛋白与RNA分子的调控作用及其对生命的意义。
什么是metagenomic(宏基因组):Magenomics研究的对象是整个微生物群落。
相对于传统单个细菌研究来说,它具有众多优势,其中很重要的两点:(1) 微生物通常是以群落方式共生于某一小生境中,它们的很多特性是基于整个群落环境及个体间的相互影响的,因此做Metagenomics研究比做单个个体的研究更能发现其特性;(2) Metagenomics研究无需分离单个细菌,可以研究那些不能被实验室分离培养的微生物。
宏基因组是基因组学一个新兴的科学研究方向。
宏基因组学(又称元基因组学,环境基因组学,生态基因组学等),是研究直接从环境样本中提取的基因组遗传物质的学科。
传统的微生物研究依赖于实验室培养,元基因组的兴起填补了无法在传统实验室中培养的微生物研究的空白。
过去几年中,DNA测序技术的进步以及测序通量和分析方法的改进使得人们得以一窥这一未知的基因组科学领域。
什么是SNP、SNV(单核苷酸位点变异)单核苷酸多态性singlenucleotide polymorphism,SNP 或单核苷酸位点变异SNV。
个体间基因组DNA序列同一位置单个核苷酸变异(替代、插入或缺失)所引起的多态性。
不同物种、个体基因组DNA序列同一位置上的单个核苷酸存在差别的现象。
有这种差别的基因座、DNA序列等可作为基因组作图的标志。
人基因组上平均约每1000个核苷酸即可能出现1个单核苷酸多态性的变化,其中有些单核苷酸多态性可能与疾病有关,但可能大多数与疾病无关。
单核苷酸多态性是研究人类家族和动植物品系遗传变异的重要依据。
在研究癌症基因组变异时,相对于正常组织,癌症中特异的单核苷酸变异是一种体细胞突变(somatic mutation),称做SNV。
什么是INDEL (基因组小片段插入)基因组上小片段(>50bp)的插入或缺失,形同SNP/SNV。
什么是copy number variation(CNV):基因组拷贝数变异基因组拷贝数变异是基因组变异的一种形式,通常使基因组中大片段的DNA形成非正常的拷贝数量。
例如人类正常染色体拷贝数是2,有些染色体区域拷贝数变成1或3,这样,该区域发生拷贝数缺失或增加,位于该区域内的基因表达量也会受到影响。
如果把一条染色体分成A-B-C-D四个区域,则A-B-C-C-D/A-C-B-C-D/A-C-C-B-C-D/A-B-D分别发生了C区域的扩增及缺失,扩增的位置可以是连续扩增如A-B-C-C-D也可以是在其他位置的扩增,如A-C-B-C-D。
什么是structure variation(SV):基因组结构变异染色体结构变异是指在染色体上发生了大片段的变异。
主要包括染色体大片段的插入和缺失(引起CNV的变化),染色体内部的某块区域发生翻转颠换,两条染色体之间发生重组(inter-chromosome trans-location)等。