高通量测序常用名词解释

合集下载

高通量测序 名词解释

高通量测序 名词解释

高通量测序基础知识汇总一代测序技术:即传统的Sanger测序法,Sanger法是根据核苷酸在待定序列模板上的引物点开始,随机在某一个特定的碱基处终止,并且在每个碱基后面进行荧光标记,产生以A、T、C、G结束的四组不同长度的一系列核苷酸,每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP)。

由于ddNTP缺乏延伸所需要的3-OH 基团,使延长的寡聚核苷酸选择性地在G、A、T或C处终止,使反应得到一组长几百至几千碱基的链终止产物。

它们具有共同的起始点,但终止在不同的的核苷酸上,可通过高分辨率变性凝胶电泳分离大小不同的片段,通过检测得到DNA碱基序列。

二代测序技术:next generation sequencing(NGS)又称为高通量测序技术,与传统测序相比,二代测序技术可以一次对几十万到几百万条核酸分子同时进行序列测定,从而使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序(Deep sequencing)。

NGS主要的平台有Roche(454 & 454+),Illumina(HiSeq 2000/2500、GA IIx、MiSeq),ABI SOLiD等。

基因:Gene,是遗传的物质基础,是DNA或RNA分子上具有遗传信息的特定核苷酸序列。

基因通过复制把遗传信息传递给下一代,使后代出现与亲代相似的性状。

DNA:Deoxyribonucleic acid,脱氧核糖核酸,一个脱氧核苷酸分子由三部分组成:含氮碱基、脱氧核糖、磷酸。

脱氧核糖核酸通过3',5'-磷酸二酯键按一定的顺序彼此相连构成长链,即DNA链,DNA链上特定的核苷酸序列包含有生物的遗传信息,是绝大部分生物遗传信息的载体。

RNA:Ribonucleic Acid,,核糖核酸,一个核糖核苷酸分子由碱基,核糖和磷酸构成。

高通量测序领域常用名词解释

高通量测序领域常用名词解释

SBS:边合成边测序反应,每次SBS会延伸一个碱基,大约耗时70分钟。

Run:单次上机测序反应,可以产生4G-75G测序通量不等。

Lane:单泳道,每条泳道可以直接物理区分测序样品,1次run最多可以同时上样8条Lane。

Channel:Lane的同义词。

Tile:小区,每条Lane中排有2列tile,合计120个小区。

每个小区上分布数目繁多的簇结合位点。

Cluster:簇,在Solexa测序技术中会采用桥式PCR方式生产DNA簇,每个DNA簇才能产生亮度达到CCD可以分辨的荧光点。

Index:标签,在Solexa多重测序(Multiplexed Sequencing)过程中会使用Index来区分样品,并在常规测序完成后,针对Index部分额外进行7个循环的测序,通过Index的识别,可以在1条Lane中区分12种不同的样品。

Barcode: Index同义词Fasta:一种序列存储格式。

一个序列文件若以FASTA格式存储,则每一条序列的第一行以“>”开头,而跟随“>”的是序列的ID号(即唯一的标识符)及对该序列的描述信息;第二行开始是序列内容,序列短于61nt的,则一行排列完;序列长于61nt的,则每行存储61nt,最后剩下小于61nt的,在最后一行排列完;第二条序列另起一行,仍然由“>”和序列的ID号开始,以此类推。

Fastq:Fastq是Solexa测序技术中一种反映测序序列的碱基质量的文件格式。

第一行以“@”符号开头,后面紧跟一个序列的描述信息;第二行是该序列的内容;第三行以“+”符号开头,后面紧跟的内容与第一行一样,同样是该序列的描述信息;而第四行是第二行中的序列内容每个碱基所对应的测序质量值。

PF%:PF%是指符合测序质量标准的簇的百分比(Multiplexed Sequencing),与测序的通量相关联。

Read:Solexa是成簇反应的,每个簇对应一条DNA序列片段,成为一个read。

高通量测序常用名词汇总

高通量测序常用名词汇总

高通量测序常用名词汇总技术支持Q20值是指的测序过程碱基识别(Base Calling)过程中,对所识别的碱基给出的错误概率. 如果质量值是Q20,则错误识别的概率是1%,即错误率1%,或者正确率是99%;如果质量值是Q30,则错误识别的概率是0.1%,即错误率0.1%,或者正确率是99.9%;如果质量值是Q40,则错误识别的概率是0.01%,即错误率0.01%,或者正确率是99.99%;你发现规律没有,Q“N”0的质量值,就是正确率有N个9的百分比,这样就非常容易记忆了.基因高通量测序中,每测一个碱基会给出一个相应的质量值,这个质量值是衡量测序准确度的。

碱基的质量值13,错误率为5%,20的错误率为1%,30的错误率为0.1%。

行业中Q20与Q30则表示质量值≧20或30的碱基所占百分比。

例如一共测了1G的数据量,其中有0.9G的碱基质量值大于或等于20,那么Q20则为90%。

Q20值是指的测序过程碱基识别(Base Calling)过程中,对所识别的碱基给出的错误概率。

质量值是Q20,则错误识别的概率是1%,即错误率1%,或者正确率是99%;质量值是Q30,则错误识别的概率是0.1%,即错误率0.1%,或者正确率是99.9%;质量值是Q40,则错误识别的概率是0.01%,即错误率0.01%,或者正确率是99.99%;一代测序技术:即传统的Sanger测序法,Sanger法是根据核苷酸在待定序列模板上的引物点开始,随机在某一个特定的碱基处终止,并且在每个碱基后面进行荧光标记,产生以A、T、C、G结束的四组不同长度的一系列核苷酸,每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP)。

由于ddNTP缺乏延伸所需要的3-OH 基团,使延长的寡聚核苷酸选择性地在G、A、T或C处终止,使反应得到一组长几百至几千碱基的链终止产物。

测序常用名词解释整理

测序常用名词解释整理

高通量测序‎领域常用名‎词解释大全‎什么是高通‎量测序?高通量测序‎技术(High-throu‎g hput‎seque‎n cing‎,HTS)是对传统S‎a nger‎测序(称为一代测‎序技术)革命性的改‎变, 一次对几十‎万到几百万‎条核酸分子‎进行序列测‎定, 因此在有些‎文献中称其‎为下一代测‎序技术(next gener‎a tion‎seque‎n cing‎,NGS )足见其划时‎代的改变, 同时高通量‎测序使得对‎一个物种的‎转录组和基‎因组进行细‎致全貌的分‎析成为可能‎,所以又被称‎为深度测序‎(Deep seque‎n cing‎)。

什么是Sa‎n ger法‎测序(一代测序)Sange‎r法测序利‎用一种DN‎A聚合酶来‎延伸结合在‎待定序列模‎板上的引物‎。

直到掺入一‎种链终止核‎苷酸为止。

每一次序列‎测定由一套‎四个单独的‎反应构成,每个反应含‎有所有四种‎脱氧核苷酸‎三磷酸(dNTP),并混入限量‎的一种不同‎的双脱氧核‎苷三磷酸(ddNTP‎)。

由于ddN‎T P缺乏延‎伸所需要的‎3-OH基团,使延长的寡‎聚核苷酸选‎择性地在G‎、A、T或C处终‎止。

终止点由反‎应中相应的‎双脱氧而定‎。

每一种dN‎T Ps和d‎d NTPs‎的相对浓度‎可以调整,使反应得到‎一组长几百‎至几千碱基‎的链终止产‎物。

它们具有共‎同的起始点‎,但终止在不‎同的的核苷‎酸上,可通过高分‎辨率变性凝‎胶电泳分离‎大小不同的‎片段,凝胶处理后‎可用X-光胶片放射‎自显影或非‎同位素标记‎进行检测。

什么是基因‎组重测序(Genom‎e Re-seque‎n cing‎)全基因组重‎测序是对基‎因组序列已‎知的个体进‎行基因组测‎序,并在个体或‎群体水平上‎进行差异性‎分析的方法‎。

随着基因组‎测序成本的‎不断降低,人类疾病的‎致病突变研‎究由外显子‎区域扩大到‎全基因组范‎围。

通过构建不‎同长度的插‎入片段文库‎和短序列、双末端测序‎相结合的策‎略进行高通‎量测序,实现在全基‎因组水平上‎检测疾病关‎联的常见、低频、甚至是罕见‎的突变位点‎,以及结构变‎异等,具有重大的‎科研和产业‎价值。

测序常用名词解释

测序常用名词解释

测序常用名词解释整理作者: 日期:高通量测序领域常用名词解释大全物种基因组大小发表时间拟南芥(Arabidopsis ilialiaiiaj125Mb2000J1 sativa)400Mb2002.4 %^(Populus trichocaipa)480Mb2006.9葡萄(Vitis vinifera)490Mb2007.9小yL^^(Physcomtrella patens)480Mb2008J番木瓜(Cnnd 口papa) -a)370Mb2008.4咼粱(Soj^ghutn bicolor)P 730Mb2009J玉来侶%mays)2300Mb2009JI 黄瓜f a ©mi ber)350M2009.11 ^^^jlycine max)1100Mb2010,1一穗短柄草(Brachypodiim distachyon)355Mb2010.2什么是高通量测序?高通量测序技术(High-throughput seque ncing, HTS )是对传统San ger测序(称为一代测序技术)革命性的改变,一次对几十万到几百万条核酸分子进行序列测定,因此在有些文献中称其为下一代测序技术(next generation sequencing NGS )足见其划时代的改变,同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序(Deep sequencing。

什么是Sanger法测序(一代测序)San ger法测序利用一种DNA聚合酶来延伸结合在待定序列模板上的引物。

直到掺入一种链终止核苷酸为止。

每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP)。

由于ddNTP缺乏延伸所需要的3-OH基团,使延长的寡聚核苷酸选择性地在G A、T或C处终止。

终止点由反应中相应的双脱氧而定。

高通量名词解释

高通量名词解释

高通量测序常用名词汇总一代测序技术:即传统的Sanger测序法,Sanger法是根据核苷酸在待定序列模板上的引物点开始,随机在某一个特定的碱基处终止,并且在每个碱基后面进行荧光标记,产生以A、T、C、G结束的四组不同长度的一系列核苷酸,每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP)。

由于ddNTP缺乏延伸所需要的3-OH 基团,使延长的寡聚核苷酸选择性地在G、A、T或C处终止,使反应得到一组长几百至几千碱基的链终止产物。

它们具有共同的起始点,但终止在不同的的核苷酸上,可通过高分辨率变性凝胶电泳分离大小不同的片段,通过检测得到DNA碱基序列。

二代测序技术:next generation sequencing(NGS)又称为高通量测序技术,与传统测序相比,二代测序技术可以一次对几十万到几百万条核酸分子同时进行序列测定,从而使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序(Deep sequencing)。

NGS主要的平台有Roche(454 & 454+),Illumina(HiSeq 2000/2500、GA IIx、MiSeq),ABI SOLiD等。

基因:Gene,是遗传的物质基础,是DNA或RNA分子上具有遗传信息的特定核苷酸序列。

基因通过复制把遗传信息传递给下一代,使后代出现与亲代相似的性状。

DNA:Deoxyribonucleic acid,脱氧核糖核酸,一个脱氧核苷酸分子由三部分组成:含氮碱基、脱氧核糖、磷酸。

脱氧核糖核酸通过3',5'-磷酸二酯键按一定的顺序彼此相连构成长链,即DNA链,DNA链上特定的核苷酸序列包含有生物的遗传信息,是绝大部分生物遗传信息的载体。

RNA:Ribonucleic Acid,,核糖核酸,一个核糖核苷酸分子由碱基,核糖和磷酸构成。

高通量测序常用名词解释

高通量测序常用名词解释

什么是高通量测序?高通量测序技术(High-throughput sequencing,HTS)是对传统Sanger测序(称为一代测序技术)革命性的改变, 一次对几十万到几百万条核酸分子进行序列测定, 因此在有些文献中称其为下一代测序技术(next generation sequencing,NGS )足见其划时代的改变, 同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能, 所以又被称为深度测序(Deep sequencing)。

什么是Sanger法测序(一代测序)Sanger法测序利用一种DNA聚合酶来延伸结合在待定序列模板上的引物。

直到掺入一种链终止核苷酸为止。

每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP)。

由于ddNTP缺乏延伸所需要的3-OH基团,使延长的寡聚核苷酸选择性地在G、A、T或C处终止。

终止点由反应中相应的双脱氧而定。

每一种dNTPs和ddNTPs的相对浓度可以调整,使反应得到一组长几百至几千碱基的链终止产物。

它们具有共同的起始点,但终止在不同的的核苷酸上,可通过高分辨率变性凝胶电泳分离大小不同的片段,凝胶处理后可用X-光胶片放射自显影或非同位素标记进行检测。

什么是基因组重测序(Genome Re-sequencing)全基因组重测序是对基因组序列已知的个体进行基因组测序,并在个体或群体水平上进行差异性分析的方法。

随着基因组测序成本的不断降低,人类疾病的致病突变研究由外显子区域扩大到全基因组范围。

通过构建不同长度的插入片段文库和短序列、双末端测序相结合的策略进行高通量测序,实现在全基因组水平上检测疾病关联的常见、低频、甚至是罕见的突变位点,以及结构变异等,具有重大的科研和产业价值。

什么是de novo测序de novo测序也称为从头测序:其不需要任何现有的序列资料就可以对某个物种进行测序,利用生物信息学分析手段对序列进行拼接,组装,从而获得该物种的基因组图谱。

高通量测序常用名词

高通量测序常用名词

外显子组测序
• 是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进行高通量测序的 基因组分析方法。外显子测序相对于基因组重测序成本较低,对研究已知基因的 SNP、InDel等具有较大的优势。
目标区域测序
• 应用相关试剂盒对基因组上感兴趣的目标区域进行捕获富集后进行大规模测序,一 般需要根据目标区域专门定制捕获芯片。
ChIp-Seq
• Chromatin Immunoprecipitation sequencing,即染色质免疫共沉淀-测序技术,即通过
染色质免疫共沉淀技术特异性地富集目的蛋白结合的DNA组范围内可以与 目的蛋白相互作用的DNA片段的方法叫做ChIP-Seq。
(rRNA)分子对应的DNA序列,16S rDNA是原核生物编码核糖体小亚基16S rRNA的
基因。 • 细菌rRNA(核糖体RNA)按沉降系数分为3种,分别为5S、16S和23S rRNA。16S rDNA是细菌染色体上编码16S rRNA相对应的DNA序列,存在于所有细菌染色体基因
中。16S rRNA普遍存在于原核生物中。16S rRNA分子,其大小约1540bp,既含有高
高通量测序常用名词
三代测序
• • Pacific Biosciences 公司研发的 PacBio RS II 单分子实时测序系统, 革命性地推出了 单分子实时(Single Molecule Real Time, SMRT)DNA测序技术,在测序历 史上首次实现 了人类观测单个DNA聚合酶合成过程的 梦想。SMRT Sequencing具有超长的测 序读长、对基因组组装和基因组变异的 检测具有极高的准确率、极度的敏感性、 直接检测广泛的碱基修饰、最小的GC偏 好性(GC bias)和无PCR扩增偏好性等 技术特点.
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

什么是高通量测序?高通量测序技术(High-throughput sequencing,HTS)是对传统Sanger测序(称为一代测序技术)革命性的改变, 一次对几十万到几百万条核酸分子进行序列测定, 因此在有些文献中称其为下一代测序技术(next generation sequencing,NGS )足见其划时代的改变, 同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能, 所以又被称为深度测序(Deep sequencing)。

什么是Sanger法测序(一代测序)Sanger法测序利用一种DNA聚合酶来延伸结合在待定序列模板上的引物。

直到掺入一种链终止核苷酸为止。

每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP)。

由于ddNTP 缺乏延伸所需要的3-OH基团,使延长的寡聚核苷酸选择性地在G、A、T或C处终止。

终止点由反应中相应的双脱氧而定。

每一种dNTPs和ddNTPs的相对浓度可以调整,使反应得到一组长几百至几千碱基的链终止产物。

它们具有共同的起始点,但终止在不同的的核苷酸上,可通过高分辨率变性凝胶电泳分离大小不同的片段,凝胶处理后可用X-光胶片放射自显影或非同位素标记进行检测。

什么是基因组重测序(Genome Re-sequencing)全基因组重测序是对基因组序列已知的个体进行基因组测序,并在个体或群体水平上进行差异性分析的方法。

随着基因组测序成本的不断降低,人类疾病的致病突变研究由外显子区域扩大到全基因组范围。

通过构建不同长度的插入片段文库和短序列、双末端测序相结合的策略进行高通量测序,实现在全基因组水平上检测疾病关联的常见、低频、甚至是罕见的突变位点,以及结构变异等,具有重大的科研和产业价值。

什么是de novo测序de novo测序也称为从头测序:其不需要任何现有的序列资料就可以对某个物种进行测序,利用生物信息学分析手段对序列进行拼接,组装,从而获得该物种的基因组图谱。

获得一个物种的全基因组序列是加快对此物种了解的重要捷径。

随着新一代测序技术的飞速发展,基因组测序所需的成本和时间较传统技术都大大降低,大规模基因组测序渐入佳境,基因组学研究也迎来新的发展契机和革命性突破。

利用新一代高通量、高效率测序技术以及强大的生物信息分析能力,可以高效、低成本地测定并分析所有生物的基因组序列。

什么是外显子测序(whole exon sequencing)外显子组测序是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进行高通量测序的基因组分析方法。

外显子测序相对于基因组重测序成本较低,对研究已知基因的SNP、Indel等具有较大的优势,但无法研究基因组结构变异如染色体断裂重组等。

什么是mRNA测序(RNA-seq)转录组学(transcriptomics)是在基因组学后新兴的一门学科,即研究特定细胞在某一功能状态下所能转录出来的所有RNA(包括mRNA和非编码RNA)的类型与拷贝数。

Illumina 提供的mRNA测序技术可在整个mRNA领域进行各种相关研究和新的发现。

mRNA测序不对引物或探针进行设计,可自由提供关于转录的客观和权威信息。

研究人员仅需要一次试验即可快速生成完整的poly-A尾的RNA完整序列信息,并分析基因表达、cSNP、全新的转录、全新异构体、剪接位点、等位基因特异性表达和罕见转录等最全面的转录组信息。

简单的样品制备和数据分析软件支持在所有物种中的mRNA测序研究。

什么是small RNA测序Small RNA(micro RNAs、siRNAs和pi RNAs)是生命活动重要的调控因子,在基因表达调控、生物个体发育、代谢及疾病的发生等生理过程中起着重要的作用。

Illumina能够对细胞或者组织中的全部Small RNA进行深度测序及定量分析等研究。

实验时首先将18-30 nt范围的Small RNA从总RNA中分离出来,两端分别加上特定接头后体外反转录做成cDNA再做进一步处理后,利用测序仪对DNA片段进行单向末端直接测序。

通过Illumina对Small RNA大规模测序分析,可以从中获得物种全基因组水平的miRNA图谱,实现包括新miRNA 分子的挖掘,其作用靶基因的预测和鉴定、样品间差异表达分析、miRNAs聚类和表达谱分析等科学应用。

什么是miRNA测序成熟的microRNA(miRNA)是17~24nt的单链非编码RNA分子,通过与mRNA相互作用影响目标mRNA的稳定性及翻译,最终诱导基因沉默,调控着基因表达、细胞生长、发育等生物学过程。

基于第二代测序技术的microRNA测序,可以一次性获得数百万条microRNA 序列,能够快速鉴定出不同组织、不同发育阶段、不同疾病状态下已知和未知的microRNA 及其表达差异,为研究microRNA对细胞进程的作用及其生物学影响提供了有力工具。

什么是Chip-seq染色质免疫共沉淀技术(ChromatinImmunoprecipitation,ChIP)也称结合位点分析法,是研究体内蛋白质与DNA相互作用的有力工具,通常用于转录因子结合位点或组蛋白特异性修饰位点的研究。

将ChIP与第二代测序技术相结合的ChIP-Seq技术,能够高效地在全基因组范围内检测与组蛋白、转录因子等互作的DNA区段。

ChIP-Seq的原理是:首先通过染色质免疫共沉淀技术(ChIP)特异性地富集目的蛋白结合的DNA片段,并对其进行纯化与文库构建;然后对富集得到的DNA片段进行高通量测序。

研究人员通过将获得的数百万条序列标签精确定位到基因组上,从而获得全基因组范围内与组蛋白、转录因子等互作的DNA区段信息。

什么是CHIRP-SeqCHIRP-Seq( Chromatin Isolation by RNA Purification )是一种检测与RNA绑定的DNA和蛋白的高通量测序方法。

方法是通过设计生物素或链霉亲和素探针,把目标RNA拉下来以后,与其共同作用的DNA染色体片段就会附在到磁珠上,最后把染色体片段做高通量测序,这样会得到该RNA能够结合到在基因组的哪些区域,但由于蛋白测序技术不够成熟,无法知道与该RNA结合的蛋白。

什么是RIP-seqRNA Immunoprecipitation是研究细胞内RNA与蛋白结合情况的技术,是了解转录后调控网络动态过程的有力工具,能帮助我们发现miRNA的调节靶点。

这种技术运用针对目标蛋白的抗体把相应的RNA-蛋白复合物沉淀下来,然后经过分离纯化就可以对结合在复合物上的RNA进行测序分析。

RIP可以看成是普遍使用的染色质免疫沉淀ChIP技术的类似应用,但由于研究对象是RNA-蛋白复合物而不是DNA-蛋白复合物,RIP实验的优化条件与ChIP实验不太相同(如复合物不需要固定,RIP反应体系中的试剂和抗体绝对不能含有RNA酶,抗体需经RIP实验验证等等)。

RIP技术下游结合microarray技术被称为RIP-Chip,帮助我们更高通量地了解癌症以及其它疾病整体水平的RNA变化。

什么是CLIP-seqCLIP-seq,又称为HITS-CLIP,即紫外交联免疫沉淀结合高通量测序(crosslinking-immunprecipitation and high-throughput sequencing), 是一项在全基因组水平揭示RNA分子与RNA结合蛋白相互作用的革命性技术。

其主要原理是基于RNA分子与RNA结合蛋白在紫外照射下发生耦联,以RNA结合蛋白的特异性抗体将RNA-蛋白质复合体沉淀之后,回收其中的RNA片段,经添加接头、RT-PCR等步骤,对这些分子进行高通量测序,再经生物信息学的分析和处理、总结,挖掘出其特定规律,从而深入揭示RNA结合蛋白与RNA分子的调控作用及其对生命的意义。

什么是metagenomic(宏基因组)Magenomics研究的对象是整个微生物群落。

相对于传统单个细菌研究来说,它具有众多优势,其中很重要的两点:(1) 微生物通常是以群落方式共生于某一小生境中,它们的很多特性是基于整个群落环境及个体间的相互影响的,因此做Metagenomics研究比做单个个体的研究更能发现其特性;(2) Metagenomics研究无需分离单个细菌,可以研究那些不能被实验室分离培养的微生物。

宏基因组是基因组学一个新兴的科学研究方向。

宏基因组学(又称元基因组学,环境基因组学,生态基因组学等),是研究直接从环境样本中提取的基因组遗传物质的学科。

传统的微生物研究依赖于实验室培养,元基因组的兴起填补了无法在传统实验室中培养的微生物研究的空白。

过去几年中,DNA测序技术的进步以及测序通量和分析方法的改进使得人们得以一窥这一未知的基因组科学领域。

什么是SNP、SNV(单核苷酸位点变异)单核苷酸多态性singlenucleotide polymorphism,SNP 或单核苷酸位点变异SNV。

个体间基因组DNA序列同一位置单个核苷酸变异(替代、插入或缺失)所引起的多态性。

不同物种、个体基因组DNA序列同一位置上的单个核苷酸存在差别的现象。

有这种差别的基因座、DNA 序列等可作为基因组作图的标志。

人基因组上平均约每1000个核苷酸即可能出现1个单核苷酸多态性的变化,其中有些单核苷酸多态性可能与疾病有关,但可能大多数与疾病无关。

单核苷酸多态性是研究人类家族和动植物品系遗传变异的重要依据。

在研究癌症基因组变异时,相对于正常组织,癌症中特异的单核苷酸变异是一种体细胞突变(somatic mutation),称做SNV。

什么是INDEL (基因组小片段插入)基因组上小片段(>50bp)的插入或缺失,形同SNP/SNV。

什么是copy number variation (CNV):基因组拷贝数变异基因组拷贝数变异是基因组变异的一种形式,通常使基因组中大片段的DNA形成非正常的拷贝数量。

例如人类正常染色体拷贝数是2,有些染色体区域拷贝数变成1或3,这样,该区域发生拷贝数缺失或增加,位于该区域内的基因表达量也会受到影响。

如果把一条染色体分成A-B-C-D四个区域,则A-B-C-C-D/A-C-B-C-D/A-C-C-B-C-D/A-B-D分别发生了C区域的扩增及缺失,扩增的位置可以是连续扩增如A-B-C-C-D也可以是在其他位置的扩增,如A-C-B-C-D。

什么是structure variation (SV):基因组结构变异染色体结构变异是指在染色体上发生了大片段的变异。

主要包括染色体大片段的插入和缺失(引起CNV的变化),染色体内部的某块区域发生翻转颠换,两条染色体之间发生重组(inter-chromosome trans-location)等。

相关文档
最新文档