(完整word版)Illumina测序基础知识

合集下载

高通量测序原理篇-Illumina测序原理4

高通量测序原理篇-Illumina测序原理4

高通量测序原理篇-Illumina测序原理4
那么要读这个Index序列,先用碱把上面这根测完“Read 1”的序列把它上面的那条DNA链给解链掉,再加入中性液。

然后,加入“Read 2”的这个测序引物,“Read 2”结合的位点正好再这个Index序列的旁边。

接下来进行第二轮测序,一般来说读到6~8个碱基,把这6~8个碱基读下来。

我们就可以知道,我们具体的DNA它来自于原始的哪个样本。

5)双端测序
这是Illumina最核心的另外一个技术,就是双端测序。

双端测序就是一根DNA链,除了从正向读一遍,还可以从DNA的负向再读一遍。

这样一下子就把Illumina测序的有效长度加了一倍。

这是非常有实际用途的。

那么这个倒链的过程,是先让DNA先合成,合成出来这跟互补链。

有了这个互补链之后用一个化学试剂再原来这根链的根上切一下,切一下原来这跟链的模板链就掉了,剩下那根互补链。

再接下来就进行第2端的测序。

第二段的测序原理和第一段的测序原理是一样的,加上了“Read 3”的引物,依次往下,一个一个碱基地往下读。

最重要的事情是一个点经过几百个循环就读出了几百个碱基,这个芯片上可以有上亿个点,“cluster”也就是簇,上亿个簇每一个循环都可以读出那么多序列。

这也就是Illumina测序非常强大的原因,
因为是成千上完,准确说是上亿个链都在合成,就得到了一个很大的数据量。

illumina二代测序原理

illumina二代测序原理

illumina二代测序原理Illumina二代测序原理。

Illumina二代测序技术是一种高通量测序技术,能够快速、准确地测序DNA和RNA样本。

它的原理基于DNA合成、测序和图像分析技术,结合了高通量测序和平行测序的优势,使得它成为当前最常用的测序技术之一。

首先,Illumina二代测序技术利用DNA聚合酶和引物将DNA片段扩增成成百上千万份复制品,形成“簇”。

接着,这些“簇”被固定在玻璃芯片上,形成DNA芯片。

然后,通过化学方法将DNA片段解链,并将每个片段与荧光标记的引物结合。

在每个碱基加入的过程中,荧光信号会被记录下来。

在测序过程中,每个碱基的加入都会释放出荧光信号,这些信号会被相机捕捉到并记录下来。

然后,计算机会根据这些信号来确定每个碱基的序列。

通过这种方式,可以快速准确地测序DNA和RNA样本。

Illumina二代测序技术的优势在于其高通量、高准确性和低成本。

由于能够同时测序成百上千万份DNA片段,因此可以在较短的时间内完成大规模的测序工作。

同时,其测序错误率非常低,能够提供高质量的测序数据。

而且,由于其平行测序的特点,使得测序成本大大降低,使得大规模测序成为可能。

除此之外,Illumina二代测序技术还具有较高的灵敏度和特异性。

它能够检测到低频突变和罕见基因变异,对于研究基因组变异和发现新基因具有重要意义。

而且,由于其高通量的特点,可以同时测序多个样本,适用于大规模的研究项目。

总的来说,Illumina二代测序技术是一种高效、准确、经济的测序技术,广泛应用于基因组学、转录组学、表观基因组学等领域。

它的原理基于DNA合成、测序和图像分析技术,结合了高通量测序和平行测序的优势,使得它成为当前最常用的测序技术之一。

随着技术的不断发展,相信Illumina二代测序技术将在生命科学领域发挥越来越重要的作用。

Day1_01_TS_Illumina_SBS二代测序简介-中国区武汉培训

Day1_01_TS_Illumina_SBS二代测序简介-中国区武汉培训

Sample Preparation
Cluster Generation
Sequencing
初级序列分析 Primary Analysis
27
初级分析
从图片中提取每个cycle的信息 首先鉴别,定位,清点DNA簇
循环 1-4
= 28DNA簇
28
初级分析
质量参数(Quality scores -Q Scores) 分配给所有的碱基分析
5’
P
T
P
+
5’
A
A
5’
P
3’
T4 DNA Ligase
5’
T A A T
3’
3’
5’
特征: 一种接头 室温进行反应· ,以维持互补部分序列相互结合的状态 5’ P5 Rd1 SP Rd2 SP Index P7 5’
6
胶纯化
5’
P
5’
T
P
5’
A
A
5’
T A
P
3’
3’
5’
T T
5’ 3’
T A A T
IIIumina二代测序技术简介
童磊, PH.D.
2012年7月12日
© 2011 Illumina, Inc. All rights reserved. Illumina, illuminaDx, BeadArray, BeadXpress, cBot, CSPro, DASL, Eco, Genetic Energy, GAIIx, Genome Analyzer, GenomeStudio, GoldenGate, HiScan, HiSeq, Infinium, iSelect, MiSeq, Nextera, Sentrix, Solexa, TruSeq, VeraCode, the pumpkin orange color, and the Genetic Energy streaming bases design are trademarks or registered trademarks of Illumina, Inc. All other brands and names contained herein are the property of their respective owners.

illumina测序的基本原理

illumina测序的基本原理

illumina测序的基本原理嗨,宝子!今天咱来唠唠Illumina测序的基本原理,这可是个超有趣的事儿呢!Illumina测序啊,就像是一场超级精密的基因探秘之旅。

你可以把基因想象成一本超级神秘的大书,里面写满了生命的密码。

而Illumina测序就是要把这本书里的每个字,也就是每个碱基,都精准地读出来。

那它是怎么做到的呢?咱先从样本准备说起。

就好像你要做一道超级复杂的菜,得先把食材准备好一样。

对于Illumina测序,我们要先把要测序的DNA提取出来。

这DNA可娇贵啦,提取的时候得小心翼翼的,就像捧着个稀世珍宝。

提取出来的DNA就像一根根细细的线,但是这些线太长啦,不好操作,所以我们要把它打断成一小段一小段的,就像把长长的面条剪成一小节一小节的。

然后呢,这些小片段的两端要加上一些特殊的“小帽子”,这些“小帽子”可是有大作用的。

它们就像是给这些小片段DNA贴上了特殊的标签,方便后面的步骤能准确地识别它们。

这就好比给每个小包裹都贴上了独一无二的快递单,这样就不会弄混啦。

接下来就是关键的一步啦,把这些带了“小帽子”的DNA片段连接到一种特殊的板子上,这个板子就像是它们的小床。

这些DNA片段就乖乖地在板子上躺好,准备迎接后面的奇妙旅程。

再之后呢,就是复制的过程啦。

这里面会有一种特殊的酶,这个酶就像是一个超级复印机。

它会以这些DNA片段为模板,不停地复制出一模一样的副本。

这个过程就像是孙悟空拔毛变出好多小猴子一样神奇。

而且啊,在复制的过程中,还会加入一些带有特殊颜色标记的小零件,这些小零件就像是彩色的小珠子。

不同的碱基会和不同颜色的小珠子结合,这就相当于给每个碱基穿上了不同颜色的衣服。

然后就是检测环节啦。

有一个超级厉害的小机器,它就像一个超级眼睛,能够看到这些彩色的小珠子。

当光线照到这些小珠子上的时候,它们就会发出不同颜色的光。

这个小机器就能根据这些光的颜色,判断出这个位置上的碱基是什么。

就好像这个小机器能读懂这些彩色密码一样。

illumina测序原理

illumina测序原理

illumina测序原理Illumina测序原理。

Illumina测序技术是一种高通量测序技术,被广泛应用于基因组学、转录组学和表观基因组学研究中。

它的原理基于DNA合成和荧光成像技术,能够快速、准确地测序大量DNA片段。

首先,DNA样本被剪碎成短片段,然后连接上测序接头。

接着,这些DNA片段被固定在玻璃芯片表面的流式单元中,形成DNA芯片。

接下来的步骤是PCR扩增,将DNA片段扩增成固定长度的DNA片段簇。

在荧光成像阶段,首先将四种碱基分别加入到PCR扩增的DNA片段簇中,每种碱基都带有一种特定的荧光标记。

然后,通过激光照射,观察每个DNA片段簇中的荧光信号,记录下每个碱基的荧光信号强度。

在数据分析阶段,根据荧光信号的强度,可以确定每个DNA片段的碱基序列。

通过对数百万个DNA片段进行多次循环,最终可以得到整个DNA样本的碱基序列。

Illumina测序技术的优势在于其高通量、高准确性和低成本。

它能够同时测序数百万个DNA片段,大大提高了测序效率。

同时,由于荧光成像技术的应用,使得测序结果具有极高的准确性。

此外,相比传统的Sanger测序技术,Illumina测序技术的成本更低,使得大规模基因组学研究变得更加可行。

总之,Illumina测序技术是一种高效、准确、经济的测序技术,为基因组学研究提供了强大的工具。

它的原理基于DNA合成和荧光成像技术,通过高通量测序,可以快速得到大量DNA片段的碱基序列,为基因组学研究提供了重要的数据支持。

Illumina测序技术的不断发展和完善,将进一步推动基因组学研究的进展,为人类健康和生命科学研究做出更大的贡献。

二代测序技术-illumina测序原理 -回复

二代测序技术-illumina测序原理 -回复

二代测序技术-illumina测序原理-回复二代测序技术(Next Generation Sequencing,NGS)是一种高通量、高效率的DNA测序技术,它革命性地改变了基因组学的研究方式。

其中,illumina测序技术是目前应用最为广泛的二代测序技术之一。

本文将以"illumina测序原理"为主题,详细介绍illumina测序技术的原理和相关步骤。

首先,介绍一下illumina测序技术的基本原理。

Illumina测序技术主要是依托于DNA链延伸和合成特性,利用偶联反应(ligation)和桥式PCR (bridge PCR)进行高效的DNA扩增,并通过荧光信号的记录来反应DNA碱基的顺序。

具体而言,illumina测序原理基于以下几个步骤:1. DNA片段准备:首先,需要将待测DNA样本进行处理。

通常,DNA 样本会被打断成短片段,这些片段的长度可以根据具体实验的需求进行调整。

2. 适配体的连接:接下来,需要将适配体连接到DNA片段的两端。

适配体是一段带有特定序列的DNA,它的作用是为PCR反应和测序提供起始位点。

3. 桥式PCR扩增:连接完适配体后,DNA片段被固定在一个玻璃芯片上。

在芯片上,每个片段的两端都会连成一条桥状结构。

接下来,进行PCR 扩增反应。

PCR反应中使用的引物能够帮助完成DNA合成,从而使得DNA片段在桥状结构上进行扩增。

4. 单碱基的加入:桥式PCR反应产生的DNA片段将被转录成RNA,然后再通过逆转录成DNA。

这一过程中,每个DNA链上的荧光核苷酸被加入到模板链上,形成一个新的DNA链。

每种不同的荧光标记代表一个特定的DNA碱基。

5. 荧光信号的检测:在illumina测序仪中,会通过激光的照射和荧光信号的检测来记录每个位置上的DNA碱基。

由于每个位置上只加入一种荧光标记的碱基,可以通过特定的滤光片来分辨不同的荧光信号。

6. 数据分析:最后,通过计算机算法对测序得到的数据进行分析和处理,得到DNA序列的信息。

illumina sequencing原理

illumina sequencing原理
Illumina sequencing(Illumina 测序)是一种广泛使用的高通量DNA 测序技术,其原理基于边合成边测序(Sequencing-by-Synthesis,SBS)的方法。

Illumina 测序的基本步骤如下:
1. 文库制备:将待测DNA 片段连接到测序载体上,形成文库。

2. 桥接和扩增:将文库加载到测序芯片上,通过桥式PCR 进行扩增,每个DNA 片段都被扩增成许多相同的拷贝。

3. 测序:在测序过程中,DNA 聚合酶会将荧光标记的核苷酸逐个添加到延伸的DNA 链上。

每次添加一个核苷酸,都会释放出相应的荧光信号,通过光学检测系统记录。

4. 图像采集和分析:光学检测系统会捕捉每个核苷酸添加时产生的荧光信号,并将其转换为数字图像。

这些图像被用于分析和识别每个核苷酸的身份。

5. 数据处理和质量控制:测序得到的原始数据需要经过处理和质量控制步骤,包括去除低质量的序列、比对到参考基因组等,以获
得最终的测序结果。

Illumina 测序技术具有高通量、高准确性和低成本的特点,使其成为基因组学研究、生物医学研究和临床诊断等领域的重要工具。

illumina测序的基本流程

illumina测序的基本流程illumina测序是一种高通量测序技术,被广泛应用于基因组学、转录组学、表观基因组学等领域。

它的基本流程可以分为建库、测序和数据分析三个步骤。

一、建库建库是指将待测DNA样本进行预处理,使其适合于测序。

首先,需要将DNA进行提取、纯化和定量,以获得高质量的DNA样本。

接下来,将DNA样本进行片段剪切,得到短片段的DNA。

然后,在DNA片段的两端添加适配体序列,这些序列将在测序过程中起到引物的作用。

最后,将适配体修饰的DNA片段进行PCR扩增,得到建库样本。

二、测序测序是指对建库样本中的DNA片段进行测序反应,以获取DNA序列信息。

illumina测序采用的是桥式扩增测序技术。

首先,将建库样本中的DNA片段固定在测序芯片的表面上。

然后,在芯片上进行PCR扩增,使每个DNA片段都形成一个桥状结构。

接着,进行碱基的添加和鉴定。

在每一轮的测序中,通过加入不同的荧光标记的碱基,可以分辨出DNA片段的序列。

最后,通过摄像机对芯片进行扫描,记录下每个位点的荧光强度,从而得到DNA的序列信息。

三、数据分析数据分析是指对测序得到的原始数据进行处理和解读,以得到最终的测序结果。

首先,需要对原始数据进行质量控制,去除低质量的碱基和序列。

然后,将得到的序列比对到参考基因组上,以确定每个DNA片段的位置和序列。

接着,对测序结果进行注释,包括基因功能、SNP等信息的分析。

最后,根据研究的需要,进行进一步的统计和生物信息学分析。

总结:illumina测序的基本流程包括建库、测序和数据分析三个步骤。

建库阶段将待测DNA样本进行预处理,得到适合测序的建库样本。

测序阶段通过桥式扩增测序技术,对建库样本中的DNA片段进行测序反应,得到DNA的序列信息。

数据分析阶段对测序得到的原始数据进行处理和解读,最终得到测序结果。

这一流程在基因组学、转录组学等领域的研究中发挥着重要的作用,为科学研究和医学诊断提供了强有力的支持。

illumina测序的化学原理

illumina测序的化学原理概览illumina是当前最热的二代测序公司,它测序的特点是使用带有可以切除的叠氮基和荧光标记的dNTP进行合成测序,由于dNTP上的叠氮基的存在,每个链每次测序循环只会合成一个碱基,由于A、C、G、T四种碱基所携带的荧光各不相同,因此读取此时的荧光就可以得知此时的碱基类型,重复这个过程,所有碱基序列就可以完成测定了。

illumina测序的工作流程建库->桥式PCR扩增->Read1测序->Read2测序->双端测序(Read3)1. 建库使用超声将DNA样品打碎成小片段,接着T4酶修补末端,klenow酶在3‘末端加A,然后DNA连接酶将测序引物和DNA片段连接,即制成测序文库。

如图所示,即是建好的文库片段。

其中a与e分别与flowcell中的P5与P7互补配对。

b-c是Read1引物结合位点,c'-d是Read2结合位点,用于读取barcode,多样品在同一lane测定时才需要检测,d'-c是Read3结合位点,双端测序时才会用到。

i是index,也叫barcode。

(c与c'互补配对,d与d'互补配对)2. 桥式PCR扩增建好的文库,会加入到flowcell的lane里面进行桥式PCR扩增。

> flowcell是什么>> illumina测序仪中实际进行的测序反应位于flowcell(流动池)中,如图就是一个典型的illumina flowcell,一个flowcell有8条lane(通道),每个lane内表面共价结合了大量的P5、P7短序列(你可以将其想象为一个牙刷,一个平面上有大量的“短发”状序列),P5与P7将会用于结合构建好的文库片段。

* 模板结合,并合成第一链将文库加入到一个lane中去,由于文库两端的序列是和lane内的P5和P7互补的,因此文库片段会和lane 内表面互补结合,如果此时加入dNTP和酶,调至延伸温度,那么就会开始进行第一链合成。

sanger测序和illumina测序的基本原理

sanger测序和illumina测序的基本原理Sanger测序是一种经典的测序方法,由Frederick Sanger在1977年首次提出。

其基本原理是通过DNA链合酶和DNA聚合酶在DNA模板上合成新的链,其中含有dideoxy核苷酸(ddNTPs)。

ddNTPs在3'-OH末端缺少一个氧原子,因此它们可以与正在复制的DNA链上的正常核苷酸相竞争,阻断进一步的DNA 合成。

在Sanger测序过程中,DNA模板首先被分为不同长度的碎片。

然后,每个碎片都与一种特定的引物结合,该引物包含在DNA模板的同一位置,并决定了待测序列起始点。

接下来,DNA链合酶和DNA聚合酶被引物引导在模板上合成新的链。

在合成过程中,据有不同ddNTPs的四个标记色素核苷酸也被加入到反应体系中。

当反应进行到某一特定的碱基时,若ddNTPs被加入反应,DNA 链不会再延伸。

因此,终止了合成链的长度,且根据加入的ddNTPs的颜色可以确定所终止的碱基。

测序完成后,反应产物通过凝胶电泳进行分离,电泳过程中,不同长度的碎片按照大小排序,从而得到一条碱基序列。

最后,通过检测反应堆中的荧光标记物,可以确定碱基的顺序。

相比于Sanger测序,Illumina测序是一种高通量测序技术,也称为链终止法测序。

它能够同时进行大量的DNA序列的并行测定。

其基本原理是在固相单分子扩增法的基础上,在DNA链延伸过程中引入可被检测的特定荧光标记物。

Illumina测序过程中,首先将DNA样品切割成短片段,并将这些片段与引物结合。

然后将这些片段通过PCR反应进行扩增,形成成千上万个DNA模板,每个模板都与一个固定的DNA蓝球(DNA cluster)相关联。

接下来,每个蓝球上的DNA模板被复制成群组,生成含有大量相同DNA模板的群组。

然后,在每个群组进行扩增过程中,测序反应中含有未标记的dNTP、标记有四种不同荧光染料的未终止ddNTP,以及终止了聚合作用的终止ddNTP。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1 第一个要给大家讲的,是它这个flowcell。Flowcell翻成中文,就叫“流动池”。 我们来看这个图片。图片当中,我们看到一个象载玻片大小的芯片。这个芯片里面,是做了8条通道。在这个通道的内表面,是做了专门的化学修饰。它的化学

修饰,主要是用2种DNA 引物,把它(2种DNA引物)种在玻璃表面。 这两种(DNA引物的)序列是和接下来要测序的DNA文库的接头序列相互补的。而且这2种引物是通过共价键,连到Flowcell上去。之所以要用共价键连到Flowcell上去,是因为接下来有大量的液体要流过这个Flowcell,只有有共价键连接的这些DNA,才不会被冲掉。这就是Flowcell。

再接下来,讲一下文库、和文库的制作(过程) 所谓的DNA文库,实际上是许多个DNA片段,在两头接上了特定的DNA接

头,型成的DNA混合物。 文库有2个特点,第1个特点,是当中这一段插入的DNA,它的序列是各种各样的。第2个特点,它的两头的接头序列,是已知的,而且是人工特地加上去的。 要做这个文库,首先是把基因组DNA,用超声波打断。然后打断之后,两头用酶把它补平,再用Klenow酶在3’端加上一个A碱基。然后,再用连接酶把这个接头给连上去。 连好了接头的DNA混合物,我们就称为一个“文库”。英文也称作“library”。

做好了Library之后,就要做桥式PCR了。桥式PCR,实际上是把文库种到芯片上去,然后进行扩增,这样的一个过程。 这个过程,首先是把文库加入到芯片上,因为文库两头的DNA序列,和芯片上引物是互补的,所以,就会产生互补杂交。 2

杂交完了之后,我们在这里面加入dNP和聚合酶。聚合酶会从引物开始,延着模板合成出一条全新的DNA链来。 新的这条链,和原来的序列是完全互补的。 接下来,我们再加入NaOH碱溶液。DNA双链在NaOH碱溶液存在下,就解链了。而且被液流一冲,原来的那个(模板)链,也就是没有和芯片共价连接的链,就被冲走了。而和芯片共价连接的链,就被保留下来。 然后,我们再在液流池里加入中性液体,主要是为了中和这个碱液,在加入中和

液之后,整个环境变成中性了。这时侯,DNA链上的另外一端,就会和玻璃板上的第二种引物,发生互补杂交。 接下来,我们加入酶和dNTP,聚合酶就延着第二个引物,合成出一条新链来;

然后,我们再加碱,把2条链解链解开;然后,我们再加中和液,这时侯,DNA链会和新的引物杂交。再加酶,再加dNTP,又从新引物合成出新的链来。 连续重复这一过程,DNA链的数量,就会以指数方式增长。

在桥式PCR完成之后,接下来要做的工作,就是要把合成的双链,变成可以测序的单链。 办法是通过一个化学反应,把其中一个引物上的一个特定的基团给切断掉。

然后,再用碱溶液来洗这个芯片。这时侯,碱让DNA的双链解链,那根被切断

了根的DNA链就被水冲掉了。留下那根共价键连在(芯片)上面的链。 接下来,再加入中性溶液,然后在这个中性溶液里面加入测序引物。

好,接下来正式的测序工作就开始了。 那么,在测序的时侯,加入进去的,最主要是2个东西:一个是带荧光标记的

dNTP。而这个dNTP,它还有一个特点,它的3’末端是被一个叠氮基堵住的。 然后,再加一个聚合酶,聚合酶就会选择:哪一个dNTP是和原来位置上的那个碱基是互补的,根据互补性原理,把这个dNTP合成到新的这个DNA链上去。 3

因为这个dNTP的3’端是被一个叠氮基团堵住了,所以,它一个循环只能延长一个碱基。然后,它就停在那儿了。 合成完了之后,就用水把多余的dNTP和酶给冲掉。 冲掉之后,就放到显微镜下,去进行激光扫描。根据发出来的荧光来判断它是哪个碱基。

因为4种dNTP,它每一种dNTP上面标的荧光素都不一样,根据红、黄、蓝、绿,它出来的哪种颜色,那么,就可以倒过来推出来,这个新合成上去的碱基,是哪种碱基。 因为新合成的碱基,是和原来位置(的碱基)是互补的,所以,又推出模板上那个碱基是哪个。 这一个循环完成之后,就加入一些化学试剂,把叠氮基团和旁边标记的荧光基团

切掉。切完了之后,3’端的羟基就暴露出来。

再接下来,加入新的dNTP和新的酶,然后,又延长一个碱基。新延长完一个碱基之后,把多余的酶和dNTP冲掉,再进行一轮显微的激光扫描,再读一下这个碱基是什么。 不断重复这个过程,可以重复上百次,到几百次,就可以把上百个碱基,甚至更多碱基的序列读出来。

那么,什么是Index哪?是因为Illumina的评委会个测序量很大,往往一个样本,用不了那么几亿条DNA。所以,科学家就想了一个办法。在文库的接头上做了一些标记,每一个样本,它有一个特定的接头,每个接头里面,它有一段特定的序列。

这段特定的序列,我们就称为Index。也有人把它叫做Barcode,反正,表达的是一个意思:这么一段特定的序列,标记了样本的来源。 那么,要读这个Index的序列,先用碱把上面这根测完“Read 1”的序列,把

上面这根DNA链给解链掉。 4

解链掉之后,再加入中性液,然后,加入“Read 2”这个测序引物。Read 2测序引物结合的位点,正好,就在这个Index序列的旁边。 接下来,就进行第2轮测序,一般来说,是读6到8个碱基。把这6到8个碱基读下来,我们就可以知道,这某一个具体的一段DNA,它来自于原始的哪个样本。

这是Illumina的最核心的另外一个技术,就是双端测序。 那么双端测序,就是说,一根DNA链,除了从正向读一遍,还可以从DNA的负向,再读一遍。 这一下子就把Illumina测序的有效长度加了一倍。这是非常有实际用途的。

那么这个倒链的过程,是这样,先让这个DNA先合成,合成出来这根互补链。 有了这个互补链之后,用一个化学试剂,在原来这根链的根上切一下。切一下,原来这根模板链就掉了,剩下那根互补链。

再接下来,就进行第2端的测序。第2端的测序原理,和第一端的测序原理是一样的。 加上了“Read 3”的这个引物,依次往下,一个一个碱基地往下读。

那么最重要的事情是什么呢?一个点,经过几百个循环,就读出了几百个碱基。但实际上,这个芯片上可以有上亿个点,上亿个“cluster”,也就是“簇”。

那么上亿个“cluster”,每个循环,它都可以读出地么多序列,这是Illumina测序非常强大的原因。因为是成千上万,准确说是上亿上链都在合成,这个就得到了很大的一个测序数据量。 5

Illumina HiSeq测序仪的工作原理。 也就是芯片上发生了这么多变化,HiSeq是如何把这些信息给读出来,并且把扫描出来的荧光信号,又通过怎样一系列的加工,变成可以识别的“A、C、G、T”的碱基序列的。

HiSeq首先是一台高精度的显微光学扫描仪。然后再配上了一整套的液流系统,和计算机软硬件,再加温控系统,组成这样一台测序仪。 其中最核心,也是结构最复杂的,是它的光学系统。

前一期,我们讲了,Illumina测序仪主要是靠4种dNTP分别带有不同的荧光基团,在被激光照了之后,发出不同颜色的荧光。再通过对光的颜色的分辩,可以判断出到底是哪个碱基。

这里,我们要说明一下:感光元件CCD,它本身是色盲。所以,它一定要配合滤光片,才能分辩出颜色来。

那我们先来看一下,HiSeq的光路图。 左边这两个元器件,就是激光器。一个发出红色激光,另一个发出绿色激光。 其中红色激光主要是激发A和C,这两种碱基上的荧光基团;而绿色激光主要是激发G和T,这两种碱基上的荧光基团。 红色和绿色这两束光,通过一面半透半反镜,组成一道激光。这道激光打在Flowcell上。

那么请注意,Flowcell就放在这个位置。 在Flowcell里面,结合在DNA上的那个荧光基团在激光的照射下,就发出荧光。 6

荧光通过3面半透半反镜,和1面全反镜,被分成4条光路,这4道光线,分别通过一道滤光片,这4张滤光片的滤过波长不一样。这样,这4 道光在经过了滤光片之后,就变成了4种颜色不同的光线。

然后,这4条颜色不同的光线,各自照在一面反射镜上,通过反射镜进入到CCD。这4个CCD就记录到不同颜色的光线。

HiSeq的光线扫描是“线扫描”,和传统的相机不一样,传统的相机是面扫描。 HiSeq采取了一种特定的叫“TDI”线扫描方式,TDI是Time delayintegration的缩写。

在HiSeq上之所以采取TDI扫描方式,因为它有非常明显的优点。 第一个优点,就是它的扫描速度非常快,在HiSeq 2500上,从Flowcell的一个Lane的一头扫到另外一头,也就是一个“Swath”的扫描时间,大概只有20秒种不到。

第二个好处,就是它的扫描精度非常高。在最新的HiSeq V4版试剂上,它的光点密度,大概可以达到每平方毫米90万个点,要扫描清楚这么高密度的光点,扫描仪的扫描精度是可想而知的。

TDI扫描的第三个好处,是这种方式,可以把Flowcell的上表面、和下表面都扫描到。

接下来,我们再要详细介绍这张Flowcell。 7

那么,先来看一下,这张flowcell有点象一张载玻片,在这一张片子里面,我们可以看到,它做了8条通道。

每条通道,我们称为一个Lane。这8个Lane之间,相互是隔绝的。 每个Lane的两端各有一个小孔。这两个小也孔,就是液流流进、流出的地方。 每个Lane的上表面和下表面,都分别以共价键的方式,种了2种DNA引物。这两种DNA引物,是与文库接头的两头序列相互补的。上一期(节目)我们已经说明了这一点。

一个Lane里面,分成2个面,上表面、和下表面。上表面和下表面,都种了DNA引物,也都是可以产生测序数据的。

在每一条Lane的每一个面,又被分成了3个扫描通道,每个道被称为一个“swath”。每条Swath是从头到底被连续扫描的。但是它的数据,在进行数据分析的时侯,是被分割成16个小方块。这每一个小方块,被称为一个“tile”。

这样一张Flowcell,总共就是768个Tile。每个Tile在扫描的时侯,会根据4种颜色,产生4张照片。

扫描完了之后,就要进行图像处理。扫描出来的最原始的文件,它的格式是“.tiff”文件。Tiff文件记录了每个像素点上采集到的光强度。Tiff文件的优点是它是完全无损,保留了所有的原始信息。但它也有它的不足之处。它的不足之处就是它的这个文件太大了。它的数据量很大,既不便于数据的传输,也不便于数据的存储。

相关文档
最新文档