转录组分析(RNA-Seq)-PPT文档资料

合集下载

转录组测序ppt课件

转录组测序ppt课件

SUCCESS
THANK YOU
2019/5/5
环境转录组也可以这样做
• 使用RNA-seq手段对实验样本进行转录组分析,关注个体或者组织器 官在不同环境条件下基因表达的动态变化,挖掘生物对逆境适应的分 子机制。
转录组?
• 转录组是特定组织或细胞在某一功能状态下所能 转录出来的所有RNA的总和,包括mRNA和非编码 RNA。
• 转录组(transcriptome)广义上指某一生理条件 下,细胞内所有转录产物的集合,包括信使RNA、 核糖体RNA、转运RNA及非编码RNA;狭义上指所有 mRNA的集合。蛋白质是行使细胞功能的主要承担 者,蛋白质组是细胞功能和状态的最直接描述, 转录组成为研究基因表达的主要手段,转录组是 连接基因组遗传信息与生物功能的蛋白质组的必 然纽带,转录水平的调控是目前研究最多的,也 是生物体最重要的调控方式。
3. DNA成簇(Cluster)扩增
4. 高通量测序(Illumina Genome Analyzer IIx)信息分析流程
生物信息分析
基本信息分析
• 数据量产出:>2Gb per sample • 测序策略:HiSeq2000, PE91 or 101 • 插入片段大小:200 bps • 测序质量控制:Q20% >80
相关概念
• 高通量测序中,每测一个碱基会给出一个相应的质量值, 这个质量值是衡量测序准确度的。Q20与Q30则表示质量值 大于等于20或30的碱基所占百分比。
• Q20值是指的测序过程碱基识别过程中,对所识别的碱基 给出的错误概率。
• 质量值Q20,错误识别概率是1%,即正确率是99%; 质量值Q30,错误识别概率是0.1%,即正确率是99.9%; 质量值Q40,错误识别概率是0.01%,即正确率99.99%; Q“N”0的质量值,就是正确率有N个9的百分比。

RNA-seq(转录组学)的分析流程和原理

RNA-seq(转录组学)的分析流程和原理

RNA-seq(转录组学)的分析流程和原理在开始详细讲解RNA测序之前,我们先来了解一下它的基本步骤:1.建库:提取RNA,富集mRNA或消除rRNA,合成cDNA和构建测序文库。

2.测序:然后在高通量平台(通常是Illumina)上进行测序(每个样本测序reads在DNA测序中,读数是对应于单个DNA片段的全部或部分的碱基对(或碱基对概率)的推断序列。

深度为10-30 Million reads。

)3.分析:先比对/拼装测序片段到转录本,通过计数、定量,样本间过滤和标准化,以进行样本组间基因/转录本统计差异分析。

大致了解这个过程之后,我们就先从建库开始了解建库的难点在于提纯出mRNA, 一般在我们抽离出的RNA中rRNA占比很大,其他还会有tRNA、microRNA等。

我们需要从抽离出的RNA中提取出mRNA,并建立cDNA文库。

这里以应用最广泛的Illumina公司的Truseq RNA的建库方法为例来进行介绍。

首先,利用高等生物的mRNA通常有poly(A)尾的(使mRNA更稳定,翻译不容易出错)特点,用带有poly(T)探针的磁珠与总RNA进行杂交,这样磁珠就和带poly(A)尾巴的mRNA结合在一起了。

接下来,就回收磁珠,把这些带poly(A)的mRNA从磁珠上洗脱下来。

再用镁离子溶液(或者超声波)进行处理,把mRNA打成小段。

然后,利用这些被打断的mRNA片段,以随机引物进行逆转录,得到第一链cDNA。

再根据第一链cDNA合成出ds-cDNA。

对cDNA在平末端进行3’端加A碱基(腺苷酸)(adapter接头上带了T碱基头,为了和adapter配对)在双链cDNA的两端加分别上Y型接头再经PCR扩增经筛选的目的基因,就得到可以上机的测序文库了。

这个建库方法对RNA的完整度有较高的要求。

也就是说,只有在mRNA大部分是完整的状态下,才能得到比较好的效果。

因为带Poly(T)的磁珠,它所吸附的是带有Poly(A)的那些序列。

RNA_Seq

RNA_Seq

IlluminTerminator a Sequencing Reversible Chemistry
3’ 5’
DNA (0.1-1.0 ug)
A C T
G A
C G A
T
C T G
Sample preparation: Fragmentation & addition of primers
Cluster growth in flow cell
[ ;J ?$ ( ' ;*( L$ ) ) 2+*$ $ v ) 2& ' I *( D2, $ , //- $
e/ < $ / ( - +$ $ A v ?;J ?/ A) 2+*$ $ ' / A3 S$ $ $
8 , A L;( SL/ $2A / C $ L2, J $ ?2& 2' 2L0& / A $ A J ;2, $ /
= ?>Y?""% >/(
/ & >1T$ $ 2, S/ ( - $ #0, *?/ +;+$ $ X r $ / */ ) D2, Y$ [ s RQ@ $ O` 5$ S$ " 477$ $ X $ ?;' Y$ K5W) s Z4O$ s 7@ ZK$ % - / L$ , i 5l $ e( +*$ I , 6L2< $ A $ ) 2+*6( , - $ $ *A w) *2A *2$ ( / 0$ L2, J / AA ( - $ $/ $
Outline
• • • • • Sequencing RNA-Seq Basic concepts in RNA-Seq Data format in RNA-Seq Brief introduction to RNA-Seq data analysis & quality assessment

转录组测序(RNA-seq)技术

转录组测序(RNA-seq)技术

转录组测序(RNA-seq)技术转录组是某个物种或者特定细胞类型产生的所有转录本的集合。

转录组研究能够从整体水平研究基因功能以及基因结构,揭示特定生物学过程以及疾病发生过程中的分子机理,已广泛应用于基础研究、临床诊断和药物研发等领域。

基于Illumina高通量测序平台的转录组测序技术使能够在单核苷酸水平对任意物种的整体转录活动进行检测,在分析转录本的结构和表达水平的同时,还能发现未知转录本和稀有转录本,精确地识别可变剪切位点以及cSNP(编码序列单核苷酸多态性),提供最全面的转录组信息。

相对于传统的芯片杂交平台,转录组测序无需预先针对已知序列设计探针,即可对任意物种的整体转录活动进行检测,提供更精确的数字化信号,更高的检测通量以及更广泛的检测范围,是目前深入研究转录组复杂性的强大工具。

技术优势:¾数字化信号:直接测定每个转录本片段序列,单核苷酸分辨率的精确度,同时不存在传统微阵列杂交的荧光模拟信号带来的交叉反应和背景噪音问题。

¾高灵敏度:能够检测到细胞中少至几个拷贝的稀有转录本。

¾任意物种的全基因组分析:无需预先设计特异性探针,因此无需了解物种基因信息,能够直接对任何物种进行转录组分析。

同时能够检测未知基因,发现新的转录本,并精确地识别可变剪切位点及cSNP,UTR区域。

¾更广的检测范围:高于6个数量级的动态检测范围,能够同时鉴定和定量稀有转录本和正常转录本。

应用领域:转录本结构研究(基因边界鉴定、可变剪切研究等),转录本变异研究(如基因融合、编码区SNP研究),非编码区域功能研究(Non-coding RNA研究、microRNA前体研究等),基因表达水平研究以及全新转录本发现。

图1 RNA-seq获得的数据能够进行全面的数据挖掘,既能够进行基因结构分析,鉴定UTR、可变剪切位点,也能够发现新的转录本及非编码RNA,比较样本间的表达水平差异康成生物提供的RNA-seq技术服务实验流程:1. 样品RNA准备2. 测序文库构建¾使用oligo dT微珠纯化mRNA¾ mRNA片段化处理¾反转录反应合成合成双链cDNA¾双链DNA末端修复及3’末端加‘A’¾使用特定的测序接头连接DNA片段两端¾高保真聚合酶扩增构建成功的测序文库3. DNA成簇(Cluster)扩增4. 高通量测序(Illumina Genome Analyzer IIx)5. 数据分析¾原始数据读取¾与数据库比对并进行注释¾深层次数据分析6. 提供实验报告¾原始数据报告(Fasta-Q格式),包含所有测序序列信息,碱基读取质量评估¾基本数据分析报告(Excel表格),包含有效序列的序列信息、与参考基因组比对后的注释信息等。

课件:5. RNA-Seq数据分析

课件:5. RNA-Seq数据分析
生物信息学进展 (5)
RNA-Seq数据分析
李国亮 2014-03-18
1
提示
• 我在服务器上建立了两个目录:tools和genome • 现将FastQC、Trimmomatic、bwa、bowtie、
bedtools和samtools放在tools目录中,将拟南 芥、果蝇、人类基因组序列放在genome目录中 • 大家可以共同使用。现在,大家已经练习过数据 的下载、程序的下载、编译、索引的建立,每个 人就不需要保留自己的备份。
– Mapping reads to genome is challenging
• The relative abundance of RNAs vary wildly
– 105 – 107 orders of magnitude
– Since RNA sequencing works by random sampling, a small fraction of highly expressed genes may consume the majority of reads
6
Variations in RNA-Seq
• mRNA • Total RNA • Small RNA, such as miRNA, tRNA • Ribosomal profiling • Long non-coding RNA
7
Challenges
• RNAs consist of small exons that may be separated by large introns
RNA-seq = RNA sequencing
4
RNA-Seq
• Purpose
– Quantify the expression levels of RNAs – Identify new transcripts/genes – Identify fusion genes – Identify alternative splicing – Identify single nucleotide variations – Identify RNA editing

RNA-seq技术原理及应用[优质ppt]

RNA-seq技术原理及应用[优质ppt]
2. 2005 年以来,以 Roche 公司的 454 技术、 Illumina 公司的 Solexa 技术和 ABI 公司的 SOLiD 技术为标志的新一代测序技术相继诞生,又称作深 度测序技术。
3.把高通量测序技术应用到由 RNA 逆转录生成 的 cDNA 上,从而获得来自不同基因的RNA 片段在 特定样本中的含量,这就是 RNA测序或 RNA-seq。
三、RNA-seq结果分析
2. 基因表达水平估计 RNA-seq 数据最基本的应用是检测基因的表达水 平 ,与基因芯片数据相比 ,RNA 测序得到的是数字 化的表达信号,具有灵敏度高、分辨率高、无饱和区 等优势。 RNA 测序数据是对提取出的 RNA 转录本中随机 进行的短片段测序,如果一个转录本的丰度高,则测 序后定位到其对应的基因组区域的读段也就多,可以 通过对定位到基因外显子区的读段计数来估计基因表 达水平。
进一步,通过对供体和受体位点的读段计数,结合 外显子其他区域的读段数据,还能定量地计算选择性 剪接事件之间的比例。
三、RNA-seq结果分析
两类样本 RNA-seq 数据比较分析的框架
四、RNA-seq技术应用
1、转录本结构研究 利用单碱基分辨率的RNA-Seq技术可极大地丰
富基因注释的很多方面内容, 包括 5′/3′边界鉴定、 UTRs区域鉴定以及新的转录区域鉴定等。RNA-Seq 还可对可变剪接(Alternative splicing)进行定量研究。
二、RNA板扩增
序列组装和比较
图像获得和处理
TGCT…
1234
TTTT…
簇序列读取反应
二、RNA-seq技术原理
RNA-seq实验流程图
三、RNA-seq结果分析
为了便于测序数据的发布和共享,高通量测序数据以 FASTQ 格式来记录所测的碱基读段和质量分数。 NCBI、EBI、 DDBJ 等数据中心建立了大容量的数据库 SRA来存放共享的测 序数据。

转录组测序原理.pptx

转录组测序原理.pptx

激发碱基荧光并收集荧光信号
去除阻断基团和荧光基团
Cycle 2-n:
重复前面的步骤
第16页/共40页
ห้องสมุดไป่ตู้基片段杂交
OH
diol
P7 P5
Flow Cell接头
diol diol
模板杂交
diol diol
延长
diol diol
变性
第17页/共40页
Cluster station
• 剩下的复制链其一端“固定”在芯片上,
Throughput : up to 25 Gb per day
Output 26-35 Gb 75-100 Gb 150-200 Gb
第15页/共40页
基于SBS测序技术
3’-
…-5’
5’-
GTATTTTCGGCACAG
A
G
A
C
T
T
C TG
Cycle 1:按顺序加入反应试剂
合成第一个碱基
清除未反应的碱基和试剂
第25页/共40页
鉴定基因可变剪接
exon1
common reads
exon2
exon3
mRNA
exon1
junction reads
exon3
exon1
exon2
exon3
第26页/共40页
鉴定融合基因
第27页/共40页
Paired Reads distribution
Reads cluster
主要内容• 样品检测 • 制备 • Cluster Station • Illumina Sequencing • 生物信息分析
第14页/共40页
新一代测序技术

RNA-seq技术原理及应用 PPT

RNA-seq技术原理及应用 PPT
RNA-seq技术是一种应用新一代高通量测序技术的方法,通过将RNA逆转录生成的cDNA进行测序,获得不同基因RNA片段在特定样本中的含量。该技术主要基于Illumina/Solexa测序平台,其原理是边合成边测序,利用带荧光标记的dNTP在DNA单链模板上合成互补链时发出不同颜色的荧光,从而确定每个组装和比较等步骤。最终,通过图像获得和处理系统,将测序结果转化为数字信号,以FASTQ格式记录所测的碱基读段和质量分数。RNA-seq技术பைடு நூலகம்有高灵敏度、高分辨率等优势,并广泛应用于转录本结构研究、转录本变异研究、非编码区域功能研究以及基因表达水平研究等领域,为基因组学研究提供了强有力的工具。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
原则上, 所有的高通量测序技术都能进行RNA测序。自2019 年以来, 以Roche 公司的454 技术、Illumina 公司的 Solexa 技术和ABI 公司的SOLiD 技术为标志的新一代测 序技术相继诞生, 之后HelicosBiosciences 公司又推出单 分子测序(Single molecule sequencing, SMS)技术。新一 代测序又称作深度测序或高通量测序, 是相对于传统的 Sanger 测序而言,主要特点是测序通量高, 测序时间和成 本显著下降。各平台测序原理及序列长度的差异决定了各 种高通量测序仪具有不同的应用侧重
Random hexamer primed cDNA synthesis
Paired-end
Solexa Sequencing
-6- dT微珠纯化mRNA ������ mRNA片段化处理 ������ 反转录反应合成合成双链cDNA ������ 双链DNA末端修复及3’末端加‘A’ ������ 使用特定的测序接头连接DNA片 段两端
转录组分析(RNA-Seq)
• 李江攀
RNA-Seq 的技术背景 RNA-Seq 的应用领域 RNA-Seq 面临的挑战及发展前景
RNA-Seq 的技术背景
RNA-Seq又称转录组高通量测序(transcriptome sequencing)或称为全转录组鸟枪法测序(Whole Transcriptom Shotgun Sequencing WTSS)
数字表达谱与芯片的比较
特点
数字化信号 高通量 可重复性高 无需重复实验 检测低丰度基因 检测新转录本 检测反义链转录本
数字表达谱
√ √ √ √ √ √ √
芯片

Unigene12000个以上,但转录组大小受基因数目和基因丰度双 重影响,组织差异、状态和实验处理也会影响转录组组成。Βιβλιοθήκη RNA-Seq 的发展前景
1、虽然RNA-Seq 技术还面临着种种困难, 但 作为一个刚刚起步的新技术RNA-Seq 已经显 示出其他转录组学技术无可比拟的优势:既 能提供单碱基分辨率的转录组注释又能提供 全基因组范围的“数字化”的基因表达谱, 而 且其成本通常比芯片和大规模的Sanger EST 测序要低, 有
Procedure of RNA-Seq
Total RNA
Rich mRNA (polyA RNA)
Oligo(dT) primed cDNA synthesis
Random hexamer primed cDNA synthesis
RNA fragment (200~700 nt)
Fragmentation (200~700 bp)
转录组?
转录组是特定组织或细胞在某一发 育阶段或功能状态下转录出来的所 有RNA 的集合
RNA-Seq 原理
把高通量测序技术应用到由mRNA 逆转录生 成的cDNA 上, 从而获得来自不同基因的 mRNA 片段在特定样本中的含量, 这就是 mRNA 测序或 mRNA-Seq, 同样原理, 各种 类型的转录本都可以用深度测序技术进行 高通量检测, 统称作RNA-Seq
RNA-Seq 面临的挑战
庞大的数据量所带来的信息学难题
如何针对更复杂的转录组来识别和追踪所有基 因中罕见RNA 亚型的表达变化
目前的高通量测序技术大都需要较多的样品起 始量, 这使得来源极为有限的生物样品分析受 到限制, 因此如何对单细胞或少量细胞进行转 录组测序是一个亟待解决的问题
2、就目前来看, 作为两个高通量的转录组 学研究技术, 在应用的某些方面既存在重叠 和竞争也存在优势互补, 一种技术能弥补另 一种技术遗漏的部分, 通常对一个生物学问 题的回答需要不同实验技术的协同配合
3、 RNA-Seq 的强项, 就在于它是一个“开 放系统”, 它的发现能力和寻找新的信息的 能力从本质上高于芯片技术, 相信随着相关 学科的进一步发展和测序成本的进一步降 低, RNA-Seq 必将在转录组学研究领域占 主导地位
������)扩增 4. 高通量测序(Illumina Genome Analyzer IIx) 5. 数据分析
������ 原始数据读取
������ 与数据库比对并进行注释
������ 深层次数据分析
RNA-Seq 的应用领域
图所示 RNA-seq获得的数据能够进行全面的数据挖掘,既能够进行 基因结构分析,鉴定UTR、可变剪切位点,也能够发现新的转录本及 非编码RNA,比较样本间的表达水平差异
RNA-seq常见问题
• 送样要求: 浓度≥400ng/ul,RNA总量≥20ug;OD260/280为1.8-2.2, 28S/18S>1.8,RIN ≥8.
• 在进行原核生物转录组分析时需要提供纯化后的原核生物 mRNA或cDNA样品。
• 进行非编码RNA测序时需要提供去除rRNA和tRNA的RNA样品。 • 测序1Gb的转录组数据时通常可以得到长度大于500bp的
相关文档
最新文档