转录组测序(RNA-Seq)--杨军

合集下载

RNA-seq(转录组学)的分析流程和原理

RNA-seq(转录组学)的分析流程和原理在开始详细讲解RNA测序之前，我们先来了解一下它的基本步骤：1.建库：提取RNA，富集mRNA或消除rRNA，合成cDNA和构建测序文库。

2.测序：然后在高通量平台（通常是Illumina）上进行测序（每个样本测序reads在DNA测序中，读数是对应于单个DNA片段的全部或部分的碱基对（或碱基对概率）的推断序列。

深度为10-30 Million reads。

）3.分析：先比对/拼装测序片段到转录本，通过计数、定量，样本间过滤和标准化，以进行样本组间基因/转录本统计差异分析。

大致了解这个过程之后，我们就先从建库开始了解建库的难点在于提纯出mRNA, 一般在我们抽离出的RNA中rRNA占比很大，其他还会有tRNA、microRNA等。

我们需要从抽离出的RNA中提取出mRNA，并建立cDNA文库。

这里以应用最广泛的Illumina公司的Truseq RNA的建库方法为例来进行介绍。

首先，利用高等生物的mRNA通常有poly(A)尾的（使mRNA更稳定，翻译不容易出错）特点，用带有poly(T)探针的磁珠与总RNA进行杂交，这样磁珠就和带poly(A)尾巴的mRNA结合在一起了。

接下来，就回收磁珠，把这些带poly(A)的mRNA从磁珠上洗脱下来。

再用镁离子溶液（或者超声波）进行处理，把mRNA打成小段。

然后，利用这些被打断的mRNA片段，以随机引物进行逆转录，得到第一链cDNA。

再根据第一链cDNA合成出ds-cDNA。

对cDNA在平末端进行3’端加A碱基（腺苷酸）（adapter接头上带了T碱基头，为了和adapter配对）在双链cDNA的两端加分别上Y型接头再经PCR扩增经筛选的目的基因，就得到可以上机的测序文库了。

这个建库方法对RNA的完整度有较高的要求。

也就是说，只有在mRNA大部分是完整的状态下，才能得到比较好的效果。

因为带Poly(T)的磁珠，它所吸附的是带有Poly(A)的那些序列。

高通量测序技术在基因组学和转录组学研究中的应用

高通量测序技术在基因组学和转录组学研究中的应用高通量测序技术（high-throughput sequencing technology），也被称为第二代测序技术，是一种革命性的基因组学工具，可用于研究基因组和转录组中的DNA和RNA序列。

自2005年首次商业化以来，高通量测序技术已经迅速发展，并成为了现代遗传学和生物学的重要工具。

它的广泛应用为研究人类及其他生物体的基因组序列带来了新的机遇，从而推动了基因组学和转录组学研究领域的快速发展。

高通量测序技术的应用范围非常广泛，包括但不限于以下几个方面：1. 基因组重测序（whole genome sequencing, WGS）：高通量测序技术可以在较短时间内低成本地测序出一个个体的全部基因组序列。

这种技术的快速发展大大降低了测序的成本和时间，从而使人们能够更广泛地研究不同生物个体之间的遗传差异，进而揭示出许多与疾病相关的基因变异。

2. 转录组测序（RNA-Seq）：高通量测序技术可以帮助科学家研究转录组中的RNA序列。

RNA-Seq技术可以揭示不同条件下细胞中的基因表达变化情况，包括甲基化修饰、剪接变异、新的外显子等，从而帮助科学家理解基因表达的调控机制和生物过程中的复杂性。

3. 亚基因组测序（exome sequencing）：高通量测序技术可以专门测序编码蛋白质的基因组区域，即外显子。

由于外显子占据了基因组的大部分功能区域，亚基因组测序可以更加高效地发现与疾病相关的基因变异。

这种技术被广泛应用于遗传病的基因诊断和研究。

4. 转录组组装（transcriptome assembly）：高通量测序技术可以生成RNA序列的大量数据，进而帮助科学家重建转录组的组装情况。

转录组组装技术允许科学家识别转录本、识别新的转录本和非编码RNA，从而深入了解基因转录和基因调控的细节。

5. 蛋白质-核酸相互作用（protein-nucleic acid interaction）：高通量测序技术可以在全基因组水平上分析蛋白质与核酸之间的相互作用。

杨军教授简介

杨军教授简介一、个人简介杨军男，1973年生，博士，教授，硕士生导师。

生物技术教研室主任，中国细胞生物学会会员，中国空间科学学会会员。

以先后承担了本科生遗传学、细胞生物学、生物化学、植物生理学、细胞工程、生物制药技术和研究生植物细胞工程、体细胞遗传学等课程的教学工作。

目前主要从事植物细胞组织培养、遗传转化、植物次生代谢产物分析分离，以及航天育种的研究工作。

先后主持省部级项目4项，校级项目1项，参与主研国家和省部级项目5项，发表论文63篇，其中有12篇被SCI收录。

2005年获西华师范大学优秀教学管理干部，2007年获西华师范大学优秀青年教师。

二、科研论著清单（共63篇，其中被SCI收录12篇，CSCD收录18篇, *为通讯作者论文）：（一）、SCI收录的论文(12篇)：1.Yang J, Hu Z, Guo G Q, Zheng G C. In vitro plant regeneration from cotyledon explants ofSwainsona salsula Taubert. Plant Cell Tissue and Organ Culture, 2001, 66(1): 35-39 (SCI收录)2.Yang Jun,Yu Chun-hong, Wang Xin-yu, Zheng Guo-chang (Cheng K C). Ultrastructuralobservation on the intra- and intercellular microtrabecular network in pollen mother cells of onion. Acta Botanica Sinica, 2001, 43(4): 331-338 （SCI收录）3.Hu Z, Yang J, Guo G Q, Zheng G C. high efficiency transformation of Lycium barbarummediated by Agrobacterium tumfaciens and transgenic plant regeneration via somatic embryogenesis. Plant Cell Reports, 2002, 21:233-237 (SCI收录)4.Li W, Yang J, Pan Y F, Guo G Q, Zheng G C. Chromosome localization of genes that controlsynchronous development of pollen mother cells in wheat. Caryologia, 2003, 56（3）: 275-279（SCI收录）（第2作者，共5人）5.Gao H H, Li W, Yang J, Wang Y, Guo G Q, Zheng G C. Effect of 6-benzyladenine and caseinhydrolysate on micropropagation of Amorpha fruticosa. Biologia Plantarum, 2003/4,47(1): 148-148（SCI收录）6.Peng Z S, Yang J,Wei S H, Zeng J H. Characterization of the common wheat (Triticumaecetivum L.) mutation line producing three pistls in a floret. Hereditas, 2004, 141: 15-18（SCI收录）7.Hou W R，Du Y J，Yu Chen，Xia Wu，Peng Z S，Yang J，Zhou C Q. Nucleotide sequenceof cDNA encoding the mitochondrial precursor protein of the ATPase inhibitor from the giant panda (Ailuropoda melanoleuca). DNA and Cell Biology，2007，26（11）：799-802 (SCI收录)8.Hou W R，Chen Y，Hu J C，Peng Z S，Y ang J，Tang Z X，Zhou C Q，Li Y M，YangS K，Du Y J，Kong L L，Ren Z L，Zhang H Y，Shuai S R. A complete mitochondrial genome sequence of Asian blank bear Sichuan subapecies (Ursus thibetanus mupinensis).International Journal of Biological Science 2007, 3(2): 85-90 (SCI收录)9.Yang J., Gong Z. C. Tan X. Induction of callus and extraction of alkaloid from Yi Mu Cao(Leonurus heterophylus Sw.) culture. African J Biotech，2008, 7 (8)：1157-1162（SCI收录）10.Li J.T., Yang J., Chen D.C., Zhang X.L. and Tang Z.S. An optimized mini-preparationmethod to obtain high-quality genomic DNA from mature leaves of sunflower. Genetics andMolecular Research，2007，6 (4): 1064-1071 （SCI收录）*11.Cao H, Yang J, Peng ZS, Kang C Y, Chen D C, Gong Z C, Tan X. Micropropagation ofPenthorum chinense through axillary buds. In Vitro Cell. Dev. Biol.—Plant, 2007, 43: 149-153 (SCI收录) *12.Wang Li-Qiang, Yang Jun,Deng E, Wang Guang-Bi, Peng Zheng-Song. Optimizing theshoot proliferation protocol of Penthorum chinense by axillary buds. Biotechnol Lett (2008) 30:2199–2203(SCI收录) *（二）、CSCD收录的论文（12篇）：1.Yang Jun, Gao Huan-huan, Li Wei, Zheng Guo-chang. Cytoskeleton in plasmodesmata andcytoplasmic channels of onion pollen mother cells. Acta Botanica Boreall-Occidentalia Sinica, 2002, 22(3): 521-5252.胡忠，杨军，郭光沁，郑国锠。

RNA-Seq项目常见问题与解答

RNA-Seq项目常见问题与解答这两年随着测序成本的下降和转录组研究的日渐火热，RNA-seq俨然已经成为了分子生物学课题组推进项目的首选方向。

在我们接触的转录组项目中，有些老师对项目分析结果存在或多或少不清楚或有疑惑的地方。

那么春天来了，花儿开了，今天福利也到了，我们特意将转录组项目中常见的一些问题进行了汇总，各位老师可以按需自取哈。

1．如何判定生物学重复一致性的高低？生物学重复统计方法及公式答：（1）皮尔逊相关系数r可以作为生物学重复相关性的评估指标，理想的生物学重复试验r2≧0.92。

考虑到个体差异、取材环境、时间以及人员操作熟练程度等因素对测序数据的影响，一般r2≧0.8为可接受范围。

（2）Pearson（皮尔逊）相关系数：皮尔逊相关也称为积差相关（或积矩相关）是英国统计学家皮尔逊于20世纪提出的一种计算直线相关的方法。

2．DEG基因用Transcripts还是Unigenes？答：DEG基因用的是Unigene。

3．transcript-id代表什么意思？为什么有的基因有多个transcript-id？答：基因转录本id；因为可变剪切的缘故，一个基因可能有多个转录本。

4．在miRNA鉴定中，可能成为miRNA的reads是怎样计算的？哪些条件会影响到mrd值？micro RNA在不同组织有异构体的存在，是如何处理的？答：与 Rfam， miRbase， RepBase和 Exon\Intro 序列库进行比对，获得 sRNA 注释信息，以此作为预测新的 miRNA 的基础。

miRNA的鉴定是利用miRDeep2软件进行已知及新（保守及非保守）的miRNA鉴定。

miDeep2会在reads比对到基因组上的位置两端分别延伸75、15bp进行结构预测，此软件认为极可能与可能是miRNA的根据是通过mrd值来区分的，mrd>-10为可能，mrd>0为极可能；影响mrd值的有reads在基因组上的分布和碱基结合的自由能等；5．对于有生物学重复的项目，怎样计算差异基因？答：两两比对使用的是R的EBseq包, 是基于负二项分布检验的方式对reads数进行差异显著性检验，重复间的比对使用的是R的DEseq包，是基于分层贝叶斯模型的原理对组合内样品进行分析。

检测基因表达变化的方法

检测基因表达变化的方法基因表达变化是指基因在特定条件下转录和翻译水平的变化。

检测基因表达变化的方法有很多种，以下是几种常用的方法：1. 转录组测序（RNA-seq）转录组测序是一种基于高通量测序技术的方法，可以检测基因在不同条件下的转录水平。

该方法首先从细胞中提取总RNA，然后通过建库、测序和分析得到每个基因的转录本序列。

通过比较不同条件下的转录本序列，可以发现基因表达的变化。

RNA-seq具有高灵敏度、高分辨率和高通量等优点，适用于研究基因表达的复杂性和动态性。

2. 定量反转录聚合酶链反应（qRT-PCR）qRT-PCR是一种基于PCR技术的方法，可以检测特定基因的表达水平。

该方法首先从细胞中提取总RNA，然后通过反转录得到cDNA，再通过PCR扩增得到目的片段。

通过比较不同条件下的目的片段拷贝数，可以发现基因表达的变化。

qRT-PCR具有高灵敏度、高特异性和可重复性好等优点，适用于验证RNA-seq等高通量测序方法的结果。

3. 微阵列分析微阵列分析是一种基于芯片技术的方法，可以同时检测多个基因的表达水平。

该方法将已知序列的探针集成在芯片上，然后将待测的cDNA或RNA与探针进行杂交。

通过检测杂交信号的强度，可以发现基因表达的变化。

微阵列分析具有高通量、高效率和高灵敏度等优点，适用于大规模的基因表达谱研究。

4. 原位杂交原位杂交是一种将探针与组织切片上的目标基因进行杂交的方法，可以检测目标基因在组织中的表达位置和表达水平。

该方法将探针与组织切片上的目标基因进行杂交，然后通过荧光或免疫组化等方法显色标记杂交信号。

通过观察杂交信号的数量和分布，可以发现基因表达的变化。

原位杂交具有高特异性、高灵敏度和定位准确等优点，适用于研究基因表达的组织特异性。

5. 免疫组织化学免疫组织化学是一种利用抗体与目标蛋白进行特异性结合的方法，可以检测目标蛋白在组织中的表达位置和表达水平。

该方法将抗体与目标蛋白进行特异性结合，然后通过显色标记抗体结合的位置。

转录组测序概述及实验分析流程（分享）

转录组测序概述及实验分析流程（分享）⼀、转录组测序概述转录组是特定物种、组织或细胞类型转录的所有RNA（转录本）的集合，包括mRNA和⾮编码RNA(Non-coding RNA，⾮编码RNA⼜包括：tRNA，rRNA，snoRNA，microRNA，piRNA，lncRNA等。

通过⽐较转录组或基因表达谱的研究以揭⽰⽣物学现象或疾病发⽣的分⼦机制是⾼通量组学研究的⼀个常⽤策略。

利⽤⾼通量测序技术研究转录组在全⾯快速得到基因表达谱变化的同时，还可以通过测定的序列信息精确地分析转录本的cSNP（编码序列单核苷酸多态性）、可变剪接等序列及结构变异，另外对于检测低丰度转录本和发现新转录本具有其独特的优势。

⼆、研究转录组⽅法有哪些⽬前研究转录组的⽅法主要三种：1. 基于杂交技术的cDNA芯⽚和寡聚核苷酸芯⽚2. 基于sanger测序法的SAGE (serial analysis of gene expression)、LongSAGE和MPSS(massively parallelsignature sequencing)3. 基于第⼆代测序技术的转录组测序，⼜称为RNA-Seq。

三、转录组测序有什么样的样品要求？（1）样品纯度要求： OD值应在1.8⾄2.2之间；电泳检测28S:18S⾄少⼤于1.8。

（2）样品浓度： totalRNA浓度不低于400ng/µg。

（3）total RNA样品请置于-20℃保存；请提供totalRNA样品具体浓度、体积、制备时间、溶剂名称及物种来源。

请同时附上QC数据，包括电泳胶图、分光光度或Nanodrop仪器检测数据。

（4）样品请置于1.5 ml管中，管上注明样品名称、浓度以及制备时间，管⼝使⽤Parafilm封⼝。

建议使⽤⼲冰运输，并且尽量选⽤较快的邮递⽅式，以降低运输过程中样品降解的可能性。

四、转录组测序需要多⼤的测序量才能得到有意义的结果？转录组测序前，需要对物种转录组的⼤⼩进⾏评估，评估⽅法如下：（1）对于有reference genome的物种，可以分析基因组信息，统计编码基因的个数，及其碱基数，从⽽估计物种转录组的⼤⼩，另外可以查询相关或相近物种转录组研究的⽂献，作为参考。

转录组测序（RNA-seq）技术

转录组测序（RNA-seq）技术转录组是某个物种或者特定细胞类型产生的所有转录本的集合。

转录组研究能够从整体水平研究基因功能以及基因结构，揭示特定生物学过程以及疾病发生过程中的分子机理，已广泛应用于基础研究、临床诊断和药物研发等领域。

基于Illumina高通量测序平台的转录组测序技术使能够在单核苷酸水平对任意物种的整体转录活动进行检测，在分析转录本的结构和表达水平的同时，还能发现未知转录本和稀有转录本，精确地识别可变剪切位点以及cSNP（编码序列单核苷酸多态性），提供最全面的转录组信息。

相对于传统的芯片杂交平台，转录组测序无需预先针对已知序列设计探针，即可对任意物种的整体转录活动进行检测，提供更精确的数字化信号，更高的检测通量以及更广泛的检测范围，是目前深入研究转录组复杂性的强大工具。

技术优势：数字化信号：直接测定每个转录本片段序列，单核苷酸分辨率的精确度，同时不存在传统微阵列杂交的荧光模拟信号带来的交叉反应和背景噪音问题。

高灵敏度：能够检测到细胞中少至几个拷贝的稀有转录本。

任意物种的全基因组分析：无需预先设计特异性探针，因此无需了解物种基因信息，能够直接对任何物种进行转录组分析。

同时能够检测未知基因，发现新的转录本，并精确地识别可变剪切位点及cSNP，UTR区域。

更广的检测范围：高于6个数量级的动态检测范围，能够同时鉴定和定量稀有转录本和正常转录本。

应用领域：转录本结构研究（基因边界鉴定、可变剪切研究等），转录本变异研究（如基因融合、编码区SNP研究），非编码区域功能研究（Non-coding RNA研究、microRNA前体研究等），基因表达水平研究以及全新转录本发现。

图1 RNA-seq获得的数据能够进行全面的数据挖掘，既能够进行基因结构分析，鉴定UTR、可变剪切位点，也能够发现新的转录本及非编码RNA，比较样本间的表达水平差异康成生物提供的RNA-se q技术服务实验流程：1. 样品RNA准备2. 测序文库构建使用oligo dT微珠纯化mRNAmRNA片段化处理反转录反应合成合成双链cDNA双链DNA末端修复及3’末端加‘A’使用特定的测序接头连接DNA片段两端高保真聚合酶扩增构建成功的测序文库3. DNA成簇（Cluster）扩增4. 高通量测序（Illumina Genome Analyzer IIx）5. 数据分析原始数据读取与数据库比对并进行注释深层次数据分析6. 提供实验报告原始数据报告（Fasta-Q格式），包含所有测序序列信息，碱基读取质量评估基本数据分析报告（Excel表格），包含有效序列的序列信息、与参考基因组比对后的注释信息等。

rnaseq 转录组测序实验方案

rnaseq 转录组测序实验方案RNA测序（RNA-Seq）是一种新兴的高通量测序技术，可用于研究转录组的整体表达特征和mRNA表达数量的变化。

本文将讨论RNA 测序实验方案，包括样品处理、测序方法和数据分析。

一、样品处理在进行RNA测序实验之前，需要注意以下几个步骤：1. 样品收集：从研究对象中收集组织样品或细胞，注意采集得到的RNA是代表性的并且不受任何处理的影响。

2. RNA提取：使用合适的方法提取总RNA或mRNA。

总RNA适用于研究全转录组表达水平的变化，而mRNA主要用于研究特定基因的表达。

二、测序方法RNA测序通常分为以下几个步骤：1. 文库制备：将RNA样品转录为cDNA，进行文库建立。

可以使用聚合酶链反应（PCR）扩增cDNA，以增加测序信号。

2. 测序平台选择：根据实验需求和预算，选择合适的测序平台，如Illumina HiSeq、Ion Torrent或PacBio等。

3. 测序深度：根据样品复杂度和研究目的，确定所需的测序深度。

较低的深度适用于检测高表达基因，而较高的深度适用于检测低表达基因或罕见突变。

三、数据分析RNA测序数据分析是整个实验的重要环节，以下是常用的数据分析步骤：1. 数据质控：使用质控工具（如FastQC）对测序数据进行质量评估，去除低质量的reads和接头序列。

2. 游离核酸去除：使用工具（如Trimmomatic）去除rRNA或tRNA 等非编码RNA。

3. 序列比对：使用参考基因组进行序列比对，如使用Bowtie、BWA等工具。

对于未知基因组，可选择进行de novo组装。

4. 表达差异分析：通过比较每个基因在不同样品中的表达量，确定差异表达基因。

常用的工具包括DESeq、edgeR等。

5. 功能注释：将差异表达基因进行功能注释，了解其在生物学过程中的作用。

可以使用GO、KEGG等数据库进行注释。

6. 数据可视化：将分析结果通过图表或热图进行可视化，更直观地展示差异表达基因和通路的变化。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

相关概念
• 高通量测序时，在芯片上的每个反应，会读出一条序列，是比较短的，叫read，它们是原始数据；有很多reads通过片段重叠，能够组装成一个更大的片段，称为contig；多个contigs通过片段重叠，组成一个更长的scaffold；一个contig被组成出来之后，鉴定发现它是编码蛋白质的基因，就叫singleton；多个contigs组装成scaffold之后，鉴定发现它编码蛋白质的基因，叫unigene。 • Unigene是UniqueGene的英文缩写，意为广泛通用的基因数据库，通过电脑对相同基因座(Locus)的收集整理集合形成一个非冗余的基因数据库。
• 测序质量控制：Q20% >80
相关概念
• 高通量测序中，每测一个碱基会给出一个相应的质量值，这个质量值是衡量测序准确度的。Q20与Q30则表示质量值大于等于20或30的碱基所占百分比。 • Q20值是指的测序过程碱基识别过程中，对所识别的碱基给出的错误概率。 • 质量值Q20，错误识别概率是1%，即正确率是99%；质量值Q30，错误识别概率是0.1%，即正确率是99.9%；质量值Q40，错误识别概率是0.01%，即正确率99.99%； Q“N”0的质量值，就是正确率有N个9的百分比。 • N50 即覆盖50%所有核苷酸的最大Unigene长度或覆盖 50%所有核苷酸的最大序列重叠群长度。
转录本
All transcripts
All mRNAs
Total RNA样品检测
• OD260/280:1.8~2.2； • RNA 28S:18S ≥ 1.0; RIN≥7 ； • 样品总量不低于15ug； • 样品浓度：total RNA浓度不低于400ng/ul。微珠纯化mRNA �� mRNA片段化处理 �� 反转录反应合成合成双链cDNA �� 双链DNA末端修复及3’末端加‘A’ �� 使用特定的测序接头连接DNA片段两端 �� 高保真聚合酶扩增构建成功的测序文库
相关数据库概念
• NR是NCBI里的非冗余蛋白数据库，即NCBI的blastp程序中的NR数据库，我们可以用自己的query序列，blast搜索这个数据库，得到这些query序列的具有序列相似性的蛋白序列。 NT：NCBI的blast页面，选择nucleotide blast，数据库选others，也就是（nr/nt）. SWISS-PROT是经过注释的蛋白质序列数据库，由欧洲生物信息学研究所(EBI)维护。 KEGG(Kyoto Encyclopedia of Genes and Genomes，京都基因与基因组百科全书)是基因组破译方面的数据库。 COG是Cluster of Orthologous Groups of proteins（蛋白相邻类的聚簇）的缩写，即直系同源基因数据库。 COG是对基因产物进行直系同源分类的数据库，每个 COG蛋白都被假定来自祖先蛋白，COG数据库是基于细菌、藻类、真核生物具有完整基因组的编码蛋白、系统进化关系进行构建的，我们将Unigene和COG数据库进行比对，预测Unigene可能的功能并对其做功能分类统计，从宏观上认识该物种的基因功能分布特征。 GO(gene ontology)是基因本体联合会(Gene Onotology Consortium)所建立的数据库，旨在建立一个适用于各种物种的，堆积因和蛋白质功能进行限定和描述的，并能随着研究不断深入而更新的语言词汇标准． • • • •
3. DNA成簇（Cluster）扩增
4. 高通量测序（Illumina Genome Analyzer IIx） 5. 数据分析 �� 原始数据读取 �� 与数据库比对并进行注释 �� 深层次数据分析
实验流程
标准信息分析流程
生物信息分析
基本信息分析
• 数据量产出：>2Gb per sample • 测序策略：HiSeq2000, PE91 or 101 • 插入片段大小：200 bps
De novo reads组装流程
Unigene GO 分类
Unigene COG 功能分类
基因表达差异分析
N1:total tag Number in sample A
N2:total tag Number in sample B
X :Gene expression level in sample A y :Gene expression level in sample B Reference: Audic S. et al. The significance of digital gene expression profiles. Genome Res. 1997 7(10):986-995
转录组？ • 转录组是特定组织或细胞在某一功能状态下所能转录出来的所有RNA的总和，包括mRNA和非编码RNA。 • 转录组（transcriptome）广义上指某一生理条件下，细胞内所有转录产物的集合，包括信使RNA、核糖体RNA、转运RNA及非编码RNA；狭义上指所有mRNA的集合。蛋白质是行使细胞功能的主要承担者，蛋白质组是细胞功能和状态的最直接描述，转录组成为研究基因表达的主要手段，转录组是连接基因组遗传信息与生物功能的蛋白质组的必然纽带，转录水平的调控是目前研究最多的，也是生物体最重要的调控方式。
转录组测序(RNA-Seq)
Jun Yang
RNA-Seq 的技术背景
• RNA-Seq又称转录组高通量测序(transcriptome sequencing)或称为全转录组鸟枪法测序(Whole Transcriptom Shotgun Sequencing WTSS) • 2005年以来, 以Roche 公司的454 技术、Illumina 公司的Solexa 技术和ABI 公司的SOLiD 技术为标志的新一代测序技术诞生, 之后HelicosBiosciences 公司又推出单分子测序(Single molecul深度测序或高通量测序。
环境转录组也可以这样做
有参考基因组序列生物信息分析
• 基因结构优化 • 鉴定基因可变剪接 • 预测新转录本 • SNP 分析
• 基因融合鉴定
有参考基因组序列信息分析流程
无参考基因组生物信息分析
• • • • • • Unigene功能注释 Unigene的GO分类 Unigene代谢通路分析预测编码蛋白框（CDS） Unigene表达差异分析 Unigene在样品间的差异GO分类和Pathway 富集性分析
•
相关概念
• 基因的编码区(Coding region），亦称为 “编码序列”（Coding sequence）或 “CDS”（Coding DNA Sequence），是指 mRNA序列中编码蛋白质的那部分序列。 CDS也等同于ORF（open reading frame）是编码蛋白质的序列，以ATG开始--终止密码子结束。
Unigene pathway 富集性分析
Pathway富集性分析列表
Thank you！
环境转录组也可以这样做
• 使用RNA-seq手段对实验样本进行转录组分析，关注个体或者组织器官在不同环境条件下基因表达的动态变化，挖掘生物对逆境适应的分子机制。 • 方案设计思路建议： • （1）植物个体受到较多环境因素的影响，包括温度、干旱、涝害、光照、盐碱、污染物、虫害以及病原菌侵染等等,相应采取的应答策略也较为多样，可以通过激素信号分子和细胞表面受体调控相关基因的表达。建议设置多个关键处理时间点，研究植物个体短时间内和长时间内转录组动态变化趋势；揭示同一器官组织在不同环境胁迫下或不同器官组织在同一环境胁迫下基因的时空表达模式； • （2）动物器官组织样本主要来源畜牧动物、水产动物、昆虫、人以及模式动物小鼠和线虫，关注点为温度处理、光照处理、污染物处理、病原菌/虫感染、用药前后特异性表达基因，根据基因表达模式分析揭示器官组织响应环境胁迫过程的分子机制； • （3）对于微生物样本，主要通过环境转录组分析不同培养环境、次生代谢产物积累以及毒素产生差异基因表达，解析环境诱导活性物质生产的分子机理。