表达谱及小RNA

合集下载

如何使用生物大数据技术分析miRNA表达谱

如何使用生物大数据技术分析miRNA表达谱

如何使用生物大数据技术分析miRNA表达谱miRNA(microRNA)是一类短小非编码RNA分子,起调控基因表达的重要作用。

miRNA的表达谱分析在生物学研究中具有重要意义,可以帮助我们理解miRNA的功能,发现miRNA与疾病之间的关联,并为疾病的诊断和治疗提供新思路。

生物大数据技术为miRNA表达谱的分析提供了巨大的支持和便利。

本文将介绍如何使用生物大数据技术分析miRNA表达谱。

首先,获取miRNA表达谱数据。

miRNA表达谱数据可以通过多种方法获得,包括实验室测序技术、公共数据库下载等。

实验室测序技术包括高通量测序技术(如RNA-seq)和芯片技术(如miRNA芯片)。

公共数据库,如The Cancer Genome Atlas(TCGA)、Gene Expression Omnibus(GEO)等,收集了大量的miRNA表达谱数据。

根据具体研究需求,选择合适的数据来源并下载相应的数据。

接下来,对miRNA表达谱数据进行预处理。

预处理的目标是去除噪声和干扰,保证数据的质量。

首先,进行数据清洗,去除低质量的读数和低表达miRNA。

其次,进行归一化操作,使不同样本之间的数据可比。

常用的归一化方法包括总读数归一化、RPKM归一化等。

最后,进行差异分析,找出在不同样本之间表达差异显著的miRNA。

差异分析方法包括t检验、方差分析、Wald检验等,根据实际情况选择合适的方法。

然后,进行miRNA的功能注释分析。

miRNA的功能注释可以帮助我们了解miRNA在调控基因表达和信号通路中的具体作用。

常用的功能注释方法包括GO (Gene Ontology)富集分析和KEGG(Kyoto Encyclopedia of Genes and Genomes)富集分析。

GO富集分析可以通过对miRNA靶基因的功能分类,揭示miRNA在生物学过程、分子功能和细胞组成等方面的参与情况。

KEGG富集分析可以帮助我们了解miRNA调控的代谢途径、信号通路以及相关的疾病。

结肠腺癌小RNA表达谱研究

结肠腺癌小RNA表达谱研究
选 差异表达 的内源性 m co N irR A。应用荧光实时定量 聚合酶链 式 扩增 技术 ( R —C 对 表达 谱 的可靠 性 进行 验证 。结果 : q TP R) 共 获得差 异表 达 的 meo N 8 i R A 0个 ,其 中上调 3 r 0个 ,下调 5 0
个 。分 析 得 到 变 化 具 有 统 计 学 意 义 ( < .5 的 mco N 9 P 00 ) i R A2 r
o dclS h o ,Xi a ioo g Unv ri fMe ia c o l ’ n Ja tn iest y,Xi a 1 0 1 ’n 7 0 6 ,
r h na =i
个, 其中上调 2个 , 调 2 下 7个 。q TP R的结 果与芯 片结果 R —C

致 。结论 : 结肠腺癌组织和正常组织存在差异表达的 me R io - r
[ src ] A M:T v sgt ted ee c fm- Abta t I o i etae h i rne o i n i f
co N ( R A) e p e s n po i s i c ln a e o ac- r R A mi N x r s i rf n oo d n c ri o l e
结 肠癌 是 常 见 的 恶 性 肿 瘤 之 一 ,居 我 国最 常见
的肿瘤 和致 死 因素 的第 4位 ,以腺 癌 多见 ,近年来 发 病 率呈 上 升趋 势 。抗 肿 瘤 药物 和手 术 方 法 的更 新 改 进 虽然 提 高 了结 肠 腺 癌 的 5年 生 存 率 ,但 结 肠 腺 癌 的发病 机制 仍 不十 分 明确 u 。mco N irR A是 小 的 非编 J 码 R A, 肿瘤 发 生 发 展 中起 重 要 作 用 J N 在 。我 们 采

基因表达谱数据

基因表达谱数据

基因表达谱数据基因表达谱数据是指在不同细胞类型、生理状态、环境条件下,某些基因在RNA水平上的表达水平。

在生物体内,不同基因的表达模式是复杂、分层和多样性的。

基因表达谱数据可从不同细胞、组织、器官和物种中获得,其中包括微生物、植物和动物。

这些数据的收集和分析对于深入理解生命过程以及疾病的发生和发展具有重要意义。

基因表达谱数据通常通过RNA测序技术得到。

RNA测序是目前最常用的基因表达测量方法。

该技术利用高通量平台对细胞或组织中的RNA 进行测序,从而得到RNA序列信息。

由此可以得到多种RNA类别的信息,包括编码蛋白的mRNA,非编码RNA(如长链非编码RNA和小核RNA)以及翻译后修饰的RNA。

通过RNA测序技术,可以获得完整的基因表达图谱以及基因不同组织或环境下的表达差异。

生成的基因表达谱数据可用于许多应用,如基因功能注释、新基因发掘和疾病诊断和治疗跟踪。

其中,基因功能注释是最常用和最基础的应用之一。

它使得在不同细胞、组织和环境中特定基因的表达模式得以比较,并可用于发现不同基因的生物学功能和信号通路调节机制。

对于新基因的发掘,基因表达谱数据可以用于预测新基因的表达模式并设计特异性引物进行验证,从而促进新基因发现的进程。

在疾病诊断和治疗跟踪方面,基因表达谱数据可以用于诊断和治疗各种疾病,例如:癌症、神经系统疾病、自身免疫性疾病和代谢性疾病等。

基因表达谱数据的分析包含许多步骤和方法,它们旨在发现生物学和疾病的特征。

目前,基于RNA次级结构(如RNA-Seq)的分析方法是主流,包括基因差异分析、聚类分析、通路分析和蛋白质互作分析。

其中,基因差异分析用于确定在不同条件下基因表达水平差异显著的基因。

它是基因表达谱数据分析中最基础、最关键的步骤之一。

聚类分析是一种将基因在不同实验条件下的表达模式归纳为相似类别的统计方法。

聚类的目标是发现表达模式相似的基因群,分别分析观察到的生物学趋势。

通路分析通过评估不同基因的生物学功能,从而确定特定病理生理条件下的信号通路和生物学过程。

基因表达谱技术的原理和应用

基因表达谱技术的原理和应用

基因表达谱技术的原理和应用在生命科学领域中,理解基因表达是非常重要的一部分。

基因表达是指DNA段的转录和翻译,以形成功能蛋白质。

良好的基因表达是维持生命的基础,而不良的基因表达则可能导致各种疾病。

为了研究基因表达水平的变化,科学家们开发了基因表达谱技术。

本文将介绍基因表达谱技术的原理和应用,以帮助更好地理解该技术的意义。

一、基因表达谱技术的原理基因表达谱通常通过检测和测量mRNA水平来确定。

mRNA是基因表达的中间产物,是由转录产生的,在生物过程中起着传递基因信息的作用。

由于每个编码蛋白质的mRNA都有其独特的序列,因此通过测量其数量可以获得有关基因表达的信息。

基因表达谱技术提供了关于哪些基因在特定条件下被激活或抑制的信息。

在基因表达谱技术中,首先需要收集样本,通常是从生物组织或细胞中提取RNA。

接下来,RNA通常会被转录成cDNA,即DNA互补(complementary)拷贝。

转录的方式可以使用一些基于PCR的技术,主要包括倒转录PCR和梯度PCR。

然后,利用芯片或DNA测序技术进行检测和识别。

在芯片技术中,检测基因表达谱所需的DNA被固定在小片片上,将混合的cDNA标记为荧光染料并且加入样品,随后又使用扫描器来读取芯片上荧光点的信息。

在DNA测序技术中,cDNA被序列化并与参考基因组进行比对,以确定哪些基因被转录生成mRNA以及其表达水平。

二、基因表达谱技术的应用1. 生物医学研究基因表达谱技术已经广泛用于生物医学研究中。

研究人员可以使用基因表达谱技术来鉴定患有某种疾病的样本和正常样本之间的差异,以确定哪些基因与该疾病相关。

例如,在癌症研究中,基因表达谱技术被用来比较癌细胞和正常细胞中基因表达水平的差异。

研究还表明,基因表达谱技术可以用于识别特定基因的变化,这些基因在特定类型的癌症中扮演了重要角色。

2. 活体诊断基因表达谱技术的另一个应用是活体诊断。

例如,基因表达谱技术可以用来诊断疾病、评估药物疗效和患者预后。

基因表达谱分析技术的原理与方法

基因表达谱分析技术的原理与方法

基因表达谱分析技术的原理与方法随着基因组学技术的发展,我们可以从一个细胞或组织中同时检测数以万计的基因,了解人体健康和病理的分子机制。

基因表达谱分析技术,又称转录组学技术,是一种重要的基因组学技术,它可以帮助我们深入了解基因表达的变化及其对生物学特征和疾病的影响。

在本篇文章中,我们将介绍基因表达谱分析技术的原理和常用方法。

原理基因编码不同功能蛋白的RNA是由基因的转录过程产生。

基因表达是指在特定的时间点和组织中转录某一基因所产生的RNA数量和质量。

例如,心脏细胞和肝脏细胞表达不同的基因,因为它们需要不同的蛋白质来执行其特定功能。

基因表达谱分析技术就是通过检测RNA水平的变化来揭示不同组织、疾病和情况下基因的表达变化。

在基因表达谱分析中,采集组织或细胞的RNA,把RNA转化为cDNA,再将cDNA探针的引物或/和微阵列片段引入cDNA上进行探针测序或比较。

探针把其考察的基因特异性的cDNA附着在cDNA探针上,然后将其组分检测出。

在反转录,多聚酶链反应(PCR)或减少串接的基础上,引物是特异探针或一段数字长cDNA中的一个段落,被称作探针序列,以检测在RNA大样本中是否有包含这样的特异性片段。

通过这种方法,我们可以得到不同组织或情况下的RNA表达状况,从而分析基因表达谱。

方法1.微阵列微阵列是最常用的基因表达谱分析技术之一。

在微阵列上,数千个cDNA探针被绑定到玻璃片上,每个探针用来检测一个特定的基因。

将RNA转化成标记染料的cDNA,将其添加到微阵列上,并运用一些特殊的分子技术比如荧光检测或电化学检测等,检测cDNA与微阵列上的探针结合的信号。

这种方法非常适合于同时分析数千个基因,在研究基因调控网络及其调节中扮演重要角色时,微阵列可以很好地对大规模基因表达谱的分析。

2. RNA测序RNA测序技术已成为转录组分析领域的领导者。

它可以直接检测RNA而不需要提前知道基因序列,而且这种技术不受在微阵列上的探针长度或性能的影响。

结核病患者血清小RNA表达谱型特征及其编码基因的染色体定位

结核病患者血清小RNA表达谱型特征及其编码基因的染色体定位
() 4 —4 . 7 :75 7 8
[ ] D e udiZ R o h D, D f e a. A s ges p 7 jl aj , au o a e M, t 1 f i l・t n e
s q e cn meh d o te d nic t n f y o a t im e unig t o fr h ie t a o o M c b ce u i f i r
与人 类基 因组进行 比对 , 定其在人 类染 色体上的定位 。结果 : 2 结核病 患者和 2 例健 康对照者血 清 确 对 7例 5
sN R A进行 了检 测与分析 , 1 ~ 0n 长度 范围 内. 在 0 3 t 结核 病 患者 不同长度血 清 s N R A的表 达丰度呈 近似正 态
分 布 , 康 人 群 则 呈 明 显 的 负偏 态分 布 ; 健 结核 病 患 者 血 清 s N 编 码 基 因 主要 位 于 染 色体 cr7 cr 、h2 、 R A hl 、h8 c r2
426 4
实用医学 杂志 2 1 0 0年第 2 6卷第 2 3期
1 6 -1 6 . 4 4 4 9
i lv f x cnrssa t My o a tru n eo o a i —e itn l c b ceim tb ruo i ci ia u e c lss lnc l
Ea i z k T, Ha a a S r y ma . Di e e ta in f f r n ito o
Yi ,Yu Z.Mu a in c a a t rz t n o r n y B g n s nX tto h r c e ia i f o A a d g r e e
( 收稿 :0 0 1 — 5 编辑 : 2 1— 0 2 吴淑金)

及癌旁正常组织中微小RNA表达谱的检测

在收集、保存、提取、芯片杂交等诸多过程中,易受外界因素影响,出现RNA降解或污染,影响实验真实性。

为此,我们在实验整个过程都注意避免以上不利因素的影响,并对每例患者样本都单独进行了质量检测,将满足实验要求的样品分别进行芯片实验,最后对数据进行聚类分析,减小了误差,同时能反映出个体情况,丰富了胃癌的miRNA差异表达谱。

本研究结果表明,通过对胃癌miRNA表达谱检测后,胃癌相对于癌旁正常组织中存在差异表达的miRNAs,这些可能与胃癌的发生、发展有关。

参考文献・1341・[1]KamangarF,DotesGM,AndersonWF.Patternsofc柚cerincidence,mortality,andprevalenceacrossfivecontinents:definingprioritiestoreducecancerdisparitiesindifferentgeographicre】gionsoftheworld.ClinOnc01.2006,24:2137-2150.[2]BarrelDP.MicroRNA:genomics,biogenesis,mechanism,andfunc-tion.Cell,2004。

116:281-297.[3]FelekkisK,TouvanaE,StefanouCH,eta1.mieroRNAs:anewlyde-∞ribedclassofencodedmoleculesthatplayaroleinhealthanddis-ea∞.Hippokmm,2010,14:236-240.[4]TakagiT,LioA,NakagawaY,eta1.DecreasedexpressionofmlcroRNA・143and一145inhumangastriccancers.Oncology,2009,77:12-21.(收稿日期:201I.0I-10)DOI:10.3760/cma.j.isan.1001-9030.20U.08.049作者单位:430030武汉,华中科技大学同济医学院附属同济医院神经外科通信作者:王胜。

高通量测序常用名词解释

什么是高通量测序?高通量测序技术(High-throughput sequencing,HTS)是对传统Sanger测序(称为一代测序技术)革命性的改变, 一次对几十万到几百万条核酸分子进行序列测定, 因此在有些文献中称其为下一代测序技术(next generation sequencing,NGS )足见其划时代的改变, 同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能, 所以又被称为深度测序(Deep sequencing)。

什么是Sanger法测序(一代测序)Sanger法测序利用一种DNA聚合酶来延伸结合在待定序列模板上的引物。

直到掺入一种链终止核苷酸为止。

每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP)。

由于ddNTP缺乏延伸所需要的3-OH基团,使延长的寡聚核苷酸选择性地在G、A、T或C处终止。

终止点由反应中相应的双脱氧而定。

每一种dNTPs和ddNTPs的相对浓度可以调整,使反应得到一组长几百至几千碱基的链终止产物。

它们具有共同的起始点,但终止在不同的的核苷酸上,可通过高分辨率变性凝胶电泳分离大小不同的片段,凝胶处理后可用X-光胶片放射自显影或非同位素标记进行检测。

什么是基因组重测序(Genome Re-sequencing)全基因组重测序是对基因组序列已知的个体进行基因组测序,并在个体或群体水平上进行差异性分析的方法。

随着基因组测序成本的不断降低,人类疾病的致病突变研究由外显子区域扩大到全基因组范围。

通过构建不同长度的插入片段文库和短序列、双末端测序相结合的策略进行高通量测序,实现在全基因组水平上检测疾病关联的常见、低频、甚至是罕见的突变位点,以及结构变异等,具有重大的科研和产业价值。

什么是de novo测序de novo测序也称为从头测序:其不需要任何现有的序列资料就可以对某个物种进行测序,利用生物信息学分析手段对序列进行拼接,组装,从而获得该物种的基因组图谱。

小RNA测序测序介绍(含miRNA测序原理及案例分析)


miRNA 家 族 : 各 物 种 中 结 构 相 似 , 功 能 相 同 的 一 类
miRNA。
注释为该家 族的表达量 最高的一条 miRNA 的 序 列
miRBase中无该物种miRNA信 息
已知miRNA的家族分析
• 已知的miRNA所归属的miRNA家族,在其
他物种中是否存在?
测得miRNA 所归属的家族
明表达差异越显著。我们将差异倍数大于2倍,且
FDR≤0.001的miRNA作为差异miRNA(可以根据需要调 整)。
miRNA聚类分析
• 以各样品中miRNA的表达量为基础,进行聚类分
析和热图分析。与RNA-Seq表达谱测序中差异基 因表达模式聚类分析方法类似。
7.miRNA靶基因预测
miRNA 植物mRNA AAAA… 3’UTR CDS 5’UTR 动物mRNA miRNA AAAA… 5’UTR
3. 后续分析(个性分析)
4. 案例分享
小RNA基础
• 小RNA是指在生物体中表达的,不编码蛋白,长度较短 (18~30nt或40nt)的RNA分子,参与诱导基因沉默,参 与细胞生长、发育、基因转录和翻译等诸多生命活动的调
控过程。
• microRNA,简称miRNA,是目前功能研究较为透彻的一
类小RNA(20~25nt)。miRNA通过与特定mRNA的结合调
小RNA分类注释
• 综合以上基因组比对结果及数据库注释结果。
• 有冲突时,用rRNAetc(Genbank > Rfam)>known miRNA(miRbase) > repeat > exon > intron的顺序进行注 释。
种类数 统计

qpcr步骤

范围和适用性本实验适用于使用StepOnePlus™实时PCR仪对DNA PE、DNA PE Index、SE文库以及Exon Capture组、转录组、表达谱、Small RNA组、表观遗传组等制备的文库进行上机前的精确定量。

摘要荧光定量PCR实验是以Agilent 2100 Bioanalyzer对文库的检测结果为参照, 使用StepOnePlus™实时PCR仪对文库进行定量,得出待测文库浓度,为之后的Cluster制备提供浓度依据。

该实验的主要内容包括:(1)梯度稀释标准品;(2)按实验要求稀释样品;(3)配制反应预混液;(4)加样;(5)设置反应程序;(6)运行实验;(7)分析实验结果,计算待测样品浓度。

整个流程需要3-4小时。

缩写词和SOP中专业术语的解释实验材料及方法1 实验试剂和耗材1.1试剂表1-1 实验所需试剂1.2 耗材表1-2 实验所需耗材2 实验仪器设备表2-1 实验所需仪器设备3 实验操作流程3.1 填写Q-PCR实验登记表样品的交接按照《质控组样品交接管理规程》执行。

实验前,先在“表单准备区”将要检测的样品在《Q-PCR实验登记表》中填写好,并根据“文库交接检测”文件夹中《____组文库检测结果》中的待测样品的顺序按顺序填到《Q-PCR 实验登记表》上,并在右上角注明批次后打印出来。

然后将需要检测的样品的样品名和文库号按照《Q-PCR实验登记表》上的顺序粘贴到“文库核对&存放位置”文件夹中的《文库检测前核对表》Excel表中,等待核对样品信息。

3.2 稀释标准品开始实验前,到-20℃冰箱和冰柜中将实验所需的标准品和样品取出,并按Q-PCR实验登记表上的顺序排好,并到表单准备区,用扫描枪将样品的文库号扫描到“文库核对&存放位置”文件夹中的《文库检测前核对表》Excel表中进行核对,核对结果为“错错错错”,则样品不正确需重新找取样品信息相同的样品;核对结果为“对”,则样品正确。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

共做3个Tag-seq 。 qPCR对Tag-seq结果进行验证: 选取了6个上调基因和2个下调表达基因进行验证Tag-seq结果, 两种技术的相关系数 r 值为:0.781-0.997。
11
利用高通量测序为基础的数字基因表达谱技术系统地分析了N-PRRSV感染 后的肺和感染引发病理发生的肺中基因表达谱之间的关系。 研究发现N-PRRSV在被感染的家猪中呈现出多种复制策略,包括破坏宿主 的先天免疫反应、抗凋亡和抗发炎状态、并发展为ADE。受病毒诱导而上调 表达的早期炎性相关细胞因子、趋化因子、粘附分子、发炎相关酶蛋白、发
Pearson r=0.9117 Spearman rank r=0.8603
Pearson r=0.8575 Spearman rank r=0.8321
两种样品的Tag-Seq 和qPCR 都具有较好的相关性
Tag-Seq、Affymetrix 芯片分别与 qPCR的相关性比较(HBRR/UHRR)
中山大学Tag-seq文章
猪繁殖与呼吸综合征(PRRS)是一种全世界范围内影响家猪生产的重要疾病, 每年都会造成很多的经济损失。 PRRS病毒感染分子机制目前了解甚少。 本研究第一次应用了illumina的数字基因表达谱技术在全基因组水平研究了宿 主在感染N-PRRSV(经典北美型PRRSV)CH1a株病毒后的转录水平作出的响应。
14
qRT-PCR验证实验:选取了9个基因,其中8个基因的qPCR结果与Tag-seq结果相一致。
Fig. Quantitative RT–PCR validation of tag-mapped genes from cotton ovules and developing fibers. (A) –(E), genes have been identified or reported before, including FDH (TA21337) (A), SCP (TA22298) (B), CesA-5 (TA21774) (C), ACT (TA20417) (D), and WBC1 (TA24519) (E).. The other tag-mapped genes included DT046968 (F, predicted flavonoid 3′,5′-hydroxylase), TA20379 (G, predicted peroxidase), and TA21004 (H, sterol-Cmethyltransferase).TPM, transcripts per million mapped reads.
12
南京农大Tag-seq文章
高地棉栽培种 Xuzhou 142 和它的突变体 fl M (fuzzless/lintless),在江苏农科院种
植。 在开花期当天对花做标记,收获-2 到8 DPA(开花期后天数)的棉花胚珠,剥离的 棉花胚珠液氮速冻后-80°C保存。 从-2、-1、0、1、2、3、5 和8 DPA的野生型和突变体的棉花胚珠中提取总RNA。 -2、-1、0和1 DPA的总RNA混合作为stageI(纤维启始)的样品,野生型和突变体的 分别标记为 WT1 和 M1; 2、3、5和8 DPA的总RNA混合作为stageII(纤维伸长)的样品,野生型和突变体分 别标记为 WT2 和 M2。
• 本文的亮点是,针对一些通过Tag-seq找出来 的差异基因,且是以前有过报道参与花发育进 程的基因,利用RT-PCR方法分别对它们在子 房和花上部做了不同发育时期的表达模式分析。 • 该部分实验结果成为了他们讨论部分的主要内 容。 • 这一个思路值得借鉴,有了Tag-seq数据后, 找自己关注的而且有些研究背景的基因进行 RT-PCR分析,以便于撰写文章的讨论部分。
技术 优点
1)检测基因数比基因芯片多 2)定量准,可重复性高(重复相关系 数≥0.99) 3)数字化信号,背景噪音低,无交叉 杂交 4)高、低丰度基因均可检测 5)不受研究物种限制,模式生物和非 模式生物均可检测 6)数据可与时俱进,即随数据库更新 而更新 7)具有较好的分析兼容性,数据格式 与芯片相同,可与芯片的分析软件兼 容
microarray community in order to avoid procedural failures and to develop 两个样品约1000 个基因的qPCR 定量结果) guidelines for microarray data analysis by providing the public with large reference datasets along with readily accessible reference RNA samples. See-3.8M的tags可以代表0.7-1.0M的一致转 录本(unique transcripts)。 去除低质量的tags后6、2943654和339210 20 10 0
0 200 400 600 800
40 30 20 10 0
0 200
n=872 genes
1000 1200 1400
n=851 genes
n=903 genes 400 600 800
1000
1200
Tag-Seq_gene expression (RPKM)
Tag-Seq_gene expression (RPKM)
10
研究思路如下: 共取9头6周大的健康小猪: 3头猪为对照;在感染实验前一天,牺牲掉取肺; 6头猪感染病毒,分别在感染后第3天和第7天,各牺牲3头猪取 肺。 每3头猪混合提取RNA,进行Tag-seq 实验,对比数据库为 sus scrofa UniGene
(/UniGene/UGOrg.cgi?TAXID=9823, UniGene Build #35 Sus scrofa, Nov, 7th, 2008)
缺点
RNA -seq
1)样本要求量比基因芯片多 2)数据量大,需要具备一定的生物信息分 析基础,才能更好的挖掘数据蕴含的丰富 信息
基因 芯片
1)平台应用较早 2)信息分析软件较多 3)有些平台要求样品量少
1)检测灵敏度较低、重复性差、检测阈值 较狭窄 2)有背景噪音,假阳性率>1% 3)受物种限制,只能检测部分模式生物 4)受基因拷贝数限制,无法检测出低丰度 基因 5)只能检测已知转录本,无法检测出新转
Tag-Seq & qPCR
qPCR: Log2(HBRR/UHRR)
-10 5 0 -5
Affy & qPCR
5 0 -5
n=767 genes
n=474 genes
-10 -10 -5 0 5
-10 -6 -4 -2 0 2 4 6
Tag-Seq: Log2(HBRR/UHRR)
Affymetrix: Log2(HBRR/UHRR)
分析内容
原始序列数据 Clean Tag数据 表达量及分布分析 实验重复性分析 基因注释、标准化 反义链的转录分析 差异表达基因筛选 新转录本检测 测序饱和度分析 共有、特有Tag分析
表达模式聚类分析
GO功能显著性富集分析
Pathway显著性富集分析
蛋白互作网络分析
Tag-Seq与基因芯片优缺点比较
/ScienceResearch/BioinformaticsTools/MicroarrayQualityControlProject/default.htm
Tag-Seq和 qPCR的相关性
qPCR_gene expression
qPCR_gene expression
372954和382503种不同的标签(distinct tags)。 所有的clean tags对比棉花公共的转录本数据库 TIGR,。约15%的 distinct tags具有唯一的参考基因对比结果,而公共数据库中有34.4%的基因被tags对比
上。
Tag对比参考数据库497和19957个注释基因。 对有了质的变化。 在WT1/M1和WT2/M2之间表达差异水平最大的20个基因是纤维素合成酶基因、磷酸 (脂)酶基因和脱氢酶基因,这些基因都参与了纤维细胞的发育进程。
Small RNA 测序实验流程
Pearson r=0.9176 Spearman rank r=0.8966
Pearson r=0.891 Spearman rank r=0.868
Tag-Seq比Affymetrix芯片具有更高的相关性
东北农大Tag-seq文章



研究对象:黄瓜的雄雌同株材料,和它的突变体材料(全雌 株)。 平行培养两类材料,在 2叶1心期,取茎尖组织提前RNA,进 行Tag-seq分析,每个材料取了15株进行混合抽提RNA. 文章的内容是DEG的结果与分析。 用RT-PCR和qRT-PCR对Tag-seq得到的差异表达基因做了验证 分析。
总的来说,本研究的深度测序分析证实了纤维早期发育中基因转录的高度复杂性,
同时结果也表明与利用基因芯片技术分析转录组相比,深度测序技术可以在一个 更大更广的范围去探测基因表达谱。
15
Small RNA 测序
16
Small RNA 的作用
• 21-24 nt • miRNAs and siRNAs
Lin He and Gregory J.Hannon. MicroRNAs: Small RNAs with a big role in gene regulation. Nature Reviews Genetics 5, 522–531 (2004)
BGI 实验

实验材料 (MAQC标准品)
– Universal Human Reference RNA (UHRR) from Stratagene. – Human Brain Reference RNA (HBRR) from Ambion.
相关文档
最新文档