人全基因组甲基化测序项目结题报告

合集下载

生物信息学研究员基因组测序数据分析总结

生物信息学研究员基因组测序数据分析总结

生物信息学研究员基因组测序数据分析总结生物信息学研究员在基因组测序数据分析方面具有重要的角色和责任。

基因组测序数据是基因组学研究的核心资源,对于揭示基因功能、疾病机理等方面的研究具有重要的意义。

本文将就生物信息学研究员在基因组测序数据分析中所扮演的角色和开展的工作进行总结和讨论。

一、基因组测序数据质量控制为了确保基因组测序数据的准确性和可靠性,生物信息学研究员首先要对测序数据进行质量控制。

质量控制包括检查测序数据的碱基质量情况,检测是否存在低质量的碱基、接头序列等,并对测序数据进行修剪或过滤,以去除低质量的碱基或序列。

此外,生物信息学研究员还需检查是否存在接头污染、宿主序列等,并对其进行剔除或分离。

二、基因组测序数据比对与拼接基因组测序数据比对与拼接是生物信息学研究员在基因组测序数据分析中的重要环节。

基因组测序数据比对是将读取序列与参考基因组进行比对,以确定每个读取序列的来源和位置。

生物信息学研究员可以使用一系列的比对工具和算法进行比对分析,并通过评估比对质量来筛选可靠的比对结果。

基因组测序数据拼接是根据比对结果,将读取序列进行拼接,得到完整的基因组序列。

三、基因组测序数据变异检测基因组测序数据变异检测是生物信息学研究员在基因组测序数据分析中的重要任务。

通过对比对结果进行进一步分析,生物信息学研究员可以检测和鉴定基因组的各种变异信息,如单核苷酸多态性(SNP)、缺失、插入等。

生物信息学研究员可以使用一系列的工具和方法进行变异检测,并通过筛选和过滤得到高可靠性和高准确性的变异结果。

四、基因组测序数据功能注释和通路分析基因组测序数据功能注释和通路分析是生物信息学研究员在基因组测序数据分析中的重要内容。

生物信息学研究员可以利用一系列的数据库和工具,对基因组测序数据进行功能注释,如预测基因的功能、编码蛋白质的功能等。

此外,生物信息学研究员还可以进行通路分析,揭示基因组测序数据在生物学过程和信号通路中的作用和调控机制。

甲基化测序结果分析

甲基化测序结果分析

甲基化测序结果分析甲基化测序是一种测试技术,它可以从特定的基因或细胞类型中检测到DNA及其附属物质的变化情况,主要用于研究基因表达和基因结构的变化。

由于它的高效性,以及适用于多种类型的试验,甲基化测序在遗传学、生物技术和药理学等领域得到了广泛的应用。

甲基化测序的基本流程是由三个部分组成的:样品处理,测序应用和信号分析。

在样品处理方面,首先将样品标记成可以测量的状态,然后将样品分成多个小组进行处理,以便确保每一组中包含有足够的信息。

接下来,样品被放入测序仪器,测序仪器会将样品中的所有片段序列化,并将结果记录到一个数据库中。

最后,数据库中的信息被输入到信号分析部分,用于进行进一步的分析。

信号分析是甲基化测序的关键部分,它的目的是从测得的信号中提取有用的信息,以及确定生物学过程的变化情况。

首先,算法会根据信号特征提取有效的特征,然后,数据处理程序会根据这些特征进行进一步的计算分析。

最后,人工智能系统可以利用这些信息来计算基因组及其附属物质的变化情况,以及其与受体的交互等。

甲基化测序的结果分析有很多种方式,以了解基因表达及其相关的生物学过程。

一种常用的方法是使用“凝聚聚类”,它可以帮助研究者查找出基因表达及其相关物质之间的差异。

另一种方法是使用“基于数据挖掘的概念模型”,它旨在帮助研究者了解某一特定基因或物质对许多不同变量之间的关系。

最后,甲基化测序结果分析还可以使用“分层模型”,用于研究特定基因及其附属物质之间的关系。

甲基化测序的结果分析在许多领域都具有重要的作用,它可以帮助研究者更好地理解基因表达及其相关生物学过程。

它可以帮助研究者更好地预测某一特定基因或物质对周围环境的影响,并给出针对这些影响的有效治疗方案。

此外,甲基化测序的结果分析也可用于研究疾病的发生机制,以及更好地开发药物等。

甲基化测序结果分析是一种重要的测试技术,它可以用来研究基因表达及其相关的生物学过程,并可以为药物开发和疾病诊断提供有效的参考依据。

甲基化测序结果分析

甲基化测序结果分析

甲基化测序结果分析甲基化测序是一种高通量的分子遗传学研究方法,目前被广泛应用于基因组学、转录组学和表观遗传学研究。

它可以用来研究基因调控、基因表达和基因突变等问题。

甲基化测序的结果分析是研究这种技术的重要环节。

甲基化测序结果分析包括两个步骤:(1)数据读取和处理;(2)数据分析和可视化。

首先,数据读取和处理步骤主要涉及结果文件的读入、格式转换以及把序列比对到参考基因组上进行标记。

其次,数据分析和可视化步骤主要是分析数据以及将分析结果以图形的形式展现出来,以方便人们在分析的结果和实验的结果之间进行关联。

目前常用的甲基化测序分析工具主要有MethylC-Seq、Methyl-seqPro、Methyl-seqAligner等。

MethylC-Seq是一款面向甲基化测序的分析软件,可以实现比较转录组的甲基化水平,识别和分类甲基化状态、对比不同样品之间的甲基化差异、收集甲基化结果等。

同时,它还可以进行多样品间的差异定位、基因分类,以及甲基化等级差异的可视化等方面的工作。

Methyl-seqPro是一种甲基化测序分析工具,可以进行多种分析,包括比对、标记和可视化等,对甲基化测序数据进行分析。

Methyl-seqAligner是一款甲基化测序分析工具,可以检测和识别一个序列中特定位点的甲基化状态,以及在多个样品中比较甲基化数据的差异,并可视化展示结果。

此外,甲基化测序分析还可以运用基因组学、转录组学和表观遗传学等方法,对不同物种或不同功能位点的甲基化水平进行比较,以揭示甲基化的分子机制和作用。

近年来,由于基因组和转录组的发达,甲基化测序分析也可以通过研究基因调控、基因表达、基因突变和基因组变异等的数据,对基因的表达及其调控机制和发挥的功能进行深入分析。

总之,甲基化测序结果分析是甲基化测序技术的重要环节,它可以深入分析基因调控、基因表达、基因突变和基因组变异等问题,为研究基因表达及其调控机制、作用提供重要信息。

基因组测序实验报告

基因组测序实验报告

基因组测序实验报告一、实验背景随着生命科学的快速发展,基因组测序技术已经成为研究生物遗传信息的重要手段。

通过对基因组的测序,可以深入了解生物的基因组成、遗传变异、基因功能以及与疾病的关系等。

本次实验旨在对_____样本进行基因组测序,以获取其详细的遗传信息。

二、实验目的1、掌握基因组测序的基本原理和实验流程。

2、对_____样本进行全基因组测序,获得高质量的测序数据。

3、分析测序数据,查找可能存在的基因突变和遗传变异。

三、实验材料与方法(一)实验材料1、样本来源:_____2、试剂与仪器:DNA 提取试剂盒测序试剂盒测序仪离心机移液器等(二)实验方法1、 DNA 提取按照 DNA 提取试剂盒的说明书,从_____样本中提取高质量的基因组 DNA。

对提取的 DNA 进行浓度和纯度检测,确保其质量符合测序要求。

2、文库构建将提取的 DNA 进行片段化处理,使其大小适合测序。

对片段化的 DNA 进行末端修复和加接头等操作,构建测序文库。

3、测序将构建好的测序文库加载到测序仪上,进行测序反应。

选择合适的测序模式和参数,以获得高质量的测序数据。

4、数据处理与分析对测序得到的原始数据进行质量评估和过滤,去除低质量的数据。

使用专业的生物信息学软件对处理后的数据进行比对、组装和变异检测等分析。

四、实验结果(一)测序数据质量评估1、测序深度:平均测序深度达到_____X,覆盖度良好。

2、碱基质量:碱基质量值的分布符合预期,大部分碱基的质量值在 Q30 以上。

(二)基因组装结果成功组装出_____样本的基因组序列,与已知的参考基因组相比,具有较高的一致性。

(三)变异检测结果1、单核苷酸多态性(SNP):共检测到_____个 SNP 位点,分布在不同的染色体上。

2、插入缺失(InDel):检测到_____个 InDel 变异,其长度和位置分布具有一定的特征。

(四)功能注释与分析对检测到的变异进行功能注释,发现其中一些变异可能与_____疾病的发生发展相关。

医院6个样品wnt4基因甲基化测序分析报告 甲基化分析服务报告书

医院6个样品wnt4基因甲基化测序分析报告   甲基化分析服务报告书

甲基化分析服务报告书1 样本信息2 服务内容DNA 检测,BSP实验3实验内容3.1基因组DNA的检测3.2BSP实验(1)亚硫酸盐处理及纯化(QIAGEN,cat:59824)操作步骤:严格按照试剂盒说明书操作,取基因组DNA 1ug进行亚硫酸盐转化并纯化回收。

(2)引物的设计(加粗斜体下划线部分为引物位置)Tcttttccttagttgagaataccactcactgtgaatttgcttacctgcgggatctccttatcag gtgagtcagctctgaaggccccttg ggagga ccggct ctgggggttggtggtggtagatgggcgggaaaggccccaccctggccgcctgatgtcagccctgttctcgggaactgagctgaaaacaagctaa ca gaaacctgggaatggatgaagaaatgaggattctttctaacctttcgaagtcaccaggatgagaggggctccatccggtccccagtgggctaaacat gctagattcagctatggctactgtccacacagcacagcctggactatatgtc ccaaacaaaactaacaaactaaaagaaaaa attcatttgtgtgatt aatatacattagtagaaaaagtcctgccWnt4-F:GTGAGTTAGTTTTGAAGGTTTTTTGWnt4-R:TTTTTCTTTTAATTTATTAATTTTATTTAAPCR产物大小:312 bp(3)PCR扩增:50µL反应程序:(4)T/A克隆与测序PCR产物纯化:按照试剂盒中的产品说明操作,将目标片段割胶纯化。

(Generay,cat:GK2043)连接T载体:采用Generay的pTG19-T(Lot:GV6021)作为载体,按照试剂盒中的产品说明操作。

转化采用XL10-Gold感受态,按照产品说明进行转化、复苏和涂板。

组蛋白甲基化检测报告

组蛋白甲基化检测报告

组蛋白甲基化检测报告1. 引言组蛋白甲基化是一种重要的表观遗传修饰方式,能够调控基因的表达和细胞的功能。

甲基化修饰的异常与许多疾病的发生和发展密切相关,因此准确地检测组蛋白甲基化水平对于疾病的诊断和治疗具有重要意义。

本文将介绍如何进行组蛋白甲基化的检测。

2. 实验材料和方法2.1 实验材料•组织样本(例如人类组织样本)•组蛋白提取试剂盒•甲基化特异性抗体(例如anti-5-methylcytosine)•单克隆抗体•荧光标记的二抗•洗涤缓冲液•甲基化标准品•聚合酶链式反应(PCR)试剂盒•硫酸钠•脱甲基化酶2.2 实验方法1.组织样本的收集和处理–从待检测的组织中取得样本,如血液、细胞培养物等。

–对组织样本进行预处理,如细胞裂解和核酸析取,以获得纯净的组织样本。

2.组蛋白的提取–使用组蛋白提取试剂盒按照说明书的步骤进行组织样本的组蛋白提取。

–获得的组蛋白样本可以进行质量和浓度检测,以确保样本的可靠性。

3.甲基化特异性抗体的应用–取得合适的抗体,如anti-5-methylcytosine。

–使用抗体对组蛋白样本进行免疫沉淀。

–使用洗涤缓冲液洗涤免疫沉淀的样本,除去非特异结合的蛋白质。

4.荧光标记的二抗的应用–取得合适的荧光标记的二抗,如荧光标记的抗鼠IgG。

–使用荧光标记的二抗与沉淀的样本进行反应,以便于后续的检测。

5.脱甲基化酶的应用–使用脱甲基化酶进行反应,去除组蛋白中的甲基化标记。

–反应后的组蛋白样本可以进行进一步的分析,如PCR扩增等。

6.PCR扩增–使用PCR试剂盒进行PCR扩增。

–设计合适的引物,以扩增感兴趣的片段。

–通过PCR扩增,可以得到被甲基化修饰的DNA片段。

7.测量甲基化水平–通过定量PCR或其他方法,测量扩增产物中的甲基化水平。

–将测量结果与甲基化标准品进行比对,以得出样本中甲基化水平的相对值。

3. 结果与讨论通过以上实验方法,我们成功地检测到了组蛋白甲基化水平,并得到了相对值。

基于全基因组测序技术的甲基化修饰分析

基于全基因组测序技术的甲基化修饰分析

基于全基因组测序技术的甲基化修饰分析近年来,随着全基因组测序技术的不断发展,甲基化修饰的分析也越来越成为了一个热门的研究领域。

甲基化修饰是指DNA链中的脱氧核苷酸(尤其是脱氧胸腺嘧啶)被一个甲基基团(CH3)所取代的一种化学修饰。

在人类和其它高等生物中,甲基化修饰是一种重要的遗传信息储存方式,能够在细胞分化和胚胎发育等生物过程中发挥作用。

基于全基因组测序技术的甲基化修饰分析可以提供全面、高通量的数据,帮助我们更好地理解甲基化修饰在人类健康和疾病中的角色。

甲基化调控影响了许多重要的基因功能,包括转录调控、DNA复制和修复、基因组稳定性以及染色质结构的变化。

因此,研究甲基化修饰对于深入了解基因调控机制和疾病发生发展具有重要意义。

全基因组测序技术的甲基化修饰分析主要有两种方法:基于BS-seq和MeDIP-seq。

前者可以确定每个甲基化位点的状态,但是需要对每个位点进行单独的测序,因此需要更高的测序深度和更大的数据存储空间;后者可以检测到与甲基化相关的两个信号,即DNA和MeDIP信号,因此可以大幅减少测序深度和数据存储空间。

两种方法各有利弊,具体选择视实验需求而定。

在甲基化修饰分析中,数据分析过程至关重要。

首先需要对原始测序数据进行质控和数据清洗,以确保测序数据质量。

然后,需要将清洗后的数据比对到参考基因组上,同时进行去重、过滤和序列校正等预处理步骤。

接着,需要使用各种甲基化分析软件进行信号区域识别、信号强度评估、差异分析和功能注释等分析步骤。

其中,信号区域识别通常采用两种方法:寻找富集的甲基化位点和寻找与特定基因表达相关的差异化甲基化位点。

对于富集的甲基化位点,常用方法是基于甲基化水平的阈值来识别;而对于与基因表达相关的甲基化位点,通常需与转录组数据结合,进行相关性分析。

目前,全基因组测序技术的甲基化修饰分析在人类疾病研究上的应用广泛。

例如,研究表明某些肿瘤细胞DNA的甲基化水平明显高于正常细胞,从而导致某些癌症的发生。

人类基因组测序与疾病研究报告

人类基因组测序与疾病研究报告

人类基因组测序与疾病研究报告1.前言人类基因组测序技术的发展是现代生命科学研究的里程碑。

自2001年人类基因组计划启动以来,人们已经测序了数十个物种的基因组,并且发展出了高通量、低成本的基因组测序技术。

这项技术既可以为鉴定罕见的遗传性疾病提供指导,也可以为推动精准医疗发展奠定基础。

本报告旨在介绍人类基因组测序技术的原理、应用及其对疾病研究的帮助。

2.人类基因组测序技术的原理人类基因组由3000万个碱基对构成,其中包含了大约20000个基因。

基因组测序的目标是确定一个个体的基因组序列及其变异情况,提供有关该个体内存在的遗传变异的全部信息。

人类基因组测序技术分为下一代测序和第三代测序两类。

下一代测序是指采用先进的测序平台如Illumina、Ion Torrent或PacBio等,在一定条件下大规模同时测序多个样本。

第三代测序则通过采用纳米孔测序(Nanopore sequencing)等技术,可以高效、准确地获得长读片段,对于检测基因突变等方面具有优势。

3.应用3.1遗传性疾病的诊断和防治基于人类基因组测序技术能够鉴定罕见遗传性疾病,如斯图尔特·韦布·韦伯综合症、芬妮综合症等。

此外,测序还可以鉴别潜在的婴儿出生前易感遗传列病,在治疗前采取预防性措施,避免疾病的出现或减轻疾病严重程度。

3.2基于人体基因组测序的个性化治疗通过研究人体基因组变异,个体化的治疗可以更有效,而不像传统的以症状为导向的治疗方法。

例如,在巨细胞动脉炎或慢性肾脏病的治疗中,个体化的治疗方案可以根据基因测序数据 ️制定,确定最好的药物治疗方案。

4.人类基因组测序在疾病研究中的应用4.1癌症研究人类基因组测序技术可用于癌症研究。

研究表明,肺癌和结肠癌等恶性疾病可以通过测序表观遗传修饰的基因来检测。

这种基因修饰与许多癌症的产生息息相关。

通过这种方式,人们可以深入了解基因突变和癌症之间的关系,为癌症的预防、治疗提供了新的机会。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

人全基因组甲基化测序项目结题报告成都生命基线科技有限公司目录一、分析方法 (3)1.1 全基因组甲基化测序 (3)1.2 生物信息分析概述 (3)1.3 数据过滤 (3)1.4 序列比对 (3)1.5 甲基化水平 (3)1.6 DMR检测 (4)1.7 甲基化水平程度差异 (4)1.8 GO注释 (4)1.9 KEGG通路富集 (4)二、项目流程 (5)2.1 实验流程 (5)2.2 信息分析流程 (5)三、项目结果报告 (6)3.1 数据基本处理与质控 (6)3.2 全基因组甲基化水平分析 (8)3.3 甲基化C碱基中CG, CHG 与CHH的分布比例 (9)3.4 甲基化CG、CHG和CHH的甲基化水平分布 (10)3.5 甲基化的CG,CHG,CHH附近碱基的序列特征分析 (10)3.6 染色体水平的甲基化C碱基密度分布 (11)3.7 基因组的不同区域的甲基化分布特征 (11)3.8 基因组不同转录元件中的DNA平均甲基化水平 (12)3.9 DMR的检测 (12)3.10 DMR相关基因的GO和Pathway分析 (14)四、参考文献 (15)一、分析方法1.1 全基因组甲基化测序首先采用Covaris聚焦超声仪对合格的DNA样品进行打断。

加入End Repair Mix置于20℃ 30分钟进行末端修复后,用QIA quick PCR Purification Kit(Qiagen)纯化DNA片段。

使用A-Tailing Mix置于37℃ 30分钟在3’末端加A碱基,然后在DNA片段两端连接上测序接头。

采用EZ DNA Methylation-Gold kit(ZYMO)进行Bisulfite处理,使用2%琼脂糖凝胶进行片段选择,并使用QIA quick Gel Extraction kit (QIAGEN)回收目标片段。

最后使用Agilent 2100 Bioanaylzer和ABI StepOnePlus Real-Time PCR System对样品文库进行质控与定量。

合格文库采用Illumina平台进行测序。

1.2 生物信息分析概述得到下机数据后,首先进行数据过滤,去掉低质量数据,得到可用数据。

完成数据过滤后,需检测可用数据量是否符合合同要求。

检测合格后,将可用数据与参考基因组进行比对,得到比对结果。

在确认比对质量合格后,使用唯一比对数据计算得到全基因组C碱基甲基化信息,进行信息分析处理,得到标准信息分析结果和个性化分析结果。

1.3 数据过滤数据过滤包括去、污染以及低质量序列。

数据过滤分析使用华自主的分析软件,低质量的reads包括以下两类,符合任意一条的都会被剔除:1) N > 10%;2) 质量值小于20的碱基>10%。

完成过滤后的reads称为clean reads,这些数据存储为FASTQ格式(参见帮助页中的FASTQ格式)。

1.4 序列比对过滤完成后,clean data与参考基因组进行比对(BSMAP),并计算每个样品的比对率和bisulfite转化率等统计信息。

1.5 甲基化水平甲基化水平是支持甲基化的reads数占所有覆盖该位点的reads数的比例[3]。

计算公式如下:Nm为改为点是甲基化C的reads数,Nnm为该位点是非甲基化C的reads数。

1.6 DMR检测在两个样品基因组相同位置上寻找包含至少5个CG(CHG或CHH)的窗口,比较该窗口在两个样品数据中CG甲基化水平的差异,寻找在两个样品中甲基化有显著差异(2倍差异,且fisher检验P value <= 0.05)的区域即为DMR。

如果两个相邻的DMR形成的连续区域在两个样品中甲基化水平有明显差异,则这两个DMR将被合并为一个连续的DMR,否则为两个独立的DMR。

1.7 甲基化水平程度差异我们用CIRCOS比较样品间DMR的甲基化水平差异来计算两个样品之间甲基化程度的差异,两样品间某位点的甲基化水平的差异程度可以用下面的公式来计算:Rm1、Rm2分别代表样品1和样品2的mC的甲基化水平。

如果Rm1或Rm2的值为0则用0.001代替[8]。

1.8 GO注释GO(Gene Ontology,基因本体论)数据库是目前对基因功能分析的一个重要工具,GO 富集分析提供所有在DMR相关基因中有明显富集的GO term,并过滤特定生物学功能的DMR相关基因。

这个方法主要是基于GO TermFinder (/help/analyze/go-term-finder),首先将DMR相关基因比对到GO term的数据库中(/),计算每个term的基因数量,然后应用超几何检验,找出与整个基因组背景相比,在DMR相关基因中显著性富集的GO term。

我们研发了十分严格的分析方法,主要计算方法如下:N为GO注释的所有基因数,n为所有基因中与DMR相关的基因数,M为注释的某特定GO term的所有基因数,m是该特定GO term中与DMR相关的基因数。

算出的p值通过Bonferroni检验,阈值设定为p≤0.05。

满足这些条件的GO term则为显著富集。

该分析可以识别DMR相关基因行使的主要的生物学功能。

1.9 KEGG通路富集在生物体内,由于不同基因通过翻译、表达、调控、相互协调使其发挥特定的生物学功能,基于Pathway 的分析有助于更进一步了解某些基因所参与的代谢通路。

KEGG[9]是有关Pathway的主要公共数据库,Pathway显著性富集分析以KEGG Pathway为单位找出与整个基因组背景相比在DMR相关基因中显著性富集的Pathway。

主要的计算方法与GO分析相同。

二、项目流程2.1 实验流程实验过程的每个步骤(如样品制备,文库构建以及测序过程)都会影响数据质量,从而影响后续信息分析结果。

为了得到高质量测序数据,我们对实验过程的每个步骤都进行严格的质控。

建库主要步骤如下:1 DNA样品提取及检测:提取DNA,检测DNA样品的完整性、纯度和浓度等;2 文库构建:基因组DNA用Bioruptor (Diagenode, Belgium) 打断成平均大小为 250 bp的片段,DNA片段末端修复、3’端加A碱基,连接甲基化接头,采用EZ DNA Methylation-Gold kit(ZYMO)进行Bisulfite处理,2%的琼脂糖凝胶电泳,片段选择,用QIAquick Gel Extraction kit (Qiagen)回收DNA片段,PCR扩增完成文库构建;3 上机测序:质控合格的文库进行上机测序。

2.2 信息分析流程得到原始测序数据后,我们将进行相关信息分析。

人全基因组甲基化信息分析流程图三、项目结果报告3.1 数据基本处理与质控在项目中,我们对两个人的样品进行了WGBS测序,平均每个样品产出Gb原始reads,将下机数据进行过滤,包括去污染,去测序接头和低质量碱基比例过高的reads,得到clean data。

表1中列出了数据产出的概况。

图1显示的是测序碱基含量分布,图2显示的是碱基测序质量分布情况。

表1各样品测序数据量统计Clean Rate (%) = Clean Data Size (bp)/Raw Data Size (bp)图1 Clean reads的碱基含量分布图。

横坐标表示碱基在reads上的位置,纵坐标表示碱基比例,如果图中碱基分布不平衡则说明测序过程有异常情况发生。

右侧框中为样品名称,相同的样品名称出现多次是因为该样品数据来源于多个测序lane。

图 2 Clean reads碱基质量分布图。

横坐标为reads上碱基位置;纵坐标为碱基测序质量。

图中每个点表示reads中相应位置碱基的测序质量。

如果低质量碱基(Q<20)的比例过多,则测序质量较差。

相同的样品名称出现多次是因为该样品数据来源于多个测序lane。

在得到clean data之后,使用比对软件BSMAP[1]将reads比对到参考基因组上,比对结果如表2所示;之后根据需要对各个文库的reads进行去duplication处理;然后进行质控(表5)来判断测序数据质量是否达标。

参考基因组:hg19 (请按照测序物种选取相应的参考基因组,此项目以基因组hg19为参考基因组。

)表2比对结果统计Bisulfite conversion rate = 1 - methylation rate of control DNA下图为各样品的测序深度分布图,理论上,其最高点对应的测序深度与全基因组平均覆盖深度一致或接近,这个分布图可以用于反映测序是否均匀。

图3 测序深度分布。

X轴为测序深度,Y轴为该测序深度所占百分比。

根据胞嘧啶(C)序列特征可以将其分为三种类型CG, CHG和CHH(H代表A或T或C碱基)[2]。

下述图表中反映了不同C碱基类型有效测序深度的累积分布(基于有效数据计算)。

图4 C碱基测序深度的累积分布图。

横轴(x轴)表示测序深度,纵轴(y轴)表示基因组中测序深度不小于该测序深度的C碱基占全基因组全部C碱基的比例。

表3样品HCT116在全基因组及各类型调控元件范围内的覆盖度表4样品DKO在全基因组及各类型调控元件范围内的覆盖度表5各样品QC质控表3.2 全基因组甲基化水平分析用于分析的DNA样品为多细胞样品,因此C碱基的甲基化水平是一个0% ~100%范围内的数值,等于该C碱基上覆盖到的支持mC的序列数除以有效覆盖的序列总数,(详细算法请参考方法部分).通常CG甲基化存在于基因和重复序列中,在基因表达调控过程中起到非常重要的作用[3][4]。

非CG类型的序列(CHG和CHH)在基因中十分少见,主要存在于基因间区和富含重复序列的区域,在沉默转座子过程中起关键作用[2]。

表6样品HCT116全基因组及各类型调控元件范围内的甲基化水平表7样品DKO全基因组及各类型调控元件范围内的甲基化水平3.3 甲基化C碱基中CG, CHG 与CHH的分布比例mCG,mCHG和mCHH三种碱基类型的构成比例在不同物种中,甚至在同一物种不同样品中都存在很大差异。

因此,不同时间、空间、生理条件下的样品会表现出不同的甲基化图谱,各类型mC ( mCG、mCHG和mCHH ) 的数目,及其在全部mC的位点中所占的比例,在一定程度上反映了特定物种的全基因组甲基化图谱的特征。

mCG、mCHG和mCHH 分别表示表示甲基化CG、甲基化CHG和甲基化CHH。

三种碱基类型占比总和为100%,甲基化C鉴定方法依据Lister的文章描述进行[3]。

表8样品HCT116中mCG、mCHG和mCHH三种类型甲基化胞嘧啶的比例表9样品DKO中mCG、mCHG和mCHH三种类型甲基化胞嘧啶的分布图5不同序列类型甲基化C碱基的分布比例。

相关文档
最新文档