高通量测序的生物信息学分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

附件三生物信息学分析

一、基础生物信息学分析

1.有效测序序列结果统计

有效测序序列:所有含样品barcode(标签序列)的测序序列。

统计该部分序列的长度分布情况。

注:合同中约定测序序列条数以有效测序序列为准。

图形示例为:

2.优质序列统计

优质序列:有效测序序列中含有特异性扩增引物、不含模糊碱基、长度大于可供分析标准的序列。

统计该部分序列的长度分布情况。

图形示例为:

3.各样本序列数目统计:

统计各个样本所含有效测序序列和优质序列数目。

结果示例为:

样品有效序列优质序列

A

B

4.OTU生成:

根据序列的相似性,将序列归为多个OTU(操作分类单元),以便后续分析。

OTU name A B C D E F G H

OTU1 149 410 27 252 45 124 136 101

OTU2 0 0 0 0 0 0 0 0

OTU3 2 3 14 23 1 5 17 29

OTU4 0 47 0 11 0 5 1 7

OTU5 19 28 82 9 57 45 303 9

OTU6 0 0 0 0 0 0 0 0

OTU7 0 182 94 24 14 5 12 60

OTU8 0 0 0 0 0 0 0 0

...... …………………………………………

5.稀释曲线(rarefaction 分析)

根据第4条中获得的OTU数据,做出每个样品的Rarefaction曲线。本合同默认生成OTU相似水平为0.03的rarefaction曲线。

rarefaction曲线结果示例:

6.指数分析

计算各个样品的相关分析指数,包括:

•丰度指数:ace\chao

•多样性指数:shannon\simpson

•本合同默认生成OTU相似水平为0.03的上述指数值。

多样性指数分析结果示例:

注:默认分析以上所列指数,如有特殊需要请说明。

7.Shannon-Wiener曲线

利用各样品的测序量在不同测序深度时的微生物多样性指数构建曲线,反映各样本在不同测序数量时的微生物多样性。当曲线趋向平坦时,说明测序数据量足够大,可以反映样品中绝大多数的微生物信息。绘制默认水平为:0.03。

例图:

8.Rank_Abuance 曲线

根据各样品的OTU丰度大小排序作丰度分布曲线图。结果文件默认为PDF格式(其它格式请注明)。

例图:

9.Specaccum物种累积曲线(大于10个样品)

物种累积曲线( species accumulation curves) 用于描述随着抽样量的加大物种增加的状况,是理解调查样地物种组成和预测物种丰富度的有效工具,在生物多样性和群落调查中,被广泛用于抽样量充分性的判断以及物种丰富度( species richness) 的估计。因此,通过物种累积曲线不仅可以判断抽样量是否

充分,在抽样量充分的前提下,运用物种累积曲线还可以对物种丰富度进行预测。

10.样品OTU分布及分类学信息

OTU产生后,统计各个样品含有OTU情况及每个OTU中含有序列的数目。同时,将所有序列与Silva库比对,得到序列的分类学信息。通过寻找最近祖先方法,得到每个OTU的分类学信息。本合同默认分析相似性水平为0.03的OTU。

结果为一份xls文件,文件内容示例为:

第一列为OTU编号,第一行为各个样品名称,中间数字表示该列样品在此行OTU中所占的序列数目,最后一列为该行OTU的种属信息。

二、高级生物信息学分析

11.OTU 分布VENN图

注:选择一组不多于五个样品,分析样品间OTU重合情况,将结果以VENN图形式展示。结果

文件默认为PDF格式(其它格式请注明)。

例图:

12.多样品相似度树状图I (样品无分组)

注:选定需要分析的多个样品作为一组对比分析,使用jest算法,比较该组分析中各样品在OTU

(0.03)水平上的群落结构相似度并作出树状图。结果文件默认为PDF格式(其它格式请注明)。

例图:

13.多样品相似度树状图II (样品有分组)

注:选定需要分析的多个样品作为一组对比分析,使用jest算法,比较该组分析中各样品在OTU

(0.03)水平上的群落结构相似度并作出树状图。结果文件默认为PDF格式(其它格式请注明)。

例图:

14.群落结构组组分图(共__N__组分析)

注:选定一个或多个需要分析的样品,选定一个分类学水平,按照相应多样性信息作图,反应各样品的群落结构。结果文件默认为PDF格式(其它格式请注明)。

可选分类学水平:门、纲、目、科、属;同一组样品选择多个分类学水平为多组分析。

例图:

15.多样品相似度树与柱状图组合分析(默认提供门的水平)

左边是样品间基于群落组成的层次聚类分析,右边是样品的群落结构柱状图。

16.PCA主成分分析Ⅰ(样品无分组)

选取多个样品,进行PCA分析。结果文件默认为PDF格式(其它格式请注明)。

例图:

17.PCA主成分分析Ⅱ(样品有分组信息)

选取多个样品,进行PCA分析。结果文件默认为PDF格式(其它格式请注明)。

例图:

18.群落Heatmap图(确定分类学水平及图片颜色)

选择多个样品,作出其在选定的分类学水平上群落结构Heatmap图。结果文件默认为PDF格式(其它格式请注明)。图形颜色默认为彩虹色,如需选黑红色请标明。

相关文档
最新文档