基因组测序和疾病变异检测

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

SNV
提供的变异信息非常丰富, 主要用来检测体细胞突变
需输入转换格式后的比对结 果,耗费更大的存储,过程 也比较繁琐
GATK
Dindels
Indels
工具包功能强大,能对比对 结果进行多项校正,并且有 结果相对准确,能检测群体 多种变异检测模式,能检测 的indels SNV和indel还有体细胞突变
基因组测序和疾病变异检测
大纲
遗传疾病基因组研究概况
SNV和indel研究的意义
SNV和indel检测上机
2
理论


研究概况 基本概念 全基因组测序 外显子捕获 软件比较
3
人类疾病分类
其它 癌症 心血管疾病
15%
精神障碍类疾病
19%
51%
15%
4
遗传疾病分类
染色体 病或染 色体综 合征
结果仍然有一定的假阳性
步骤繁琐,处理时间长,需 要的计算资源大
20
上机


测序数据处理 参考序列处理 比对到参考序列 局部比对 SNV Calling Indes Calling 注释
21
去接头
22
原则

N碱基的数量超过10% 质量值小于5的碱基数量超过50% 序列中含有adapter
单基因 病
遗传类 疾病
多基因 病
癌症
5
遗传疾病基因组研究手段
疾病类型
单基因病
测序手段
高层数外显子捕获
检测变异类型
SNV,小indel
多基因病
全基因组测序(高,低层数),高层数 CNV,SV,SNV,小indel 外显子捕获
癌症
全基因组测序(高,低层数),高层数 CNV,SV,SNV,小indel 外显子捕获
小卫星DNA
LINE
DNA转座子
15
外显子捕获
16
17
外显子捕获 or 全基因组序列
Sequencing byห้องสมุดไป่ตู้illumina
下载参考序列
SNV&Indels 检测分析 框架图
Remove adapter
参考序列索引
Alignment to referenceuse BWA
Sort and rmdup use samtools
低层数大插入片段全基因组测序 染色体拷贝
染色体病
6
通过SNV和indel研究发现膀胱癌和染色质重塑密切相关
7
通过SNV和indel研究发现肾癌和泛素介导的蛋白降解通路(UMPP)密切相关
8
已经找到的一些癌症药靶基因
9
中心法则
10
11
基因组变异类型
12
全基因组测序
13
全基因组数据分析
14
人类基因组的组成
人类基因组 3000Mb
基因和基因 相关序列 900Mb
基因外DNA 2100Mb
编码DNA 90Mb
非编码DNA 810Mb
单拷贝和低 拷贝DNA 1680Mb
重复DNA 420Mb
拟基因
基因片段
内含子,前 导区
串联重复
散布于整个 基因组的重 复
卫星DNA
微卫星DNA
LTR元件
SINE
23
比对

BWA SOAP

Bowtie LastZ
24
Sam格式比对结果
25
比对结果可视化
samtools tview *.bam <genome.fasta>
Press “g”
示例位点: chr1:808922
26
Press ‘b’ :Color for base quality Press ‘m’ :Color for mapping quality
Local realignment use GATK
SNV and Indel detectuse GATK
SNVs and smallIndels
Annotation use SIFT
18
基因组的深度分布图
19
软件比较
Varscan samtools
BWA配套软件,处理比对信 息非常方便
提供的变异信息比较少,给 后期的数据处理造成一定困 难
Blue: 0-9 Green: 10-19 Yellow: 20-29 White: >=30
27
Pileup格式
28
SIFT
29
30
Result
31
FP & FN
32
生物信息分析软件
网站:http://www.molgenis.org/
33
34
35
相关文档
最新文档