拷贝数变异的全基因组关联分析_孙玉琳(2)

合集下载

拷贝数变异及其研究进展

拷贝数变异及其研究进展

拷贝数变异及其研究进展摘要:拷贝数变异(Copy number variations, CNVs)主要指1kb-1Mb的DNA片段的缺失、插入、重复等。

文章主要介绍了CNVs的基本知识及其机理,着重介绍了其各种检测技术,并进一步阐明CNVs对人类疾病及哺乳动物疾病的影响。

此外,对其研究发展进行可行性展望。

关键词:拷贝数变异机理检测技术疾病2004年,两个独立实验小组几乎同时报道,在人类基因组中广泛存在DNA片段大小从1 kb到几个Mb范围内的拷贝数变异(CNVs)现象。

在2006 年的《Nature》杂志上,来自英国Wellcome Sanger研究所以及美国Affymetrk公司等多国研究人员组成的研究小组公布了第1张人类基因组的第1代CNV图谱,后续又有3篇文章陆续发表在《Nature Genetics》和《Genome Research》杂志上,聚焦这一重大发现。

受到检测手段的限制,这类遗传变异直到最近2年才为研究者所重视,并迅速成为当前人类遗传学研究的热点。

CNVs 最初在患者的基因组中发现,但后来发现CNVs也大量存在于正常个体的基因组内,主要引起基因(或部分基因)的缺失或增多。

拷贝数的变异过程既与疾病相关,也与基因组自身的进化有关。

针对CNVs的发现,美国遗传学家JamesR.Lupski提出“我们不能再将人与人之间的差异想当然地认为仅是单碱基突变的结果,因为还存在更复杂的来自于CNVs的结构性差异”。

Lupski认为,CNVs的发现将改变人类对遗传学领域的认知,并将影响19世纪被誉为“遗传学之父”的孟德尔及 1953年发现“DNA双螺旋”的弗兰西斯•克里克与吉姆•沃特森所确立的人类遗传学基准1 CNV概述1.1 CNV的概念基因组变异包括多种形式,包括SNPs,数目可变串联重复位点VNTRs (微卫星等),转座元件 (Alu序列等),结构变异(重复、缺失、插入等)。

CNVs指大小从1kb到1Mb 范围内亚微观片段拷贝数突变,这些拷贝片段的缺失、复制、倒置等的变异都统称为CNVs,但不包括由转座子的插人和缺失引起的基因变异(如0-6kb Kpn I重复)[1]。

拷贝数变异(CNV)的概念和影响

拷贝数变异(CNV)的概念和影响

拷贝数变异(CNV)的概念和影响拷贝数变异(CNV)是指基因组中在一些个体中重复或缺失的DNA片段,它们通常大于1 kb,可以涉及一个或多个基因。

CNV是一种常见的基因组变异,它们在人类基因组中占据约12%的区域,影响约4400个基因。

CNV可以通过不同的机制产生,如不对称的同源重组、非同源末端连接、转座等。

CNV可以影响基因的表达水平、功能和相互作用,从而导致不同的表型和性状。

CNV与许多人类疾病有关,如癌症、神经退行性疾病、自闭症等。

CNV的检测方法和挑战CNV的检测方法主要有两类:基于芯片的方法和基于测序的方法。

基于芯片的方法是利用微阵列芯片或SNP芯片对基因组进行杂交分析,根据信号强度的变化推断CNV的存在与否。

基于测序的方法是利用高通量测序技术对基因组进行测序分析,根据覆盖度或连接信息推断CNV 的位置和大小。

CNV的检测方法面临着一些挑战,如:•基于芯片的方法只能检测到比较大的CNV(>10 kb),而且受到芯片设计和分辨率的限制。

•基于测序的方法需要大量的计算资源和复杂的算法,而且受到测序深度和质量的影响。

•不同方法之间存在一定的差异和不一致,需要进行标准化和整合。

•CNV与性状之间的关联分析需要考虑多种因素,如遗传背景、环境因素、表观遗传修饰等。

CNV在英国生物数据库中的新发现在一项新的研究中,来自美国布罗德研究所、布莱根妇女医院和哈佛医学院的研究人员开发出一种计算方法,在英国生物数据库(UK Biobank)中检测到1500万个CNV,比以前对相同数据的分析结果多出六倍。

英国生物数据库是一个包含了50万名志愿者的健康和遗传信息的大型数据库,它为研究人员提供了一个研究人类性状和疾病风险的宝贵资源。

研究人员使用了一种名为cnv-scan(copy-number variant scan)的计算方法,它可以利用英国生物数据库中已有的SNP芯片数据来检测CNV。

cnv-scan方法具有以下几个特点:•它可以检测到比较小的CNV(<10 kb),并且可以区分单拷贝变异(SCN)和多拷贝变异(MCN)。

拷贝数变异名词解释

拷贝数变异名词解释

拷贝数变异名词解释
拷贝数变异是指在基因组中存在多个拷贝数不同的基因或
DNA序列。

拷贝数是指一个基因或DNA序列在某个基因组中的重复次数。

拷贝数变异可以是正常人群中的一种常见现象,也可以是导致遗传疾病的原因之一。

在正常情况下,基因组中的某些基因或DNA序列会存在多个
拷贝,这被认为是基因组进化的结果。

这些多个拷贝可能具有不同的功能或表达模式,从而为生物个体提供更多的遗传变异性。

然而,当某个基因或DNA序列的拷贝数发生异常变化时,就可能导致疾病或其他健康问题。

拷贝数变异可能呈现多种形式,包括基因缺失、重复、扩增等。

例如,当某个基因的拷贝数减少时,可能导致该基因的功能丧失或减弱,进而导致相关疾病的发生。

相反,当某个基因的拷贝数增加时,可能导致该基因的过度表达或功能改变,也可能引发疾病。

拷贝数变异的检测和研究对于理解遗传疾病的发病机制和个体差异具有重要意义。

近年来,随着高通量测序技术的发展,拷贝数变异的检测已经成为基因组研究的重要内容之一。

通过对拷贝数变异的分析,可以揭示基因组结构的变异和进化过程,也可以为疾病的诊断和治疗提供有价值的信息。

生命科学中的基因拷贝数变异研究

生命科学中的基因拷贝数变异研究

生命科学中的基因拷贝数变异研究基因是构成生命体的一项重要组成成分,它决定了一个生命体的特征、功能乃至其行为。

基因拷贝数变异是基因组结构变异中的一个重要类型,它影响基因表达、功能及与疾病相关的遗传变异和个体健康等。

因此,在生命科学研究中,基因拷贝数变异的研究十分重要。

基因拷贝数变异是指某些基因因复制过程中,发生了拷贝数的增加或减少。

这种变异形式广泛存在于不同种群的人类和动植物中,具有较高的遗传变异率和丰富的遗传多样性。

基因拷贝数变异引起的遗传多样性能量大、效应普遍,涉及生命科学的多个领域,包括细胞、分子生物学、生态学、进化等。

它们在分子分析技术的发展中也扮演了重要角色。

基因拷贝数变异是发现最早、也是研究最广泛和最容易被检测的基因组结构变异类型之一。

其中,重复数多态性(Copy Number Variation,CNV)是向来备受关注的一种,因为它的频率高、普遍性强并且对个体的表现产生深刻的影响。

CNV可以导致一个基因家族中某些成员基因数量的改变,这种变化会对人体生理学、代谢、免疫系统、身体壮年和行为产生多种复杂的影响。

基于复制数不同,CNV可以分为CNV gain(拷贝数增多型)和CNV loss(拷贝数减少型)。

增多型CNV在人群中的频率较高,是由于基因串联或基因簇在复制过程中发生多次复制导致的。

与之相反,减少型CNV则是由于基因串联或基因簇在复制过程中,减少了拷贝数,并且在人群中较为罕见。

CNV可以显性遗传和隐性遗传,隐性遗传的CNV具有一定的复杂性。

从遗传学角度讲,基因拷贝数变异对基因表达量和功能的调节能力十分重要,因为拷贝数增加或减少可能对基因的转录、表达和调控产生深刻影响。

同时,这种变异也受到环境因素、年龄、种族和性别等因素的调节。

CNV可以分为重复内部CNV和重复终止CNV。

重复内部CNV指由两个相同类型的基因的反向定向、反向复制构成,这会导致两个基因在某些人中存在多份拷贝。

重复终止CNV指基因的相同部分在定向和复制时存在问题,在某些人中不复制或少复制,导致其基因数量减少。

遗传咨询与处理:临床意义不明的染色体拷贝数变异 PPT课件

遗传咨询与处理:临床意义不明的染色体拷贝数变异 PPT课件
遗传咨询与处理:临床意义不明的染色体拷贝数变异
蒋宇林 北京协和医院妇产科 2018年11月
出生缺陷往往是由多种遗传异常疾病构成的
• 各种新生儿和儿童期可识别的出生缺陷约有40%
左右存在染色体或基因层面的异常
• 21三体综合征 • 其他染色体数目的异常 • 染色体微小缺失或重复综合征 • 新发或遗传性的基因突变导致的基因病

较常见的微缺失综合征,发生率1/25000 17p11.2缺失导致 产前临床表现:无报道 产后临床表现::发育迟缓、智力迟滞、行为异常等
§ 小头畸形,联眉,内眦赘皮, § 入睡困难,易激惹、注意力低下,自残行为,痛阈低下,剔甲癖等
J Med Genet,1999,36:394-397 BMC Medical Genetics,2010,11:142-146
倍体性异常和 大片段结构异常
染色体核型分析
染色体微缺失和微重 复异常
基因外显子缺失和 基因序列变异
染色体微阵列分析
测序和PCR



• 那些核型无法检测的染色体小片段改变与孕 妇年龄无关,所以Microarray适用于所有需 要产前诊断的孕妇人群
• 对于胎儿存在一个或多个超声结构异常的情 形,应该建议Microarray检查,并可取代核 型分析检测
— 不能明确意义的拷贝数改变(VOUS)对产前咨询带来的挑战 — 产前对于偏致病性的片段改变,进行生后表型预测的困难性


判读结果 明确致病性
标准
• 多篇独立的文献报道明确的致病性 • 较大的染色体片段CNV,虽然未在医学文献中报道,但全覆盖一个较小
的且明确致病的区域位点 • 核型分析可见的染色体片段结构异常,但对于没有明确涉及相关综合征

拷贝数变异分析流程

拷贝数变异分析流程

拷贝数变异分析流程下载温馨提示:该文档是我店铺精心编制而成,希望大家下载以后,能够帮助大家解决实际的问题。

文档下载后可定制随意修改,请根据实际需要进行相应的调整和使用,谢谢!并且,本店铺为大家提供各种各样类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,如想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by theeditor. I hope that after you download them,they can help yousolve practical problems. The document can be customized andmodified after downloading,please adjust and use it according toactual needs, thank you!In addition, our shop provides you with various types ofpractical materials,such as educational essays, diaryappreciation,sentence excerpts,ancient poems,classic articles,topic composition,work summary,word parsing,copy excerpts,other materials and so on,want to know different data formats andwriting methods,please pay attention!1. 数据准备:收集样本的基因组数据,通常是通过测序技术获得的。

基因组拷贝数变异与生物学功能研究

基因组拷贝数变异与生物学功能研究

基因组拷贝数变异与生物学功能研究基因组拷贝数变异(Copy Number Variations, CNVs)是指基因组中重复序列的变异,导致某个基因在个体间存在不同的复制数。

CNVs在人类基因组研究中的重要性越来越被重视。

一方面,CNVs是人类基因组演化过程中的重要驱动力之一。

一些CNVs具有很高的频率,表明它们在进化中具有某种重要的功能。

另一方面,CNVs也是复杂疾病的潜在遗传因素。

一些CNVs 与多种复杂疾病如自闭症、癌症、精神疾病、肥胖症等相关。

因此,CNVs引起了生物学家们的强烈兴趣。

他们试图揭示CNVs的分布规律、功能以及其与疾病之间的关系。

下面,我们将从这三个方面分别进行详细阐述。

一、CNVs的分布规律CNVs的分布比较复杂,既存在与物种进化相关的范式,也存在与人类特有的复杂性疾病相关的特点。

随着近年来CNVs的高通量发现技术的不断发展,生物学家们已经发现越来越多的CNVs。

据目前公布的数据库显示,人类基因组中CNVs的数量已经超过30万个。

CNVs的分布与以下因素有关:1. 位置CNVs分布于多种基因区域中,包括编码区(包括外显子、内含子、启动子等)、非编码区(包括LncRNA、miRNA等)、基因沉默区(DNA甲基化高频区)等。

根据甲基化的状态,这些区域可能具有不同的基因表达水平。

2. 大小CNVs的大小从数百至数千kb之间不等。

小于1kb的变异通常被视为单核苷酸多态性(Single Nucleotide Polymorphisms,SNPs)。

3. 频率CNVs的频率可能很高,如LCT反转子(lactase persistence),在欧洲、中东以及印度等区域的差异可能达到90%以上。

也有一些CNVs具有较低的频率,可能只在某些家族或种群中发现。

二、CNVs的功能CNVs的功能是CNVs 研究中的热点之一。

CNVs 可信赖的功能预测是深化我们对基因组结构与功能的理解的前提。

截至目前,已经发现一些CNVs能够对表型产生有效的影响。

拷贝数变异(CNV)

拷贝数变异(CNV)

拷贝数变异(CNV)人类基因组由23对染色体中的60亿个碱基(或核苷酸)组成。

正常人类基因组成分通常是以2个拷贝存在,分别来自父母。

拷贝数变异(CNV)是由基因组发生重排而导致的,一般指长度为1kb以上的基因组大片段的拷贝数增加或者减少,主要表现为亚显微水平的缺失和重复,是人类疾病的重要致病因素之一。

异常的DNA拷贝数变化(CNV)是许多人类疾病(如癌症、遗传性疾病、心血管疾病)的一种重要分子机制。

作为疾病的一项生物标志,染色体水平的缺失、扩增等变化已成为许多疾病研究的热点,然而传统的方法(比如G显带,FISH,CGH等)存在操作繁琐,分辨率低等问题,难以提供变异区段的具体信息。

CNV,即拷贝数变异,一般指长度为1kb到几个Mb基因组大片段的拷贝数复制、缺失。

CNV被定义为一段至少1kb大小DNA的拷贝数,与具有代表性的参考基因组拷贝数不同。

CNV在基因组中的存在形式主要有以下几种:2条同源染色体拷贝数同时出现缺失;1条同源染色体发生缺失,1条正常;1条同源染色体出现拷贝数重复,另1条正常;1条同源染色体出现缺失,另1条出现拷贝数重复;2条同源染色体同时出现拷贝数重复。

染色体拷贝数变异(CNV)检测:NIPT技术目前医院临床应用的为普通NIPT技术,商业上还有通过增加测序数据的升级版的NIPT产品(可以检测染色体微缺失/微重复和某些单基因病)。

对于NIPT提示的CNV可以分为两种:母源性CNV,就是母亲存在CNV(此时胎儿50%可能存在相同的CNV,50%可能不存在该CNV);第二种,胎儿CNV。

母源性CNV的阳性预测值(PPV)接近100%,因为母源游离DNA占比90%,因此阳性预测值(PPV)很高就不足为奇。

但是不同的检测机构或者有些已发表文献,并不提示母源性CNV。

对于母源性CNV,胎儿无非两种情况,和母亲一样拥有同样的CNV,或不含有该CNV。

在临床咨询中,对于这种来源于母源或父源CNV,如果父母本身没有任何表型,胎儿本身也不存在超声结构异常,我们大多认为偏良性。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
早在 20 世纪 80 年代,人们已经发现基因组中 存在多种类型的染色体数目和结构变异.2004 年, Iafrate 和 Sebat 各自所在的研究小组首次在人类基 因组中描述了拷贝数变异(copy number variations, CNVs)的存在[2, 3].它是指与参考序列相比,基因组 中≥1 kb 的 DNA 片段插入、缺失和 / 或扩增,及 其 互 相 组 合 衍 生 出 的 复 杂 染 色 体 结 构 变 异 [4]. 随 后,2006 年 Redon 等[4]在 HapMap 计划的 270 名正 常 健 康 供 者 中 鉴 定 到 1 447 个 CNV 区 域 (CNV region,CNVR),它们覆盖了 12%(300 Mb)的人类 基因组,而且与基因组变异和疾病致病 / 易感基因 位点相关.这些结果提示,CNVs 可能像 SNPs 一 样影响着基因的表达、表型的变异和适应,因此也
是一种重要的疾病易感变异,能引起疾病或增加复 杂疾病的发病风险[1, 4].因此,在随后的两年中,多 种常见复杂疾病的全基因组 CNVs 分析结果相继出 现 , “ CNV 全 基 因 组 关 联 分 析 (CNV association analysis)”的概念也日趋成熟[5].本文就 CNVs 的人 群遗传学特点,CNV 全基因组关联分析的研究策 略和方法及其在疾病易感基因鉴定中的应用等问题 简要综述.
在人群之间的传递相对稳定,符合 Hardy-Weinberg 平衡定律.两个不同个体之间的 CNVs 变化不足 0.5%,而只有不到 1%的 CNVs 无法通过同一等位 基因的简单遗传方式来解释.因此,相对于 SNPs 的概念,将人群中等位基因频率 > 1%的 CNVs 定 义为基因组拷贝数多态(copy number polymorphisms, CNPs),90%以上的 CNVs 属于这一类型,而 < 1% 的 CNVs 称为罕见 CNVs.应用一定的算法,可以 将 CNPs 划 分 为 双 等 位 或 多 等 位 位 点 (~10% 的 CNVs)[6].其中双等位缺失位点可以有 0、1、2 三 种拷贝数,代表三种基因型,相应的,双等位扩增 位点可以有 2、3、4 三种基因型.而多等位位点可 以有比较复杂的拷贝数变化范围,可以通过降维 (比如将≥4 的拷贝数合并为 1 个值)等方法来处 理.将 CNVs 理解为数量性状位点,有利于阐述各 种 CNVs 的遗传力.
CNV 数目
含 CNV 的基因数
染色体编码基因数
染色体全长(Mb)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 X Y 合计
1 518 1 402 1 139 1 411 1 000 1 073 1 251 1 177
985 893 921 898 509 544 774 731 668 426 700 454 255 470 524
摘要 基因组拷贝数变异(copy number variations,CNVs)是指与基因组参考序列相比,基因组中≥1 kb 的 DNA 片段插入、 缺失和 / 或扩增,及其互相组合衍生出的复杂变异.由于其具有分布范围广、可遗传、相对稳定和高度异质性等特点,目前 认为,CNVs 是一种新的可以作为疾病易感标志的基因组 DNA 多态性,其变异引起的基因剂量改变可以导致表型改变.最 近,一种基于 CNVs 的新的疾病易感基因鉴定策略—— —CNV 全基因组关联分析开始出现,这一策略和传统的基于单核苷酸 多态性的关联分析具有互补性,通过认识基因组结构变异可以认识复杂疾病的分子机制和遗传基础.
* 国家高技术研究发展计划(863)(2006AA02Z19B, 2008DFA31130) 和国家自然科学基金(30721001, 30772507)资助项目. ** 通讯联系人. Tel: 010-67709015, E-mail: zhaoxh@ 收稿日期:2008-12-25,接受日期:2009-05-26
关键词 拷贝数变异,全基因组关联分析,单核苷酸多态性,遗传标志,复杂疾病
学科分类号 Q39,Q75
DOI: 10.3724/SP.J.1206.2008.00881
目前,以第三代遗传标志— ——单核苷酸多态性 (single nucleotide polymorphism,SNP)为基础的 全 基 因 组 关 联 分 析 (genome-wide association studies, GWAS)已经成为研究常见复杂疾病遗传易感性的 主要手段.近些年来,利用这一方法人们已经成功 地将上百个临床表型与常见序列多态联系起来,鉴 定了 200 个以上的疾病易感基因或染色体相关区 段.然而,人们随后惊讶地发现,这些位点或区段 仅仅能够解释大约 2%~15%的疾病家族聚集性原 因[1].人类遗传学研究面临的另一个挑战是如何解 释其余的遗传变异,甚至是散发性疾病的分子 基础.
2009; 36 (8)
孙玉琳等:拷贝数变异的全基因组关联分析
·969·
Table 1 The numbers of CNVs and their involved genes in each chromosome in human 表 1 人类基因组各条染色体上的 CNVs 数目及涉及基因数
染色体
另外,利用父母 - 子女三人同胞对(Trios)样本 分析时发现,子女中绝大多数的 CNVs 遗传自父 母,这些位点成为遗传性 CNVs( inherited CNVs), 而新发生的与父母染色体同源序列重合率 < 50%的 CNV,称为新的 CNV 或新的拷贝数突变(De novo CNVs,or De novo CN mutations)[9].遗传性 CNVs 通常是某些疾病具有家族聚集性的遗传学基础,而
图中每条染色体右侧的蓝线代表一个相应位置的 CNVs(数据来自 DGV 数据库).
ABCD 参考序列
ABCCD 重复片段倍增—— —双等位 CNV(C)2
ABCCCD 多等位 CNV(C)0~n ABCDDDDCDCDCD 复杂 CNV(D)4(CD)3
CCC 插入(C)1~n
Fig. 2 Categories of CNVs[8] 图 2 CNVs 的几种组成形式[8]
69 19 792
724 447 344 263 314 295 399 288 307 257 466 312 106 170 231 396 477 97 615 193 81 224 224 35 7 265
2 107 1 340 1 096
777 893 1 087 988 732 848 812 1 363 1 056 353 639 655 900 1 230 286 1 453 578 253 504 868 89 20 907
目 前 的 研 究 发 现 , CNVs 既 可 以 是 简 单 的
DNA 结构变化(如单一片段的扩增、缺失、插入), 也可以是复杂的染色体扩增、缺失和插入的各种组 合形式(图 2).非等位基因同源重组和非同源末端 连接可能在 CNVs 的形成中发挥重要作用,尤其是 前者.Redon 等[4]根据 CNVs 的遗传和组成形式, 将 CNVs 分为 5 类:a.缺失,b.扩增,c.同一 位 点 并 发 的 缺 失 与 扩 增 , d. 多 等 位 基 因 位 点 , e.复杂难以描述的位点.通常,扩增比缺失更为 常见,并覆盖更大的范围,这主要是因为染色体大 片段缺失通常会引起更为严重的表型后果,甚至会 造成携带该变异的胎儿致死,难以在进化中保留下 来.另外一个与 CNVs 相关的概念是重复片段倍增 (segmental duplication,SDs),它是指 参 考 基 因 组 序列中出现 DNA 片段长度 > 1 kb 的两个或两个以 上拷贝,不同拷贝之间的序列同源性 > 90%[4, 7].全 基因组中 SDs 的密度约是 4%~5%,而 CNVs 富集 区的 SDs 平均密度约 25%,CNVs 稀有区的平均密 度近 2%~3%.因此,CNVs 和 SDs 的发生具有高 度相关性,表明两者可能具有相似的发生学基础. 目前认为 SDs 也是 CNVs 的一种组成形式[7].
·970·
生物化学与生物物理进展 Prog. Biochem. Biophys.
2009; 36 (8)
1 2 3 4 5 6 7 8 9 10 11 X 12 13 14 15 16 17 18 19 20 21 22 Y
Fig. 1 The distribution of CNVs in human genome 图 1 CNVs 在人类基因组中的分布
2009; 36 (8)
孙玉琳等:拷贝数变异的全基因组关联分析
1.3 CNVs 具有可遗传性、相对稳定性和高度异 质性
CNVs 除了具有上面提到的覆盖范围广、组成 形式多样的特点以外,还具有其作为疾病易感标志 的三个重要特点— ——可遗传性、相对稳定性和高度 异质性.近期 McCarroll 等[6]对 HapMap 计划 270 名个体的高分辨 CNVs 研究结果显示,正常个体中 的绝大多数 CNVs 遵从孟德尔遗传规律,而且它们
Reviews and Monographs ress in Biochemistry and Biophysics 2009, 36(8): 968~977
拷贝数变异的全基因组关联分析 *
孙玉琳 刘 飞 赵晓航 **
(中国医学科学院北京协和医学院,肿瘤医院肿瘤研究所,分子肿瘤学国家重点实验室,北京 100021)
尽管如此,虽然目前发现的人类基因组中 CNVs 的个数远远低 于 ~1 200 万 的 SNPs ( 图 1), 但是,它们覆盖的染色体长度至少达到 150 Mb, 这也是目前任何一种遗传标志都不能比拟的.另 外,CNVs 在染色体上的分布具有非随机性,它与 其他的基因组特征,如外显子、可移动元件(如 Alu 重复序列)等密切相关,而这些基因组特征通 常是导致疾病发生的遗传学基础之一.此外,它们 的分布还具有明显的富集区和稀有区,例如人类染 色 体 上 有 250 Mb 的 区 域 超 过 50% 的 序 列 发 生 CNVs,而有 60 Mb 的区域 90%以上的序列位于 CNV 中.这些富集区主要集中在近着丝粒和亚端 粒区等具有高度多态和进化不稳定的区域[4]. 1.2 CNV 的组成形式
相关文档
最新文档