人类遗传变异-拷贝数变异(CNVs)和疾病研究及检测
拷贝数变异在妇科恶性肿瘤中的研究进展

拷贝数变异在妇科恶性肿瘤中的研究进展康雅芳;孙蓬明【摘要】Copy number variations (CNVs) can serve as significant disease susceptibility markers in many disorders. The availability of a large number of chromosomal copy number profiles in both malignant and normal tissues in cancer patients presents an opportunity to characterize not only somatic alterations but also germline CNVs, which may confer increased risk for cancer. The determination methods of CNVs mainly includes the gene chip technology, high throughput sequencing, real-time quantitative PCR and FISH, etc. The most important method is the gene chip technology. At present the study of CNVs in gynecologic malignant tumor is relatively limited. The article focus on researching that CNVs is closely related to some tumor disease of gynaecology, such as ovarian cancer, cervical cancer, endometrial cancer. Comprehensive mining of copy number variations and bioinformatics analysis, understanding of the progress of the gynecological malignant tumors, degradation mechanism, and provide new ideas and methods for tumor prevention, diagnosis and treatment.%在许多疾病中,拷贝数变异(copy number variations,CNVs)可作为有意义的疾病易感标志。
基因组拷贝数变异及其突变机理与人类疾病

综 述
基 因组拷 贝数 变异 及其 突变机 理 与人 类疾病
杜仁骞 , 力 1, 金 , ,张锋 2 3 ,
1 .复 旦大 学生命 科学 学 院现代人 类 学教育 部重 点实 验室 ,上海 2 0 3 04 3
2 .复 旦大 学生命 科学 学 院遗传 工程 国家重 点实 验室 ,上海 2 0 3 ; 04 3
Ab t a t C p u e ait n(NV)s h i p f t c r aiin(v cue ygn mi rarn e n, sr c : o yn mb r r i C v ao itemant eo r t evr t s ) a sdb eo c er g met y su u ao a
rc g i da n f h i g n t a tr u d r ig h ma i ae . h t inrt p rl U ) f NV i mu h e o nz so eo e e t ma e e cfc s n el n u nd s s s T emua o e(e C S o n i o y e t a O C c S
2 Sae y a oao G n t gn eig S h o L eS i csFua nvri , h n h i 0 4 3 C ia .tt L b r tr o e eiEn ier ,c o l i ce e, d nU i sy S ag a 0 3 , hn ; Ke yf c n f o f n e t 2 3 Isi tsfBo dc l c n e, d nU iest, h n h i 0 0 2 C ia .ntue ime i i csFua nvri S a g a 0 3 , hn t o aSe y 2
生物信息学研究进展之人类基因组拷贝数变异与复杂疾病

2008年8月的一项研究发现,克罗恩病和IRGM基因 (与对抗侵入性细菌有关)上游区域20,000碱基对的缺 失之间存在相关。
2008年9月的一项研究证实了早先的发现,表明在 22号染色体的一个区域有长度为3百万碱基对缺失的人三 成患有精神疾病,像自闭症和精神分裂症。
2009 年 1 月 另 有 研 究 发 现 , 体 重 指 数 和 一 个 称 为 NEGR1的基因中45,000个碱基对缺失具有很高的相关性, 这个基因影响调节饥饿感和代谢的下丘脑的神经生长。
What makes humans unique?
美国科学家对比研究了人类和其它灵 长类动物的基因组,发现这可能是因为 人类某些基因的拷贝数与其它动物有很 大不同。
这一发现将有助于人们对疾病、寿命 等展开更深入的研究。相关论文发表于 2007年7月31日的Genome Research上。
以前的报道认为,CNVs之所以普遍存在是因为它对人 类的健康和进化有益。
生物信息学研究进展
拷贝数变异(CNVs)
(1860-1902年)
安妮-琼斯是美国一位长 有大胡子的女子,她是巴尔 努穆杂技团的亮点人物。
成年之后,她成为美国 最著名的“胡须女子”,并 作为杂技团“畸形人”的代 言人。她曾在俄罗斯进行巡 回表演,并以耶稣形象作为 绘画模特。
后期琼斯成为一位音乐家, 1902年,琼斯死于肺结核。
典型地,假如一个基因组含有某个基因的三份拷贝, 而不是正常的两份(分别来自父母),那么细胞就会用三 份拷贝都来生产、达并非总是如此,细胞不管怎样 还是维持正确的量;CNVs对调控另外的基因表达的DNA 区域有影响,使问题更加复杂。
尽管如此,科学家们已经将CNVs和一些复杂的疾病联 系起来。
cnvs基本概念及研究

CNVs 定义
拷贝数变异(CNVs) CNVs是人类基因组内从1 kb到几个Mb的DNA片段拷贝数的不同,包括 DNA片段的删除、插入、复制和复合多位点的变 异等类型。以往一直认为DNA的SNPs是遗传变 异最常见的形式,而当前的研究表明CNVs不仅广 泛存在于正常个体,且在整个基因组中覆盖的核 苷酸总数至少是SNPs的3倍,可见CNVs可能在 遗传变异和物种进化方面比SNPs起着更为重要的 作用,是今后研究包括眼病在内的人类疾病的热 点
目前cnvs与snp研究
对于复杂疾病来讲,由于致病性变异可能分 布在不同的染色体上,因此以 SNPs 为基础 的关联分析对疾病易感位点的检出能力有限, 即单一位点的 SNPs 等位基因无法有效地将 受累个体和健康对照区分开来. 然而,对于 致病性 CNVs 来说,则不存在这样的问 题. 因为CNVs 引起的基因剂量改变足以改 变表型. 所以拷贝数变异的全基因组关联分 析更容易鉴定到致病突变.
CNVS与疾病
CNVs 通过扰乱基因活性和改变基因剂量来影响 基因表达、表型差异和表型适应, 从而引起疾病。 基因拷贝数变异是个体之间在基因组序列差异上 的一个重要源泉,是研究基因组进化和表型差异 的一个重要因素。许多关于基因拷贝数变异的研 究结果表明,拷贝数变异可导致不同程度的基因 表达差异,对正常表型的构成及疾病的发生发展 具有一定作用。
CNV 的组成形式
CNVs 既 可 以 是 简 单 的DNA 结构变化(如单一 片段的扩增、缺失、插入),也可以是复杂的染色体 扩增、缺失和插入的各种组合形式. Redon 等根据 CNVs 的遗传和组成形式,将 CNVs 分为 5 类: a. 缺失,b. 扩增,c. 同一位点并发的缺失与扩 增,d. 多等位基因位点,e. 复杂难以描述的位 点. 通常,扩增比缺失更为常见,并覆盖更大的范 围,这主要是因为染色体大片段缺失通常会引起更 为严重的表型后果,难以在进化中保留下来.
不可不看的CNV全解析

不可不看的CNV全解析导读拷贝数变异(Copy number variation,CNV)是由基因组发生重排而导致的,一般指长度为1kb以上的基因组大片段拷贝数的增加或减少,主要表现为亚显微水平的缺失或重复。
这种变异既有个体的正常多态性变异,也有致病性的变异[1]。
目前,按照CNV是否致病可分为致病性CNV、非致病性CNV和不明临床意义CNV。
对于如何解读检测出的CNV临床意义,长期困扰着临床医生。
1拷贝数变异概念拷贝数目变异也称拷贝数目多态,是一种长度大于1kb的DNA片段的变异,在人类基因组中广泛分布,CNV位点的突变率远高于SNP (Single nucleotide polymorphism),是人类疾病的重要致病因素之一。
2检测方法目前全基因组检测方法主要有微阵列比较基因组杂交(Array CGH)和最新的基于高通量测序技术的染色体异常检测(NGS染色体异常检测)。
两种技术相比较:由于Array CGH是在已知探针前提下进行检测,所以无法检测出未知的CNV;成本偏高,受检者负担较重;而NGS染色体异常检测为最新的CNV检测技术,对样本要求较低,能发现更多的新变异CNV,在国内临床已得到广泛应用。
关于检测出CNV的遗传咨询,是目前临床医生的一个难点,特别是对于不明临床意义的CNV。
希望通过以下两篇关于CNV解读的文章为临床医生的遗传咨询提供参考,以便更好的与患者及其家属沟通。
3CNV解读流程(1)欧洲人类遗传学杂志发表的一篇关于CNV解读流程的文章[2],该文章把CNV解读过程分为五步,以此进行CNV解读。
图1 CNV解读流程[2]第一步:得到CNV结果,与序列数据库进行比对,能比对到数据库中,人群分别频率n≥1%,说明CNV为人群中比较常见多态性即非致病性CNV。
对于没有比对到数据库中的结果进行下一步;第二步:与基因组变异数据库(Database of Genomic Variants)比对,数据库中出现正常次数n≥3,表明CNV为正常多态性即非致病性CNV。
拷贝数变异(CNV)的概念和影响

拷贝数变异(CNV)的概念和影响拷贝数变异(CNV)是指基因组中在一些个体中重复或缺失的DNA片段,它们通常大于1 kb,可以涉及一个或多个基因。
CNV是一种常见的基因组变异,它们在人类基因组中占据约12%的区域,影响约4400个基因。
CNV可以通过不同的机制产生,如不对称的同源重组、非同源末端连接、转座等。
CNV可以影响基因的表达水平、功能和相互作用,从而导致不同的表型和性状。
CNV与许多人类疾病有关,如癌症、神经退行性疾病、自闭症等。
CNV的检测方法和挑战CNV的检测方法主要有两类:基于芯片的方法和基于测序的方法。
基于芯片的方法是利用微阵列芯片或SNP芯片对基因组进行杂交分析,根据信号强度的变化推断CNV的存在与否。
基于测序的方法是利用高通量测序技术对基因组进行测序分析,根据覆盖度或连接信息推断CNV 的位置和大小。
CNV的检测方法面临着一些挑战,如:•基于芯片的方法只能检测到比较大的CNV(>10 kb),而且受到芯片设计和分辨率的限制。
•基于测序的方法需要大量的计算资源和复杂的算法,而且受到测序深度和质量的影响。
•不同方法之间存在一定的差异和不一致,需要进行标准化和整合。
•CNV与性状之间的关联分析需要考虑多种因素,如遗传背景、环境因素、表观遗传修饰等。
CNV在英国生物数据库中的新发现在一项新的研究中,来自美国布罗德研究所、布莱根妇女医院和哈佛医学院的研究人员开发出一种计算方法,在英国生物数据库(UK Biobank)中检测到1500万个CNV,比以前对相同数据的分析结果多出六倍。
英国生物数据库是一个包含了50万名志愿者的健康和遗传信息的大型数据库,它为研究人员提供了一个研究人类性状和疾病风险的宝贵资源。
研究人员使用了一种名为cnv-scan(copy-number variant scan)的计算方法,它可以利用英国生物数据库中已有的SNP芯片数据来检测CNV。
cnv-scan方法具有以下几个特点:•它可以检测到比较小的CNV(<10 kb),并且可以区分单拷贝变异(SCN)和多拷贝变异(MCN)。
DNA拷贝数变异CNV检测——基础概念篇

DNA拷贝数变异CNV检测——基础概念篇⼀、CNV 简介拷贝数异常(copy number variations, CNVs)是属于基因组结构变异(structural variation),根据⼤⼩可分为两个层次:显微⽔平(microscopic)和亚显微⽔平(submicroscopic)。
显微⽔平的基因组结构变异主要是指显微镜下可见的染⾊体畸变, 包括整倍体或⾮整倍体、缺失、插⼊、倒位、易位、脆性位点等结构变异。
亚微⽔平的基因组结构变异是指 DNA ⽚段长度在 1Kb-3Mb 的基因组结构变异, 包括缺失、插⼊、重复、重排、倒位、DNA 拷贝数⽬变化等,这些统称为 CNV (也称为拷贝数多态性(copy number polymorphisms, CNPs)。
CNVs最初是在病⼈的基因组中发现, 但后来的研究表明在正常⼈体中也普遍存, 说明CNV 是⼀组具有良性、致病性或未知临床意义的基因组结构改变。
有统计显⽰, ⽬前共发现CNVs约57 829个(这个数据不准确,肯定在更新,图1, 已发现的CNVs与染⾊体位置关系,http://projects.tcag.ca/variation/), 其中染⾊体倒位847; 100 bp~1 Kb的插⼊缺失为30 748个; 倒置断裂位点约14 478个。
此外, 据Hurles[1] 研究估计, CNVs⾄少占到基因组的12%, 已成为基因组多态性的⼜⼀重要来源。
有关CNVs的研究将随机个体之间的基因组差异估计值提⾼到⼤于1%, ⼤⼤改变了⼈们先前的认识, 有学者甚⾄认为这⼀发现将改变⼈类对遗传学领域的认知[3,9]。
与⼀直以来研究较多的单核苷酸多态性(SNPs)相⽐, CNVs发⽣的频率虽然较低, 但累及的序列长度却明显超过了前者, 因此对⼈类健康和疾病的影响更为显著。
染⾊体⾮等位同源重排、⾮同源突变和⾮βDNA 结构是造成基因组拷贝数变异的重要原因。
基因拷贝数变异的病理机制及其与疾病的关系

基因拷贝数变异的病理机制及其与疾病的关系近年来,基因拷贝数变异(CNV)成为了各大科学研究领域热门话题之一。
它既是人体基因组的重要组成部分,也与多种疾病密切相关。
人类基因组中拥有大量CNV,其引发的基因失衡可导致许多疾病的发生。
本文将着重探讨CNV的病理机制及其与疾病的关系。
一、基因拷贝数变异是什么?基因拷贝数变异是指基因组中含有重复拷贝(repetitive copy)的情况。
通俗地说,就是一个基因在同一基因组中有多于一个的拷贝。
CNV通常由DNA的非同源有交换机制引起,包括等位基因间的交换、基因片段的重组、转座子和复制错误等。
CNV范围很广,有可能覆盖多个基因,引起基因型和表型的变异。
CNV的频率比SNP(单核苷酸多态性)高得多,也更加多样化。
教科书上记载的几个重复次数的范围可能并不是针对某个CNV来确定的,CNV的大小和碱基数量非常多,不同区域的大小和不同个体的变异性都有很大差别。
据研究,人类基因组中可能包含上万个CNV,其中一些CNV更加常见;而另一些CNV则很罕见。
二、基因拷贝数变异的病理机制CNV引起疾病的病理学机制是多种多样的。
CNV可能导致基因副本数增加或减少,从而导致不同类型和程度的基因失衡。
1、基因拷贝数增加导致的疾病基因拷贝数的增加是CNV最常见的病理机制之一,它涉及到基因表达和基因功能的增强,导致多种疾病的发生。
(1)神经系统疾病CNV的拷贝数增加可能导致神经系统疾病。
例如,三体综合征(Trisomy 21, Down综合征)是常见的由21号染色体上的CNV 引起的神经系统疾病,该疾病会导致智力低下、异常颅面部特征和其他系统发育异常。
此外,CNV的拷贝数增加也与自闭症、注意力缺陷多动障碍(ADHD)和精神分裂症等神经和心理障碍有关。
(2)肿瘤CNV的拷贝数增加在很多恶性肿瘤中都是常见的遗传学改变。
例如,HER2基因在许多黑色素瘤和乳腺癌中出现CNV增加而过度表达,导致肿瘤细胞增殖和侵袭。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在人类细胞遗传学研究的早期,人们在显微镜下研究染色体,发现了染色体的拷贝数、重排和结构方面存在变异,而且在很多情况下这些变异可能与疾病相关。
在分辨率频谱的另一端即高分辨率区域,DNA短片段的分析和测序方法的发展导致了短串联重复序列和单核苷酸多态性(SNPs)的发现。
显而易见,人为遗传变异范围包括从序列水平上单一碱基对的变化到用显微镜检测到的几兆碱基长度的染色体差异。
最近,通过观测亚微观DNA片段中广泛颁布的拷贝数变异,我们对于人类遗传变异的认识又进一步得到了拓展。
全基因组扫描方法的实行大大推动了这种关于人为变异的新认识,这些方法给我们提供了一个在显微镜细胞遗传学(>5-10Mb)和DNA序列分析(1-700bp)之间的对基因组中间范围遗传变异进行解读的强有力工具。
正如图6所示的结构变民中的中等分辨率范围内的测亚微观部分。
现在已经发展了很多方法来检测这类中等大小范围内的DNA遗传变异,DNA生物芯片技术可能是其中最为有效的方法。
拷贝数变异(CNV)鉴定的主要方法是比较基因组杂交(CGH),而商业的标准CGH芯片在人类基因组的每1Mb长度范围有一个细菌人工染色体(BAC)克隆,这样就很难精确鉴定小于50kb的单拷贝数差异。
昂飞的人类基因组图谱SNP芯片500K和SNP 5.0芯片的标记间距离中位数为2.5kb,最近推出的SNP 6.0的中位数则少于700个碱基对。
这类基因型芯片通过将测试样本所获取的信息强度与其他个体的进行比较来确定每个位点相对基因组拷贝数。
同时,拷贝数检测运算法中将探针的长度和GC含量考虑到其中,从而进一步降低了基因型芯片检测噪音。
另外一个优点是,基因型芯片对拷贝数变异区域进行全面检测,并通过在连续的几个探针中要有重大的比率变化来确认。
所以说,这样的工具明显提高了检测的精确度。
除了提供拷贝数信息,SNP 基因型芯片提供的基因型信息不但可以用于遗传关联性研究,还可以用于检测杂合性丢失,这为缺失的存在提供支持证据,还可能提示片段性单亲二体。
近年来通过拷贝数变异(CNVs)的研究,我们知道人类群体中的任何两个个体基因组结构上的差异比核苷酸序列水平上的差异更大(请参阅应用案例2)。
保守的估计显示个体之间CNVs总计有4Mb(相当于每800bp 就有1个不同)。
不保守估计则认为有多达5-24Mb范围内存在CNVs。
无论是哪种估计,平均来说CNVs中的核苷酸变异数量比SNPs还要多,后者总数大约是2.5Mb(相当于每1,200个bp中有1个SNP)。
因此人类个休之间的所有基因组差异性要远远大于先前所认为的,至少存在0.2%的差异:结构水平上有0.12%以上的差异,核苷酸水平上有0.08%的差异。
昂飞芯片技术革新不但为之前未被发现的人类健康人群中存在的基因组变异的基础研究敞开了大门,也为研究疾病的遗传基础打开了一扇新的窗户.致癌基因的扩增和/或肿
瘤抑制基因的缺失是癌症起始和发展的特点,这一特点近来被认为可用来暗示癌症对治疗剂的反应。
因此在细胞系和肿瘤样品中对这些
2008年7月23日第三十三期第 8 页,共 14 页下一页 返 回
改变进行定位是癌症研究的重要目标。
近几年来,科学家应用了昂飞芯片技术对基因组总拷贝数改变和杂合性丢失进行评估,发表了众多的有关文章,并探讨其研究结果在癌症鉴定和分类中的应用。
另外,针对目前最广泛采用的可贮存临床组织的形式之一—福尔马林固定、石蜡包埋(FFPE)样品,昂飞最近提供了总结推荐的质量控制(QC)步骤和实验方案,从而使500K芯片可以分析来源于FFPE的合格DNA样品,全面了解基因型、杂合性丢失以及拷贝数。
除了癌症研究以外,关于CNVs在遗传疾病中的作用,之前我们所知的大量信息都来源于关于“基因组疾病”的文献资料。
基因组疾病是一大类由DNA拷贝数变化引起的遗传疾病。
这些突变可以是相当大的,能在显微镜下观察,即可见的不平衡区域;也可以是非常小的,需要更高分辨率的手段才能检测。
而以前我们由可利用的方法所了解到的关于基因组疾病的信息主要是局限在:那些有明显临床症状的疾病,或是通过细胞遗传学方法可以检测到基因组不平衡性的疾病,以及性状以显性方式遗传的疾病。
应用高分辨率大提高检测与疾病相关的CNVs的能力。
此外,越来越多的证据证明这些遗传学发现为医生提供了非常有用的与疾病临床特点有关的信息。
第 9 页,共 14 页下一页 返 回。