全基因组关联分析(GWAS)解决方案

合集下载

遗传学研究中的全基因组关联分析

遗传学研究中的全基因组关联分析

遗传学研究中的全基因组关联分析遗传学研究一直是医学和生物学领域的热门话题之一。

DNA的解析和基因组测序技术的普及,使得研究人员能够更好地理解人类基因,从而找到各种疾病的解决方案。

其中,全基因组关联分析(GWAS)是最近广泛应用于遗传研究中的一种方法。

1. 什么是全基因组关联分析?全基因组关联分析(GWAS)是一种计算生物学方法,用于寻找人群中基因变异与疾病之间的关联。

这项技术通过大规模分析大量个体的基因序列和临床表现数据,鉴定那些与疾病或特定性状相关联的基因或基因变异位点。

基于统计学的方法,GWAS可以扫描所有已知基因组位点,以寻找这些位点与疾病之间的关联性。

目前,全基因组关联分析已经被广泛应用于寻找许多常见疾病的遗传因素,比如糖尿病、自闭症、多发性硬化症等。

2. 全基因组关联分析的应用全基因组关联分析的应用远不止于疾病遗传因素的研究,还包括寻找与其他性状的关联,如身高、体重、眼色、皮肤颜色等等。

这种方法通过探索遗传变异的关联性,有助于我们深入理解这些特征的遗传基础。

此外,全基因组关联分析还可以用于动物遗传学研究和农业遗传学研究中,以更好地了解养殖动物或农作物的遗传特性,进而实现遗传改良。

3. 全基因组关联分析的挑战虽然全基因组关联分析已经成为了遗传学研究中的重要方法,但是它也存在着一些挑战。

首先,由于个体之间存在大量的基因差异,这就需要收集大量的个体数据才能找到显著的遗传变异并生成可靠的统计模型。

其次,全基因组关联分析技术并不能获得关于基因表达或基因调控的直接信息,这对于理解一些更深层次的遗传机理而言有着重要的意义。

最后,由于测试的重复性和可重复性等问题,全基因组关联分析所发现的一些位点与疾病之间的关联很难被精确鉴定和验证。

因此,在全基因组关联分析中确保数据质量和测试的可靠性至关重要。

4. 全基因组关联分析的前景随着科技的迅速发展,全基因组关联分析在未来必将继续得到广泛应用。

新兴的技术,如深度基因组测序、单细胞测序和人群基因组学,将使我们更好地理解人类基因组,并扩展全基因组关联分析的应用领域。

全基因组关联分析(GWAS)取样策略

全基因组关联分析(GWAS)取样策略

全基因组关联分析(GWAS)取样策略GWAS要想做得好,材料选择是至关重要的一环。

So,小编查阅了上百篇GWAS文献,精心梳理了一套GWAS的取样策略,是不是很贴心呢?赶紧来学习一下吧!一、常见经济作物样本选择对于经济作物来说,一般都有成百上千个品系,其中包括野生种、地方栽培种、驯化种及商业品种。

一般选择多个品系来确保群体遗传多样性。

文献中常见的经济作物的样本收集于全国或者全世界各地。

表1 常见经济作物样本收集二、常见哺乳动物样本选择对于哺乳动物,一般选择雄性个体作为研究对象(除研究产奶、产仔等性状外),并且要求所研究的对象年龄相近。

下表是我们统计的一些已发表的哺乳动物取材案例,供大家参考。

表2 常见哺乳动物样本收集三、常见家禽类样本选择对于家禽而言,一般会选择家系群体(全同胞家系或半同胞家系)。

为了增加分析内容,可以构建多个家系群体进行研究。

此外,尽量使群体所有个体生长环境以及营养程度保持一致,同时家禽的年龄也尽量保持一致,这对表型鉴定的准确性有很大的帮助。

表3 常见家禽类样本收集四、林木类样本选择对于林木类,一般选择同一物种的多个样本,多个样本做到表型丰富。

表4 林木类样本收集五、其他物种样本选择对于原生生物以及昆虫等的取样策略,可以参考表5中已发表的文献。

表5 其他物种样本收集有这么多文献支持,各位看官是不是已经整明白了GWAS该如何取材呢?最后,小编再温馨提示一句,根据文献统计及项目经验,一般来说,GWAS的样本大小要不少于300个才是极好的。

参考文献[1] Jia G, Huang X, Zhi H, et al. A haplotype map of genomic variations and genome-wide association studies of agronomic traits in foxtail millet (Setaria italica)[J]. Nature Genetics, 2013, 45(8):957-61.[2] Zhou L, Wang S B, Jian J, et al. Identification of domestication-related loci associated with flowering time and seed size in soybean with the RAD-seqgenotyping method[J]. Scientific reports, 2015, 5.[3]Zhou Z, Jiang Y, Wang Z, et al. Resequencing 302 wild and cultivated accessions identifies genes related to domesticatio n and improvement in soybean[J]. Nature Biotechnology, 2015, 33(4):408-414.[4] MorrisG P, Ramu P, Deshpande S P, et al. Population genomic and genome-wide association studies of agroclimatic traits in sorghum[J].Proceedings of the National Academy of Sciences, 2013, 110(2): 453-458.[5] Yano K, Yamamoto E, Aya K,et al. Genome-wide association study using whole-genome sequencing rapidly identifies new genes influencing agronomic traits in rice[J]. Nature Genetics, 2016, 48(8).[6] Wang X, Wang H, Liu S, et al. Genetic variation in ZmVPP1 contributes to drought tolerance in maize seedlings[J]. Nature Genetics, 2016.[7] Pryce J E, Bolormaa S, Chamberlain A J, et al. A validated genome-wide association study in 2 dairy cattle breeds for milk production and fertility traits using variable length haplotypes[J]. Journal of dairy science, 2010, 93(7):3331-3345.[8] Hayes B J, Pryce J, Chamberlain A J, et al. Genetic architecture of complex traits and accuracy of genomic prediction:coat colour, milk-fat percentage, and type in Holstein cattle as contrastingmodel traits[J]. PLoS Genet, 2010, 6(9): e1001139.[9] Heaton M P, Clawson M L, Chitko-Mckown C G,et al. Reduced lentivirus susceptibility in sheep with TMEM154 mutations[J].PLoS Genet, 2012, 8(1): e1002467.[10] Tsai K L, Noorai R E, Starr-Moss A N, et al. Genome-wide association studies for multiple diseases of the German Shepherd Dog[J]. Mammalian Genome, 2012, 23(1-2): 203-211.[11] Petersen J L, Mickelson J R, Rendahl A K, et al. Genome-wide analysis reveals selection for important traits in domestic horse breeds[J]. PLoS Genet, 2013,9(1): e1003211.[12] Do D N, Strathe A B, Ostersen T, et al. Genome-wide association study reveals genetic architecture of eating behaviorin pigs and its implications for humans obesity by comparative mapping[J]. PLoS One, 2013, 8(8).[13] Daetwyler H D, Capitan A, Pausch H, et al. Whole-genome sequencing of 234 bulls facilitates mapping of monogenic andcomplex traits in cattle[J]. Nature genetics, 2014, 46(8): 858-865.[14] Wu Y, Fan H, Wang Y, et al. Genome-Wide Association Studies Using Haplotypes and Individual SNPs in Simmental Cattle[J]. PLoS One,2014,9(10): e109330.[15] Parker C C, Gopalakrishnan S, Carbonetto P,et al.Genome-wide association study of behavioral, physiological and gene expression traits in outbred CFW mice[J]. Nature Genetics, 2016.[16] Gu X, Feng C, Ma L, et al. Genome-wide association study of body weight in chicken F2 resource population[J]. PLoS One, 2011, 6(7): e21872.[17] Xie L, Luo C, Zhang C, et al. Genome-wide association study identified a narrow chromosome 1 region associated with chicken growth traits[J]. PLoS One, 2012, 7(2): e30910.[18] Liu R, Sun Y, Zhao G, et al. Genome-Wide Association Study Identifies Loci and Candidate Genes for Body Composition and Meat Quality Traits in Beijing-You Chickens[J]. Plos One, 2012, 8(4):-.[19] Evans L M, Slavov G T, Rodgers-Melnick E, et al. Population genomics of Populus trichocarpa identifies signatures of selection and adaptive trait associations[J]. Nature genetics, 2014.[20] Porth I, Klapšte J, Skyba O,et al. Genome‐wide association mapping for wood characteristics in Populus identifiesan array of candidate single nucleotide polymorphisms[J]. New Phytologist,2013, 200(3): 710-726.[21] Van Tyne D, Park D J, Schaffner S F, et al. Identification and functional validation of the novel antimalarial resistance locus PF10_0355 in Plasmodium falciparum[J]. PLoS Genet, 2011, 7(4): e1001383.[22] Ke C, Zhou Z, Qi W, et al. Genome-wide association study of 12 agronomic traits in peach[J]. Nature Communications,2016, 7:13246.[23] Miotto O, Amato R, Ashley E A, et al. Genetic architecture of artemisinin-resistant Plasmodium falciparum[J]. Naturegenetics, 2015, 47(3): 226-234.[24] Spötter A, Gupta P, Nürnberg G, et al. Development of a 44K SNP assay focussing on the analysis of a varroa‐specific defence behaviour in honey bees (Apis mellifera carnica)[J]. Molecular ecology resources, 2012, 12(2): 323-332.重测序业务线靳姣姣丨文案武苾菲丨编辑。

全基因组关联分析2篇

全基因组关联分析2篇

全基因组关联分析2篇全基因组关联分析(GWAS)是一种流行的研究方法,可以识别与人类复杂疾病相关的基因变异和遗传因素。

它通过对大规模的基因数据进行分析,寻找与疾病风险相关的单核苷酸多态性(SNP)位点。

本文将介绍GWAS的基本原理、优点和限制,并探讨如何将GWAS结果应用于临床实践中。

一、GWAS的基本原理GWAS的基本原理是将患病个体和正常个体之间的基因差异进行比较,以确定疾病的遗传基础。

GWAS使用全基因组SNP 芯片来确定大量SNP位点的遗传结构差异,并对这些位点进行关联分析。

GWAS基本流程如下:(1)研究样本的选择:GWAS要求大量研究个体,通常从多个人群中招募病例组和对照组。

(2)SNP芯片分析:研究人员使用SNP芯片对每个个体进行基因扫描,并确定他们的SNP位点。

(3)关联分析:将疾病风险和SNP位点之间的关系进行关联分析。

(4) GWAS结果的验证:以多个人群中的患者和正常个体进行复制研究以验证GWAS结果。

(5)功能研究:进一步分析GWAS结果中表观基因、基因调控元件或基因组变异是如何在疾病发生中作用的。

二、GWAS的优点(1)识别新潜在基因:GWAS是发现新潜在疾病基因的最有效方法之一。

通过GWAS分析,可以确定在某些疾病的发生和发展中,可能存在以前未发现的基因。

(2)覆盖广泛的基因组区域:GWAS分析可以同时针对基因组中数百万个SNP位点进行分析,包括那些不在编码区域的SNP位点,这使得该方法能够发现以前未知的功能区域。

(3)便于筛选疾病风险:GWAS的结果可用于评估某个特定基因或SNP位点与疾病风险之间的关系。

这可以帮助医生预测个体患某种疾病的风险,并制定个性化的预防和治疗方案。

三、GWAS的限制(1)复杂遗传模式:因为大多数疾病都具有复杂的遗传模式,所以很难在单个基因或SNP位点处揭示疾病的遗传机制。

(2)静态分析:GWAS只能提供静态遗传数据,不能提供关于变异类型、环境因素或表观遗传学变化的信息。

全基因组关联分析的原理和方法

全基因组关联分析的原理和方法

全基因组关联分析(Genome-wide association study;GWAS)是应用基因组中数以百万计的单核苷酸多态性(single nucleotide ploymorphism ,SNP)为分子遗传标记,进行全基因组水平上的对照分析或相关性分析,通过比较发现影响复杂性状的基因变异的一种新策略。

随着基因组学研究以及基因芯片技术的发展,人们已通过GWAS方法发现并鉴定了大量与复杂性状相关联的遗传变异。

近年来,这种方法在农业动物重要经济性状主效基因的筛查和鉴定中得到了应用。

全基因组关联方法首先在人类医学领域的研究中得到了极大的重视和应用,尤其是其在复杂疾病研究领域中的应用,使许多重要的复杂疾病的研究取得了突破性进展,因而,全基因组关联分析研究方法的设计原理得到重视。

人类的疾病分为单基因疾病和复杂性疾病。

单基因疾病是指由于单个基因的突变导致的疾病,通过家系连锁分析的定位克隆方法,人们已发现了囊性纤维化、亨廷顿病等大量单基因疾病的致病基因,这些单基因的突变改变了相应的编码蛋白氨基酸序列或者产量,从而产生了符合孟德尔遗传方式的疾病表型。

复杂性疾病是指由于遗传和环境因素的共同作用引起的疾病。

目前已经鉴定出的与人类复杂性疾病相关联的SNP位点有439 个。

全基因组关联分析技术的重大革新及其应用,极大地推动了基因组医学的发展。

(2005年, Science 杂志首次报道了年龄相关性视网膜黄斑变性GWAS结果,在医学界和遗传学界引起了极大的轰动, 此后一系列GWAS陆续展开。

2006 年, 波士顿大学医学院联合哈佛大学等多个研究机构报道了基于佛明翰心脏研究样本关于肥胖的GWAS结果(Herbert 等. 2006);2007 年, Saxena 等多个研究组联合报道了与2 型糖尿病( T2D ) 关联的多个位点, Samani 等则发表了冠心病GWAS结果( Samani 等. 2007); 2008 年, Barrett 等通过GWAS发现了30 个与克罗恩病( Crohns ' disrease) 相关的易感位点; 2009 年, W e is s 等通过GWAS发现了与具有高度遗传性的神经发育疾病——自闭症关联的染色体区域。

生物大数据技术的全基因组关联分析方法

生物大数据技术的全基因组关联分析方法

生物大数据技术的全基因组关联分析方法近年来,随着生物大数据技术的快速发展,全基因组关联分析方法已成为生物学、医学研究领域中的重要工具。

全基因组关联分析(GWAS)是一种寻找基因与某一特定性状或疾病之间相互关联的分析方法。

本文将介绍全基因组关联分析的原理和方法,并探讨其在研究中的应用和挑战。

全基因组关联分析的基本原理是将多个个体的基因组数据与其具体的性状或疾病状态进行比较,寻找基因位点与性状或疾病之间的关联。

这种分析方法的关键在于基因型-表型关联的检测。

在全基因组关联分析中,研究对象通常是单核苷酸多态性(SNP)位点,因为SNP是个体基因组中最常见的变异类型。

全基因组关联分析方法通常包括以下几个步骤。

首先,收集研究对象的基因组数据和相关性状或疾病的表型数据。

其次,通过基因组测序技术或芯片技术对个体的基因组进行分析,得到其SNP位点的基因型数据。

然后,通过统计学方法计算基因型与表型之间的关联。

最后,对这些关联进行统计分析,判断是否存在显著的关联信号。

在全基因组关联分析中,常用的统计学方法包括卡方检验、线性回归分析和逻辑回归分析等。

卡方检验适用于疾病的风险和基因型之间的关联分析;线性回归和逻辑回归分析则适用于连续性和二分性表型特征的关联分析。

不同的统计方法适用于不同的研究问题和数据类型。

全基因组关联分析方法在生物学、医学研究中的应用广泛。

它可以揭示基因变异与疾病发生发展之间的关系,有助于发现潜在的疾病风险基因和药物靶标。

全基因组关联分析还可以帮助了解个体在药物代谢、药物反应和药物副作用方面的差异,实现个体化医疗的目标。

此外,全基因组关联分析还可以为遗传病的早期筛查和诊断提供重要依据。

然而,全基因组关联分析也存在一些挑战。

首先,全基因组关联分析需要大样本量来获得可靠的结果,并且需要考虑到样本的种族和人口结构,以避免虚假关联的出现。

其次,全基因组关联分析结果需要进行复制实验来验证其确切性。

此外,全基因组关联分析还需要解决对多个检验进行校正和纠正,以降低虚假关联的发生概率。

植物全基因组关联分析及其在遗传改良中的应用

植物全基因组关联分析及其在遗传改良中的应用

植物全基因组关联分析及其在遗传改良中的应用随着生物技术的快速发展,全基因组关联分析(GWAS)成为了植物遗传学中的一个关键工具。

其可以帮助我们在大规模的基因组中寻找与重要性状相关的位点。

这为植物育种和遗传改良提供了重要的指导,许多研究表明,这种方法可以有效地提高植物的产量、抗病性、耐逆性和品质等重要性状,为农业生产做出了重要的贡献。

什么是全基因组关联分析?全基因组关联分析(GWAS)是一种基于单核苷酸多态性(SNP)的遗传分析方法。

SNP是一种常见的基因多态性标记,它们通常分布在基因组中。

在GWAS 中,研究者会测量一组个体的SNP,然后将这些数据与这些个体的某种性状进行比较,从而鉴定SNP与某种性状的关联关系。

研究者可以利用这些关联关系确定可能有助于某种性状的基因。

在研究中,研究者必须遵循严格的方法论来确保结果的准确性。

首先,GWAS需要大量个体的基因数据和性状数据。

其次,研究者需要使用适当的分析方法来控制潜在的混淆因素,例如种群结构和家系效应。

最后,研究者需要验证其结果,以确保其可以在不同的环境和种群中得到重复。

为什么全基因组关联分析对遗传改良非常重要植物基因组的测序技术正在快速发展,这使我们能够在广泛的物种中进行全基因组SNP数据的生成。

这就提供了在遗传改良中应用全基因组关联分析的巨大机会。

全基因组关联分析可以鉴定一些难以加工或评估其他方式的基因,这些基因可能对复杂的农业性状贡献良多。

例如植物的抗病性、耐旱性和生物量等。

它还可以帮助我们识别有利特征的基因型,这些基因型可能包括多个基因,对特定性状有不同的影响。

通过应用模型,我们可以预测这些基因型的表现,从而为育种计划提供指导。

如何使用全基因组关联分析改良植物在实践中,我们通常使用多种方法来使用全基因组关联分析来改良植物。

例如,一些研究组将关联结果与分子标记相结合,开发特异的代表单个或多个位点的标记,然后通过分子重组选育(MAS)的方案来进行育种计划。

全基因组关联分析中荟萃分析的异质性和重叠数据问题的研究

全基因组关联分析中荟萃分析的异质性和重叠数据问题的研究

全基因组关联分析中荟萃分析的异质性和重叠数据问题的研究全基因组关联分析中荟萃分析的异质性和重叠数据问题的研究摘要:全基因组关联分析(genome-wide association study,GWAS)是一种用于发现人类疾病与基因关联的重要方法。

荟萃分析作为GWAS的一项重要分析策略,可以整合多个独立的GWAS研究以增加样本数量,并提高关联的统计功效。

然而,荟萃分析在实践中面临着两个主要问题:异质性和重叠数据。

本文将对这两个问题进行详细讨论,并介绍一些可能的解决方法。

一、异质性问题在多个独立GWAS研究中,样本来源、疾病定义、基因检测方法等因素的差异会导致异质性问题。

异质性可能会导致GWAS 结果产生假阳性或假阴性的关联,并降低荟萃分析的可靠性和准确性。

解决方法:1. 合理选择研究样本:在进行荟萃分析之前,应对参与研究的样本进行严格的质量控制和校正分析,排除低质量的样本,确保研究的一致性。

2. 详细记录研究设计和方法:在每个研究中详细记录研究设计、样本特征和基因分析方法,以便进行后续的异质性分析和调整。

3. 针对异质性进行统计调整:使用适当的统计方法对异质性进行调整,例如采用固定效应模型、随机效应模型或混合效应模型等,以减少异质性的影响。

二、重叠数据问题重叠数据是指多个独立GWAS研究使用相同的样本数据进行关联分析,这可能会导致估计效果失真和关联结果的过于乐观。

解决方法:1. 去除重叠样本:在进行荟萃分析之前,应对参与的各个研究样本进行检查,排除重叠的样本。

一般可根据样本的基本信息、疾病诊断和其他基因特征进行判断。

2. 敏感性分析:通过对比包含重叠样本和不包含重叠样本的荟萃分析结果,评估重叠数据对结果的影响,并进行敏感性分析,验证关联结果的稳定性和可靠性。

3. 采用加权方法:对包含重叠样本的研究进行权重调整,减少重叠数据的影响。

例如,可以根据每个独立研究的质量和样本量来确定权重,将质量较高、样本量较大的研究的权重调整为较高,减少重叠数据的影响。

全基因组关联分析 GWAS

全基因组关联分析 GWAS

在 SORL1基因中确定了好几个与疾病有关的 SNPs 。

他说:“ 很多人对此持怀疑态度 , 因为它是一种候选基因 , 但在最近的一些 GWAS 研究中获得了支持。

” 相关证据也支持了 SORL1的作用———在蛋白质产生水平较低的小鼠中 , 其大脑中积聚的β淀粉样蛋白也更多。

蒙蒂尼研究小组在血液或脑脊液 (CFS 中寻找可能预示老年痴呆症发病的生理指标时 , 发现了另一个候选因子 , 即脑源性神经营养因子与其他多种神经系统疾病有关 , 而这种蛋白质水平被证明是预测阿尔茨海默氏症的一种强有力的指标。

然而 , 关于这种基因变异的致病作用还没有明确的证据。

蒙蒂尼说:“ 在我们的观察中还找不到这其中的联系 , 但我们也还没有对这整个基因进行测序。

”有待实验科学家阐明机制阿尔茨海默氏症风险的最后一个组成部分 , 可能源自于遗传易感性与一生中积累起来的生理损害之间的相互作用。

蒙蒂尼说:“ 对于一种与老龄化密切相关的疾病来说 , 我们的生活环境和我们的人生经历 , 都将成为重要的影响因素。

”例如 , 糖尿病和中风可导致生产高活性的化合物 , 这种被称为自由基的化合物反过来对脂肪、蛋白质和核酸诱导产生一些有毒的化学变化 , 这种氧化应激现象似乎是阿尔茨海默氏症患者大脑中的一种普遍特征 , 其结果是有可能损害或杀死神经元。

蒙蒂尼说:“ 这是人体老化的一个正常组成部分 , 但对于阿尔茨海默氏症患者来说 , 自由基会给他们造成更严重的损害。

” 作为细胞能量之源的线粒体 , 通常对氧化应激起着调控作用 , 几项研究正在对此作出评估 , 以确定线粒体 DNA 是否也包含了阿尔茨海默氏症的危险因子。

在了解环境因素对疾病的影响方面 , 遗传学家面临着同样巨大的挑战。

首先是数据的获得和分析 , 然后还要构建出对诊断和治疗有意义的理论假设 , 这些都费时费力且代价高昂。

“ 遗传学有可能定义某种相关性 , 但却无法确定其机制,” 蒙蒂尼说, “ 现在是需要实验科学家去努力弄明白这类机制的时候了。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

全基因组关联分析(GWAS)解决方案
※ 概述
全基因组关联研究(Genome-wide association study,GWAS)是用来检测全基因组范围的遗传变异与
可观测的性状之间的遗传关联的一种策略。

2005年,Science杂志报道了第一篇GWAS研究——年龄相关性黄
斑变性,之后陆续出现了有关冠心病、肥胖、2型糖尿病、甘油三酯、精神分裂症等的研究报道。

截至2010年
底,单是在人类上就有1212篇GWAS文章被发表,涉及210个性状。

GWAS主要基于共变法的思想,该方法是
人类进行科学思维和实践的最重要工具之一;统计学研究也表明,GWAS很长时期内都将处于蓬勃发展期(如
下图所示)。

基因型数据和表型数据的获得,随着诸多新技术的发展变得日益海量、廉价、快捷、准确和全面:如
Affymetrix和Illumina公司的SNP基因分型芯片已经可以达到2M的标记密度;便携式电子器械将产生海量的表型
数据;新一代测序技术的迅猛发展,将催生更高通量、更多类别的基因型,以及不同类别的高通量表型。

基于
此,我们推出GWAS的完整解决方案,协助您一起探索生物奥秘。

※ 实验技术流程
※ 基于芯片的GWAS
Affymetrix公司针对人类全基因组SNP检测推出多个版本检测芯片,2007年5月份,Affymetrix公司发布了
人全基因组SNP 6.0芯片,包含90多万个用于单核苷酸多态性(SNP)检测探针和更多数量的用于拷贝数变化(CNV)检测的非多态性探针。

因此这种芯片可检测超过180万个位点基因组序列变异,即可用于全基因组
SNP分析,又可用于CNV分析,真正实现了一种芯片两种用途,方便研究者挖掘基因组序列变异信息。

Illumina激光共聚焦微珠芯片平台为全世界的科研用户提供了最为先进的SNP(单核苷酸多态性)研究平
台。

Illumina的SNP芯片有两类,一类是基于infinium技术的全基因组SNP检测芯片(Infinium™ Whole Genome Genotyping),适用于全基因组SNP分型研究及基因拷贝数变化研究,一张芯片检测几十万标签SNP位点,提
供大规模疾病基因扫描(Hap660,1M)。

另一类是基于GoldenGate™特定SNP位点检测芯片,根据研究需要挑选SNP位点制作成芯片(48-1536位点),是复杂疾病基因定位的最佳工具。

罗氏NimbleGen根据人类基因组序列信息设计的2.1M超高密度CGH芯片,可以在1.1Kb分辨率下完成全基
因组检测,可有效检测人基因组中低至约5kb大小的拷贝数变异。

※ 基于高通量测序的GWAS
传统的基于芯片的GWAS取得了不少成功,但仍存在诸多局限,如发现的疾病相关变异多为非直接致病因
素,对表型效应或遗传力的贡献微弱,对SNP以外的其它变异检测效力低等。

随着高通量测序技术的出现和不
断发展,一种广义的GWAS概念开始出现,即在全基因组范围内,利用关联分析的原理和方法进行各种组学研
究,不仅包括SNP,还包括插入缺失、结构变异(包括CNV)、基因表达、表观遗传修饰等。

※ 计算中心GWAS案例
华中农业大学玉米农艺性状GWAS数据分析。

基因型为玉米的600K芯片数据,表型为各发育时期不同农艺性状的总共797种表型。

利用计算中心高性
能计算机群的分布式计算能力,仅用1天半的时间便完成了全部分析工作。

※ 参考文献
1、Huang et al., Genome-wide association studies of 14 agronomic traits in rice landraces. Nature Genetics. 2010, 42: 961-967
2、Kim et al., Design of Association Studies with Pooled or Un-pooled Next-Generation Sequencing Data. Genetic Epidemiology. 2010, 34 : 479-491
3、The Wellcome Trust Case Control Consortium, Genome-wide association study of 14,000 cases of seven common diseases and 3,000 shared controls. Nature. 2007 June 7; 447(7145): 661-678
4、Zhang et al., Psoriasis genome-w ide association study identifies susceptibilit y variants w ithin LCE gene cluster at 1q21. Nat Genet. 2009 Feb;41(2):205-10
5、Yan et al., Rare genetic variation at Zea mays crtRB1 increases β-carotene in maize grain. Nature Genetics. 2010, 42: 322-327
6、Li et al., Low-coverage sequencing: Implications for design of complex trait association studies. Genome Res. 2011. 21: 940-951。

相关文档
最新文档