全基因组关联分析的原理和方法

合集下载

遗传学研究中的全基因组关联分析

遗传学研究中的全基因组关联分析遗传学研究一直是医学和生物学领域的热门话题之一。

DNA的解析和基因组测序技术的普及，使得研究人员能够更好地理解人类基因，从而找到各种疾病的解决方案。

其中，全基因组关联分析（GWAS）是最近广泛应用于遗传研究中的一种方法。

1. 什么是全基因组关联分析？全基因组关联分析（GWAS）是一种计算生物学方法，用于寻找人群中基因变异与疾病之间的关联。

这项技术通过大规模分析大量个体的基因序列和临床表现数据，鉴定那些与疾病或特定性状相关联的基因或基因变异位点。

基于统计学的方法，GWAS可以扫描所有已知基因组位点，以寻找这些位点与疾病之间的关联性。

目前，全基因组关联分析已经被广泛应用于寻找许多常见疾病的遗传因素，比如糖尿病、自闭症、多发性硬化症等。

2. 全基因组关联分析的应用全基因组关联分析的应用远不止于疾病遗传因素的研究，还包括寻找与其他性状的关联，如身高、体重、眼色、皮肤颜色等等。

这种方法通过探索遗传变异的关联性，有助于我们深入理解这些特征的遗传基础。

此外，全基因组关联分析还可以用于动物遗传学研究和农业遗传学研究中，以更好地了解养殖动物或农作物的遗传特性，进而实现遗传改良。

3. 全基因组关联分析的挑战虽然全基因组关联分析已经成为了遗传学研究中的重要方法，但是它也存在着一些挑战。

首先，由于个体之间存在大量的基因差异，这就需要收集大量的个体数据才能找到显著的遗传变异并生成可靠的统计模型。

其次，全基因组关联分析技术并不能获得关于基因表达或基因调控的直接信息，这对于理解一些更深层次的遗传机理而言有着重要的意义。

最后，由于测试的重复性和可重复性等问题，全基因组关联分析所发现的一些位点与疾病之间的关联很难被精确鉴定和验证。

因此，在全基因组关联分析中确保数据质量和测试的可靠性至关重要。

4. 全基因组关联分析的前景随着科技的迅速发展，全基因组关联分析在未来必将继续得到广泛应用。

新兴的技术，如深度基因组测序、单细胞测序和人群基因组学，将使我们更好地理解人类基因组，并扩展全基因组关联分析的应用领域。

全基因组关联分析2篇

全基因组关联分析2篇全基因组关联分析（GWAS）是一种流行的研究方法，可以识别与人类复杂疾病相关的基因变异和遗传因素。

它通过对大规模的基因数据进行分析，寻找与疾病风险相关的单核苷酸多态性（SNP）位点。

本文将介绍GWAS的基本原理、优点和限制，并探讨如何将GWAS结果应用于临床实践中。

一、GWAS的基本原理GWAS的基本原理是将患病个体和正常个体之间的基因差异进行比较，以确定疾病的遗传基础。

GWAS使用全基因组SNP 芯片来确定大量SNP位点的遗传结构差异，并对这些位点进行关联分析。

GWAS基本流程如下：（1）研究样本的选择：GWAS要求大量研究个体，通常从多个人群中招募病例组和对照组。

（2）SNP芯片分析：研究人员使用SNP芯片对每个个体进行基因扫描，并确定他们的SNP位点。

（3）关联分析：将疾病风险和SNP位点之间的关系进行关联分析。

（4） GWAS结果的验证：以多个人群中的患者和正常个体进行复制研究以验证GWAS结果。

（5）功能研究：进一步分析GWAS结果中表观基因、基因调控元件或基因组变异是如何在疾病发生中作用的。

二、GWAS的优点（1）识别新潜在基因：GWAS是发现新潜在疾病基因的最有效方法之一。

通过GWAS分析，可以确定在某些疾病的发生和发展中，可能存在以前未发现的基因。

（2）覆盖广泛的基因组区域：GWAS分析可以同时针对基因组中数百万个SNP位点进行分析，包括那些不在编码区域的SNP位点，这使得该方法能够发现以前未知的功能区域。

（3）便于筛选疾病风险：GWAS的结果可用于评估某个特定基因或SNP位点与疾病风险之间的关系。

这可以帮助医生预测个体患某种疾病的风险，并制定个性化的预防和治疗方案。

三、GWAS的限制（1）复杂遗传模式：因为大多数疾病都具有复杂的遗传模式，所以很难在单个基因或SNP位点处揭示疾病的遗传机制。

（2）静态分析：GWAS只能提供静态遗传数据，不能提供关于变异类型、环境因素或表观遗传学变化的信息。

全基因组关联研究技术及其应用

全基因组关联研究技术及其应用随着基因科学的飞速发展，全基因组关联研究技术（GWAS）成为现代生物医学研究的重要手段之一。

通过对人类基因组中的上百万个DNA位点进行分析，GWAS技术可以寻找人类遗传变异与疾病发生的潜在关联。

在近年来的生物医学研究中，GWAS技术已经被广泛应用，为人类疾病的预防、诊治和治疗提供了重要的科学依据。

在本文中，我们将详细介绍GWAS技术的原理、流程及其应用。

一、GWAS技术的原理GWAS技术是一种大规模的关联分析技术，基于假设：如果某个单核苷酸多态性（SNP）与某种疾病的发生存在显著相关，那么这个SNP就可能是影响这种疾病的关键基因。

因此，通过研究不同个体间SNP的差异，可以寻找影响疾病发生的重要基因。

在GWAS研究中，研究对象通常是一组“病例-对照”样本组。

病例组包括某种特定疾病的患者，对照组则是与病例组性别、年龄和人种相似的健康人群。

然后，将这两组人群的DNA进行大规模的基因分型，筛选出存在差异的SNP位点。

最终，通过统计分析，可以将这些差异SNP与目标疾病的关系进行关联推断。

二、GWAS技术的流程GWAS技术一般包括以下几个步骤：1.样本筛选：选择适当的样本组，包括病例组和对照组，并设计合理的样本数量；2.基因分型：将样本组中的DNA序列进行大规模分型，得到SNP的变异情况；3.数据处理：对基因分型数据进行质量控制，去除质量不佳的SNP和样本；4.关联分析：将样本组中不同个体的SNP差异和疾病发生进行关联分析；5.生物信息学分析：对具有显著差异的SNP进行生物信息学分析，确定这些SNP的生物学意义，辅助研究人员进行基因功能的预测和功能注释。

三、GWAS技术的应用GWAS技术已经被广泛应用于多种疾病的研究中，如心血管疾病、肺癌、乳腺癌、糖尿病、帕金森病等等。

通过GWAS技术，研究人员可以寻找与疾病发生密切相关的基因，为疾病的发生机制和治疗手段的开发提供了重要的科学依据。

gwas原理

gwas原理GWAS（全基因组关联研究）原理引言：GWAS是一种广泛应用于遗传学研究的方法，通过分析大规模样本中的基因变异与表型特征的相关性，从而寻找与人类疾病和特征相关的基因位点。

本文将介绍GWAS的基本原理及其在疾病研究中的应用。

一、GWAS的基本原理GWAS是一种观察性研究，旨在寻找基因多态性与表型特征之间的关联。

其基本流程包括以下几个步骤：1.样本收集：研究人员需要收集大规模的样本，包括患者组和对照组。

患者组是指患有特定疾病或表现出特定特征的个体，而对照组是与患者组相似但不具备该特征的个体。

2.基因分型：对样本进行基因分型，通常采用SNP（单核苷酸多态性）芯片或全基因组测序技术。

这些技术可以检测大量的基因位点，从而获取个体的基因型信息。

3.统计分析：使用适当的统计方法，比如卡方检验或回归模型，来评估基因型与表型特征之间的关联。

通过计算P值，可以判断该关联是否具有统计学意义。

4.结果验证：为了验证GWAS结果的可靠性，研究人员通常需要在独立的样本集中进行复制性研究。

只有在多个独立样本集中得到一致的结果时，才能认为该基因位点与表型特征之间存在真实的关联。

二、GWAS在疾病研究中的应用GWAS已经在许多疾病的研究中取得了重要的突破，如癌症、心血管疾病、糖尿病等。

通过GWAS，我们可以发现与疾病风险相关的基因变异，从而为疾病的预防、诊断和治疗提供新的靶点和策略。

1.疾病易感基因的发现：GWAS可以帮助我们找到与疾病易感性相关的基因位点。

例如，在2型糖尿病研究中，GWAS发现了多个与疾病发生风险显著相关的基因位点，如TCF7L2、CDKAL1等。

2.疾病机制的解析：GWAS还可以揭示疾病的发病机制。

通过研究基因变异与表型特征之间的关联，我们可以了解这些基因对疾病的影响，从而深入了解疾病的发生和发展过程。

例如，在帕金森病研究中，GWAS发现了多个与该疾病相关的基因位点，如SNCA、LRRK2等，为帕金森病的研究提供了重要线索。

gwas遗传概念

gwas遗传概念1. 概述GWAS（Genome-Wide Association Study，全基因组关联研究）是一种广泛应用于遗传学研究的方法，旨在寻找基因与特定性状或疾病之间的关联。

通过对大规模样本进行基因组广泛扫描，GWAS可以揭示遗传变异与复杂性状之间的关系。

本文将深入探讨GWAS的原理、应用和挑战。

2. GWAS原理GWAS通过对大规模样本进行基因组扫描来寻找与特定性状或疾病有关的遗传变异。

这种方法利用单核苷酸多态性（SNP）来检测个体间的遗传差异。

SNP是一种常见的遗传变异形式，其在人类基因组中广泛存在。

GWAS将SNP与个体表型数据相关联，并通过统计学方法来确定SNP与表型之间是否存在显著相关。

3. GWAS流程3.1 样本选择：GWAS需要大规模样本数据以获得足够统计功效。

样本选择要尽可能代表目标人群，并且要考虑到可能存在的人群结构和亲缘关系。

3.2 基因组扫描：利用高通量测序技术，对样本进行基因组广泛扫描，检测SNP的存在和分布。

通常采用芯片或测序技术进行SNP分型。

3.3 关联分析：将样本的基因型数据与表型数据进行关联分析，以确定SNP与表型之间的关联。

常用的统计方法包括卡方检验、线性回归和逻辑回归等。

3.4 多个测试校正：由于GWAS涉及大量的统计检验，需要对多个测试进行校正以控制假阳性率。

常用的校正方法包括Bonferroni校正、FDR（False Discovery Rate）等。

4. GWAS应用4.1 复杂性疾病研究：GWAS广泛应用于复杂性疾病的遗传研究，如心血管疾病、精神障碍和肿瘤等。

通过GWAS可以发现与这些复杂性疾病相关的遗传变异，并揭示其潜在机制。

4.2 药物反应个体差异：GWAS可以帮助解释药物反应个体差异。

通过将药物反应表型与基因组数据相关联，可以发现影响药物代谢、药物靶点和药物作用途径的遗传变异。

4.3 人种和种群遗传学研究：GWAS还被用于研究人种和种群之间的遗传差异。

全基因组关联分析的研究及其趋势

全基因组关联分析的研究及其趋势全基因组关联分析（GWAS）是一种通过比较遗传变异和特定表现型之间的关联来识别常见病遗传因素的方法。

GWAS在过去的几年中得到了广泛的应用，帮助人们对许多疾病的发病机制有了更深入的认识。

本文将介绍GWAS的基本原理、发展历程以及未来的发展趋势。

一、GWAS的基本原理GWAS基于基因多态性的假设，即常见疾病的发生可能与多个基因之间的遗传变异有关。

GWAS研究会对数千名个体进行基因型分析，以寻找与特定表现型（如疾病）相关的指定单核苷酸多态性（SNP）。

统计分析用于确定这些SNP是否与表现型的变异有关。

GWAS是一种有潜力的方法，可以为疾病的发病机制提供补充信息。

它可以提高对疾病基因型的理解，通过发现几个共同遗传因素，可以为更个性化的临床治疗方案提供基础。

二、GWAS的发展历程第一项GWAS研究是2005年发表的关于亚洲人口的基因变异和糖尿病的关联研究。

在那以后不久，GWAS就成为了一种热门的研究方法。

随着技术和生物信息学方法的发展，越来越多的基因变异可以被检测，并将被纳入GWAS的分析中。

在许多大规模的GWAS研究中，指向数千个潜在基因影响多个疾病和特征的基因变异已被发现。

这些研究为许多疾病的研究和治疗提供了深入的洞察力，包括骨质疏松症，心血管疾病，痴呆症，心理疾病以及各种癌症。

三、GWAS的未来趋势在未来几年，GWAS将继续成为基因相关研究中的主要方法。

越来越多的疾病现在可以使用GWAS来探索其潜在的基因贡献。

在长时间的GWAS研究中，我们可以看到关于疾病病因的更多信息的出现，甚至在没有疾病症状的人身上也可以看到这种基因负载。

这将使我们更具有针对性地开发个性化的治疗方法，同时在疾病预防方面也具有更积极的作用。

GWAS的未来趋势还包括创新的技术和更加灵活的研究设计。

通过在抗击传染病和新兴病原体方面的应用，GWAS正在以更广泛的方式帮助生物医学界。

总的来说，GWAS是一种非常有前途的研究方法，其对于识别与疾病相关的基因位点具有巨大的潜力。

全基因组关联分析剖析

对家系数据进行检查,排除样本混淆、亲子关系错误等问题,控制家系关系的正确性。
全基因组关联分析的结果验证
验证检查
对于全基因组关联分析的结果,需要进行严格的验证检查,以确保结果的可靠性和重复性。
重复实验
在不同的人群或样本中重复实验,比较结果是否一致进一步的功能实验,探讨基因变异与表型之间的机制。
全基因组关联分析的统计方法
统计分析
全基因组关联分析通常采用统计模型对遗传标记与表型之间的关联进行测试,如线性回归、logistic 回归等。
多重检验校正
由于基因组级别的大量比较检验,需要采用Bonferroni、FDR等方法进行多重检验校正,以控制I型错误风险。
机器学习方法
近年来,全基因组关联分析也开始采用机器学习技术,如Ridge回归、Lasso回归等方法,以提高检测能力。
全基因组关联分析的研究热点
1 复杂疾病研究
全基因组关联分析被广泛应用于探索复杂疾病如糖尿病、心血管疾病、肿瘤等的遗传学基础。
3 交互作用研究
多基因、基因-环境等交互作用的研究是全基因组关联分析的重要方向。
2 药物反应预测
全基因组分析有助于识别影响药物反应的基因变异,助力个体化精准医疗。
生物学解释
从统计上显著关联的遗传位点到生物学功能解释存在鸿沟,需要更深入的研究。
跨人群适用性
现有大多数研究集中于欧美人群,如何推广到其他人群是一大挑战。
全基因组关联分析的研究进展
多组学整合
研究者正在探索将全基因组关联分析与转录组学、表观遗传学等多种组学数据相结合的方法,以更全面地了解复杂疾病的遗传学机制。
新型统计方法
学者们不断开发基于机器学习、贝叶斯统计等的创新分析方法,以提高检测复杂遗传变异和基因-环境相互作用的能力。

全基因组关联分析及遗传基因组学的研究进展

全基因组关联分析及遗传基因组学的研究进展随着基因技术的快速发展，遗传基因组学成为目前最具前景的研究领域之一。

在遗传基因组学中，全基因组关联分析（GWAS）被广泛应用于疾病的遗传研究中，是目前最有效的基因分析方法之一。

本文将重点介绍全基因组关联分析及遗传基因组学的研究进展，以期提供对该领域的深入了解。

一、全基因组关联分析的概念及原理全基因组关联分析是一种高通量的基因分析方法，其原理是比较大量样本中的遗传变异与表型间的关联，以确定影响表型的基因及其变异。

具体而言，全基因组关联分析通过扫描整个基因组，检查单核苷酸多态性（SNP）与研究对象表型之间的关联性，如果发现某些基因与表型有显著相关性，就可以将这些基因作为疾病的潜在风险因素进行研究。

全基因组关联分析所用的DNA样本源于大量人群，其优点在于可以检测到多个基因之间的相互作用，缺点是高度依赖统计学方法，并且会出现假阳性率高的问题。

为了减少假阳性率，全基因组关联分析研究通常采用Bonferroni校正或FDR校正等方法。

二、全基因组关联分析的应用全基因组关联分析主要应用于人类的疾病遗传研究中，如糖尿病、肥胖症、阿尔茨海默病、乳腺癌和鳞状细胞癌等疾病。

近年来，全基因组关联分析也被广泛应用于畜禽的遗传研究，如猪的生长性状和奶牛的产奶量等。

除了疾病的遗传研究，全基因组关联分析还可以用于预测个体对药物的反应，从而实现个体化用药。

例如，全基因组关联分析可以确定与药物代谢相关的基因，以此为基础预测不同个体对药物的代谢情况，为实现个体化用药提供依据。

三、遗传基因组学的研究进展遗传基因组学研究除了全基因组关联分析以外，还包括单细胞遗传学、转录组学、表观遗传学和功能基因组学等方面的研究。

这些研究方法的开展使得人们对基因组学的理解更加深入，为了更好地了解遗传基因组学的研究进展，以下将分别进行介绍。

1.单细胞遗传学单细胞遗传学是一种新型的研究方法，该方法可以对单个细胞进行遗传分析。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

全基因组关联分析(Genome-wide association study;GWAS)是应用基因组中数以百万计的单核苷酸多态性(single nucleotide ploymorphism，SNP)为分子遗传标记，进行全基因组水平上的对照分析或相关性分析，通过比较发现影响复杂性状的基因变异的一种新策略。

随着基因组学研究以及基因芯片技术的发展，人们已通过GWAS方法发现并鉴定了大量与复杂性状相关联的遗传变异。

近年来，这种方法在农业动物重要经济性状主效基因的筛查和鉴定中得到了应用。

全基因组关联方法首先在人类医学领域的研究中得到了极大的重视和应用，尤其是其在复杂疾病研究领域中的应用，使许多重要的复杂疾病的研究取得了突破性进展，因而，全基因组关联分析研究方法的设计原理得到重视。

人类的疾病分为单基因疾病和复杂性疾病。

单基因疾病是指由于单个基因的突变导致的疾病，通过家系连锁分析的定位克隆方法，人们已发现了囊性纤维化、亨廷顿病等大量单基因疾病的致病基因，这些单基因的突变改变了相应的编码蛋白氨基酸序列或者产量，从而产生了符合孟德尔遗传方式的疾病表型。

复杂性疾病是指由于遗传和环境因素的共同作用引起的疾病。

目前已经鉴定出的与人类复杂性疾病相关联的SNP位点有439个。

全基因组关联分析技术的重大革新及其应用，极大地推动了基因组医学的发展。

（2005年, Science杂志首次报道了年龄相关性视网膜黄斑变性 GWAS结果,在医学界和遗传学界引起了极大的轰动,此后一系列GWAS陆续展开。

2006年, 波士顿大学医学院联合哈佛大学等多个研究机构报道了基于佛明翰心脏研究样本关于肥胖的 GWAS结果 (Herbert等. 2006);2007年, Saxena等多个研究组联合报道了与 2型糖尿病( T2D )关联的多个位点, Samani等则发表了冠心病 GWAS结果( Samani 等. 2007); 2008年, Barrett等通过 GWAS发现了 30个与克罗恩病( Crohns ' disrease)相关的易感位点; 2009年, W e is s等通过 GWAS发现了与具有高度遗传性的神经发育疾病——自闭症关联的染色体区域。

我国学者则通过对 12 000多名汉族系统性红斑狼疮患者以及健康对照者的GWAS发现了 5个红斑狼疮易感基因, 并确定了 4个新的易感位点( Han 等. 2009)。

截至 2009年 10月,已经陆续报道了关于人类身高、体重、血压等主要性状, 以及视网膜黄斑、乳腺癌、前列腺癌、白血病、冠心病、肥胖症、糖尿病、精神分裂症、风湿性关节炎等几十种威胁人类健康的常见疾病的 GWAS结果, 累计发表了近万篇论文, 确定了一系列疾病发病的致病基因、相关基因、易感区域和 SNP变异。

）标记基因的选择：1）Hap Map是展示人类常见遗传变异的一个图谱 ,第 1阶段完成后提供了4个人类种族 [ Yoruban ,Northern and Western European , and Asian ( Chinese and Japanese) ]共 269个个体基因组,超过 100万个SNP (约1 SNP / 3kb )及连锁不平衡区域 ( linkage disequilibrium, LD )关系的图谱。

第二阶段增加了其它的人类种族数据。

基于 Hap Map可以选择 500 000到1 000 000个覆盖全基因组的 SNP。

2）基因组拷贝数变异 ( copy number variations ,CNV )是 20世纪 80年代发现的在人类基因组中存在的多种类型的染色体数目和结构变异。

是指与参考序列相比,基因组中∃1 kb的 DNA 片段插入、缺失和 /或扩增,及其互相组合衍生的复杂染色体结构变异。

与 SNP相似,部分 CNV在不同人群中以不同频率分离并具有显著性差异, 并可能影响基因表达和表型改变,因此 CNV也是一种引起疾病或增加复杂疾病发病风险的重要遗传变异。

GWAS采用的研究方式与传统的候选基因病例—对照(case-control)关联分析一致, 即如果人群基因组中一些 SNP与某种疾病相关联, 理论上这些疾病相关 SNP等位基因频率在某种疾病患者中应高于未患病对照人群。

动物重要经济性状即复杂性状GWAS分析方法的原理是，借助于SNP分子遗传标记，进行总体关联分析，在全基因组范围内选择遗传变异进行基因分型，比较异常和对照组之间每个遗传变异及其频率的差异，统计分析每个变异与目标性状之间的关联性大小，选出最相关的遗传变异进行验证，并根据验证结果最终确认其与目标性状之间的相关性。

GWAS的具体研究方法与传统的候选基因法相类似：1）单阶段方法，即选择足够多的样本，一次性地在所有研究对象中对目标SNP进行基因分型，然后分析每个SNP与目标性状的关联，统计分析关联强度和OR值（计算出的OR值等于1时，则该因素的疾病发生不起任何作用；大于1时，该因素为危险因素；小于1时，该因素为保护因素。

）。

2）目前GWAS研究主要采用两阶段方法/多阶段方法。

第一阶段用覆盖全基因组范围的SNP进行对照分析，统计分析后筛选出较少数量的阳性SNP进行。

可以以个体为单位，也可以采用DNA pooling的方法（后者可大大降低及基因分型的成本和工作量）。

但是 DNA pooling的基因分型结果与对所有个体进行基因分型的结果仍有一定差异, DNA pooling估计的等位基因频率标准差在 1 % ~ 4% 的范围, 因而若单独以 DNApooling来估计等位基因频率, 那么这种误差对全基因组的病例—对照研究的检验效能 ( power of test)有重要影响。

第二阶段或随后的多阶段中采用更大样本的对照样本群进行基因分型，然后结合两阶段或多阶段的结果进行分析。

这种设计需要保证第一阶段筛选与目标性状相关SNP的敏感性和特异性，尽量减少分析的假阳性或假阴性，并在第二阶段应用大量样本群进行基因分型验证。

结果的统计和分析：1）在GWAS用于病例-对照研究设计时，比较病例和对照组中每个 SNP等位基因频率差别多采用 4 格表的卡方检验 ( chi-square test ) ,并计算OR及其 95%的可信区间 ( confidence interval , CI) ,归因分数( attributable fraction , AF)和归因危险度 ( attributable risk , AR ); 同时需对如年龄、性别等主要混杂因素采用 Logistic回归分析,以基因型和混杂因素作为自变量,研究对象患病状态为因变量进行分析。

2）GWAS用于研究随机人群的SNP与某一数量性状关联时 (如身高、体重、血压等) ,主要应用单因素方差分析 ( one-way ANOVA )比较 SNP位点 3种基因型与所研究的数量性状水平的关系,需要调整混杂因素时则采用协方差分析( analysis o f covariance)或线性回归引起结果误差的主要原因有人群分层和多重假设检验调整。

无论是 GWAS两阶段/多阶段设计, 还是采用 Bonferroni校正等遗传统计方法, 都难以解决人群分层及多重比较导致的假阳性或假阴性问题。

GWAS不能仅凭 P 值判断某个 SNP是否与疾病真正关联, 多种族、多群体、大样本的重复验证研究(replication)才是提高检验效能、确保发现真正疾病关联 SNP的关键。

【例】全基因组关联分析在乳腺癌易感位点筛选的应用2007 年 6 月，乳腺癌关联协作组 ( Breast Cancer Association Consortium，BCAC) 首先报告了乳腺癌 GWAS 的结果，该研究共包括三个阶段: 第一阶段: 408 例家族性乳腺癌患者和400 名对照，266 722 个 SNP;第二阶段: 3990 例乳腺癌患者和3916 名对照，12 711 个SNP;第三阶段: 22 例病例－对照研究，合计21 860 例患者和22 578 名对照，30 个 SNP。

研究结果最终发现了5 个乳腺癌的易感性位点，4 个位于已知基因: FGFR2 ( rs2981582) 、TNRC9 /LOC643714( rsl2443621 ) 、 MAP3K1( rs889312) 和 LSPl ( rs3817198) ，而 rsl3281615 位于染色体8q24。

虽然 GWAS结果在很大程度上增加了对复杂性状分子遗传机制的理解,但也显现出很大的局限性。

首先，通过统计分析遗传因素和复杂性状的关系,确定与特定复杂性状关联的功能性位点存在一定难度。

通过GWAS发现的许多SNP位点并不影响蛋白质中的氨基酸,甚至许多SNP位点不在蛋白编码开放阅读框(open reading frame ,ORF)内,这为解释 SNP位点与复杂性状之间的关系造成了困难。

而且，就目前来说 GWAS难以检测的部分可能主要集中在最小等位基因频(minor allele frequency ,MAF)介于 0 . 5 % ~ 5 %之间的少见变异, 或者MAF< 0 . 5 %的罕见变异,现有的基因分型芯片较难有效地发现这些遗传变异但是，由于复杂性状很大程度上是由数量性状的微效多基因决定的,SNP位点可能通过影响基因表达量对这些数量性状产生轻微的作用，它们在RNA的转录或翻译效率上发挥作用，可能在基因表达上产生短暂的或依赖时空的多种影响，刺激调节基因的转录表达或影响其RNA剪接方式。

因此，在找寻相关变异时应同时注意到编码区和调控区位点变异的重要性。

其次，等位基因结构 (数量、类型、作用大小和易感性变异频率)在不同性状中可能具有不同的特征。

在GWAS研究后要确定一个基因型-表型因果关系还有许多困难，由于连锁不平衡的原因，相邻的SNP之间会有连锁现象发生。

同样，在测序时同样存在连锁不平衡现象，而且即使测序的费用降到非常低的水平，要想如GWAS研究一般地获得大量样本的基因组数据还是非常困难的。

*llumina宣布HiSeq X Ten测序系统将会于1月份重磅回归，该技术的早期运用还需要等待一段时间，然而GEN预测了Illumina X Ten在2015年可能会实现的6大应用。

Illumina X Ten的测序功能非常强大，一台机器一年能完成18000个人类基因组测序，尽管大规模基因组测序还会面临一系列挑战，但是现在可以将这些顾虑暂时搁置，思考一下科学家们可以利用该技术完成哪些有趣的工作呢？下面就是GEN预测的6大应用。

1 新生儿与儿科疾病预测新生儿重症监护病房和儿童医院每年都会收治大量患有严重疾病的患儿，而其中很多致命的疾病都存在其遗传基础。