QTL作图的基本原理和完备区间作图方法
QTL定位的原理和方法

Fine Mapping Strategies
Genomewide-based strategies:
Large scale BC, F2, half sibs, etc. Recombinant inbred lines (RIL) Advanced Intercross Lines (AIL)
标 记 和
概 率
19:27
数据分析
• yij为具有QTL基因型 j的个体 i 的性状记录; • m j为具有QTL基因型 j的个体的期望效应(如 m d
或 m a ); • eij为随机误差,并且 eij ~ N (0, 2 ),因此有:
yij ~ N (mj , 2 )
19:27
– 1 LOD下降对应97%的QTL置信区间;
– 2 LOD下降对应99.8%的QTL置信区间;
19:27
19:27
Bootstrap置信区间
1. 对于一个大小为 n的群体,抽取 n个带有覆盖性
质的记录(有些记录被抽取多次,而有些记录 没被抽取);
2. 分析并估计QTL位置;
3. 重复上面的1和2两个过程,如200次或更多;
4. 在分布的两尾去掉2.5%的极端的QTL位置估计 值;
5. 剩余的95%表示置信区间的估计值。
19:27
QTL位置估计的置信区间
19:27
预测置信区间
• 置信区间的长度受样本大小、QTL效应和标记密 度的影响,对一个高密度标记图谱,Darvasi and Soller (1997)给出了一个预测的近似95%的置信 区间(单位cM):
19:27
19:27
多次检测问题
• 如果有许多独立的零假设被检验,而且事 先知道所有的零假设都为真,则,至少出 现一次假显著(false positive)的概率为
线性模型作图法

以上所介绍的作图方法均建立在一个简单的遗传假 设上:数量性状的表现型变异只受遗传效应和残差 机误影响,且遗传效应为固定效应,仅残差机误为 随机效应。因而这些方法均不能直接分析更多的随 机效应(如环境效应和环境互作效应等) 基于混合线性模型的作图方法一方面可以把遗传效 应和残差机误作更深层次的分解,使模型项目不断 扩充;另一方面可在模型中包括多项随机效应,同 时分析固定效应和多项随机效应 因此该作图方法既可不断地深化对数量性状QTL效 应构成的了解,更能直接有效地分析环境及环境互 作等随机效应,具有广阔的应用前景
j j hj h hj h hj h
u
f
M fj
eM uME eME hj
f l lhj lh
where a and d additive and do min ant effect of QTL, fixed xA and xD coefficients of QTL effects
量eDE等 ) ,可采用BLUP、LUP或AUP等预测
随机效应的方法预测
也可采用Henderson 提出的方法同时估计QTL 主效应及预测QTL×环境互作效应
u 1 Байду номын сангаас 1 6 6
Ru matrix about correlation coefficient
四、基于混合线性模型的复合区间作图
2. 最大似然分析
L1 (b,V ) (2 ) n / 2 V
1/ 2
exp[ 1/ 2( y Xb)T V 1 ( y Xb)]
( X T V 1 X ) 1 X T V 1 y b Var ( b) ( X T V 1 X ) 1
四、基于混合线性模型的复合区间作图
QTL作图主要统计方法及主要作图群体

同时, 也将其他适当选取的标记考虑到模型中以控 制遗传背景效应。 V&;J 为这种方法命名为复合 区间作图法 ( X/L4/@AD> CBD>EF. ’F44AB0) , 简称 XC’% 以 B 个个体的回交群体为例, 其 XC’ 模型如下: (& + ! Y * ! +& ! Y "*,+&, Y -& , , , …, & +$ . ($ % <)
!
收稿日期:#))> D )@ D )U 基金项目:国家自然科学基金重点项目 ("?J))*G) ; 云南省教育厅科研基金资助项目 ()!*!>@);)#A1)@!)
万方数据 (!"U! D ) 作者简介:林谦 , 女, 湖北黄冈人, 硕士, 讲师, 主要从事分子数量遗传学研究。
7>>
云南农业大学学报
" 表示标记与 &’( 之间的重组率。 % 检验统 计量为:
!!! L !!$ (7O@) 7 > 7 ’&( M ) (7 (> > ’& 为两个标记基因型间样本方差, (7, (> 分
%& !! 和 !$ 的个体数, , %& P ( % ) L >) ) 为总个体数。两标记群体的期望差异为: [!!! L !!$ ] * K [ (7 L " ) [! (7 L " ) " >] L " 7M K !7 M ! !>] ( $ M +) (7 L > " ) (7O6) 零假设 DI : (7OQ) !!! L !!$ K I 可用上述 , 检验来检验零假设是否成立, 若成 立, 有两种可能: ( $ M +) (7OH) K I 或 " K IOQ 前者说明没有遗传效应, 而后者说明 &’( 与 标记独立。该分析过程可在 !#!, !R!! 等统计软件 中进行。 综上所述, 单标记分析法在一定程度上是有效 的, 简单且抓住了 &’( 作图的本质。但该方法的 [Q, H] 估计结果较粗糙 , 只能说明 &’( 与标记相关, 但不能估计出它的大致位置, 且 &’( 与标记之间 的重组率无法单独估计, 无法区别否定 DI 的原因 究竟是一个效应小的 &’( 与标记紧密连锁还是一 个效应大的 &’( 与标记松散连锁。 !"# 区间作图法 (#SFTU 和 VE!’T$S 等提出了基于两个侧连 [Q] 标记的区间作图法 ( $+,/0.*: "*33-+4) 简称 $"5 它 以一元回归模型和正态混合分布的极大似然函数 为基础, 借助于分子标记连锁图谱, 计算基因组任 一相邻标记之间的任一位置上存在 &’( 和不存在 ( (EF 值) 。根据整 &’( 的似然函数的比值的对数 个染色体上各点的 (EF 值可以描绘出一个 &’( 在 染色体上存在与否的似然图谱。当 (EF 值超过某 一给定的临界值时, &’( 的可能位置可用 (EF 支 持区间表示出来。在回交群体中, 似然函数为:
区间作图法

*
QQ的频率 (1- rM Q )(1- rQM (1- rM Q ) rQM
i i 1 i 1
Qq的频率
i i 1
M i M i M i 1M i 1 n1 M i M i M i 1mi 1 M i mi M i 1M i 1 M i mi M i 1mi 1 n2 n3 n4
i
i 1
) / rM M
i
i 1
i 1
/ rM M
i
i 1
1- ) 1
(0) ( 1)
1- (0) 0
rM Q rQm
i
i 1
/(1- rM M
i
i 1
)0
(1- rM Q )(1- rQm ) /(1- rM M
i i 1 i
i 1
Mi Mi
rMiQ Q q
Mi+1 mi+1
第9讲 植物QTL作图的基本原理(2)
一、单标记分析Single marker analysis
二、区间作图Interval mapping
三、复合区间作图Composition interval mapping 四、基于混合线性模型的复合区间作图 Composition interval mapping based on mixed linear model
M1M1m2 m2
M1m1M2 M2
M1m1M2 m2
(1- ) 1-2 (1- )
(1 )2 2 (1 ) 1
2
0 0 0
2 rM 1M 2
1
1
2
(1- )
M1m1m2 m2
m1m1M2 M2
1
作物QTL分析的原理与方法

作物QTL定位方法与技术作物QTL定位的方法主要有传统连锁分析、基因芯片 技术和深度学习等。连锁分析通过群体遗传学手段,鉴定两个或多个基因位点 间的连锁关系,进而确定控制性状的QTL。基因芯片技术利用基因组wide的标 记分布,对大量基因位点进行同时检测,高效地定位QTL。深度学习则利用神 经网络等算法,自动化学习和识别数据中的特征,实现对QTL的精准定位。
四、自然群体
自然群体是指在没有人为干预下自然形成的群体,如野生种、地方品种、自然 变异群体等。这些群体通常具有丰富的遗传变异和复杂的遗传结构,对于研究 作物的适应性、抗逆性和产量等性状的遗传基础非常有用。此外,自然群体还 可以用于发现和克隆稀有或特殊的QTL。
五、基于基因组的作图群体
随着基因组学技术的发展,基于基因组的作图群体越来越受到重视。这种群体 可以通过重测序技术获得大量的SNP(单核苷酸多态性)标记,并利用这些标 记构建高密度的遗传图谱。这种图谱可以用于精细定位和克隆QTL,以及研究 基因组中的结构变异和非编码区基因组。
2、QTL分析的具体步骤
(1)数据采集:收集作物的基因型和表型数据。基因型数据可以通过高通量 测序技术获得,而表型数据则可以通过田间试验和室内分析等方法获得。
(2)作图:利用作图软件将基因型和表型数据组装成图,以展示它们之间的 关系。常用的作图软件包括QTL Cartographer、QTL IciMapping等。
原理
1、QTL的概念及定义
QTL是指作物基因组中控制数量性状的基因座位,它们可以通过影响表型变异 来影响作物的农艺性状。QTL通常分为两类:主效QTL和微效QTL。主效QTL是 指对表型变异起主要作用的QTL,而微效QTL则是指对表型变异起较小作用的 QTL。
QTL定位研究与作图

Lander 和Botstein( 1989) 等提出, 建立在个体数 量性状观测值与双侧标记基因型变量的线性模型的基础上, 利 用最大似然法对相邻标记构成的区间内任意一点可能存在的QTL 进行似然比检测, 进而获得其效应的极大似然估计。其遗传假 设是, 数量性状遗传变异只受一对基因控制,表型变异受遗传效 应( 固定效应) 和剩余误差( 随机效应) 控制, 不存在基因型 与环境的互作。区间作图法可以估算QTL 加性和显性效应值。 与单标记分析法相比, 区间作图法具有以下特点:能从支撑区间 推断QTL 的可能位置;可利用标记连锁图在全染色体组系统地搜 索QTL, 如果一条染色体上只有一个QTL, 则QTL 的位置和效应 估计趋于渐进无偏; QTL 检测所需的个体数大大减少。但IM也 存在不足: QTL 回归效应为固定效应;无法估算基因型与环境间 的互作( Q×E) , 无法检测复杂的遗传效应( 如上位效应等) ; 当相邻QTLs 相距较近时, 由于其作图精度不高, QTLs间相互干
对QTL的定位必须使用遗传标记 ,遗传标记是指生物体的某些性状或物质 , 它们能够稳定遗传且遗传方式简单, 可 以反映生物个体或群体的特征。现有的遗 传标记有形态标记、同工酶标记、RFLP标
记、RAPD标记、AFLP标记等。
人们通过寻找遗传标记和感兴趣 的数量性状之间的联系,将一个或多个QTL 定位到位于同一染色体的遗传标记旁,换句 话说,标记和QTL是连锁的。根据统计分析 方法的不同, 可分为方差与均值分析法、回 归及相关分析法、矩估计及最大似然法等。 根据标记区间数可分为零区间作图、单区间 作图和多区间作图。此外, 还有将不同方法 结合起来的综合分析方法, 如QTL 复合区间 作图( CIM) 多区间作图( MIM) 、多QTL 作
QTL 定位方法---

QTL 定位方法分子标记技术和数量遗传学的发展,使得分子遗传学与数量遗传学相互渗透和融合,从而形成了一个新的研究领域—分子数量遗传学(Molecular Quantitative Genetics)。
分子数量遗传学研究的内容,就是借助分子标记,采用适当的统计分析方法明确QTL 在染色体上的位置及其效应。
而QTL 定位的原理是:利用适当的分离群体,构建较高密度的、分布较均匀的、覆盖全基因组的分子标记连锁图。
根据遗传连锁的基本遗传学原理,对分离群体中单株的标记基因型和性状的表型值进行一定的统计分析,将决定数量性状的QTL 定位在分子标记连锁图中。
目前,QTL 定位的方法主要有单标记分析法(Edwards et al, 1987),区间作图法(Lander and Botstein, 1989)和复合区间作图法(Zeng, 1994)等。
单标记法(Single marker analysis)是最简单的分析标记与性状关联的方法,包括以标记为基础的分析方法(Marker-based analysis, MBA)和以性状为基础的分析方法(Trait-based analysis, TBA,Lebowitz et al., 1987)。
前者利用每个标记位点不同基因型间的性状均值差异,以传统的单因素方差分析法测验被研究的数量性状在标记基因型间的差异显著性。
对于一个作图群体而言,任意标记位点具有三种基因型(F2群体)或两种基因型(回交群体、重组自交系、双单倍体系),分析每一基因型个体的数量性状均值的差异,并进行F 测验,当F 测验显著时,则表明该标记位点可能与一个或多个QTL 连锁。
利用这种方法进行的数量性状分析,既简单又符合QTL 定位的基本统计原理,且不需要完整的分子标记连锁图,是定位QTL 的最为有效方法。
但不足之处是不能准确估计QTL 的位置,且往往会低估其遗传效应。
以性状为基础的分析方法的原理是假定因选择而使数量性状的高表型个体中的QTL 增效等位基因和低表型个体中的QTL 减效等位基因的频率增加,当QTL 的等位基因与某一标记基因连锁时,会因相互关联而导致高、低表型个体间标记基因频率的差异。
数量遗传(QTL)定位的原理及研究进展(ppt文档可编辑修改)

上也取得了巨大的进展。
营销人员必备知识
二、QTL定位的群体
营销人员1必、备分知识离群体
与环境的互作;
存在基因的多效性和异质性;
较低的外显率;
随机机误影响较大,统计功率较低。
4、数量性状(基因)的研究方法
借助1数、理市 统计场方营法销 ,将基复本杂概 的多念基因系统作为一个整体或灰色 、营销人员系必统备2,、 知用识 电平均信值市和场 方差介来绍表示数量性状的整体遗传特征, 而对
单 互作个3等基、无因市法的深效场入应分及了析 解位,置方从、法而基限因制间了的育相种互中作数用量及性基状因的与遗环传境的操作
营销人员必备知识
由1、于市个场体营间销存基在本分概离念,因此,这类群体的缺点是 难2、以电进信行市多场年介、绍多点试验和消除环境的干扰; 最31、早、市用市场场 于分营Q析T销L方基定法本位概研念究的主要分离群体是F2和回 交2群、体电信市场介绍
由3于、形市成场F分 2个析体方的2法个配子都含有重组事件的信息,因此
销人员必备知识
包1括、回市交场群营体销、基F本2及概其念衍生的F3、F4家系等; 特21点、 、是电 市群信 场体市 营内场 销个介 基体绍 本间概基念因型不同,各个体的基因 型32杂、 、合市 电;场 信分 市析 场方 介法 绍 这13类、、群市市体场场营的分销优析基点方本是法概不念但可提供丰富的遗传信息, 而2且、可电以信市用场来介估绍算加性效应及显性效应,这在杂 种3优、势市机场分理析研方究法中是其他群体不可替代的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Position (cM) RIL1 RIL2 RIL3 RIL4 RIL5 RIL6 RIL7 RIL8 RIL9 RIL10
0.0 1 2 1 1 1 1 1 2 1 1
3.5 1 2 2 1 1 1 1 2 1 1
8.5 1 2 2 1 1 1 1 1 1 1
19.5 1 2 2 1 1 2 1 2 1 1
3个标记间的重组率
当
(即两个区间上的交换是独立的)时,有 或
当时 (即完全干涉,一个区间上的交换完 全阻止另外一个区间上的交换),有
作图函数
图距(Mapping distance)
图距的单位:摩尔根(M, Morgan)或厘 摩(cM,centi-Morgan), 1M=100cM 图距m是交换率r的函数,即: 为作图函数(Mapping function)。 ,称f
DATASET OF QTL MAPPING Mapping population Linkage map Marker genotype Phenotypic data
QTL作图群体
F2群体 (张鲁燕专门讲解) 回交 (BC, backcross) 群体 加倍单倍体 (DH, doubled haploids) 群体 重组近交家系 (RIL, recombination inbred lines) 群体 导入系(染色体片断置换系) 自然群体
1 + 2r 1 − 2r
r=
−1 1e 2 em / 25 + 1
e m /+ 1 25
4m
三种作图函数的比较
不同物种的遗传图距和物理图距间的关系
物种 酵母(Yeast) Neurospora Arabidopsis Drosophila 西红柿(Tomato) 人类(Human) 小麦(Wheat) 水稻(Rice) 玉米(Corn) 单倍体基因组大小(kb) 遗传图谱的长度(cM) 碱基对(kb)/cM 2.2×10 4 4.2×10 4 7.0×10 5 2.0×10 5 7.2×10 6 3.0×10 7 1.6×10 5 4.4×10 6 3.0×10
The expectation of the genotypic value G conditional on known marker types can be written as a linear function of marker variables
are where b1 = λ1a1, b j = ρ j −1a j −1 + λ j a j (j=2, …, m), and bm +1 = ρ m am; and functions of the three recombination fractions between the jth marker and the jth QTL, between the jth QTL and (j+1)th marker, and between the jth and (j+1)th markers.
线性模型(j=1,2,…,n )
yi = b0 + b* x * + e j j
b*表示QTL的效应,
x
* j 为取值0和1的指示变量
区间测验 (Interval test) 似然曲线 (Likelihood profile)
回交群体区间作图方 法中指示变量的取值
区间标记型 标记型* 左侧标记 i 1 2 3 4 + + 右侧标记 i+1 + + 样本量
理论频率 f1= 1 (1-r) 2 f2= 1 r 2 f3= 1 r 2 f4= 1 (1-r) 2
重组率的极大似然估计
建立似然函数
建立对数似然函数 求解重组率的极大似然估计
求信息量 应用估计公式求重组率的估计值和它的方差
实
例
某回交试验中 P1和P2的基因型分别为AABB和aabb 回交BC1世代中4种基因型的植株数 AABB:162;AABb:40; AaBB:41;AaBb:158
第六届“QTL作图和育种模拟研讨会”,2010年4月19-21日,湖北武汉
QTL作图的基本原理和 完备区间作图方法
李慧慧 Institute of Crop Science, Chinese Academy of Agricultural Sciences lihuihui@
OUTLINES
Linear regression model
表型对标记线性回归模型的性质
假定不同QTL间的效应是可加的,偏回归系数只依 赖于两个相邻标记所标定区间上的QTL.
模型中加入非连锁标记,能有效控制剩余遗传方差, 从而降低统计量的抽样方差,提高QTL的检测功效. 模型中的连锁标记可以降低连锁QTL对检验统计量 的影响. 模型中的两个标记的偏回归系数是不相关的。
4
3700 500 500 290 1400 2710 2575 1575 1400
6 80 140 700 510 1110 6214 279 2140
EXAMPLE: 10 RILS OF RICE (LINKAGE MAP OF CHR. 5 )
Marker C263 R830 R3166 XNpb387 R569 R1553 C128 C1402 XNpb81 C246 R2953 C1447 Grain width (mm)
BC1 基因型 MMQQ MMQq MmQQ MmQq
1 2
BC2 基因型值 m+a m+d m+a m+d 基因型 MmQq Mmqq mmQq mmqq
1 2
基因型频率
1 2
基因型频率
1 2
基因型值 m+d m-a m源自d m-a(1 − r )
1 2
(1 − r )
1 2
r r
r r
1 2
1 2
= r ( m + a ) + (1 − r )( m + d ) = m + ra + (1 − r ) d
两种标记基因型的平均值差异
μ MM − μ Mm = (1 − 2r )(a − d )
单标记分析中的假设测验
亚群体(Sub-populations) t-统计量的计算
t= ˆ ˆ μ1 − μ 2 se2 se2 + df1 df 2
p=
riq ri ( i +1)
x*
n1
1 取 1 的概率为 1-p;取 0 的概率为 p 取 1 的概率为 p;取 0 的概率为 1-p 0
n2
n3
n4
回交群体中的区间标记型和QTL基因型
Additive genetic model and the derived statistical model for mapping additive QTL
常见作图函数
• Morgan 作图函数
以M为单位 m =r (M) 以cM为单位 m =r ×100 (cM)
• Haldane 作图函数 没有考虑干涉的情况下,即M1-M2间的
交换和M2-M3间的交换相互独立 以M为单位 以cM为单位 m = f (r ) = −50 ln(1 − 2r )
r = 1 (1 − e − 2 m ) 2
r = 1 (1 − e − m / 50 ) 2
• Kosambi作图函数 考虑干涉的情况下,即M1-M2间的交换
和M2-M3间的交换不独立,干涉系数应重组率的函数 1 + 2r 以M为单位 m = f (r ) = 1 ln 1 − 2r r = 1 e − 1 4 2
4m
以cM为单位
m = 25 ln
Parameters estimation:
ˆ B H 0 = (X' X)X' Y
2 ˆ ˆ σ H = [( Y − XB H )' (Y − XB H )] / n
0 0 0
•
•
Parameters estimation:
ˆ ˆ ˆ B = (X' X)X' (Y − P b * )
ˆ ˆ ˆ ˆ b * = ( Y − XB )' P / c
Composite Interval Mapping (CIM;Zeng 1994)
• Linear regression model:
y j = b0 + b* x * + j
• Hypotheses:
k ≠ i ,i +1
∑b
•
k
x jk + e j
•
Likelihood function under the null hypothesis:
96.8 1 2 2 2 1 2 1 2 1 1 2.33 1.99 2.24 1.94 2.76 2.32 2.32 2.08 2.24 2.45
•15
QTL作图的基本原理
一个标记位点上3种基因型的性状平均数
•16
P1:MMQQ×P2:MMQQ回交群体中标记位点M与 数量性状基因位点Q的基因型及其频率和基因型值
• QTL作图所需数据 • 标记数据和连锁图谱构建 • QTL作图的基本原理 • 数量性状基因的完备区间作图方法 (ICIM) • ICIM在实际作图群体中的应用
WHAT IS QTL MAPPING?
The procedure to map individual genetic factors with small effects on the quantitative traits, to specific chromosomal segments in the genome is called QTL mapping. The key questions in QTL mapping studies are: How many QTL are there? Where are they in the marker map? How large an influence does each of them have on the trait of interest?