1 张勤 动物基因组选择
张勤主编的(畜牧兽医)生物统计学方面的习题作业及答案

第一章绪论一、名词解释总体个体样本样本含量随机样本参数统计量准确性精确性二、简答题1、什么是生物统计它在畜牧、水产科学研究中有何作用?2、统计分析的两个特点是什么?3、如何提高试验的准确性与精确性?4、如何控制、降低随机误差,避免系统误差?第二章资料的整理一、名词解释数量性状资料质量性状资料半定量(等级)资料计数资料计量资料二、简答题1、资料可以分为哪几类它们有何区别与联系?2、为什么要对资料进行整理对于计量资料,整理的基本步骤怎样?3、在对计量资料进行整理时,为什么第一组的组中值以接近或等于资料中的最小值为好?4、统计表与统计图有何用途常用统计图、统计表有哪些?第三章平均数、标准差与变异系数一、名词解释算术平均数几何平均数中位数众数调和平均数标准差方差离均差的平方和(平方和)变异系数二、简答题1、生物统计中常用的平均数有几种各在什么情况下应用2、算术平均数有哪些基本性质?3、标准差有哪些特性?4、为什么变异系数要与平均数、标准差配合使用?三、计算题1、10头母猪第一胎的产仔数分别为:9、8、7、10、12、10、11、14、8、9头。
试计算这10头母猪第一胎产仔数的平均数、标准差和变异系数。
2、随机测量了某品种120头6月龄母猪的体长,经整理得到如下次数分布表。
试利用加权法计算其平均数、标准差与变异系数。
组别组中值(x)次数(f)80—84 288—92 1096—100 29104—108 28112—116 20120—124 15128—132 13136—140 33、某年某猪场发生猪瘟病,测得10头猪的潜伏期分别为2、2、3、3、4、4、4、5、9、12(天)。
试求潜伏期的中位数。
4、某良种羊群1995—2000年六个年度分别为240、320、360、400、420、450只,试求该良种羊群的年平均增长率。
5、某保种牛场,由于各方面原因使得保种牛群世代规模发生波动,连续5个世代的规模分别为:120、130、140、120、110头。
动物遗传育种学资料整理

第二章 通径系数1、父子之间的相关为(0.5);母女之间的相关为(0.5);叔侄之间的相关为(0.25);祖孙间的相关为(0.25)2、全同胞之间的相关为(0.5);半同胞之间的相关为(0.25)3、表示通径线相对重要性的数值称(通径系数);表示相关线相对重要性的数值称为(相关系数)4、自然界两个或多个事物的关系不外乎两种情况,一种是平行关系,另一种是(因果关系)5、简述通径链的追溯原则。
(1)先退后进;(2)在一条连接的通径链内最多只能改变一次方向;(3)邻近的通径必须以尾端才能与相关线相连接、一条通径链最多只能含有一条相关线、不同的通经链可以重复通过一条相关线; (4)追溯两个结果的所有通径时应避免重复。
6、老李(X )有个亲侄子(Y ),侄子又有了个儿子(Z ),根据三者关系画出一个谱系,并求X 与Z 的相关。
解:Z125.0)2/1()2/1(44)(=+=XZ R第三章 群体的遗传组成1、解释下列名词孟德尔群体、基因库、基因频率、基因型频率、随机交配孟德尔群体:个体间能相互繁殖的群体,它们享有共同的基因库,群体遗传学所研究的群体均为孟德尔群体。
基因库:指群体全部遗传基因的总和。
基因频率:指群体中某一基因对其等位基因的相对比例。
基因型频率:指一个群体中某一性状的各种基因型的比例。
随机交配:指在一个有性繁殖的生物群体中,任何一个雌性或雄性的个体与任何一个相反的性别的个体交配的 概率相等 。
2、一个性状的遗传性不仅决定于基因,更直接的决定于(基因型)。
3、群体遗传学的交配系统包括(随机交配、选型交配、近交)而没有杂交。
4、在一个随机交配的平衡群体中,杂合子的比例其值永不超过(0.5)。
5、在一个平衡群体中,对于一个稀少的等位基因而言,稀少基因的频率下降10倍,则杂合子频率与稀少基因纯合子频率的比值(增加10倍)。
6、一个孟德尔群体是个体间能相互繁殖的群体,它们享有共同的(基因库)。
7、就畜禽个体而言,完全不加任何选配而绝对随机的交配(比较少)。
基因组选择技术及其在猪育种中的应用探讨

基因组选择技术及其在猪育种中的应用探讨一、简介基因组选择技术是一种利用先进的遗传学和生物信息学技术,通过对个体基因组的全面分析,选取优良基因组的方法。
本文将探讨基因组选择技术在猪育种中的应用,包括其原理、技术手段和在猪育种中的具体应用案例。
二、基因组选择的原理基因组选择技术的核心原理是基于遗传多态性,通过测定个体基因组上的关键位置的基因型,来评估这些个体的遗传潜力。
对于猪育种来说,关键位置一般指的是对性状和经济性状有重要影响的基因。
三、基因组选择的技术手段基因组选择技术的应用离不开以下几种主要的技术手段:1. SNPs分析SNPs(Single Nucleotide Polymorphisms)是基因组中常见的遗传变异形式,是在基因组中单个核苷酸位置上的单碱基突变。
通过对SNPs的分析,可以快速、高效地评估个体基因组的多样性和遗传水平。
2. GWASGWAS(Genome-Wide Association Study)是一种通过对大量个体基因组数据进行关联分析,来寻找基因与性状相关性的方法。
通过GWAS可以发现与猪育种有关的重要基因,并为进一步的基因组选择提供依据。
3. QTL分析QTL(Quantitative Trait Loci)是指影响数量性状的基因或位点,通过对QTL的定位和分析,可以确定这些基因在个体中的具体位置,进而预测个体的遗传性状。
四、基因组选择在猪育种中的应用案例基因组选择技术在猪育种中的应用已经取得了显著的成果。
以下是一些具体的应用案例:1. 疾病抗性育种基因组选择技术可以帮助猪场选育更具抗病力的猪种。
通过对猪基因组中与抗病相关的基因的分析,可以选取携带有这些基因的个体进行繁殖,提高整个猪群的抗病力。
2. 生长性能改良基因组选择技术可以用于改良猪的生长性能。
通过对一些与生长发育相关的基因进行筛选,可以选取具有快速生长、高瘦肉率等优良性状的个体进行繁殖,提高猪的生产性能。
3. 品质优化基因组选择技术在优化猪肉品质方面也有广泛应用。
动物全基因组选择育种技术路线

动物全基因组选择育种技术路线以动物全基因组选择育种技术路线为题,本文将介绍动物全基因组选择育种技术的原理、应用和前景。
动物全基因组选择育种技术是指利用高通量测序技术和生物信息学分析方法,对动物全基因组进行全面的测序和分析,从而实现对某种特定性状的选择育种。
需要对待选动物进行全基因组测序。
通过将待选动物的DNA提取并进行高通量测序,可以获得该动物的全基因组序列。
随着高通量测序技术的不断发展,现在已经可以快速、准确地测序动物的全基因组。
接下来,将测序得到的全基因组序列进行生物信息学分析。
通过比对该动物的基因组序列与参考基因组序列的差异,可以识别出与特定性状相关的基因和突变位点。
此外,还可以利用生物信息学方法分析基因的功能、调控网络等信息,进一步了解基因与性状之间的关系。
在分析得到与特定性状相关的基因和突变位点后,可以利用这些信息进行选择育种。
通过选择具有有利基因和突变位点的个体进行配对繁殖,可以逐渐累积有利基因和突变位点,从而达到改良特定性状的目的。
这种选择育种方法相比传统的选择育种方法,可以更加精确地选择和改良特定性状,提高育种效果。
动物全基因组选择育种技术在农业、畜牧业和宠物养殖等领域具有广阔的应用前景。
通过该技术,可以提高农作物和家禽的产量和品质,改良畜牧动物的生长速度和抗病能力,培育出更适合家庭和社会需求的宠物。
同时,动物全基因组选择育种技术也可以用于保护濒危物种和改良野生动物的种质资源,以促进生物多样性的保护和可持续利用。
然而,动物全基因组选择育种技术也面临一些挑战和问题。
首先,全基因组测序和生物信息学分析需要大量的时间、资源和专业知识,因此对于一些资源有限的地区和机构来说,实施该技术可能存在一定的困难。
其次,由于动物性状的复杂性和多基因控制性,往往需要对多个基因进行选择和改良,这就需要更深入的基因功能研究和更精准的选择方法。
动物全基因组选择育种技术是一种强大的工具,可以帮助我们更好地了解动物基因组的结构和功能,实现对特定性状的选择育种。
山东小毛驴全基因组选择信号检测

河南农业科学,2021,50(2):145-150Journal of Henan Agricultural Sciencesdoi :10.15933/ki.1004-3268.2021.02.018收稿日期:2020-08-11基金项目:山东省农业良种工程重大课题(2013lz016,2017LZGC020,2017LZN022);山东省现代农业产业技术体系驴创新团队建设专项(SDAIT -27);山东省重点区域引进急需人才项目(2019-58);山东省农业重大应用技术创新项目(SD2019XM 008);2019年乡村振兴重大专项(S190503110001-lcy );内蒙古自治区科技厅关键技术攻关计划项目(2019GG381)作者简介:陈建兴(1980-),男,山西运城人,副教授,博士,主要从事马属动物资源开发利用研究㊂E -mail:kuaihuilai2004@通信作者:孙玉江(1963-),男,山东烟台人,教授,博士,主要从事马属动物分子遗传育种与繁殖研究㊂E -mail:s36s@山东小毛驴全基因组选择信号检测陈建兴1,2,童家兴1,张孝忠2,张向阳3,王宇鑫4,孙玉江2,5(1.赤峰学院化学与生命科学学院,内蒙古赤峰024000;2.青岛农业大学动物科技学院,山东青岛266109;3.内蒙古东阿黑毛驴牧业有限公司,内蒙古赤峰024328;4.东阿阿胶股份有限公司,山东聊城252200;5.东营职业学院,山东东营257091)摘要:为研究不同驴品种间的群体分化程度,检测全基因组选择信号,以挖掘山东小毛驴(SDL )重要性状相关的候选基因,基于山东小毛驴和德州驴的三粉类群(DZS )㊁德州驴的乌头类群(DZW )㊁广灵驴(GL )以及华北驴(NC )等5个驴群体共计60个个体全基因组重测序数据,利用群体遗传分化系数(F st )和核苷酸多样性比值(πratio )方法检测山东小毛驴与其他驴群体间的选择信号,共找到39个落入选择信号区域的候选基因㊂与DZS 群体相比,检测出强选择信号候选基因5个,分别是Fsip1㊁AHNAK2㊁CTAGE2㊁CYP3A12㊁LOC106830441;与DZW 群体相比,检测出强选择信号候选基因5个,分别是NKG2DL1㊁KLK1E2㊁CTAGE2㊁FAM170A ㊁LOC106823932;与GL 群体相比,检测出强选择信号候选基因6个,分别是NKG2DL1㊁AHNAK2㊁CTAGE2㊁FAM170A ㊁LOC106823932㊁LOC106848008;与NC 群体相比,检测出强选择信号候选基因2个,分别是CTAGE2㊁FAM170A ㊂这些候选基因主要在免疫㊁生殖㊁细胞作用等通路中发挥重要的作用,说明山东小毛驴在免疫力和生殖能力等性状上经历了人工选择㊂关键词:山东小毛驴;基因组重测序;选择信号;候选基因;遗传分化系数中图分类号:S822㊀㊀文献标志码:A㊀㊀文章编号:1004-3268(2021)02-0145-06Detection of Selection Signatures of Population-Specific Whole-GenomicRegions Selected in Shandong Little DonkeyCHEN Jianxing 1,2,TONG Jiaxing 1,ZHANG Xiaozhong 2,ZHANG Xiangyang 3,WANG Yuxin 4,SUN Yujiang 2,5(1.College of Chemistry and Life Science,Chifeng University,Chifeng 024000,China;2.College of Animal Science andTechnology,Qingdao Agricultural University,Qingdao 266109,China;3.Inner Mongolia Dong E Black DonkeyAnimal Husbandry Co.,Ltd.,Chifeng 024328,China;4.Dong E E Jiao Co.,Ltd.,Liaocheng 252200,China;5.Vocational College of Dongying,Dongying 257091,China)Abstract :This experiment was conducted to study genetic differentiation among different donkeypopulations by genome-wide detection of selection signatures and search the candidate genes related toimportant traits of Shandong little donkey (SDL ).This study was based on the whole genome re-sequencing data of 60donkeys from 5donkey populations including SDL,Dezhou Sanfen donkey(DZS),Dezhou Wutou donkey (DZW ),Guangling donkey (GL)and North China donkey (NC ).The selectionsignals between SDL and other donkey populations were detected by population genetic differentiationindex(F st )and ratio of nucleotide diversity (πratio )method.As a result,39candidate genes were河南农业科学第50卷detected in the positive selection signal pared with DZS,five candidate genes with strong selection signals were detected,including Fsip1,AHNAK2,CTAGE2,CYP3A12and LOC106830441. Compared with DZW,five candidate genes with strong selection signals were detected,including NKG2DL1,KLK1E2,CTAGE2,FAM170A and pared with GL,six candidate genes within strong selection signals were detected,including NKG2DL1,AHNAK2,CTAGE2,FAM170A, LOC106823932and pared with NC,only two candidate genes with strong selection signals were detected,including CTAGE2and FAM170A.These candidate genes mainly played important roles in the immune,reproductive,cellular and other pathways,revealing that SDL experienced artificial selection in the traits of immunity and reproductive traits.Key words:Shandong little donkey;Whole-genome re-sequencing;Selective signal;Candidate gene; Genetic differentiation index㊀㊀山东小毛驴(SDL)过去主要产地在胶东半岛㊁沂蒙山区和鲁中平原[1],旧称胶东小毛驴,因现在中心产区在海阳等地,又称海阳小毛驴[2]㊂山东小毛驴体质外形与华北驴类同,属小型驴,具有体型小㊁挽力大㊁耐粗饲㊁抗逆性强等特点[2]㊂现代农业机械化和交通业的快速发展,驴的役用地位迅速降低,使得山东小毛驴种质资源迅速衰减,遗传多样性下降,育种潜力逐渐丧失㊂家畜遗传资源问题是全球性生物资源问题的组成部分,与人类未来的生存与发展紧密相关[3]㊂驴产业又是我国的特色产业㊁民生产业和创新产业[4],随着我国社会经济发展和中国特色社会主义建设的不断推进,独特的驴遗传资源将会越来越珍贵,对山东小毛驴的种质资源的保护开发将会日趋重要㊂不同品种驴在体型外貌㊁生长性能㊁抗病力和适应性等方面存在较大差异,这些差异是自然选择与人工选择共同作用于一些目标基因定向选择出来的结果,而选择信号是与选择相对应的基因组信息,是选择在基因组上留下的印迹,通常表现为受选择的DNA片段或位点多态的降低或者基因的纯合[5]㊂随着单核苷酸多态性(SNP)芯片和第二代测序技术成本的不断降低,利用选择信号分析来揭示引起畜禽性状表型差异的遗传机制的相关研究日益普遍㊂吕世杰等[6]利用选择性清除方法筛选郏县红牛和中国荷斯坦奶牛2个品种间差异的基因组区域,通过与动物数量性状座位(QTL)数据库中牛繁殖性状相关QTLs进行比对,认为CFDP1㊁CFDP2和FAM204A基因可优先作为牛繁殖性状相关候选基因㊂PETERSEN等[7]使用固定指数分析寻找了马的基因组的选择信号,研究结果表明,MSTN㊁ECA11和DMRT3基因受到了选择,另外通过关联分析发现,MSTN内含子的1个SNP和启动子的1个InDel 与肌纤维比例有关㊂樊英智[8]通过对我国6个不同类型的家驴品种群体(共57头)进行全基因组混池重测序,分析了不同类群基因组间的选择信号,找到与驴品种表型如体尺㊁毛色等性状有关联的11个候选基因㊂通过对不同驴品种进行基因组重测序,检测不同驴品种群体间基因组的选择信号的差异,有助于揭示品种群体的进化历史,了解重要表型性状形成的遗传基础㊂目前,对山东小毛驴基因组选择信号的检测还未见报道㊂利用群体遗传分化系数(F st)和核苷酸多样性比值(πratio)方法,对山东小毛驴与德州驴的三粉类群(DZS)㊁德州驴的乌头类群(DZW)㊁广灵驴(GL)㊁华北驴(NC)等4个驴群体间的选择信号差异进行分析,以期筛选出山东小毛驴的选择信号区域,探讨山东小毛驴特性的形成原因,旨在为山东小毛驴的保护和利用提供参考㊂1㊀材料和方法1.1㊀供试动物及样品本研究采用4个驴品种(5个群体)共60头驴作为供试动物(表1)㊂对所有样本均采集颈静脉血液10mL于EDTA抗凝管中,置于-20ħ冰箱短暂保存后于干冰保鲜盒中快递至美吉生物公司(上海)进行后续研究㊂1.2㊀测序数据利用超声波将检测合格的样品基因组DNA片段化形成随机片段,对片段化的DNA进行末端修复㊁3ᶄ端加A㊁连接测序接头后,再利用磁珠吸附富集400bp左右的随机片段,经PCR扩增形成测序文库㊂构建好的测序文库通过Illumina HiSeq TM平台进行测序,测序策略为Illumina PE150㊂测序数据已上传到NCBI的SRA数据库,SRA号为SAMN14484743 SAMN14484802㊂1.3㊀SNP、InDel检测与注释本研究采用BWA软件[9]将高质量测序数据比对到参考基因组序列(https://www.ncbi.nlm.nih.641㊀第2期陈建兴等:山东小毛驴全基因组选择信号检测gov/genome/7038)上,利用GATK软件[10]进行比对后校正,并进行SNP和Small InDel标记的检测;利用SnpEff软件[11]和参考基因组的基因预测信息进行变异功能注释,得到SNP㊁InDel的功能注释信息㊂表1㊀供试驴信息Tab.1㊀Information of donkey samples群体Population体型Body size毛色Coat color产地Locality of growth数量/头Number SDL小型灰色山东省烟台市海阳市10 DZS大型三粉山东省聊城市东阿县14 DZW大型黑色山东省德州市禹城市11 GL大型三粉山西省大同市广灵县12 NC小型灰色内蒙古赤峰市阿鲁科尔沁旗131.4㊀Fst 与πratio计算F st计算公式:F st=(MSP-MSG)/[MSP+(n-1) MSG][12]㊂其中,MSP为群体间均方差,MSG为群体内均方差,n为校正后平均样本大小㊂F st可用来评价群体间的分化程度,该值越接近1说明两群体间分化程度越高,越接近于0说明两群体间分化程度非常有限㊂对于高质量SNP(次等位基因频率maf不低于0.05,缺失率miss为0,样本测序深度不低于5),利用VCFtools软件[13]计算了两两群体间的F st值(2Mb窗口,10kb步长滑窗)㊂Π= ij x i x jπij,其中,x i x j分别代表第i个和第j个序列的对应频率,πij则为2个序列之间不同位点所占百分比㊂Π是遗传变异的1个量化值,用于表征某一种群多态性的强弱,通常用于衡量种群内或种群间的多样性,该值不依赖于样本大小[14]㊂每个群体的πratio值也使用VCFtools软件[13]进行计算,同样是2Mb窗口,10kb步长滑窗㊂1.5㊀群体间选择信号检测本研究采用基于F st和πratio的方法对5个驴群体间的选择信号进行检测㊂F st和πratio分别选取阈值0.95和0.05(分位数),关联F st和πratio提取相应候选区域(取重叠区域),并提取相应区域内的变异位点信息㊂采用选择性清除方法,分别对SDL与其余4个驴群体进行比较分析,检测到相应的选择信号区域㊂选择信号强弱的判定,根据VCFtools软件筛选出有选择性消除位点相应的注释,选择注释级别为HIGH而排除MODERATE和LOW的结果㊂对选择信号区域中存在的基因,通过在GeneCards数据库()或NCBI Gene(/gene/?term=)中查询基因注释来确定基因功能㊂2㊀结果与分析2.1㊀5个驴群体变异检测结果5个驴群体的全基因组重测序,共获得740.57G 高质量数据,平均每个样本获得了12.34G的数据㊂将高质量测序数据比对到参考基因组之后,总共获得了10096033个SNP(SDL㊁DZS㊁DZW㊁NC㊁GL分别占72.03%㊁77.01%㊁71.62%㊁74.99%和70.34%)和1311358个InDel(SDL㊁DZS㊁DZW㊁NC㊁GL分别占75.50%㊁79.71%㊁74.46%㊁76.86%和73.48%)㊂整体来看,2种变异(SNP和InDel)的最大比例均出现在德州驴的三粉类群中,而最小比例出现在广灵驴群体中(表2)㊂然而,杂合SNP和InDel数目以及πratio的最大值都出现在山东小毛驴群体中,而最低值都出现在华北驴群体中㊂观测杂合度和杂合SNP数㊁杂合InDel数一样,最大值出现在山东小毛驴群体中,最低值出现在华北驴群体中㊂转换颠换比(Ts/Tv)的最大值出现在山东小毛驴群体中,最低值出现在德州驴的三粉类群中(表2)㊂表2㊀5个驴群体的变异和遗传多样性指数Tab.2㊀Summary of variants and genetic diversity index from five donkey populations群体Population SNP数SNPnumber杂合SNP数Het SNPInDel数InDelnumber杂合InDel数Het InDel观测杂合度Obs Het期望杂合度Exp Het转换颠换比Ts/Tv核苷酸多样性比值πratioSDL DZS DZW GL NC 7272628777495972303177101408757108315191331402028136313012975431246848990056104522897648396357310078691824301647481595241495201425010.693880.690310.676880.680910.676720.404450.405810.398590.401790.400812.0872.0832.0842.0852.0850.425730.420840.417570.419260.41684741河南农业科学第50卷2.2㊀群体间遗传分化分析通过计算F st ,群体间的遗传分化程度能够得到估量,计算结果见表3㊂F st 值从DZS 和NC 群体间的0.00780到DZW 和SDL 群体间的0.011460㊂显然,各F st 值都非常低,接近于0(WRIGHT 认为[15],表3㊀5个驴群体间遗传分化系数Tab.3㊀F st estimates among five donkey populations群体Population DZWNCGLSDLDZS 0.0089500.0078000.0088770.009011DZW 0.0092150.0107710.011460NC 0.0095160.010029GL0.010716该值处于0~0.05,表明群体间遗传分化很小,可以不用考虑),表明这5个驴群体间的分化水平极低㊂2.3㊀山东小毛驴与其他4个驴群体的选择性清除结果选择性清除指新的有利突变会增加其频率并固定下来,导致其相邻核苷酸序列的差异下降或消除的过程[16]㊂为了检测到可能的选择性消除位点,采用基于F st 和πratio 的方法搜索寻找了驴的基因组中的高度固定的区域,筛选过程见图1,选择F st 值大于0.95分位阈值并且πratio 值小于0.05分位阈值的区域,筛选的具体结果见表4㊂蓝色点是筛选的候选区域,F st 值大于0.95分位阈值并且πratio 值小于0.05分位阈值Blue dots mean the regions with F st values greater than 0.95percentile and πratio values lessthan 0.05percentile of genome-wide values图1㊀F st 和πratio 选择的候选位点Fig.1㊀Candidate loci selected with F st and πratio㊀㊀由表4可知,山东小毛驴与其他4个驴群体共检测到正向选择区域95个,德州驴的乌头类群最多,共30个,华北驴最少,只有17个㊂为进一步了解这些信号选择区域的功能,对落入选择信号区域的39个基因及基因功能进行了生物信息学分析㊂山东小毛驴与德州驴的乌头类群比较,群体间信号选择区落入的基因数最多,有13个,与华北驴群体比较信号选择区落入的基因数最少,只有5个(表4)㊂经统计,与德州驴的三粉类群相比,群体间检测出强选择信号候选基因5个,分别是Fsip1㊁AHNAK2㊁841㊀第2期陈建兴等:山东小毛驴全基因组选择信号检测表4㊀山东小毛驴与其他驴群体信号选择区域Tab.4㊀Genomic regions of selection signatures between SDL and other donkey populations群体Population 正向选择区域数量Region numbers ofadaptive selection基因数Gene number强选择信号基因Genes of strongsignal selection基因功能Gene functionDZS2410Fsip1神经发育㊁生殖AHNAK2细胞作用㊁钙信号调节CTAGE2免疫CYP3A12药物代谢㊁脂肪代谢LOC106830441未知DZW3013NKG2DL1免疫KLK1E2免疫CTAGE2免疫FAM170A细胞作用㊁生殖LOC106823932未知GL2411NKG2DL1免疫AHNAK2细胞作用㊁钙信号调节CTAGE2免疫LOC106848008未知FAM170A细胞作用㊁生殖LOC106823932未知NC175CTAGE2免疫FAM170A细胞作用㊁生殖㊀注:基因名称只列出了强信号选择的位点㊂㊀Note:Only the genes of strong signal selection showed in this table.CTAGE2㊁CYP3A12㊁LOC106830441;与德州驴的乌头类群相比,群体间检测出强选择信号候选基因5个,分别是NKG2DL1㊁KLK1E2㊁CTAGE2㊁FAM170A㊁LOC106823932;与广灵驴相比,群体间检测出强选择信号候选基因6个,分别是NKG2DL1㊁AHNAK2㊁CTAGE2㊁FAM170A㊁LOC106823932㊁LOC106848008;与华北驴相比,群体间检测出强选择信号候选基因2个,分别是CTAGE2㊁FAM170A㊂落入强选择信号的10个基因(表4中强选择信号基因列中显示的所有基因),大多与免疫㊁生殖以及细胞作用和代谢相关㊂3㊀结论与讨论本研究采用基于F st和πratio的方法对山东小毛驴和德州驴的三粉类群㊁德州驴的乌头类群㊁广灵驴㊁华北驴等5个驴群体进行了选择信号分析㊂SNP和InDel的最大比例出现在德州驴的三粉类群中,这可能与德州驴自古以来都是优秀大型驴种有关[17],一直与各地驴种之间存在交流,不断有优秀的个体引入该群体,而SNP和InDel的最小比例出现在广灵驴群体中,这与广灵驴目前处于保种状态是相一致的㊂因为处于保种状态,很少有其他驴品种与之交流,必然导致群体近交系数增大,纯合度提高,而群体多样性以及SNP和InDel的比例下降㊂然而,杂合SNP和InDel数目以及πratio的最大值都出现在山东小毛驴群体中㊂尽管山东小毛驴各驴体高明显较德州驴小,而且毛色多为灰色,但很可能与其地理位置相近的德州驴有杂交,也可能与地缘位置较近的河北省的一些驴种有基因交流,而杂合SNP和InDel数目以及πratio的最低值都出现在华北驴群体中,可能与华北驴距离各驴种都较远,而且也可能与采集的样本来自偏远的蒙古族村子有关,与其余驴种很少有杂交,几乎没有外源基因导入该群体㊂遗传分化通常是生物长期进化的产物,受交配系统㊁生物历史和基因流等生物特征的影响㊂WRIGHT[15]认为,如果F st<0.0500,各群体间就几乎没有分化㊂本研究中,各驴群体间的F st值介于0.00780~0.011460,明显低于具有混合交配系统或几年寿命的物种的F st值,表明各驴群体在遗传上很相似㊂这也凸显了对这些驴品种进行保护的必要性,不及时进行保护,现今犹存的一些群体特征会随着群体间杂交而逐渐消失㊂Fsip1是一种生精细胞特异性表达蛋白,也是精子鞭毛纤维鞘的成分,在成年动物的睾丸组织有超高水平的表达,其次为中枢神经系统也有一定表达,已知参与组装AKAP4辅助调节蛋白激酶A (PKA)㊂LIU等[18]发现,Fsip1在HER2过表达型乳腺癌中能够与HER2直接结合调控乳腺癌细胞的生长和侵袭㊂随后,LIU等[19]发现,Fsip1能够通过诱导自噬,减少线粒体生成及增强和激活AMPK途径来调节三阴性乳腺癌细胞的耐药性㊂AHNAK2是AHNAK2基因编码的1个较大的核蛋白,该蛋白质可能通过与钙通道蛋白相结合在钙信号调节中发挥重要作用[20]㊂NKG2DL1是NKG2D这种免疫受体蛋白的配体,该受体因为具有抗病毒和抗肿瘤功能近些年引起了广泛关注[21]㊂KLK1E2基因编码的是丝氨酸蛋白酶的1个亚基,该酶具有广泛的生理941河南农业科学第50卷功能,越来越多的证据表明其参与癌症发生,有些分子具有作为癌症和其他疾病新的生物标志物的潜力㊂有研究表明,KLK1在流感病毒感染早期就干预抗病毒防御,调节流感感染的严重程度,慢性阻塞性肺病患者KLK1表达降低可能导致流感恶化[22]㊂或许受到选择的这些基因对于山东小毛驴适应严酷环境的能力至关重要,这些基因才会在山东小毛驴群体内逐渐固定下来㊂这暗示山东小毛驴可能在免疫相关过程中经历了一定的选择作用,对揭示山东小毛驴免疫性状的遗传机制具有一定的意义㊂这也说明相对于其他驴种,山东小毛驴在抗病力强㊁繁殖力强这些优良性状上经历了较强的人工选择㊂本研究利用5个驴群体共计60个个体的全基因组重测序数据,对山东小毛驴群体选择信号进行了检测分析,检测到选择信号的区域共计95个,落入这些区域并且选择信号强的候选基因有10个㊂相比于其他4个驴群体,山东小毛驴在免疫㊁生殖等性状上经历了人工选择㊂致谢:感谢内蒙古阿鲁科尔沁旗太极天驴集团有限公司的钟勇先生和舒蕾先生在采集华北驴样本时的大力支持;感谢国家级广灵驴保种场姜正广先生和许增孝先生在采集广灵驴样本时的大力支持;感谢东阿阿胶股份有限公司嵇传良先生在采集德州驴样本时提供的大力支持;感谢山东海阳小毛驴保种繁育基地由松利先生在采集山东小毛驴样本时提供的大力支持㊂参考文献:[1]㊀中国马驴品种志编写组.中国马驴品种志[M].上海:上海科学技术出版社,1987.Editorial Section of the Horse and Ass Breeds in China.Horse and ass breeds in China[M].Shanghai:ShanghaiScientific&Technical Publishers,1987.[2]㊀张孝忠,陈建兴,张国梁,等.山东小毛驴概述[J].农业科学,2019,9(9):770-775.ZHANG X Z,CHEN J X,ZHANG G L,et al.Overview ofthe Shandong little donkey[J].Hans Journal ofAgricultural Sciences,2019,9(9):770-775. [3]㊀常洪.中国家畜遗传资源研究[M].西安:陕西人民教育出版社,1998.CHANG H.Research on genetic resources of livestock inChina[M].Xi an:Shaanxi People s Education Press,1998.[4]㊀陈静波,孙玉江,王长法,等.现代养驴关键技术[M].北京:中国农业科学出版社,2019.CHEN J B,SUN Y J,WANG C F,et al.Key technologiesfor modern donkey raising[M].Beijing:ChinaAgricultural Science Press,2019.[5]㊀马云龙,张勤,丁向东.利用高密度SNP检测不同猪品种间X染色体选择信号[J].遗传,2012,34(10):1251-1260.MA Y L,ZHANG Q,DING X D.Detecting selectionsignatures on X chromosome in pig through high densitySNPs[J].Hereditas(Beijing),2012,34(10):1251-1260.[6]㊀吕世杰,陈付英,张子敬,等.利用选择性清除方法鉴定牛繁殖性状相关的候选基因[J].河南农业科学,2020,49(7):133-138.LÜS J,CHEN F Y,ZHANG Z J,et al.Identification ofcandidate genes for cattle reproductive traits usingselective sweep method[J].Journal of Henan AgriculturalSciences,2020,49(7):133-138.[7]㊀PETERSEN J L,MICKELSON J R,RENDAHL A K,etal.Genome-wide analysis reveals selection for importanttraits in domestic horse breeds[J].PLoS Genetics,2013,9(1):e1003211.[8]㊀樊英智.基于全基因组重测序技术对五个中国家驴品种选择信号的研究[D].杨凌:西北农林科技大学,2019.FAN Y Z.The study on selection signals of five Chinesedonkey breeds based on whole genome resequencing[D].Yangling:Northwest A&F University,2019. [9]㊀LI H,DURBIN R.Fast and accurate short read alignmentwith Burrows-Wheeler transform[J].Bioinformatics,2009,25(14):1754-1760.[10]㊀MCKENNA A,HANNA M,Banks E,et al.The GenomeAnalysis Toolkit:A MapReduce framework for analyzingnext-generation DNA sequencing data[J].Genome Res,2010,20(9):1297-1303.[11]㊀CINGOLANI P,PLATTS A,WANG L L,et al.Aprogram for annotating and predicting the effects ofsingle nucleotide polymorphisms,SnpEff:SNPs in thegenome of Drosophila melanogaster strain w1118;iso-2;iso-3[J].Fly,2012,6(2):80-92.[12]㊀WRIGHT S.Physiological and evolutionary theories ofdominance[J].Am Nat,1934,67:24-53. [13]㊀DANECEK P,AUTON A,ABECASIS G,et al.Thevariant call format and VCFtools[J].Bioinformatics,2011,27(15):2156-2158.[14]㊀LIN T,ZHU G,ZHANG J,et al.Genomic analysesprovide insights into the history of tomato breeding[J].Nature Genetics,2014,46(11):1220-1226. [15]㊀WRIGHT S.Evolution and the genetics of populations[M].Chicago:The University of Chicago Press,1978.[16]㊀NIELSEN R,HELLMANN I,HUBISZ M,et al.Recentand ongoing selection in the human genome[J].NatureReviews Genetics,2007,8(11):857-868. [17]㊀杨莉,冯培祥,李海静,等.德州驴生长曲线的拟合分析[J].河南农业科学,2020,49(8):143-148.YANG L,FENG P X,LI H J,et al.Study on growthcurve fitting of Dezhou donkey[J].Journal of HenanAgricultural Sciences,2020,49(8):143-148. [18]㊀LIU T,ZHANG H,SUN L,et al.FSIP1binds HER2directly to regulate breast cancer growth and invasiveness[J].Proc Natl Acad Sci USA,2017,114(29):7683-7688.[19]㊀LIU C,SUN L,YANG J,et al.FSIP1regulates autophagyin breast cancer[J].Proc Natl Acad Sci USA,2018,115(51):13075-13080.[20]㊀KOMURO A,MASUDA Y,KOBAYASHI K,et al.TheAHNAKs are a class of giant propeller-like proteins thatassociate with calcium channel proteins ofcardiomyocytes and other cells[J].Proc Natl Acad SciUSA,2004,101(12):4053-4058.[21]㊀ZAFIROVA B,WENSVEEN F M,GULIN M,et al.Regulation of immune cell function and differentiation bythe NKG2D receptor[J].Cell Mol Life Sci,2011,68(21):3519-3529.[22]㊀MAGNEN M,GUEUGNON F,PETIT-COURTY A,et al.Tissue kallikrein regulates alveolar macrophage apoptosisearly in influenza virus infection[J].Am J Physiol LungCell Mol Physiol,2019,316(6):1127-1140.051。
基于SNP芯片数据分析不同奶牛场基因组近交系数及筛选功能性基因

畜牧兽医学报 2023,54(7):2848-2857A c t a V e t e r i n a r i a e t Z o o t e c h n i c a S i n i c ad o i :10.11843/j.i s s n .0366-6964.2023.07.017开放科学(资源服务)标识码(O S I D ):基于S N P 芯片数据分析不同奶牛场基因组近交系数及筛选功能性基因王振宇1,张赛博1,刘文慧1,梁 栋1,任小丽2,闫 磊2,闫跃飞2,高腾云1,张 震2,3*,黄河天1*(1.河南农业大学动物科技学院,郑州450046;2.河南省奶牛生产性能测定中心,郑州450045;3.河南省种业发展中心,郑州450046)摘 要:旨在利用基因组长纯合片段(r u n s o f h o m o z y g o s i t y,R OH )信息评估河南省不同中国荷斯坦牛群体的全基因组近交水平,并通过R OH 检测鉴定基因组R OH 富集区域,筛选与奶牛经济性状相关的候选基因㊂本研究基于G G P B o v i n e 150K 芯片对来自河南省7个牧场900头荷斯坦牛进行全基因组R OH 检测,统计R OH 在荷斯坦群体中的数目㊁长度及频率,根据R OH 计算基因组近交系数(F R O H ),并对高频R OH 区域进行基因注释㊂结果表明,在全部900个体中共检测出55908个R OH 片段,平均长度4.23M b ㊂7个牧场平均近交系数(F R O H )的变化范围从0.082(H 7)到0.123(H 2),平均F R O H 为0.106㊂在R OH 的高频区域内共鉴定到79个与奶牛经济性状相关的基因,如与牛体型㊁体高有关的基因A K A P 3㊁C 5H 12o r f 4㊁F G F 6,与胴体及繁殖性状相关的基因C A P N 3,与妊娠维持和胎儿生长直接相关的基因C H S T 14,影响牛奶蛋白质组成的基因I L 5R A ,参与调节胎儿卵泡生成的基因F G F 10㊂其中,在14号染色体上检测到一个高频率的R OH 区域(22.78~23.38M b ),超过80%的个体都在该区域内发生R OH 片段,并在此区域鉴定到与生长和饲料转化率相关的基因T G S 1㊁L Y N ㊁C H C HD 7㊂基于R OH 信息的奶牛近交评估可为奶牛场的选种选配提供指导,在高频R OH 区域鉴定到的候选基因可作为奶牛分子育种中进行标记辅助选择的基因㊂关键词:长纯合片段(R OH );基因组近交系数;候选基因;中国荷斯坦牛中图分类号:S 823.91 文献标志码:A 文章编号:0366-6964(2023)07-2848-10收稿日期:2022-11-22基金项目:国家现代农业产业技术体系(C A R S 36);河南省现代农业(奶牛)产业技术体系建设专项资金(H A R S -22-14-S );河南省重点研发专项(221111111100);河南省科技攻关项目(222102110342;222102110254)作者简介:王振宇(1996-),男,河南永城人,硕士生,主要从事动物遗传育种研究,E -m a i l :w z yh a n 2017@163.c o m *通信作者:黄河天,主要从事动物遗传育种研究,E -m a i l :h u a n gh t @h e n a u .e d u .c n ;张 震,主要从事动物遗传育种与繁育研究,E -m a i l :z z gx u @163.c o m G e n o m i c I n b r e e d i n g C o e f f i c i e n t A n a l y s i s a n d F u n c t i o n a l G e n e S c r e e n i n gi n D i f f e r e n t D a i r y F a r m s B a s e d o n S N P C h i p Da t a WA N G Z h e n y u 1,Z H A N G S a i b o 1,L I U W e n h u i 1,L I A N G D o n g 1,R E N X i a o l i 2,Y A N L e i 2,Y A N Y u e f e i 2,G A O T e n g yu n 1,Z H A N G Z h e n 2,3*,HU A N G H e t i a n 1*(1.C o l l e g e o f A n i m a l S c i e n c e a n d T e c h n o l o g y ,H e n a n A g r i c u l t u r a l U n i v e r s i t y ,Z h e n g z h o u 450046,C h i n a ;2.H e n a n D a i r y H e r d I m p r o v e m e n t C e n t e r ,Z h e n gz h o u 450045,C h i n a ;3.H e n a n S e e d I n d u s t r y D e v e l o p m e n t C e n t e r ,Z h e n gz h o u 450046,C h i n a )A b s t r a c t :T h i s s t u d y a i m e d t o e s t i m a t e w h o l e -g e n o m e i n b r e e d i n gl e v e l s o f C h i n e s e H o l s t e i n c a t t l e f r o m d i f f e r e n t h e r d s i n H e n a n p r o v i n c e b y u s i n g t h e r u n s o f h o m o z y g o s i t y (R O H ),a n d i d e n t i f yR O H e n r i c h e d r e gi o n s a n d s c r e e n c a n d i d a t e g e n e s a s s o c i a t e d w i t h t h e t r a i t s o f e c o n o m i c i n t e r e s t .7期王振宇等:基于S N P芯片数据分析不同奶牛场基因组近交系数及筛选功能性基因A t o t a l o f900C h i n e s e H o l s t e i n c a t t l e f o r m7d a i r y h e r d s i n H e n a n p r o v i n c e w e r e u s e d t o d e t e c t g e n o m e-w i d e R OH b y t h e G G PB o v i n e150K B e a d c h i p.T h e n u m b e r,l e n g t h a n d f r e q u e n c y o f R O H i n H o l s t e i n p o p u l a t i o n w a s c o u n t e d.T h e g e n o m e i n b r e e d i n g c o e f f i c i e n t(F R O H)w a s c a l c u-l a t e d a c c o r d i n g t o R O H,a n d t h e h i g h f r e q u e n c y R O H r e g i o n s w e r e a n n o t a t e d.R O H w a s i d e n t i-f i e d i n a l l a n i m a l s,55908R O H w e r e i d e n t i f i e d,w i t h a m e a n l e n g t h o f4.23M b.T h e e s t i m a t e d i n b r e e d i n g c o e f f i c i e n t s o f R O H i n7h e r d s r a n g e d f r o m0.082(H7)t o0.123(H2),w i t h a n a v e r-a g e F R O H o f0.106i n a l l a n i m a l s.M o r e o v e r,79g e n e s r e l a t e d t o t h e e c o n o m i c t r a i t s o f d a i r y c o w s i n t h e g e n o m i c r e g i o n w i t h h i g h f r e q u e n c y R O H w e r e i d e n t i f i e d.A m o n g t h e s e g e n e s,A K A P3, C5H12o r f4,a n d F G F6w e r e r e l a t e d t o t h e b o d y s i z e a n d h e i g h t o f c a t t l e,C A P N3w a s a s s o c i a t e d w i t h c a r c a s s a n d r e p r o d u c t i v e t r a i t s,C H S T14w a s d i r e c t l y r e l a t e d t o p r e g n a n c y m a i n t e n a n c e a n d f e t a l g r o w t h,t h e t r a i t s o f m i l k p r o t e i n c o m p o s i t i o n w e r e a f f e c t e d b y I L5R A,a n d F G F10w a s i n-v o l v e d i n r e g u l a t i n g f e t a l f o l l i c u l o g e n e s i s.N o t a b l y,a h i g h-f r e q u e n c y R O H r e g i o n w a s d e t e c t e d o n c h r o m o s o m e14(22.78-23.38M b),w h e r e m o r e t h a n80%o f i n d i v i d u a l s c a r r i e d R O H f r a g-m e n t s.T h e g e n e s T G S1,L Y N a n d C H C HD7r e l a t e d t o g r o w t h a n d f e e d c o n v e r s i o n w e r e i d e n t i-f i e d i n t h i s r e g i o n.E v a l u a t i o n o f d a i r y c a t t l e i n b r e e d i n g b a s e d o n R O H i n f o r m a t i o n c o u l d b e a u s e f u l t o o l f o r s e l e c t i o n a n d m a t i n g s t r a t e g i e s.T h e c a n d i d a t e g e n e s i d e n t i f i e d c o u l d b e u s e d f o r m a r k e r-a s s i s t e d s e l e c t i o n i n d a i r y c a t t l e b r e e d i n g.K e y w o r d s:r u n s o f h o m o z y g o s i t y(R O H);g e n o m i c i n b r e e d i n g c o e f f i c i e n t;c a n d i d a t e g e n e;C h i-n e s e H o l s t e i n c a t t l e*C o r r e s p o n d i n g a u t h o r s:HU A N G H e t i a n,E-m a i l:h u a n g h t@h e n a u.e d u.c n;Z H A N G Z h e n,E-m a i l:z z g x u@163.c o m基因组长纯合片段(r u n s o f h o m o z y g o s i t y, R OH)一般存在于二倍体生物中,它是亲代将单倍型基因中同源相同(i d e n t i t y b y d e s c e n t,I B D)的片段遗传给子代,并且在子代的基因组中形成连续性的纯合片段[1],即子代从亲代继承了同源的染色体片段,从而导致后代基因组中的纯合片段产生并上升到R O H[2]㊂连锁不平衡㊁种群瓶颈㊁遗传漂变㊁近亲交配和选择都可能是引起R O H产生的因素[1,3-4]㊂不同的群体历史会产生不同长短的R OH,长片段R O H通常由群体近几个世代近交产生,短片段R O H通常来自更远的祖先[5-7]㊂因此,通过全基因组R OH特征的检测,可以了解种群历史㊁结构㊁近交情况㊂R O H最早在人类染色体基因组发现,并被认为可能对人类健康有重要影响㊂随着R O H在人类群体遗传学中研究的深入[8-10],不同畜禽的R O H 分析研究也逐渐开展[11-13]㊂基于R O H估计基因组近交系数已成为利用全基因组信息评估近交的常用方法,即利用R O H计算基因组近交系数F R O H(i n-b r e e d i n g c a l c u l a t e d f r o m R O H),它可以准确计算个体近交系数㊂现已有多项研究证明了基于系谱信息计算的近交系数要低于真实的近交系数㊂杨湛澄等[14]利用牛54K S N P芯片数据对北京地区2107头荷斯坦牛基因组R O H分布进行了统计,并计算了基因组近交系数和系谱近交系数,发现基于R O H 计算的基因组近交系数能更准确地反映个体的真实近交情况㊂P e r i p o l l i等[15]利用770K S N P芯片数据比较了2908头吉尔牛(G y r)基于R O H(F R O H)㊁基因组关系矩阵(g e n o m i c r e l a t i o n s h i p m a t r i x, F G R M)㊁基因组纯合子百分比(h o m o z y g o s i t y, F H OM)㊁系谱信息(p e d i g r e e,F P E D)4种方法计算的近交系数,结果表明在没有系谱记录的情况下, F R O H可用作近交估计的替代方法㊂此外,通过识别群体的高频R O H片段,鉴定到了与产奶量㊁乳成分㊁热适应相关的基因㊂N a n i和P eña g a r i c a n o[16]研究发现,基因组R O H与荷斯坦公牛繁殖性状显著相关,公牛群体中高度纯合的基因组区域与公牛繁殖性状呈现负相关,并在低繁殖力公牛R O H富集区域鉴定到与精子生物学和雄性生育能力密切相关的基因㊂L i u等[17]利用简化基因组测序的方法,通过R O H与综合单倍型评分(i n t e g r a t e d h a p l o t y p e s c o r e,i H S)分析,检测到与上海荷斯坦奶牛群体健9482畜牧兽医学报54卷康㊁繁殖㊁环境适应等有关的候选基因㊂通过对全基因组R O H进行检测,可以更准确地掌握群体的近交程度,帮助研究者在育种实践中制定科学合理的选种选配方案㊂鉴定全基因组的R O H也可以更好的了解R O H在染色体上的分布规律,进而挖掘可能影响畜禽重要性状的候选基因[18-20]㊂在我国,北京[14]㊁上海[17]㊁宁夏[21]基于荷斯坦牛群体基因组R OH估算群体近交系数㊁检测与经济性状相关候选基因及选育过程中的选择信号等的研究,为中国荷斯坦奶牛育种提供了重要数据参考㊂然而,通过基因组R O H信息估计不同牧场荷斯坦奶牛群体近交水平和检测群体选择特征的研究仍然较少㊂本研究旨在利用奶牛150K S N P芯片数据对河南省7个奶牛场荷斯坦牛进行全基因组R O H检测,计算R O H的长度㊁频率㊁数目和分布以及基因组近交系数F R O H,比较不同牧场荷斯坦牛基因组近交程度,并在高频R O H区域注释与荷斯坦牛经济性状相关的候选基因㊂以期为详细了解河南省荷斯坦牛群体基因组R O H分布特征及基因组近交程度,为牧场今后选种选配提供参考㊂也可通过R OH富集区域鉴定一些与奶牛经济性状相关的基因,为奶牛标记辅助选择提供候选基因信息,为奶牛场科学选种选配提供指导㊂1材料与方法1.1试验动物根据系谱㊁生产数据记录的完整性,筛选出7个存栏量在150~5000头的规模化牧场,按存栏量10%的比例抽取牧场核心群个体进行血液样本采集,最终共采集了900头荷斯坦牛㊂具体样本分布情况详见表1㊂1.2S N P芯片分型及数据质量控制采集尾椎静脉血,提取D N A,利用G G P B o v i n e 150K芯片进行基因分型㊂用P L I N K(v1.90)[22]对原始数据进行质控,设定条件:1)S N P检出率大于95%;2)个体检出率大于99%;3)最小等位基因频率大于0.01;4)哈迪-温伯格平衡P值大于10-6;5)保留常染色体数据㊂1.3群体结构及连锁不平衡分析基于S N P信息,使用G C T A(v1.93)软件[23]对900头荷斯坦牛群体进行主成分分析(p r i n c i p a l c o m p o n e n t a n a l y s i s,P C A)㊂采用P o p L D d e c a y (v3.42)软件[24]计算每个牧场的连锁不平衡(l i n k-a g e d i s e q u i l i b r i u m,L D)程度,并使用软件自带的P l o t_M u l t i P o p.p l脚本绘制L D衰减曲线图㊂1.4R O H检测及基因组近交系数的计算R O H检测使用P L I N K软件[22],使用滑动窗口的方法对常染色体进行检测,具体检测参数如下: 1)滑动窗口阈值使用0.05;2)滑动窗口设置50个S N P s位点;3)每一个滑动窗口中允许丢失的基因型为5个;4)每一个滑动窗口中允许的杂合子数目为1个;5)组成R O H的S N P的最大间隔为1M b;6)组成R O H的S N P的最低密度为每50k b1个S N P;7)R O H片段的最小长度设为500k b;8)每个R O H至少由50个S N P s组成㊂利用R OH计算近交系数(F R O H),公式如下:F R O H=ðL R O HL g e n o m e其中,ðL R O H为常染色体上R OH片段长度之和,L g e n o m e为常染色体基因组物理长度之和(2.49G b)㊂1.5高频R O H区域候选基因鉴定使用R语言统计每个S N P在奶牛群体中参与组成R O H的次数占样本数的比例,并将前1%的S N P s区域作为高频的R O H区域㊂基于高频R O H 区段的物理位置,并通过生物数据库E n s e m b l[25]中的B i o M a r t模块与牛参考基因组(B o s_t a u r u s.A R S-U C D1.2)进行比对,检索基因,然后依据N CB I (h t t p s://w w w.n c b i.n l m.n i h.g o v/)㊁G e n eC a r d s (h t t p s://w w w.g e n e c a r d s.o r g/)网站及文献查询基因功能㊂运用K O B A S(h t t p://b i o i n f o.o r g/k o-b a s/)[26]在线数据库对注释到的基因进行K E G G 通路富集分析,当P<0.05时,则表示显著富集㊂2结果2.1S N P质控结果及群体遗传结构和连锁不平衡分析在质控后每个个体保留了96789个S N P s位点,相邻S N P s之间的平均距离为25.72k b,以供后续分析㊂图1A显示了7个牧场荷斯坦牛群体的P C A分析结果㊂从图1可以看出,7个牛场主要分为了5个亚群㊂采用P o p L D d e c a y分别计算各牧场群体的成对r2值,用于比较不同荷斯坦牛群体的L D 水平(图1B)㊂L D分析显示,7个牧场奶牛群体L D 衰减的顺序为:H7>H4&H5>H2&H3&H6>H1㊂05827期王振宇等:基于S N P芯片数据分析不同奶牛场基因组近交系数及筛选功能性基因A.主成分分析图;B .L D 衰减图㊂H 1~H 7代表牧场编号A.P r i n c i p a l c o m p o n e n t a n a l y s i s o f H o l s t e i n c a t t l e p o p u l a t i o n ;B .L D d e c a y o f H o l s t e i n c a t t l e p o p u l a t i o n .H 1-H 7r e pr e s e n t s pa s t u r e n u mb e r 图1 群体遗传结构及连锁不平衡F i g .1 P o p u l a t i o n g e n e t ic s t r u c t u r e a nd l i n k a ge d i s e qu i l i b r i u m 2.2 R O H 数目㊁长度及分布的统计由表1可以看出,在7个牧场荷斯坦牛群体中共检测出55908个R O H ,R O H 的平均长度为4.23M b ,范围在1.90~14.07M b ㊂其中H 6号牛场R O H 平均长度最小,为3.27M b ;H 2号牛场R OH 平均长度最大为4.49M b ㊂在0~5M b 长度上,R O H 总体比例占76.21%,其中H 1㊁H 6牧场R OH 比例较大(83.70%㊁84.30%),其余牧场R O H 比例范围为73.33%~76.52%;在5~10M b长度上,R O H 总体比例占15.14%,其中H 1㊁H 6牧场R O H 比例较小(10.26%㊁10.67%),其余牧场R O H 比例范围为14.89%~17.06%;在>10M b长度上,R O H 总体比例占8.64%,其中H 1㊁H 6牧场R O H 比例较小(6.03%,5.04%),其余牧场R O H 比例范围为7.61%~9.61%㊂图2展示了常染色体上不同长度R O H 的数目㊂表1 不同奶牛场荷斯坦牛R O H 长度和数量T a b l e 1 T h e m e a n l e n g t h a n d n u m b e r o f r u n s o f h o m o z y g o s i t y (R O H )i n H o l s t e i n o f d i f f e r e n t d a i r y f a r m s 牛场编号F a r m n u m b e r 牛群数量N u m b e ro f c a t t l e 成母牛数量N u m b e ro f c o w s样本数S a m pl e s i z e 总R OH 数量T o t a l n u m b e ro f R OHR OH 平均长度/M bT h e m e a n l e n gt h o f R OH 均值M e a n标准差S D最小值M i n最大值M a xH 1152721411163.470.442.754.26H 23631983624634.490.523.575.71H 3185991912234.380.653.525.91H 451522600530325494.361.262.1014.07H 513106*********4.400.872.676.50H 610055019371663.270.622.185.41H 711265109747404.211.061.908.52平均A v e r a ge 132866212979874.080.782.677.20合计T o t a l92934632900559084.231.161.9014.072.3 基因组近交系数评估不同牧场荷斯坦牛群体基于R O H 的近交系数及变化范围见表2㊂全群中基于R O H 的基因组F R O H 范围为0.021~0.447,近交系数平均值为0.106,标准差为0.040㊂其中H 2号牧场平均F R O H最高(0.123),H 7号牧场平均F R O H 最低(0.082),其他牧场分别为0.112㊁0.114㊁0.109㊁0.108㊁0.103㊂在个体层面中,F R O H 最低的个体出现在H 71582畜 牧 兽 医 学 报54卷图2 染色体上不同长度R O H 的数目F i g .2 N u m b e r o f R O H w i t h d i f f e r e n t l e n gt h o n c h r o m o s o m e 号牛场中(0.021),F R O H 最高的个体出现在H 4号牛场中(0.447)㊂2.4 高频R O H 区域及候选基因鉴定与注释㊁富集图3展示了在1~29号染色体上组成R O H 的S N P s 占群体的百分率㊂通过选择组成R O H 中前1%S N P s ,以确定统计阈值,本研究选取频率大于29.78%作为高频率的R O H 区域阈值㊂共检测到8个高频区域,并通过E n s e m b l 数据库对R O H 中的高频区域进行基因注释,共注释到79个基因,见表3㊂其中,14号染色体上22.78~23.38M b 位置的区域,80%的个体都在该区域内发生R O H 片段,并注释到3个基因㊂利用K O B A S 对注释到的基因进行K E G G 通路富集分析,结果见表4㊂分析得出表2 基于R O H 的不同奶牛场的近交系数(F R O H )T a b l e 2 I n b r e e d i n g c o e f f i c i e n t (F R O H )o f d i f f e r e n t d a i r yf a r m s b a s e d o n R O H 牛场编号F a r m n u m b e r 样本数S a m pl e s i z e 近交系数(F R O H )I n b r e e d i n g co e f f i c i e n t 均值M e a n标准差S D最小值M i n最大值M a xH 1140.1120.0260.0620.156H 2360.1230.0190.0840.163H 3190.1140.0680.0680.173H 45300.1090.0430.0290.447H 51110.1080.0360.0280.213H 6930.1030.0310.0410.196H 7970.0820.0350.0210.226平均A v e r a ge 1290.1070.0370.0470.225合计T o t a l9000.1060.0400.0210.447图3 R O H s 中S N P s 百分比曼哈顿图F i g .3 M a n h a t t a n p l o t o f S N P s p e r c e n t a ge s i n R O H s 25827期王振宇等:基于S N P 芯片数据分析不同奶牛场基因组近交系数及筛选功能性基因79个基因显著富集于酮体的合成与降解(s yn t h e s i s a n d d e gr a d a t i o n o f k e t o n e b o d i e s )㊁缬氨酸㊁亮氨酸和异亮氨酸降解(v a l i n e ,l e u c i n e a n d i s o l e u c i n ed e gr a d a t i o n )㊁丁酸代谢(b u t a n o a t e m e t a b o l i s m )㊁R a s 信号通路(r a s s i g n a l i n g p a t h w a y)等11个信号通路㊂表3 荷斯坦牛高频R O H 区域及候选基因T a b l e 3 H i g h -f r e q u e n c y R O H r e gi o n s a n d c a n d i d a t e g e n e s i n H o l s t e i n c a t t l e 染色体C h r o m o s o m e物理位置/M b P h ys i c a l d i s t a n c e S N P s 数目N u m b e r o f S N P s 基因G e n e5105.514~105.77639A K A P 3㊁C 5H 12o r f 4㊁F G F 23㊁F G F 61035.989~38.53083B A H D 1㊁C 10H 15o r f 62㊁C A P N 3㊁C C ND B P 1㊁C H A C 1㊁C H P 1㊁C H S T 14㊁D L L 4㊁G A N C ㊁G C H F R ㊁H A U S 2㊁I T P K A ㊁I V D ㊁J M J D 7㊁K N L 1㊁K N S T R N ㊁M A P K B P 1㊁M G A ㊁P L A 2G 4B ㊁R A D 51㊁R P U S D 2㊁R T F 1㊁S N A P 23㊁S P I N T 1㊁T M E M 62㊁T Y R O 3㊁Z F Y V E 19㊁V P S 181421.726~25.698323R G S 20㊁M R P L 15㊁S O X 17㊁R P 1㊁X K R 4㊁T G S 1㊁L Y N ㊁C H C HD 7㊁F AM 110B ㊁U B XN 2B ㊁S D C B P1710.153~10.55516P R M T 9205.444~6.070134C P E B 4㊁C 20H 5o r f 47㊁N S G 224.070~33.323299E S M 1㊁C S P G 4B ㊁A R L 15㊁M O C S 2㊁E M B ㊁H C N 1㊁F G F 10㊁P A I P 1㊁C 20H 5o r f 34㊁C C L 28㊁T M E M 267㊁HM G C S 1㊁S E L E N O P ㊁O X C T 1㊁P L C X D 3㊁C 62222.914~23.31715C R B N ㊁I L 5R A2937.108~39.90862M S 4A 15㊁M S 4A 10㊁C C D C 86㊁T M E M 109㊁T M E M 132A ㊁C D 6㊁C D 5㊁P A G 10㊁P A G 12㊁P A G 8㊁P G A 5㊁T K F C ㊁T M E M 138㊁T M E M 216表4 高频R O H 区域基因的K E G G 通路富集分析(P <0.05)T a b l e 4 K E G G p a t h w a y e n r i c h m e n t a n a l y s i s o f g e n e s i n h i g h -f r e q u e n c y R O H r e gi o n s (P <0.05)通路P a t h w a y注释D e s c r i pt i o n 基因数NP 值P v a l u e基因G e n eb t a 04974:P r o t e i n d i g e s t i o n a n d a b s o r pt i o n 蛋白质消化吸收42.99ˑ10-4P A G 8㊁P A G 12㊁P A G 10㊁P G A 5b t a 00280:V a l i n e ,l e u c i n e a n di s o l e u c i n e d e gr a d a t i o n 缬氨酸㊁亮氨酸和异亮氨酸降解34.36ˑ10-4I V D ㊁HM G C S 1㊁O X C T 1b t a 00072:S y n t h e s i s a n d d e gr a d a t i o n o f k e t o n e b o d i e s酮体的合成与降解25.60ˑ10-4HM G C S 1㊁O X C T 1b t a 05224:B r e a s t c a n c e r乳腺癌48.42ˑ10-4F G F 6㊁F G F 10㊁D L L 4㊁F G F 23b t a 05218:M e l a n o m a黑色素瘤31.18ˑ10-3F G F 6㊁F G F 10㊁F G F 23b t a 00650:B u t a n o a t e m e t a b o l i s m 丁酸代谢23.03ˑ10-3HM G C S 1㊁O X C T 1b t a 05200:P a t h w a ys i n c a n c e r 癌症的通路63.73ˑ10-3I L 5R A ㊁D L L 4㊁R A D 51㊁F G F 6㊁F G F 10㊁F G F 23b t a 04014:R a s s i g n a l i n g p a t h w a y R a s 信号通路44.61ˑ10-3P L A 2G 4B ㊁F G F 10㊁F G F 23㊁F G F 6b t a 04611:P l a t e l e t ac t i v a t i o n血小板活化34.76ˑ10-3P L A 2G 4B ㊁L Y N ㊁S N A P 23b t a 04010:MA P K s i g n a l i n g p a t h w a y MA P K 信号通路48.76ˑ10-3P L A 2G 4B ㊁F G F 10㊁F G F 23㊁F G F 6b t a 05226:G a s t r ic c a n c e r胃癌38.95ˑ10-3F G F 6㊁F G F 10㊁F G F 233 讨 论3.1 荷斯坦牛群体基因组R O H 基本统计分析不同育种目标及选择强度会引起不同荷斯坦牛群体中R O H 数目㊁长度及分布情况的差异[5-6,27]㊂K i m 等[7]通过比较3个北美荷斯坦牛群体在产奶性状不同选择强度下基因组R O H 的变化,揭示了总体R O H 频率和分布方面的显著差异,结果显示3582畜牧兽医学报54卷群体内R OH平均长度约为6M b,小于5M b的R OH片段数目占总片段数目的53%㊂而与K i m 等[7]的研究结果相比,本研究中荷斯坦牛群体R OH平均长度为4.23M b,小于5M b的R O H片段的数目占总片段数目的76.21%㊂另外对比不同牧场群体,小于5M b的R O H片段数目所占比例也有差异㊂在基因组R O H长度上,M a r r a s等[28]利用50K S N P芯片对5个意大利公牛品种进行R O H分析,结果表明相较于其他品种,乳用品种荷斯坦牛和意大利布朗牛的平均R O H长度更大(3.6㊁3.9M b),其中荷斯坦牛群体的R OH平均长度与本研究的结果相近㊂在牧场群体方面,H1和H6号牧场群体在小于5M b的R O H片段数目占总片段数目最高(83.70%㊁84.30%),而大于10M b的R O H片段数目占总片段数目比例最低(6.03%㊁5.04%)㊂研究显示,较近世代的共同祖先会造成长R O H片段的形成,短的R OH来源于关系较远的共同祖先[7,29]㊂此外,各个牧场奶牛群体R O H平均长度㊁变化范围也有差异,这与不同牧场奶牛群体来源以及选配过程中使用不同国别的冷冻精液有关㊂因此,本研究基于对不同牧场群体基因组R O H的数目㊁长度及分布的研究,评估群体近交情况,为牧场今后的选种选配提供参考㊂3.2基于R O H的基因组近交系数目前,R OH常用来计算个体近交系数,且具有较高的准确性[15,30-33]㊂本研究中,河南荷斯坦牛群体总平均F R O H(0.106)与宁夏[21](0.101)㊁北京[14] (0.007~0.312)荷斯坦牛群体F R O H相近,与上海[17]荷斯坦牛群体(0.363)相差较大㊂上海与北京作为我国的南㊁北奶牛养殖业的代表地区,由于选育目标㊁强度㊁气候等因素的影响,群体近交程度出现差异,河南地理位置上属于中原地区,在奶牛育种策略和群体近交情况上与北方更相近㊂近交水平在一定程度上也可以反映牧场选种选配管理状况㊂在牧场选配管理上,由表2可以看到,H1㊁H2㊁H3号牧场平均F R O H较高(0.112㊁0.123㊁0.114),H7号牧场平均F R O H较低(0.082),不同牧场之间的差异侧面反映出这些牧场在选配过程中对群体近交问题的管理程度;在牧场规模上,H1㊁H2㊁H3号牧场规模较小,群体数量较少,平均F R O H较高(0.112㊁0.123㊁0.114),H4号牧场规模较大,群体数量多,平均F R O H较低(0.109)㊂此外,在H4号牧场中有些个体的F R O H明显较高(>0.285),最大F R O H达到0.458,反映出该牧场在个体选种选配过程中未充分考虑近交问题㊂因此,通过对近交系数的计算可以了解不同牧场群体近交状况,从而在实际选种选配工作中能更有效的避免近交,减少经济损失㊂3.3基因组高频R O H区域的候选基因分析本研究在高频R O H区域中共鉴定到了79个基因,其中包含与奶牛经济性状有关的基因,如A K A P3㊁C5H12o r f4㊁C A P N3㊁A R L15㊁X K R4㊁C R B N㊁I L5R A等㊂5号染色体上A K A P3㊁C5H12o r f4㊁F G F6基因与体型㊁体高有关[34-36]㊂10号染色体上C A P N3基因与胴体㊁繁殖性状相关[37-38]㊂C H S T14基因与妊娠维持和胎儿生长直接相关[39]㊂22号染色体上I L5R A基因影响牛奶蛋白质组成[40]㊂此外还有一些基因与繁殖㊁生长等性状有关,如F G F10基因参与调节胎儿卵泡生成[41]㊂值得注意的是,14号染色体上22.78~ 23.38M b区域是R O H频率最高的区域,80%的个体都在该区域内发生R O H片段(图3)㊂发现该区域与宁夏[21]荷斯坦牛群体高频区域(21.61~ 24.99M b)高度重合,这可能与不同地区育种目标及选择强度有关,并随着选育的推进,在基因组中出现相近的长纯合区域㊂这个高频区域注释到T G S1㊁L Y N㊁C H C HD7基因,这些基因与生长㊁胴体相关性状[42-43]和饲料效率有关[35,44-45]㊂因此,本研究在R O H富集区域鉴定的基因可以为荷斯坦奶牛分子育种提供候选基因信息㊂4结论本研究对河南省荷斯坦牛群体进行全基因组R O H检测与分析,发现R OH在不同牧场群体中的数目㊁长度及频率存在差异,基于R OH计算的近交系数范围在0.082~0.123,反映出不同牧场近交水平存在差异,这有助于了解河南省荷斯坦牛群体近交程度,为牧场选育过程中避免近交提供指导㊂在全基因组范围内检测到8个高频R O H富集区域,共筛选出79个与奶牛经济性状相关的基因,如A K A P3㊁C5H12o r f4㊁C A P N3㊁A R L15㊁X K R4㊁C R B N㊁I L5R A等,可作为奶牛分子育种中进行标记辅助选择的候选基因㊂参考文献(R e f e r e n c e s):[1] C E B A L L O S F C,J O S H I P K,C L A R K D W,e t a l.R u n s o f h o m o z y g o s i t y:w i n d o w s i n t o p o p u l a t i o n45827期王振宇等:基于S N P芯片数据分析不同奶牛场基因组近交系数及筛选功能性基因h i s t o r y a n d t r a i t a r c h i t e c t u r e[J].N a t R e v G e n e t,2018,19(4):220-234.[2] B R OMA N K W,W E B E R J L.L o n g h o m o z y g o u sc h r o m o s o m a l s e g m e n t s i n r e f e r e n c e f a m i l i e s f r o m t h eC e n t r e d E t u d e d u P o l y m o r p h i s m e H u m a i n[J].A m JH u m G e n e t,1999,65(6):1493-1500.[3] C U R I K I,F E R E N㊅C A K O V I C'M,SÖL K N E R J.I n b r e e d i n g a n d r u n s o f h o m o z y g o s i t y:a p o s s i b l es o l u t i o n t o a n o l d p r o b l e m[J].L i v e s t S c i,2014,166:26-34.[4] MU L I M H A,B R I T O L F,P I N T O L F B,e t a l.C h a r a c t e r i z a t i o n o f r u n s o f h o m o z y g o s i t y,h e t e r o z y g o s i t y-e n r i c h e d r e g i o n s,a n d p o p u l a t i o ns t r u c t u r e i n c a t t l e p o p u l a t i o n s s e l e c t e d f o r d i f f e r e n tb r e e d i n g g o a l s[J].B M C G e n o m ic s,2022,23(1):209.[5] Z HA N G Q Q,G U L D B R A N D T S E N B,B O S S E M,e ta l.R u n s o f h o m o z y g o s i t y a n d d i s t r ib u t i o n o ff u n c t i o n a l v a r i a n t s i n t h e c a t t l eg e n o m e[J].B M CG e n o m i c s,2015,16(1):542.[6] P U R F I E L D D C,B E R R Y D P,M C P A R L A N D S,e ta l.R u n s o f h o m o z y g o s i t y a n d p o p u l a t i o n h i s t o r y i nc a t t l e[J].B M C G e n e t,2012,13:70.[7] K I M E S,C O L E J B,HU S O N H,e t a l.E f f e c t o fa r t i f i c i a l s e l e c t i o n o n r u n s o f h o m o z y g o s i t y i n U.S.H o l s t e i n c a t t l e[J].P L o S O n e,2013,8(11):e80813.[8] L E N C Z T,L AM B E R T C,D E R O S S E P,e t a l.R u n s o fh o m o z y g o s i t y r e v e a l h i g h l y p e n e t r a n t r e c e s s i v e l o c i i ns c h i z o p h r e n i a[J].P r o c N a t l A c a d S c i U S A,2007,104(50):19942-19947.[9] C O R R E I A-C O S T A G R,S G A R D I O L I I C,S A N T O SA P D,e t a l.I n c r e a s e d r u n s o f h o m o z y g o s i t y i n t h ea u t o s o m a l g e n o m e o f B r a z i l i a n i n d i v i d u a l s w i t hn e u r o d e v e l o p m e n t a l d e l a y/i n t e l l e c t u a l d i s a b i l i t y a n d/o r m u l t i p l e c o n g e n i t a l a n o m a l i e s i n v e s t i g a t e d b yc h r o m o s o m a l m i c r o a r r a y a n a l y s i s[J].G e n e t M o lB i o l,2022,45(1):e20200480.[10] D A C R U Z P R S,A N A N I N A G,S E C O L I N R,e t a l.D e m o g r a p h i c h i s t o r y d i f f e r e n c e s b e t w e e n H i s p a n i c sa n d B r a z i l i a n s i m p r i n t h a p l o t y p e f e a t u r e s[J].G3(B e t h e s d a),2022,12(7):j k a c111.[11]刘家鑫,魏霞,邓天宇,等.绵羊全基因组R OH检测及候选基因鉴定[J].畜牧兽医学报,2019,50(8):1554-1566.L I U J X,W E I X,D E N G T Y,e t a l.G e n o m e-w i d e s c a nf o r r u n o f h o m o z yg o s i t y a n d i d e n t i f i c a t i o n o fc o r r e s p o nd i n g c a n d i d a te g e n e s i n s h e e p p o p u l a t i o n s[J].A c t a V e t e r i n a r i a e t Z o o t e c h n i c a S i n i c a,2019,50(8):1554-1566.(i n C h i n e s e)[12] G O R S S E N W,M E Y E R MA N S R,J A N S S E N S S,e ta l.A p ub l ic l y a v a i l a b l e r e p o s i t o r y o f R OH i s l a nd sr e v e a l s s i g n a t u r e s o f s e l e c t i o n i n d i f f e r e n t l i v e s t o c ka n d p e t s p e c i e s[J].G e n e t S e l E v o l,2021,53(1):2.[13]赵国耀.基于肉牛基因组纯合片段的性状关联与预测[D].北京;中国农业科学院,2021.Z HA O G Y.A s s o c i a t i o n a n d p r e d i c t i o n o f t r a i t s b a s e do n g e n o m i c h o m o z y g o u s s e g m e n t s i n b e e f c a t t l e[D].B e i j i n g:C h i n e s e A c a d e m y o f A g r i c u l t u r a l S c i e n c e s,2021.(i n C h i n e s e)[14]杨湛澄,黄河天,闫青霞,等.利用高密度S N P标记分析中国荷斯坦牛基因组近交[J].遗传,2017,39(1):41-47.Y A N G Z C,HU A N G H T,Y A N Q X,e t a l.E s t i m a t i o n o f g e n o m i c i n b r e e d i n g c o e f f i c i e n t s b a s e do n h i g h-d e n s i t y S N P m a r k e r s i n C h i n e s e H o l s t e i nc a t t l e[J].H e r ed i t a s,2017,39(1):41-47.(i n C h i ne s e)[15] P E R I P O L L I E,S T A F U Z Z A N B,MU N A R I D P,e ta l.A s s e s s m e n t o f r u n s o f h o m o z y g o s i t y i s l a n d s a n de s t i m a t e s ofg e n o m i c i n b r e e d i n g i n G y r(B o s i n d i c u s)d a i r y c a t t l e[J].B M C Ge n o m i c s,2018,19(1):34.[16] N A N I J P,P EÑA G A R I C A N O F.W h o l e-g e n o m eh o m o z y g o s i t y m a p p i n g r e v e a l s c a n d i d a t e r e g i o n sa f f e c t i n gb u l l f e r t i l i t y i n U S H o l s t e i nc a t t l e[J].B M CG e n o m i c s,2020,21(1):338.[17] L I U D Y,C H E N Z L,Z HA O W,e t a l.G e n o m e-w i d es e l e c t i o n s i g n a t u r e s d e t e c t i o n i n S h a n g h a i H o l s t e i nc a t t l e p o p u l a t i o n ide n t if i e dg e n e s r e l a t e d t o a d a p t i o n,h e a l t h a n d r e p r o d u c t i o n t r a i t s[J].B M C G e n o m i c s,2021,22(1):747.[18] MA K A N J U O L A B O,MA L T E C C A C,M I G L I O R F,e t a l.I d e n t if i c a t i o n o f u n i q u e R OH r eg i o n s w i t hu n f a v o r a b l e e f f e c t s o n p r o d u c t i o n a n d f e r t i l i t y t r a i t s i nC a n a d i a n H o l s t e i n s[J].G e n e t S e l E v o l,2021,53(1):68.[19] L I U J X,S H I L Y,L I Y,e t a l.E s t i m a t e s o f g e n o m i ci n b r e e d i n g a n d i d e n t i f i c a t i o n o f c a n d i d a t e r e g i o n s t h a td i f fe r b e t w e e n C h i n e s e i n d i g e n o u s s h e e p b r e e d s[J].JA n i m S c iB i o t e c h n o l,2021,12(1):95.[20]史良玉,王立刚,张鹏飞,等.不同来源大白猪总产仔数近交衰退评估[J].畜牧兽医学报,2021,52(10):2772-2782.S H I L Y,WA N G L G,Z HA N G P F,e t a l.E v a l u a t i o no f i n b r e e d i n g d e p r e s s i o n o n t h e t o t a l n u m b e r s o fp i g l e t s b o r n i n d i f f e r e n t g r o u p s o f l a r g e w h i t e p i g s[J].A c t a V e t e r i n a r i a e t Z o o t e c h n i c a S i n i c a,2021,525582畜牧兽医学报54卷(10):2772-2782.(i n C h i n e s e)[21]刘丽元.GWA S㊁C N V及R OH挖掘宁夏地区荷斯坦奶牛重要性状候选基因的研究[D].银川:宁夏大学,2021.L I U L Y.I n t e g r a t i n g GWA S,C N V a n d R OH a n a l y s i sr e v e a l s c a n d i d a t e g e n e s o f i m p o r t a n t t r a i t s i n N i n g x i ah o l s t e i n c o w[D].Y i n c h u a n:N i n g x i a U n i v e r s i t y,2021.(i n C h i n e s e)[22] C HA N G C C,C HOW C C,T E L L I E R L C A M,e ta l.S e c o n d-g e n e r a t i o n P L I N K:r i s i n g t o t h e c h a l l e n g eo f l a r g e r a n d r i c h e r d a t a s e t s[J].G i g a s c i e n c e,2015,4(1):7.[23] Y A N G J A,L E E S H,G O D D A R D M E,e t a l.G C T A:a t o o l f o r g e n o m e-w i d e c o m p l e x t r a i t a n a l y s i s[J].A m J H u m G e n e t,2011,88(1):76-82.[24] Z HA N G C,D O N G S S,X U J Y,e t a l.P o p L D d e c a y:af a s t a n d e f f e c t i v e t o o l f o r l i n k ag e d i s e q u i l i b r i u m d e c a ya n a l y s i sb a s e d o n v a r i a n tc a l l f o r m a t f i l e s[J].B i o i n f o r m a t i c s,2019,35(10):1786-1788.[25] C U N N I N G HAM F,A L L E N J E,A L L E N J,e t a l.E n s e m b l2022[J].N u c l e i c A c i d s R e s,2022,50(D1):D988-D995.[26] B U D C,L U O H T,HU O P P,e t a l.K O B A S-i:i n t e l l i g e n t p r i o r i t i z a t i o n a n d e x p l o r a t o r y v i s u a l i z a t i o no f b i o l o g i c a l f u n c t i o n s f o r g e n e e n r i c h m e n t a n a l y s i s[J].N u c l e i c A c i d s R e s,2021,49(W1):W317-W325.[27] HOWA R D J T,MA L T E C C A C,HA I L E-MA R I AMM,e t a l.C h a r a c t e r i z i n g h o m o z y g o s i t y a c r o s s U n i t e dS t a t e s,N e w Z e a l a n d a n d A u s t r a l i a n J e r s e y c o w a n db u l l p o p u l a t i o n s[J].B M C G e n o m ic s,2015,16(1):187.[28] MA R R A S G,G A S P A G,S O R B O L I N I S,e t a l.A n a l y s i s o f r u n s o f h o m o z y g o s i t y a n d t h e i rr e l a t i o n s h i p w i t h i n b r e e d i n g i n f i v e c a t t l e b r e e d sf a r m e d i n I t a l y[J].A n i m G e n e t,2015,46(2):110-121.[29] K E L L E R M C,V I S S C H E R P M,G O D D A R D M E.Q u a n t i f i c a t i o n o f i n b r e e d i n g d u e t o d i s t a n t a n c e s t o r sa n d i t s d e t e c t i o n u s i n g d e n s e s i n g l e n u c l e o t i d ep o l y m o r p h i s m d a t a[J].G e n e t i c s,2012,189(1):237-249.[30] F E R E N C A K O V I C M,HAM Z I C E,G R E D L E R B,e ta l.R u n s o f h o m o z y g o s i t y r e v e a l g e n o m e-w i d ea u t o z y g o s i t y i n t h e A u s t r i a n F l e c k v i e h c a t t l e[J].A g r i c C o n s p e c S c i,2011,76(4):325-329.[31] Z HA N G Q Q,C A L U S M P L,G U L D B R A N D T S E NB,e t a l.E s t i m a t i o n o f i n b r e e d i n g u s i n g p e d i g r e e,50kS N P c h i p g e n o t y p e s a n d f u l l s e q u e n c e d a t a i n t h r e ec a t t l e b r e ed s[J].B M C Ge n e t,2015,16:88.[32] F O R U T A N M,MA H Y A R I S A,B A E S C,e t a l.I n b r e e d i n g a n d r u n s o f h o m o z y g o s i t y b e f o r e a n d a f t e rg e n o m i c s e l e c t i o n i n N o r t h A m e r i c a n H o l s t e i n c a t t l e[J].B M C G e n o m i c s,2018,19(1):98.[33] L O Z A D A-S O T O E A,T I E Z Z I F,J I A N G J C,e t a l.G e n o m i c c h a r a c t e r i z a t i o n o f a u t o z y g o s i t y a n d r e c e n ti n b r e e d i n g t r e n d s i n a l l m a j o r b r e e d s o f U S d a i r yc a t t l e[J].J D a i r y S c i,2022,105(11):8956-8971.[34]J I A N G J C,C O L E J B,F R E E B E R N E,e t a l.F u n c t i o n a l a n n o t a t i o n a n d B a y e s i a n f i n e-m a p p i n gr e v e a l s c a n d i d a t e g e n e s f o r i m p o r t a n t a g r o n o m i c t r a i t si n H o l s t e i n b u l l s[J].C o m m u n B i o l,2019,2(1):212.[35] G HO R E I S H I F A R S M,E R I K S S O N S,J OHA N S S O N A M,e t a l.S i g n a t u r e s o f s e l e c t i o nr e v e a l c a n d i d a t e g e n e s i n v o l v e d i n e c o n o m i c t r a i t s a n dc o ld a c c l i m a t i o n i n f i ve S w e d i s h c a t t l e b r e e d s[J].G e n e t S e l E v o l,2020,52(1):52.[36] F A N G L Z,C A I W T,L I U S L,e t a l.C o m p r e h e n s i v ea n a l y s e s o f723t r a n s c r i p t o m e s e n h a n c e g e n e t i c a n db i o l o g ic a l i n t e r p r e t a t i o n s f o r c o m p l e x t r a i t s i n c a t t l e[J].G e n o m e R e s,2020,30(5):790-801.[37] Z HA N G Y Y,X U E X L,L I U Y,e t a l.G e n o m e-w i d ec o m p a r a t i v e a n a l y s e s r e v e a l s e l e c t i o n s i g n a t u r e su n d e r l y i n g a d a p t a t i o n a n d p r o d u c t i o n i n T i b e t a n a n dP o l l D o r s e t s h e e p[J].S c i R e p,2021,11(1):2466.[38] WA N G J F,L I B Z,Y A N G X R,e t a l.I n t e g r a t i o n o fR N A-s e q a n d A T A C-s e q i d e n t i f i e s m u s c l e-r e g u l a t e dh u b g e n e s i n c a t t l e[J].F r o n t V e t S c i,2022,9:925590.[39] S I G D E L A,B I S I N O T T O R S,P EÑA G A R I C A N O F.G e n e s a n d p a t h w a y s a s s o c i a t e d w i t h p r e g n a n c y l o s s i nd a i r y c a t t l e[J].S c i Re p,2021,11(1):13329.[40] Z HO U C H,L I C,C A I W T,e t a l.G e n o m e-w i d ea s s o c i a t i o n s t u d y f o r m i l k p r o t e i n c o m p o s i t i o n t r a i t si n a c h i n e s e h o l s t e i n p o p u l a t i o n u s i n g a s i n g l e-s t e pa p p r o a c h[J].F r o n t G e n e t,2019,10:72.[41] F R E I T A S P H F,O L I V E I R A H R,S I L V A F F,e ta l.S h o r t c o mm u n i c a t i o n:t i m e-d e p e n d e n t g e n e t i cp a r a m e t e r s a n d s i n g l e-s t e p g e n o m e-w i d e a s s o c i a t i o na n a l y s e s f o r p r e d i c t e d m i l k f a t t y a c i d c o m p o s i t i o n i nA y r s h i r e a n d J e r s e y d a i r y c a t t l e[J].J D a i r y S c i,2020,103(6):5263-5269.[42] C H E R U I Y O T E K,B E T T R C,AM I MO J O,e t a l.S i g n a t u r e s o f s e l e c t i o n i n a d m i x e d d a i r y c a t t l e i nt a n z a n i a[J].F r o n t G e n e t,2018,9:607.6582。
家畜基因组选择信号鉴别方法

家畜基因组选择信号鉴别方法作者:顾京晶来源:《当代畜禽养殖业》 2018年第11期随着众多家畜基因组测序的完成和高通量测序价格的直线下降,研究者们从全基因组角度在家畜基因组上寻找同人工选择、环境适应和驯化历史等的选择印记成为可能。
一般而言,当获得家畜目标群体的全基因组数据后,需要考虑选择发生的时间、选择的强度、研究包括的群体和选择的模式等因素,从而确定将要使用的数理分析方法。
目前常用的家畜基因组选择信号的鉴别方法主要有以下几种。
先介绍基于非同义突变和同义突变替换率的检验方法。
基因组上的非同义突变(non-synonymous)指导致氨基酸改变的核苷酸变异,同义突变(synonymous)指由于密码的简并性,使得发生在基因编码区的突变并不改变编码的氨基酸。
该种方法使用基因编码区在非同义位置上的非同义突变数目的替换率(dn)同在同义位置上的同义突变数目的替换率(ds)的比值来判断出现的选择模式。
认为当dn同ds的比值等于1时,位点处于中性进化;当dn同ds的比值大于1时,认为出现了正向选择;反之,当dn同ds的比值小于1时,认为出现了负向选择。
有众多方法可以对dn和ds进行计算,最初计算只能在2条DNA序列中进行,近期在多条序列之间进行dn和ds计算也成为了可能,并且可以利用似然比检验对假设的中立模型和替代模型进行统计学检验。
计算基于dn同ds的比值选择信号鉴定常使用软件MEGA和PAML进行。
另一种方法是基于位点变异的遗传频谱(frequencyspectrum)选择信号鉴定,常用的有Tajima’sD检验,通过比较群体突变率的两个估计值θ和π的差异,检测正向选择,Tajima’sD的值小于0,表示位点可能发生了正向选择或是负向选择;而Tajima’sD的值大于0,表示位点可能发生了长期的平衡选择。
可以看出为负值的Tajima’sD不能区分是发生了正向选择还是负向选择,但后续使用Fay和Wu的H检验后,当位点H值为负值时,提示出现正向选择。
全基因组选择在畜禽育种上的应用

全基因组选择在畜禽育种上的应用全基因组选择(Whole Genome Selection,WGS)是一种基于分子标记的育种方法,通过对动植物基因组的全面分析,选择与目标性状密切相关的基因型,从而加速育种进程,提高育种效果。
在畜禽育种中,全基因组选择已经得到广泛应用,并取得了显著的成果。
畜禽育种是指通过选配和繁殖等手段,改良和培育出具有优良性状的畜禽品种。
传统的畜禽育种方法主要依赖于表型选择和亲本配对,但这种方法存在效率低、周期长、成本高等缺点。
全基因组选择的出现,为畜禽育种带来了革命性的变革。
全基因组选择通过对畜禽个体的基因组进行全面扫描,鉴定出与目标性状密切相关的基因型,从而实现对性状的精确选择。
这种方法不仅可以提高育种效率,还可以降低育种周期和成本。
全基因组选择依赖于高通量测序技术和生物信息学分析方法,能够快速、准确地分析大规模的基因组数据,从而为育种工作提供科学依据。
全基因组选择的应用在畜禽育种中具有广泛的应用前景。
首先,全基因组选择可以帮助育种者快速筛选出携带目标性状基因的个体,提高选配的准确性。
其次,全基因组选择可以帮助育种者预测后代的遗传表现,从而为育种计划的制定提供科学依据。
此外,全基因组选择还可以帮助育种者进行基因组选择组合,实现多个性状的联合选择,进一步提高育种效果。
全基因组选择在畜禽育种中的应用不仅可以提高育种效率,还可以实现育种目标的精确控制。
例如,在家禽育种中,全基因组选择可以帮助育种者选择出具有快速生长、高产蛋和抗病性等优良性状的个体,从而培育出高效益的家禽品种。
在畜牧业中,全基因组选择可以帮助育种者选择出肉质优良、抗病性强、适应环境能力强等特点的畜禽品种,提高畜禽养殖的经济效益。
然而,全基因组选择在畜禽育种中的应用也面临一些挑战和问题。
首先,全基因组选择需要大量的基因组数据支持,这对于资源条件有限的养殖场来说可能是一个难题。
其次,全基因组选择需要高水平的生物信息学分析能力,这对于养殖场技术人员的素质要求较高。