基因组学
基因组学

基因组学的定义有广义和狭义之分。
广义的基因组学涉及到细胞学、遗传学、进化论和分子生物学的研究对象和范畴,可以称为是规模化的生物学研究。
狭义的基因组学主要是以各类物种的基因组为研究对象,形成复杂的概念、理论框架和研究命题。
基因内涵的最新发展基因在分子生物学中占据了核心地位,基因概念的发展贯穿了分子生物学理论的整个发展历程。
在某种程度上,基因内涵的更新与发展可以视为分子生物学发展阶段的标志。
从最初孟德尔通过离散型表型抽象出的遗传因子(genetic factor)开始,在基因内涵的发展史上先后出现过遗传物质究竟是核酸还是蛋白质之争、DNA琴弦假说等早期探索性工作。
目前,大家所熟知的基因形式包括顺反子、断裂基因、重复基因、重叠基因、跳跃基因、rRNA基因、tRNA基因、假基因等,近来又发现了以微小RNA基因为代表的多种非编码RNA基因(noncoding RNA gene)、跨染色体剪接基因、跨物种横向转移基因(即自然界的转基因)等多种新的基因形式。
诺贝尔生理医学奖在历史上曾多次与基因的更新和发展有关。
随着更多新的基因形式被不断发现,基因内涵也在不断发生变化。
Gerstein等(2007)和Pesole(2008)分别对基因的概念做了较新的定义。
他们给出的基因新概念主要在强调基因编码产物形式的多样性,其本质仍然是遗传信息的功能单位,而且细胞核基因组DNA也仍然是承载基因的主要物质载体。
在传统观念中,除了RNA编辑、剪接,以及蛋白质分子修饰之外,遗传信息从DNA到表型的传递过程几乎是完全线性的,至DNA以下的所有环节,包括中间分子信息和表型均最终受控于基因组DNA,生物的可遗传组分完全由基因组DNA的序列信息决定。
但随着研究的不断深入,这种传统观点正逐渐被打破,目前已经知道表观遗传及其他“软”遗传(soft inheritance)机制也广泛参与了跨代遗传的调控过程。
此外,已在细胞水平和整体水平上证明环境刺激引起的基因表达模式改变也可以在一定条件下实现跨代遗传,好像米丘林遗传学这一被扔进历史垃圾堆里的伪科学又死灰复燃了,在与孟德尔遗传学分道扬镳多年后又开始有了相互靠拢的新迹象(说不准某些曾经的伪科学还真有咸鱼翻身的机会)。
基因组学概念

基因组学概念
基因组学(Genomics)是一门研究基因组结构和功能的学科,它涵盖了生命科学、生物信息学、计算机科学等多个领域。
基因组学通过研究基因组的结构、组成、表达和调控,深入理解生命的本质、生物多样性和疾病发生机制,为新药研发、医学诊断和治疗提供基础支持和解决方案。
基因组学的主要研究对象是基因组,即生物体内部所有基因的集合体。
基因组由DNA序列组成,其中包括编码蛋白质和调节基因表达的基因,以及非编码DNA序列和重复DNA序列等。
基因组学的研究内容包括以下几个方面:
1. 基因组测序:通过高通量测序技术,对基因组进行大规模的测序分析,以获取基因组的详细序列和变异信息。
2. 基因组组装:通过对测序数据进行组装和分析,构建基因组的物理图谱和遗传图谱,以确定基因组的结构和组成。
3. 基因组注释:通过对基因组序列进行注释和分析,确定基因的编码区、调控序列和重复序列等信息,以揭示基因的功能和表达模式。
4. 基因组变异分析:通过分析基因组序列中的变异,包括单核苷酸变异(SNV)、插入和缺失(INDEL)、结构变异(SV)等,揭示基因组的遗传多样性和疾病发生机制。
5. 基因组学应用:将基因组学应用于医学、农业、环境科学等领域,包括新药研发、疾病诊断和治疗、生物多样性保护等。
基因组学的发展得益于现代科技的不断进步和创新,如高通量测序技术、生物信息学方法和计算机科学算法等。
随着技术的不断革新和完善,基因组学将在生命科学、医学和农业等领域发挥越来越重要的作用,为人类提供更加全面、深入和精准的知识和解决方案。
基因组学

基因组:生物所具有的携带遗传信息的遗传物质的总和,是指生物细胞中所有的DNA,包括所有的基因和基因间区域。
基因组学:研究基因组结构和功能的科学。
指以分子生物学技术、计算机技术和信息网络技术为研究手段,以生物体内全部基因为研究对象,在全基因背景下和整体水平上探索生命活动的内在规律及其内外环境影响机制的科学。
C值:指一个单倍体基因组中DNA的总量,以基因组的碱基对来表示。
每个细胞中以皮克(pg,10-12g)水平表示。
C 值矛盾:在结构、功能很相似的同一类生物中,甚至在亲缘关系十分接近的物种之间,它们的C值可以相差数10倍乃至上百倍。
序列复杂性:不同序列的DNA总长称为复杂性,复杂性代表了一个物种基因组的基本特征。
隔裂基因:指基因内部被一个或更多不翻译的编码顺序即内含子所隔裂。
假基因:来源于功能基因但已失去活性的DNA序列。
微卫星序列:或称简单串联重复,重复单位较短。
重复序列只有1-6个核苷酸,分布在整个基因组,10-50个重复单位.重叠群:通过末端的重叠序列相互连接形成连续的DNA长片段的一组克隆称为重叠群。
指纹:指确定DNA样品所具有的特定DNA片段组成。
STS作图:根据STS序列设计引物,扩增文库当中的克隆,能扩出条带的克隆都含有序列重叠的插入子。
荧光原位杂交:指在染色体上进行DNA杂交,以便识别荧光标记探针在染色体上位置的方法。
辐射杂种群:通过放射杂交产生的融合细胞群称为辐射杂种群。
覆盖面(或深度):每个核苷酸在完成顺序中平均出现的次数,或者说完成顺序的长度与组装顺序长度之比。
支架:一组已锚定在染色体上的重叠群, 内部含间隙或不含间隙.同源性:基因系指起源于同一祖先但序列已经发生变异的基因成员。
一致性:指同源DNA顺序的同一碱基位置的相同的碱基成员, 或者蛋白质的同一氨基酸位置的相同的氨基酸成员, 可用百分比表示.相似性:指同源蛋白质的氨基酸序列中一致性氨基酸和可取代氨基酸所占的比例。
转座子:一段DNA顺序可以从原位上单独复制或断裂下来,插入另一位点,并对其后的基因起调控作用,此过程称转座,这段序列称跳跃基因或转座子。
基因组学

基因表达调控的研究
蛋白质组学(proteomics) • 鉴定蛋白质的产生过程、结构、功能和 相互作用方式
2 基因组图谱的构建
基因组计划的主 要任务是获得全 基因组序列 但是,现在的测 序方法每次只能 测800~1000bp 小基因组物种常 用鸟枪射击法
(restriction fragment length polymorphism,RFLP)
如有两个 DNA 分子(一对染色体),一 个具有某一种酶的酶切位点,而另一个 没有这个位点,酶切后形成的DNA片段长 度就有差异,即多态性。
• 利用限制性内切酶消化基因组DNA,形成大小 不等、数量不同的分子片段, • 经电泳分离, • 通过Southern印迹将DNA片段转移至支持膜 (尼 龙膜或硝酸纤维素膜)上, • 然后用放射性同位素(32P)或非同位素 (如地高 辛,荧光素)标记的探针与支持膜上的DNA片 段进行杂交。 • 不同基因组DNA酶切位点的改变,会使得 RFLP谱带表现出不同程度的多态性.
中英联合实验室
双脱氧终止法测序反应体系包括:
DNA polymerase
Template:(单链DNA模板)
Primer:(带有3-OH末端的单链寡核苷酸引物)
Mg2+ dNTP(dATP,dGTP,dCTP和dTTP) ddNTP(ddATP,ddGTP,ddCTP和ddTTP)
DNA自动测序
形态标记
能够用肉眼识别和观察、明确显示遗传多样性 的外观性状。 形态性状:株高、颜色、白化症等 又称表型标记 简单直观 数量少 很多突变是致死的 受环境、生育期等因素的影响
基因组学

1.突变:指基因组中小段区域内核苷酸序列的改变,大多数突变是点突变,即核苷酸序列中某一碱基取代了另一碱基,其他的突变则涉及一个或几个核苷酸的插入或缺失。
2. 重组:指基因组中发生重新组合的区段,产生于减数分裂时同源染色体的交换,染色体的到位和易位,转座成分在同一染色体或不同染色体上转座以及外源DNA的整合等。
3.重组的分类:同源重组和非同源重组。
4. (1)同义突变:突变的密码子仍然指令同一氨基酸,因而同义突变是沉默突变。
(2)错义突变:此类突变发生的位置在密码子的第1位和第2位碱基,可改变密码子的含义,指令一个不同的氨基酸。
(3)终止突变:可使原来编码氨基酸的密码子变成翻译终止密码,产生残缺的蛋白质。
(4)连续突变:终止密码变成指令某一氨基酸的密码子,使翻译继续进行。
5.突变对多细胞生物的影响:(1)功能丧失(2)功能增益6.染色体重排:染色体的非同源重组与交换会导致染色体重排。
7.转座:一个转座子由基因组的一个位置转移到另一个位置的过程。
8.基因簇:基因家族中来源相同、结构相似和功能相关的基因在染色体上彼此紧邻所构成的串联重复单位。
9.基因组学:用于概括涉及基因组作图、测序和整个基因组功能分析的遗传学学科分支,并已用来命名一个学术刊物。
10.基因组学的研究内容:全基因组范围研究基因的结构,组成,功能及其变化,因而涉及大范围高通量收集和分析有关基因组DNA的序列组成,染色体分子水平的结构特征,全基因组的基因数目,功能和分类,基因组水平的基因表达与调控以及不同物种间基因组的进化关系。
11.遗传的分子基础:绝大多数生物,包括低等生物和高等生物的基因组都由脱氧核糖核酸(DNA)组成,少数病毒基因组则为核糖核酸(RNA)。
12.蛋白质的二级结构:(1)α螺旋:多肽链中一些连续的氨基酸序列能自发形成有规律的盘旋构型。
(2)β-折叠:由侧向平行的多肽链组成,一条多肽链中肽键的羰酰氧原子与另一条多肽链中肽键的酰胺氢原子形成氢。
基因组学

名词解释:第一章基因组遗传图(连锁图):指基因或DNA标记在染色体上的相对位置与遗传距离。
单位是厘摩cM (基因或DNA片段在染色体交换过程中分离的频率)。
物理图:以已知核苷酸序列的DNA片段(序列标签位点,sequence-tagged site, STS)为“路标”,以碱基对作为基本测量单位(图距)的基因组图。
转录图:以EST(expressed sequence tag ,表达序列标签)为标记,根据转录顺序的位置和距离绘制的图谱。
EST:通过从cDNA文库中随机挑选的克隆进行测序所获得的部分cDNA的5'或3'端序列称为表达序列标签(EST),一般长300-500 bp左右。
序列图(分子水平的物理图):序列图是指整个人类基因组的核苷酸序列图,也是最详尽的物理图。
既包括可转录序列,也包括非转录序列,是转录序列、调节序列和功能未知序列的总和。
基因:合成有功能的蛋白质或RNA所必需的全部DNA序列,即一个基因不仅包括编码蛋白质或RNA的核酸序列,还应包括为保证转录所必需的调控序列。
基因组(genome):生物所具有的携带遗传信息的遗传物质的总和。
基因组学(genomics):涉及基因组作图、测序和整个基因组功能分析的一门学科。
C值:单倍体基因组的DNA总量,一个特定种属具有特征C值C值矛盾(C value paradox):指一个有机体的C值和其编码能力缺乏相关性。
单一序列:基因组中单拷贝的DNA序列。
重复序列:基因组中多拷贝的DNA序列。
复杂性(complexity):基因组中不同序列的DNA总长。
高度重复序列(highly repetitive sequence):重复片段的长度单位在几个到几百个碱基对(base pair,bp)之间(一般不超过200 bp),串联重复频率很高(可达106以上),高度重复后形成的这类重复顺序称为高度重复顺序。
中度重复序列(intermediate repetitive sequence ):重复长度300~7000 bp不等,重复次数在102~105左右。
基因组学:基因与基因组的研究
基因编辑技术的伦理与法律问题
基因编辑技术如CRISPR-Cas9等为人类提供了重新编程生命的能力,具有巨大的潜力。然而,这种技 术的伦理和法律问题也引起了广泛的关注和讨论。例如,是否可以对人类胚胎进行基因编辑、是否可 以使用基因编辑技术创造“设计婴儿”等。
在伦理方面,人们担心基因编辑可能会破坏自然的生命过程,导致不公平的遗传优势,甚至可能引发 新的社会不平等问题。因此,需要建立严格的伦理准则和法律监管框架,以确保基因编辑技术的合理 和安全使用。
基因组学在医学领域的应用广泛,如疾病诊断、药物研发和 个性化医疗等方面,有助于提高疾病的预防、诊断和治疗水 平。
生物产业发展
基因组学的研究对于推动生物产业的发展也具有重要意义, 如基因治疗、生物制药和基因编辑等领域。
基因组学的研究历史与发展
研究历史
基因组学的研究可以追溯到20世纪初,随着DNA双螺旋结构的发现和分子遗传学的发展,基因 组学逐渐成为一门独立的学科。
04
基因组学在生物医学中的应 用
疾病诊断与预防
疾病诊断
基因组学技术可以帮助医生通过检测 基因变异来确定疾病的原因,为疾病 的早期诊断提供依据。
预防策略
基因组学研究有助于发现与疾病易感 性相关的基因变异,为制定针对性的 预防策略提供科学依据。
药物研发与治疗
药物靶点
基因组学有助于发现新的药物靶点, 提高药物研发的效率和成功率。
研究现状
目前,全球已经完成了多个人类和模式生物的基因组测序,基因组学的研究重点已经从基因组的 测序转向了基因的表达、调控和进化等领域。
发展趋势
未来,基因组学将继续朝着高通量、高精度和智能化等方向发展,同时与其他学科的交叉融合也 将更加紧密,如生物信息学、合成生物学和系统生物学等。
基因组学——精选推荐
基因组学1.基因组学包括那些研究内容?(1)结构基因组学:通过基因组作图、核苷酸序列分析,研究基因组结构,确定基因组成、基因定位的科学基因组测序:⾸先将整个基因组的DNA分解为⼀些⼩⽚段,然后将这些分散的⼩⽚段逐个测序,最后将测序的⼩⽚段按序列组装基因组作图:在长链DNA分⼦的不同位置寻找特征性的分⼦标记,绘制基因组图。
根据分⼦标记可以准确⽆误地将已测序的DNA⼩⽚段锚定到染⾊体的位置上。
(2)功能基因组学:利⽤结构基因组学提供的信息和产物,在基因组系统⽔平上全⾯分析基因功能的科学。
功能基因组学的研究内容:(1)进⼀步识别基因以及基因转录调控信息。
(2)弄清所有基因产物的功能,这是⽬前基因组功能分析的主要层次。
(3)研究基因的表达调控机制,分析基因产物之间的相互作⽤关系,绘制基因调控⽹络图。
(3)⽐较基因组学:研究不同物种之间在基因组结构和功能⽅⾯的亲源关系及其内在联系的学科。
⽐较基因组学的研究内容::(1)绘制系统进化树,显⽰进化过程中最主要的变化所发⽣的时间及特点。
据此可以追踪物种的起源和分⽀路径。
(2)了解同源基因的功能。
(3)对序列差异性的研究有助于认识产⽣⼤⾃然⽣物多样性的基础。
2.基因组学的历史变⾰与发展趋势?(⼀)1900年代以前:前遗传学时代(1)物种进化的⾃然选择学说——达尔⽂进化论。
(2)1865年G.Mendel发表豌⾖杂交实验结果,提出了遗传学的两⼤遗传规律—分离规律和独⽴分配规律,并认为是⽣物体内的遗传因⼦或遗传颗粒控制⽣物性状(⼆)1900—1950年代:经典遗传学时代标志:1900年,孟德尔遗传规律再发现标志着遗传学的诞⽣)⼈们开始把控制⽣物遗传性状的遗传单称为基因。
⽣命科学的研究基本都是围绕着基因来进⾏。
(三)1950—1990年代:分⼦⽣物学时代(前基因组学时代)标志:Watson & Crick 的DNA 双螺旋结构的发现[《Nature》1953.4.25],标志着分⼦⽣物学时代的开始 F.Crick根据DNA 的X射线衍射图谱,提出了DNA双螺旋结构模型,解释基因复制的机制,从⽽真正开始从分⼦⽔平上研究⽣命活动。
基因组学
SSR或微卫星
■重复序列: ◆串联重复序列(tandem repeated sequence),其重复单位首尾 相连,成串排列(Flavell 1986)。 ◆散布重复序列(interspersed repeated sequence),其重复单位 与其它无关序列或单拷贝序列相间排列。 ■微卫星DNA序列又称简单重复序列(simple sequence repeat , SSR)、短串联重复序列(short sequence repeat,STR),它是 由几个核甘酸(一般1~5个)为重复单位簇集而成的串联重复序 列,可分布在整个基因组的不同位置上,而且在基因组中的分 布是随机的。微卫星长度具有高度变异性,并且这种多态性常 常表现复等位性,两端的序列多是相对保守的单拷贝序列,因 而可以根据两端的序列设计一对特异引物,扩增每个位点的微 卫星序列,从而揭示其长度的多态性(simple sequence length polymorphism,SSLP)。
功能基因组学
基因组DNA测序: 基因组DNA测序: 测序 人类对自身基因组认识的第一步。 人类对自身基因组认识的第一步。 功能基因组学: 功能基因组学: 从基因组信息与外界环境相互作用的高度, 从基因组信息与外界环境相互作用的高度, 阐明基因组的功能。 阐明基因组的功能。 功能基因组学的研究内容: 功能基因组学的研究内容:
EST EST(expressed sequence tags) 是长约300~400bp的基因表达 序列片段。 EST技术是将mRNA反转录成 cDNA隆,对 其5′或3′端进行一步法测序, 将所获序列与基因数据库中已 知序列进行比较,从而获得对 生物体生长、发育、代谢、繁 殖、衰落死亡等一系列生理生 化过程认识的技术(Hatey 1998)。
基因组学
我国水稻基因组计划 • 我国超级杂交稻(籼稻)基因组计划2001年7月启动, 2002年4月5日《Science》。
☆材料:籼稻“9311”。
☆完成单位:华大基因研究中心、中科院遗传与发育生物 学研究所等12个单位。 ☆水平:水稻基因组的总基因数约为46022~55615个,工 作框架图序列已覆盖水稻整个基因组92%以上的基因。
大肠杆菌基因组是双链环状DNA , 全长4.6 ×106bp,含有4230个基因, 编码蛋白的序列占基因组的87.7%, 非编码的重复序列占0.7%,剩下 的11.6%可能起调控作用。
二、细菌和病毒基因组特点
4. 功能相关的几个基因排列在一起形成操纵子
如,乳糖操纵子结构
5. 存在重叠基因 如,ΦΧ174基因组为5386bp,
▲ 1986年3月,杜伯克在美国《科学》杂志上发 表了一篇题为《癌症研究的转折点:测序人类 基因组》的文章,这篇短文后来被称为人类基 因组计划的“标书”。
(一)人类基因组计划
• 1990年,美国国会批准美国的“人类基因组计划”在10月1日 正式启动。其总体规 划是准备在15年内(1990-2005)至少 投入30亿美元,分析人类的基因组30亿个碱基对。 • 1996,完成标记密度为0.6cM的人类基因组遗传图谱,100kb 的物理图谱 • 2000,完成草图
四、基因组学的发展
(一)人类基因组计划
与曼哈顿原子 计划、阿波罗登月计划并称的人类科学 史上的重大工程。于1990年首先在美国启 动,后有德、 日、英、法、中等国的科学家先后正式加入。
(一)人类基因组计划
▲美国从70年代起启动了 “肿瘤计划”,但是, 不惜血本的投入换来的是令人失望的结果。人 们渐渐认识到,包括癌症在内的各种人类疾病 都与基因直接或间接相关。测出基因的碱基序 列,Fra bibliotek是基因研究的基础。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基因组:生物所具有的携带遗传信息的遗传物质的总和,是指生物细胞中所有的DNA,包括所有的基因和基因间区域。
基因组学:指以分子生物学技术、计算机技术和信息网络技术为研究手段,以生物体内全部基因为研究对象,在全基因背景下和整体水平上探索生命活动的内在规律及其内外环境影响机制的科学。
基因组学包括3个不同的亚领域1结构基因组学:以全基因组测序为目标2功能基因组学:以基因功能鉴定为目标3比较基因组学C值是指一个单倍体基因组中DNA的总量,以基因组的碱基对来表示。
C值悖理(矛盾):在结构、功能很相似的同一类生物中,甚至在亲缘关系十分接近的物种之间,它们的C值可以相差数10倍乃至上百倍。
C值不随生物的进化程度和复杂性而增加;关系密切的生物C值相差甚大;真核生物的DNA的量远大于编码蛋白质所需的量。
C值反映了总体趋势上,随着生物结构和功能的复杂性的增加,各分类单元中最小基因组的大小随分类地位的提高而递增。
单一顺序:基因组中单拷贝的DNA序列重复顺序:基因组中多拷贝的基因序列真核生物基因组DNA组分为非均一性,可分为3种类型:快速复性组分、居间复性组分、缓慢复兴组分基因家族:是真核基因组的共同特征,他们来自一个共同的祖先,因基因加倍和趋异,产生了许多在DNA序列上基本一致而略有不同的成员。
包括编码RNA的基因和编码蛋白质的基因隔裂基因(split gene):指基因内部被一个或更多不翻译的编码顺序即内含子所隔裂。
3、异常结构基因分类重叠基因:编码序列彼此重叠的基因,含有不同蛋白质的编码序列。
基因内基因:一个基因的内含子中包含其他基因。
反义基因:与已知基因编码序列互补的的负链编码基因,参与基因的表达调控,可以干扰靶基因mRNA转录与翻译。
假基因:来源于功能基因但已失去活性或者改变原来活性功能的DNA序列.四、基因组特征比较真核生物基因组的特征:复杂性较高的生物基因组结构松弛,在整个基因组范围内分布大量重复顺序(小基因组重复序列较少,大基因组重复序列急剧扩增);含有大量数目不等的线性DNA分子,并且,每个长链DNA都与蛋白质组成染色体结构;含有细胞器基因组(所有真核生物都具有环状的线粒体DNA,植物细胞还含有环状的叶绿体DNA。
)原核生物基因组的特征:原核生物基因数目比真核生物少,大小在5Mb以下;原核生物基因组结构更紧凑;(极少重复序列;重复基因的数量远远低于真核生物;不存在内含子,基本都是编码序列,无断裂基因。
)为何要绘制遗传图与物理图?1)基因组太大,必需分散测序,然后将分散的顺序按原来位置组装,需要图谱进行指导。
2)基因组存在大量重复顺序,会干扰排序,因此要高密度基因组图。
3)遗传图和物理图各有优缺点,必须相互整合校正。
基因组测序方法、原理及特点:1.克隆重叠群法(clone contig method,作图法测序):先构建遗传图,再利用几套高度覆盖的大片段基因组文库(BAC、PAC等)获得精细的物理图,选择合适的BAC或PAC克隆测序,利用计算机拼装。
BAC内的空洞基本上都可以利用设计引物等手段填补,形成一条完整的BAC序列。
然后由相互关联、部分重叠的BAC克隆连成一个大的重叠群(Contig)。
优点:通过这种方法得到的基因组数据是最为准确和精细的数据,也是基因组测序的最终目标。
缺点:该方法的技术难度较高,尤其大片段基因组文库(BAC)和精细物理图构建是技术性极强的工作;此外,费用相对于鸟枪法要稍高一些,完成整个基因组测序周期也要长些。
2.全基因组鸟枪法(whole-genome shotgun method):是随机先将整个基因组打碎成小片段进行测序,最终利用计算机根据序列之间的重叠关系进行排序和组装,并确定它们在基因组中的正确位置。
优点:速度快,简单易行,成本较低,可以在较短的时间内通过集中机器和人力的方法获得大量的基因片断。
缺点:最终排序结果的拼接组装比较困难,尤其在部分重复序列较高的地方难度较大。
此外有许多序列片段难以定位在确切的染色体上,成为游离片断;同时又会有许多地方由于没有足够的覆盖率而形成空缺。
这些缺陷最终导致整个基因图会留下大量的空洞,也影响其准确度。
遗传作图(Genetic mapping):采用遗传学分析方法将基因或其它DNA序列标定在染色体上构建连锁图。
此方法包括杂交实验,家系分析。
遗传图距单位为厘摩(cM),每单位厘摩定义为1%交换率。
(相对位置)物理作图(Physical mapping):采用分子生物学技术直接将DNA分子标记、基因或克隆标定在基因组实际位置。
物理图的距离依作图方法而异,如辐射杂种作图的计算单位为厘镭(cR),限制性片段作图与克隆作图的图距为DNA的分子长度,即碱基对(bp,kb)。
(绝对位置)基因是首先被使用的标记:基因十分有限,大量的基因间隔区DNA标记必须有等位型才是有用的。
1.限制性片段长度多态性(RFLP)同一物种的亚种、品系或个体间基因组DNA受到同一种限制性内切酶作用而形成不同的酶切图谱的现象,第一代分子标记。
特点:1)处于染色体上的位置相对固定;2)同一亲本及其子代相同位点上的多态性片段特征不变;3)同一凝胶电泳可显示等位区段不同多态性片段,表现为共显性(可鉴定纯合子和杂合子);4)需要用Southern杂交检测显示。
2.简单序列长度多态性(SSLP)第二代分子标记SSR技术的优点是:(1)在基因组中随机分布,检测的多态性频率高;(2)PCR特异引物,重复性好(3)共显性,操作相对简单。
问题是:(1)SSR需要测序和设计引物,因而需要大量的人力、物力和时间;(2)另外其种属特异性强,开发所需的费用高昂,因此一些实验室进行了合作,共同开发微卫星引物。
SSR标记的关键是引物的设计3.单核苷酸多态性(SNP)是指同一物种不同个体基因组DNA的等位序列上单个核苷酸存在差异的现象。
其中最少一种在群体中的频率不小于1%;根据SNP在基因中的位置,SNP可分为:基因编码区SNP、基因周边SNP、基因间SNP。
SNP特点:(1)SNP由核苷酸代换产生(2)人类基因组平均600bp含一个SNP(3)人类基因组SNP总量大于500万占人类DNA序列差异的10%-50%(4)基因组中一些紧密连锁的SNP 可组成单倍型(Haplotype).单倍型中不同的SNP位点之间不发生重组与交换.。
遗传作图理论基础:采用一组分子标记构建遗传图的方法主要依赖于连锁分析。
基本方法:两点测验法和三点测验法。
不同模式生物连锁分析有性杂交实验、质谱分析、DNA转移Lod值是基因连锁可能性的对数,用于初步判断所研究的2个基因是否位于同一染色体上。
细菌的遗传作图:部分二倍体作图法转化:供体细胞释放的一段DNA(通常小于50kb),经受体细胞摄取后整合到基因组中,可借助抗性培养基筛选重组克隆。
转导:通过噬菌体将小片段DNA从供体细胞转移到受体细胞。
接合:两个细菌形成物理接触,DNA从供体转移到受体。
转移DNA可以是一段也可以是整个染色体,可达1Mb.一、为什么需要物理作图?1、遗传图谱分辨率有限:由于人类及其大多数高等真核生物来说,不可能获得巨大数量的后代,因此可用于研究的减数分裂体就少很多,连锁分析就受限制,导致标记密度的减小,从而影响遗传作图;2、遗传图覆盖面低:由于染色体交换区域的不平衡,有些区段很少发生交换,难以获得高密度连锁图;3、遗传图分子标记的排列有时会出现差错:遗传作图依赖子代的重组及分离比,由于环境及取样误差,有时结果会出现差异,相同的标记在连锁图上位置不一样。
二、物理作图方法及原理(限制性作图、基于克隆的基因组作图、荧光原位杂交(FISH)、序列标签位点(STS))1、限制性作图:将限制性酶切位点标定在DNA分子的相对位置。
方法及原理:通过比较不同限制性内切酶切割所产生DNA片段大小:首先用一种酶处理样品后,电泳确定DNA片段的大小;然后用第二种酶处理,获得第二组片段。
最后用两种酶混合处理,获得第三组片段。
收集上述资料进行对比组装:两种酶切位点交替出现的区段用加减法确定其的相对位置。
连续出现2个或多个相同酶切位点的区段,采用部分酶解法。
切点过多时可以采用末端同位素标记结合部分酶解进行绘图。
限制性作图更适合于小分子。
当需要对大于50kb的基因组进行限制性作图时,通过选择靶DNA分子中的稀有酶切位点酶可以克服限制性酶切作图的局限性。
大分子DNA分离采用特殊电泳:脉冲凝胶电泳(PFGE)、正交交变电场凝胶电泳(OFAGE)2、基于克隆的基因组作图:根据克隆的DNA片段之间的重叠序列构建重叠群(Contig),绘制物理连锁图。
常用大分子DNA克隆载体:酵母人工染色体YAC、噬菌体P1载体、细菌人工染色体BAC、P1人工染色体PAC、F黏粒。
方法及原理:1、基因克隆2、构建重叠群(染色体步移法、指纹法)3、荧光原位杂交FISH:指在染色体上进行DNA杂交,以便识别荧光标记探针在染色体上位置的方法。
4、序列标签位点作图STS:通过PCR或分子杂交将小段DNA序列定位在基因组的DNA 区段中。
三、脉冲电泳PFGE的基本原理:将一个方向不断变换的电场,取代简单的单一电场(单向电场),使电泳中受阻的DNA分子在电场改变时扭转迁移方向,较小的分子比较大的分子重新排列的快,以此达到分离的目的。
分辨率达到10Mb。
四、重叠群:可以通过末端的重叠序列相互连接形成连续的DNA长片段的一组克隆称为重叠群(contig)五、指纹法:1、分类:限制性带型指纹:用不同限制性酶消化后,经凝胶分离产生的条带。
重复顺序DNA指纹:将不同克隆的限制性片段电泳转膜后,与基因组范围分布的重复序列杂交形成的带型。
重复顺序DNA PCR或分散重复顺序PCR指纹:用基因组范围的重复序列的互补序列做引物,扩增两个重复序列之间的单一顺序,得到的产物带型。
2、克隆指纹法的原理:如果2个克隆彼此重叠,它们一定含有相同的序列。
3、基因组范围内查找重叠克隆的最好方法首推克隆指纹排序。
4、指纹:指确定DNA样品所具有的特定DNA片段组成,一个克隆的指纹表示了该克隆所具有的指定序列的特征,可以同其他克隆产生的同类指纹比较。
六、STS作图法:根据STS序列设计引物,扩增文库当中的克隆,能扩出条带的克隆都含有序列重叠的插入子。
(前提:某一克隆重叠群锚定到现有的STS标记物理图上,STS是单一序列,序列已知。
)序列标记位点:指一段短的DNA序列,通常长度在100-500bp,易于识别,在待研究的染色体或基因组中仅存有1个拷贝。
因此当2个片段含有同一STS顺序时,可以确认这两个片段彼此重叠。
合格的STS需要具备的两个条件:1.在染色体上的位置独一无二;2.序列已知,方便PCR检测。
寻找STS的方法:1)表达序列标签:来源于cDNA克隆的小段序列。