Comparative Genomics Software Packages at GMOD

合集下载

2014-基因组学——最终版

2014-基因组学——最终版

基因组学题库一基因组学介绍1 基因组与基因组学基因组是指生物的整套染色体所含有的全部DNA序列,是生物体所有遗传信息的总和。

基因组学(Genomics)是以生物信息学分析为手段研究基因组的组成、结构、表达调控机制和进化规律的一门学科,研究对象是基因组结构特征、变演规律和生物学意义。

2 C质与C质悖论C值(C value)通常是指某一生物单倍体基因组DNA的总量。

C值悖论(C Value Paradox):生物的复杂性与基因组的大小并不完全成比例增加。

3 人类基因组计划及其8个目标人类基因组计划(human genome project, HGP)是由美国科学家于1985年率先提出,于1990年正式启动的。

美、英、法、德、日和我国科学家共同参与了这一预算达30亿美元的人类基因组计划。

按照这个计划的设想,在2005年,要把人体内约10万个基因的密码全部解开,同时绘制出人类基因的谱图。

其8个目标:1)人类DNA序列(Human DNA sequence);2)开发测序技术(Develop sequencing technology);3)识别人类基因组序列变异(Identify human genome sequence variation);4)功能基因组学技术(Functional genomics technology);5)比较基因组学(Comparative genomics);6)伦理、法律、社会问题(ELSI: ethical, legal, and social issues);7)生物信息学和系统生物学(Bioinformatics and computational biology);8)Training and manpower。

4 什么是宏基因组(metagenomics)?研究一类在特殊的或极端的环境下共栖生长微生物的混合基因。

生境中全部微小生物遗传物质的总和。

它包含了可培养的和未可培养的微生物的基因,目前主要指环境样品中的细菌和真菌的基因组总和。

全基因组名词解释

全基因组名词解释

全基因组(Genome)是指一个生物个体细胞中包含的所有遗传物质的总和。

遗传物质主要包括DNA(脱氧核糖核酸)。

全基因组包含了生物体遗传信息的全部,涵盖了编码蛋白质的基因以及调控基因表达的非编码区域。

以下是一些与全基因组相关的重要概念和解释:
1. 基因(Gene):生物体中的基本遗传单位,是一段DNA序列,编码特定的蛋白质或RNA分子。

2. 编码区域(Coding Region):全基因组中包含基因的部分,这些基因编码蛋白质。

3. 非编码区域(Non-coding Region):不包含编码蛋白质的DNA区域,但可能包含对基因表达和调控至关重要的元件。

4. 基因组大小:描述一个生物体细胞中DNA的总长度。

不同物种的基因组大小差异很大,与生物体的复杂性和进化历程有关。

5. 基因组学(Genomics):研究整个基因组的科学领域,包括基因的定位、功能、调控及其在生物体内的相互作用。

6. 人类基因组计划(Human Genome Project):一个国际性的科研项目,目标是解析人类的全基因组结构,确定人类所有基因的DNA序列。

7. 比较基因组学(Comparative Genomics):比较不同物种基因组的结构和序列,以了解它们之间的遗传差异和相似性,进而推断生物体的进化关系。

全基因组研究为了解生物体的遗传信息、进化和疾病发生提供了重要的基础。

随着技术的不断进步,全基因组研究已经成为生物学、医学和生物信息学等领域的一个重要方向。

genomics

genomics

gene是DNA分子中含有特定遗传信息的一段核苷酸序列,是遗传物质的最小功能单位。

基因组(genome):生物所具有的携带遗传信息的遗传物质的总和,是指生物细胞中所有的DNA,包括所有的基因和基因间区域。

genomics以整个基因组为研究对象,而不是以单个基因为单位作为研究对象。

指以分子生物学技术、计算机技术和信息网络技术为研究手段,以生物体内全部基因为研究对象,在全基因背景下和整体水平上探索生命活动的内在规律及其内外环境影响机制的科学。

基因组学包括3个不同的亚领域结构基因组学(structural genomics) 通过基因组作图、核苷酸序列分析,研究基因组结构,确定基因组成、基因定位的科学。

功能基因组学(functional genomics)详尽分析序列,描述基因组所有基因的功能,包括研究基因的表达及其调控模式,这就是功能基因组学。

比较基因组学(comparative genomics) 研究不同物种之间在基因组结构和功能方面的亲源关系及其内在联系的学科,以便深入理解每个基因组的功能和进化关系。

基因组学的意义生物学研究医学生物技术制药工业社会经济生物进化尤其是人类疾病基因的研究C 值悖理(矛盾)(C-value paradox):在结构、功能很相似的同一类生物中,甚至在亲缘关系十分接近的物种之间,它们的C值可以相差数10倍乃至上百倍。

基因组的序列组成高度重复序列中度重复序列单一序列基因主要位于单一序列DNA基因家族同一物种或不同物种中来自一个共同的祖先,因加倍和趋异而产生的一组具有相似序列组成或略不同的基因成员。

超基因家族起源于共同祖先,由相似DNA序列组成的许多基因亚家族或相似的基因成员构成的群体,具有相似的功能。

反义基因:与已知基因编码序列互补的的负链编码基因,参与基因的表达调控,可以干扰靶基因mRNA转录与翻译。

假基因: 来源于功能基因但已失去活性的DNA序列.真核生物基因组的特征结构松弛大量重复顺序由线性DNA与蛋白质组成染色体结构含有细胞器基因组原核生物基因组的特征1) 结构紧凑2) 大小在5 Mb以下3) 缺少重复顺序4) 很少非编码顺序为何要绘制遗传图与物理图1)基因组太大,必需分散测序,然后将分散的顺序按原来位置组装,需要图谱进行指导。

分子生物学资料

分子生物学资料
61.限制性片段长度多肽性(RFLP):使用限制性DNA内切酶消化某个DNA分子后出现的长度多样性。
62.单核苷酸多样性(SNP):指基因组DNA序列中由于单个核苷酸的突变而引起的物种多态性。
63.比较基因组学(comparative genomics):是基于基因组图谱和测序技术基础上,对已知的基因和基因组结构进行比较以了解基因的功能、表达机制和物种亲缘关系的学科。
33.癌(cancer):是一群不受生长调控而繁殖的细胞。
36.良性肿瘤(benign tumor):是一群仅局限在自己的正常位置,且不侵犯周围其他组织和器官的细胞。
37.癌基因(oncogene):是指人类或其他动物细胞固有的一类基因,它们一旦活化便能促使人或动物的正常基因发生癌变。
38.病毒癌基因(viral oncogene,V-onc):指反转录病毒的基因组里带有可使受病毒感染的宿主细胞发生癌变的基因。
一、名词解释。
1.翻译(translation):指将mRNA链上的核苷酸从一个特定的起始点开始,按每三个核苷酸代表一个氨基酸的原则,依次合成一条多肽链的过程。
2.三联密码子(codon):mRNA上每三个核苷酸翻译成蛋白质多肽链上的一个氨基酸,这三个核苷酸就称为三联密码子。
3.可读框(open reading frame):由起始密码子开始,到终止密码子结束的核苷酸序列就被称为可读框。
23.正转录调控可分为正控诱导和正控阻遏;在正控诱导系统中,效应物的存在使激活蛋白处于活性状态,在正控阻遏系统中,效应物的存在使激活蛋白处于非活性状态。
24.根据操纵子对某些调节它们的小分子应答的不同,分为:可诱导调节和可阻遏调节。
25.大肠杆菌乳糖操纵子包括3个结构基因:Z、Y和A,以及启动子、控制子、阻遏子等。

医学遗传学专业英文词汇

医学遗传学专业英文词汇

acrocentric chromosome近端着丝粒染色体acute intermittent porphyria急性间隙性卟啉症additive gene累加基因adenylate deaminase,ADA腺苷脱氨酶affected pedigree member,APM患病家系成员法affected sib-pair,ASP患病同胞对法agammaglobulinemia丙种球蛋白血症albinism白化病alkaptonuria尿黑酸尿症Allele-specific oligonucleotide,ASO等位基因特异性寡核苷酸Alu family Alu家族An International System for Human Cytogenetics Nomenclature,ISCN人类细胞遗传学命名的国际体制anaphase lag染色体分裂后期延滞anencephalus无脑畸胎aneupliod非整倍体anticipation遗传早现antisense technology反义技术association关联assortative mating选型婚配atrial septal defect,ASD房间隔缺损autoimmune disease,AID自身免疫性疾病autosomal disease常染色体病autosomal dominant inheritance,AD常染色体显性遗传autosomal dominantly inherited chronic progressive external ophthalmoplegia,AD-CPEO慢性进行性外眼肌麻痹autosomal inheritance常染色体遗传average inbreeding coefficient平均近婚系数autosomal recessive inheritance,AR常染色体隐性遗传autosome常染色体Bbalanced translocation carrier染色体平衡易位携带者base substitution碱基替换biological fitness生物适合度biometric model fitting生物统计模型拟合birth defect出生缺陷brachydactyly短指(趾)症breakage断裂bronchial asthma支气管哮喘carrier携带者centi-Morgan,cM厘摩centric fusion着丝粒融合centromere着丝粒chromatid染色单体chromatin染色质chromosomal disorder染色体病chromosomal polymorphism染色体多态性chromosomal rearrangement染色体重排chromosome染色体chromosome aberration染色体畸变chromosome banding染色体显带chromosome lose染色体丢失chromosome set染色体组chronic progressive external ophthalmoplegia,CPEO慢性进行性眼外肌瘫痪clinical genetics临床遗传学co-segregation共分离codominance共显性codon密码子coefficient of relationship亲缘系数comparative genomics比较基因组学complete penetrance完全外显complex disease复杂疾病congenital adrenal hyperplasia先天性肾上腺皮质增生症congenital glucose-galactose malabsorption先天性葡萄糖、半乳糖吸收不良症congenital malformation先天畸形consanguinous mating近亲婚配cri du chat syndrome猫叫综合征cysticfibrosis,CF囊性纤维样变cystinuria胱氨酸尿症Ddelayed dominance延迟显性deletion缺失derivation chromosome衍生染色体diabetes mellitus,DM糖尿病diandry双雄受精dicentric chromosome双着丝粒染色体digyny双雌受精diploid二倍体Down Syndrome,DS Down综合征Down syndrome cell adhesion molecule,DSCAM DS细胞黏附分子Down syndrome critical region,DCR DS关键区Duchenne muscular dystrophy,DMD Duchenne型肌营养不良症duplication重复dynamic mutation动态突变EEdward syndrome Edward综合征Ehlers-Danlos Ehlers-Danlos综合征endomitosis核内有丝分裂endoreduplication核内复制euchromatin常染色质eugenics优生学euphanics优形学euploid整倍体eupsychics优心学euthenics优境学expanded familial genetic counseling扩大的家庭遗传咨询expressivity表现度Ffetal alcohol syndrome胎儿酒精综合征frame-shift mutation移码突变functional cloning功能克隆functional genomics功能基因组学familiar hypercholesterolemia家族性高胆固醇血症Ggain-of-function mutation功能加强突变galactosemia半乳糖血症gene基因gene augmentation基因增强gene correction基因修正gene expression基因表达gene mutation基因突变gene replacement基因替代gene therapy基因治疗genetic code遗传密码genetic counseling遗传咨询genetic disease遗传病genetic heterogeneity遗传异质性genetic imprinting遗传印记genetic map遗传图genetic medicine遗传医学genetic shift随机遗传漂变genome基因组genomic imprinting基因组印记glucose-6-phosphate dehydrogenase deficiency,G6PD葡糖-6-磷酸脱氢酶缺乏症glycogen storage disease,GSD糖原贮积症GT-AG rule GT-AG法则Hhaploid单倍体haplotype单倍型healthy birth健康生殖hemizygote半合子hemoglobinopathy血红蛋白疾病hemolytic disease of the newborn新生儿溶血症hemophilia A血友病Ahereditary chorea遗传性舞蹈病hereditary enzymopathy遗传性酶病heritability遗传度heterochromatin异染色质heteromorphism异形性heteroplasmy异质性histo-blood group组织血型homoplasmy同质性housekeeping protein持家蛋白human genetics人类遗传学human genome diversity project,HGDP人类基因组多样性计划human genome project,HGP人类基因组计划human leucocyte antigen,HLA人类白细胞抗原human prion diseases人类朊蛋白病Huntington’s chorea Huntington舞蹈病hydramnios羊水过多hyperdiploid超二倍体hypodiploid亚二倍体Iimmunodeficiency免疫缺陷inborn errors of metabolism先天性代谢缺陷inbreeding coefficient近婚系数incomplete penetrance不完全外显induced aberration诱发畸变induced mutaion诱发突变industrial genomics工业基因组学inherited disorders of col1age胶原蛋白病insertion插入interstitial deletion中间缺失intrauterine diagnosis宫内诊断inversion倒位irregular dominance不规则显性isochromosome等臂染色体Kkaryotype核型karyotype analysis核型分析Kearns-Sayre syndrome,KSS Kearns-Sayre综合征Klinefelter syndrome Klinefelter综合征KpnⅠfamily KpnⅠ家族Llandmark界标Leber hereditary optic neuropathy,LHON Leber遗传性视神经病Leigh sysdrom,LS Leigh综合征Lesch-Nyhan syndrome Lesch-Nyhan综合征liability易患性length-based heteroplasmy长度异质性linkage map连锁图loss-of-function mutation功能丢失的突变luxury protein奢侈蛋白Mmajor gene主基因major histocompatibility complex,MHC主要组织相容性复合体maternal inheritance母系遗传medical genetics医学遗传学metacentric chromosome中着丝粒染色体minor gene微效基因missense mutation错义突变mitochondrial disease线粒体病mitochondrial DNA,mtDNA线粒体DNAmitochondria1 encephalomyopathies,ME线粒体脑肌病mitochondrial encephalomyopathy with lactic acidosis,and stroke-like episodes,MELAS线粒体脑肌病合并乳酸血症及卒中样发作molecular diagnosis分子诊断molecular disease分子病monogenic disorder基因遗传病monosomy单体型morbid genomics疾病基因组学mucopolysaccharidosis,MPS粘多糖贮积症multifactorial disorder多因子病multifactorial inheritance,MF多因子遗传mutagen诱变剂mutant protein突变蛋白mutation突变mutation load突变负荷myeloschisis脊髓裂myoclonic epilepsy and ragged red fibers,MERRF伴有破碎红纤维的肌阵挛癫痫Nneonatal screening新生儿筛查neurogenic muscle weakness,ataxia,and retinitis pigmentosa,NARP神经源性肌软弱、共济失调并发色素性视网膜炎non-disjunction不分离non-sense mutation无义突变novel property mutation新特征突变nuclear DNA,nDNA核DNAnullosomy缺体型OOnline Mendelian Inheritance in Man在线《人类孟德尔遗传》osteogenesis imperfecta成骨不全Pparacentric inversion臂内倒位parental imprinting亲代印记Parkinson disease,PD帕金森病path analysis通径分析Patau syndrome Patau综合征pedigree analysis系谱分析法penetrance外显率pericentric inversion臂间倒位peudogene拟基因pharmacogenomics药物基因组学phenocopy拟表型phenylketonuria,PKU苯丙酮尿症physical map物理图plasma protein disease血浆蛋白病pleiotropy基因的多效性point mutation点突变polygenic disorder多基因遗传病polygenic inheritance多基因遗传polyploid多倍体polysomy多体型positional cloning位置克隆post-translational isozyme翻译后同工酶prenatal diagnosis产前诊断proband先证者proteomics蛋白质组学pseudodiploid假二倍体Qqualitative character质量性状quantitative character数量性状quantitative trait loci,QTL数量性状位点Rreceptor disease受体病reciprocal translocation相互易位recurrence risk再发风险率rejoin重接restriction fragment length polymorphism,RFLP限制性片段长度多态性reunion愈合或重合rheumatoid authritis,RA类风湿性关节炎ring chromosome环状染色体Robertsonian translocation罗伯逊易位Ssame sense mutation同义突变schizophrenia,SZ精神分裂症segregation load分离负荷selection coefficient选择系数sequence-based heteroplasmy序列异质性sequence map序列图severe combined immunodeficiency,SCID严重联合免疫缺陷病sex chromatin性染色质sex chromosome性染色体sex chromosome disease性染色体病sex-conditioned inheritance从性遗传sex-determining region Y,SRY Y性别决定区域sex-limited inheritance限性遗传short tandem repeat,STR短串联重复sick1e cel1 anemia镰状细胞贫血single gene disorder单基因遗传病single nucleotide polymorphism,SNP单核苷酸多态性single-strand conformation polymorphism,SSCP单链构象多态性small deletion syndrome微小缺失综合征somatic cell genetic disorder体细胞遗传病somatic mutation体细胞突变spina difida脊柱裂spina bifida occulta隐性脊柱裂spontaneous aberration自发畸变spontaneous mutation自发突变static mutation静态突变structural equation modeling结构等式模型structural genomics结构基因组学submetacentric chromosome亚中着丝粒染色体susceptibility易感性Ttandemly repeatd genes串联重复基因telocentric chromosome端着丝粒染色体telomere端粒teratogen致畸因子terminal deletion末端缺失terminator codon mutation终止密码突变testis-determining factor,TDF睾丸决定因子tetralogy of Fallot法乐氏四联症tetraploid四倍体tha1assemia地中海贫血tissue-specific protein组织特异性蛋白translocation易位transcription map转录图transition转换transmission disequilibrium test,TDT传递不平衡检验法transvertion颠换3trinucleotide repeat amplification脱氧三核苷酸重复扩增trinucleotide repeat expansion diseases,TREDs三核苷酸重复扩增疾病triplet code三联体密码trisomy三体型Turner syndromeTurner综合征Vvariable number of tandem repeats,VNTR可变数目串联重复ventricular septal defect,VSD室间隔缺损vitamin D-resistant rickets抗维生素D佝偻病XX chromatin X染色质X inactivation X染色体失活X-linked dominant inheritance,XD X伴性显性遗传X-linked inheritanceX伴性遗传X-linded recessive inheritance,XR X连锁隐性遗传xeroderma pigmentosum,XP着色性干皮病YY chromatin Y染色质Y-linked inheritance Y连锁遗传。

植物和微生物基因组数据分析和处理的研究

植物和微生物基因组数据分析和处理的研究

植物和微生物基因组数据分析和处理的研究随着生物技术的飞速发展,越来越多的生物数据被测序并上传至公共数据库中,其中包括植物和微生物的基因组数据。

这些数据的分析和处理在植物和微生物学研究中起着重要作用,可以帮助研究人员深入了解这些生物的基因组组成和功能。

本文将介绍植物和微生物基因组数据分析和处理的研究进展和应用。

植物基因组数据分析和处理植物基因组是复杂的,包含大量的基因和非编码区域。

植物基因组数据的分析和处理需要解决三个主要问题:序列质量控制、基因注释和基因表达分析。

序列质量控制是基因组数据分析的第一步。

因为测序错误会对后续的数据分析和处理造成影响,所以需要对序列数据进行质量控制。

一般通过序列比对、K-mer分析、GC含量分析、重复序列过滤等方法来处理和控制序列质量。

基因注释是基因组数据分析的重要步骤。

基因注释是对基因组序列中的基因和非编码序列进行识别和注释。

常用的方法包括基于Comparative Genomics(比较基因组学)和基于实验数据的方法。

其中比较基因组学方法是基于比较已知物种中的基因和基因组结构相似性来找到植物基因组中的相似序列,从而注释基因。

而基于实验数据的方法是利用RNA-Seq等实验数据来确定基因位置和剪接模式,从而注释基因。

基因表达分析是基因组数据分析中的最后步骤。

基因表达分析可以评估植物基因组序列中的基因在不同的生长和发育阶段以及不同的环境条件下的表达级别。

常用的方法包括差异表达分析、功能分析和通路分析等。

这些方法可以帮助研究人员深入了解植物基因的功能和在生长发育和环境响应中的作用。

微生物基因组数据分析和处理微生物基因组是相对较小的基因组,一般只包含一个或几个染色体。

与植物基因组相比,微生物基因组数据量较小,但数据分析的难度不小。

微生物基因组数据分析包括序列拼接、基因注释、基因比较和功能分析等步骤。

序列拼接是微生物基因组数据分析的第一步。

大多数微生物基因组都是利用测序技术通过多次测序生成的短序列来拼接成较长的序列。

2生物学数据库及其检索

2生物学数据库及其检索

❖ print "Primary accession " . $1;

}
❖ $newEntry=0;

}
❖ if($line =~ /^SQ\s*\w*\s*(\w*)/) {
❖ # match SQ line
❖ print " sequence length: " . $1 . "\n";

}
❖ # ignore other lines
❖ Primary accession P18646 sequence length: 75
❖ Primary accession P13813 sequence length: 296
❖ ………
三、序列格式
❖ 序列格式主要在布局和序列码行的形成上不 同,而一些格式同时提供描述或元数据或行 集。
❖ 对于许多软件工具来说,它们能很自然地自 动区分和接受不同格式的序列
EMBnet
❖ EMBnet (European Molecular Biology Network)建立于1988年,由多个 位于欧洲及欧洲以外的成员国节点及专业节点组成。除了上面提到的欧 洲生物信息学研究所EMBL-EBI,瑞士生物信息研究所SIB、澳大利亚国 家基因组学信息服务(AGRIS)以及中国北京大学的生物信息中心PKUCBI都是EMBnet的成员。它们不仅为本国用户提供生物信息资源及生物 计算服务,同时提供用户支持、培训以及进行相关的生物信息研究与开 发。比如专业蛋白质分析系统ExPASy就是由SIB开发及维护,而通用蛋 白质资源UniProt则由EMBL-EBI及SIB、PIR共同进行维护的。由于 EMBnet的成员国节点及专业节点各自包含了大量的公共数据信息及自 行开发的数据库及分析工具,因此可作为生物学数据资源的补充来源。 相关信息可以从/en/members/National 和 /en/members/Specialist中查到。

基因组学考试 名词解释

基因组学考试 名词解释

武汉大学李阳生老师基因组学考试名词解释名词解释1.基因= 由不同的DNA片段共同组成的一个完整的表达单元,有一个特定的表达产物,表达产物可以是RNA分子,亦可为多肽分子。

2.遗传图谱=以遗传距离表示基因组内基因座位相对位置的图谱。

3.遗传作图= 采用遗传学分析方法将基因或其他DNA顺序标定在染色体上构建连锁图。

4.DNA标记= 一段DNA顺序,具有2个或多个不同的可以区分的版本,即等位形式。

AFLP、STS、RALP、RFLP、SSR、SNP等。

5.重组热点= 染色体的某些位点之间比其他位点之间由更高的交换频率,被称为重组热点。

6.共分离= 在有性繁殖的后代,这种基因附近有一个紧密连锁的分子标记与连锁的基因有最大的可能同时出现在同一个体中,这一现象被称为共分离。

7.物理图谱= 指表示DNA序列上DNA标记之间实际距离的图。

8.物理作图= 采用分子生物学技术直接将DNA分子标记、基因或克隆标定在基因组实际位置。

9.重叠群= 相互重叠的DNA片段组成的物理图称为重叠群。

10.稀有切点限制酶=指该酶识别的碱基顺序在基因组中只有很少数量,可产生较大的DNA片段。

11.DNA指纹= 小卫星DNA具有高度的可变性,不同个体,彼此不同。

但“小卫星DNA”中有一段序列则在所有个体中都一样,称为“核心序列”。

如果把核心序列串联起来作为探针,与不同个体的DNA进行分子杂交,就会呈现出各自特有的杂交图谱,它们与人的指纹一样,具有转移性和特征性,因人而异,因此被称作“DNA指纹”(DNA fingerprint)。

12.染色体步移=从第一个重组克隆插入片段的一端分离出一个片段作为探针从文库中筛选第二个重组克隆,该克隆插入片段含有与探针重叠顺序和染色体的其他顺序。

从第二个重组克隆的插入片段再分离出末端小片段筛选第三个重组克隆,如此重复,得到一个相邻的片段,等于在染色体上移了一步,故称之为染色体步移(Chromosome Walking)染色体步移技术(genome walking)是一种重要的分子生物学研究技术,使用这种技术可以有效获取与已知序列相邻的未知序列。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

gbrowse_syn 2 to 5 with Web more in an upcoming release
4
GBrowse Compatible plus an Alignment *** Database Chado
GBrowse 1.69
Sybil
5,6
Unlimited
**
Web
Standard CPAN Modules
Screenshot
CMap
3
Unlimited
*
Web
CMap Database
Standard CPAN Modules
CMap is a comparative map viewer that can display a variety of maps including sequence, genetic and physical, and so can display the comparison between syntenic genomes. CMap can also generate chromosome comparison dot plots. Each organism's data are stored in its own GBrowse compatible database and gbrowse_syn uses an alignment database to draw synteny data. Any genome can be used as the reference and each GBrowse database stands on its own as a standard GBrowse instance Chado was designed from its inception to allow data for multiple organisms, so no special modification to the schema is required. In addition to synteny views, Sybil also provides a “whole genome comparison” view. All data are stored in one GBrowse database, though it is possible to switch reference genomes for comparison.
SynBrowse
7
Unlimited
**
Web
GBrowse Compatible
At least GBrowse 1.68, 1.69 may work
SynView
8,9
Unlimited
**
Web
GBrowse Compatible
Any recent version of GBrowse
All data is stored in one GBrowse database, with a single reference organism and other organisms' data included in ninth column of the reference organism's GFF file. It is not possible to switch reference organisms. Synteny data is drawn with custom perl code in the GBrowse configuration file.
Using Apollo to browse and edit genome annotations. Misra S, Harris N., Curr Protoc Bioinformatics. 2006 Jan;Chapter 9:Unit 9.5. Download: /current/install.html. 3 CMap work by Ben Faga; download at /wiki/Downloads. 4 gbrowse_syn work by Sheldon McKay; distributed with GBrowse, download at /wiki/Downloads. 5 Sybil: methods and software for multiple genome comparison and visualization. Crabtree J, Angiuoli SV, Wortman JR, White OR. Methods Mol Biol. 2007;408:93-108. 6 Download: /downloads.html. 7 Download: /. 8 SynView: a GBrowse-compatible approach to visualizing comparative genome data. Wang H, Su Y, Mackey AJ, Kraemer ET, Kissinger JC. Bioinformatics. 2006 Sep 15;22(18):2308-9. Epub 2006 Jul 14. 9 Distributed with GBrowse, download at /wiki/Downloads.
Application Apollo
1,2
Number of Platform Genomes 2 to 3 Java/ Desktop
Database Chado or XML files
Other software required None
Comments
Apollo is a desktop application for editing genome features. As part of its suite of tools it can show synteny to facilitate feature editing and so can be used as a synteny browser.
Comparative Genomics Software Packages at GMOD

1
Scott Cain , David Clements and the GMOD Consortium
Cold Spring Harbor Laboratory, 1 Bungtown Road, Cold Spring Harbor, NY 11724 USA 2 National Evolutionary Synthesis Center, 2024 W. Main Street, Suite A200, Durham, NC 27705-4667 USA
1 2
*Limited only by horizontal screen real estate, unlimited with side scrolling. **Limited only by vertical screen real estate, unlimited with vertical scrolling. ***Requires an alignment database to store synteny data and one GBrowse database for each genome; additionally, each GBrowse database may be from a different schema (i.e., one SeqFeature::Store and one Cha of comparative genomics has been increasing recently due to the explosion of inexpensive genome sequences, and the visualization software packages at the Generic Model Organism Database (GMOD) project reflects that interest in comparative genomics. There are at least six software packages for visualizing synteny at GMOD. Here we present each of those packages, along with suggestions for use cases as well as caveats for their use. Software packages presented here include Apollo, CMap, gbrowse-syn, SynBrowse, SynView, and Sybil. All of these packages are free and open source. The GMOD project is supported by grants from the National Institutes of Health and the USDA Agricultural Research Service.
相关文档
最新文档