线粒体基因组数据的分析方法和软件_李雪娟
新西兰白兔线粒体基因组全序列的测定与分析

1.1新西兰白兔线粒体基因组特征
M M 和 /V/)6,终止密码子为不完全密码子T A 的是 /VD/ 和 /VZW,其余为TAA。对密码子进一步分析,发现 密码子的第三位碱基为A 和 C 的比例高于G 和 T, 第二位碱基为嘧啶的比例明显高于嘌呤。相邻基因之 间存在重叠现象,压缩基因组有利于更快复制和转 录。<4FAweS与 4 77々《e6 重 叠 43 bp,重叠最多,其次 是 W/V4-G/y 与 C0 U 重叠 20 bp,/V/34A 与 /VZW重叠 7 bp,M)5 和 /VD6 重叠 5 bp,冰 舰 -//e 和 成/V/l -C/n 重 叠 3 bp,/l 77々《e6 和 C0 AJ 重叠丨 bp,C).劝和 -7V 重 叠 1 bp。Chen
Abstract The aim of this study was to obtain the complete mitochondrial DNA (mtDNA)sequence of New Zealand white rabbit.According to the whole genome sequence of mtDNA of Neonatal Rabbit (GenBank accession No.: AJ0 0 1588.1), 12 pairs of primers were designed to cover the whole mtDNA sequence of New Zealand white rabbit. The whole mitochondrial sequence of New Zealand white rabbit was obtained by PCR amplification,sequencing and assembling, and its characteristics were analyzed. The complete mitochondrial genome sequence of New Zealand white rabbit was 17 418 bp with a high AT content of 59.72%, having 13 protein coding genes,2 rRNA genes,22 tRNA genes and 1 D-loop region.The sequence of mitochondrial genome of New Zealand white rabbit was identical with that of other rabbits.Four special secondary structures of tRNA were analyzed.It was found that tRNA-ser (AGY)was a two-leaf clover type,lacking DHU arm,and the other three tRNAs were clover pared with the D-loop region of the mitochondrial genome of other mammals,the nucleotide composition, coding preference and amino acid composition of New Zealand white rabbit and Lepus granatensis were similar.The mi-
线粒体基因组测序策略和方法

一、为何需要针对线粒体基因组 进行测序
线粒体基因组测序对于研究人类以及其它生物的遗传学具有重要意义。线粒体 基因组具有独特的生物学特性,如母系遗传、高突变率等,因此对其进行测序 有助于揭示物种演化和人类起源的奥秘。此外,线粒体基因组测序在医学和临 床领域也有广泛的应用,如遗传疾病诊断、肿瘤发生机制研究等。
关键词
棉花线粒体基因组、测序、序列 初步分析、进化、遗传多样性
内容大纲
1、棉花线粒体基因组的测序
2、测序数据的初步分析
引出实验设计 1、实验材料棉花品种:中棉所41 2、样品处理采集棉花幼叶,提iSeq X Ten进行测序,获得原始数据。
线粒体基因组测序策略和方法
目录
01 一、为何需要针对线 体基因组测 序策略制定
03
三、线粒体基因组测 序方法
04 四、数据分析
05 参考内容
线粒体基因组测序是一种用于研究线粒体DNA序列的方法,它有助于揭示人类 以及其它生物的遗传奥秘。线粒体基因组测序涉及到多个方面,包括策略制定、 测序技术选择、测序深度设置、DNA提取、PCR扩增和数据分析等。本次演示 将就这些方面进行详细阐述。
2、测序深度设置
测序深度是指单位时间内所获得的序列数据量。合理的测序深度能够保证测序 结果的可靠性和全面性。在确定测序深度时,需要考虑研究目标、样本数量和 实验成本等因素。对于线粒体基因组测序而言,一般要求较高的测序深度以保 证突变的检测精度和覆盖率。
三、线粒体基因组测序方法
1、DNA提取
在进行线粒体基因组测序之前,首先需要从样本中提取出高质量的DNA。由于 线粒体DNA含量相对较低,因此需要采用一些特异性引物或试剂盒来富集线粒 体DNA。常用的DNA提取方法包括酚-氯仿抽提法、蛋白酶K消化法等。
几种不同提取线粒体的方法对线粒体含量及活性的影响

几种不同提取线粒体的方法对线粒体含量及活性的影响吴媛;董凌月;安威;安云庆【期刊名称】《首都医科大学学报》【年(卷),期】2010(031)002【摘要】目的比较几种不同的提取线粒体的方法对线粒体蛋白浓度及活性的影响.方法采用蔗糖密度梯度离心法、普利莱试剂盒提取方法和Pierce线粒体提取试剂盒方法分别提取线粒体,测定提取得到的线粒体蛋白浓度、污染情况和活性.结果同样数量的细胞采用普利莱法提取得到的线粒体蛋白浓度高于其他2种方法所提取的线粒体蛋白浓度(P<0.05);采用Western blotting的方法测定提取的线粒体发现采用普利莱法提取得到的线粒体中胞质蛋白污染较其他2种方法提取得到的线粒体少,线粒体纯度高;测定线粒体中细胞色素C和ATP含量后发现同样采用普利莱法提取得到的线粒体活性最高.结论普利莱法提取线粒体的方法优于蔗糖密度梯度离心法和Pierce线粒体提取试剂盒方法.【总页数】4页(P241-244)【作者】吴媛;董凌月;安威;安云庆【作者单位】首都医科大学基础医学院细胞生物学系;肝脏保护与再生调节北京市重点实验室;首都医科大学基础医学院细胞生物学系;肝脏保护与再生调节北京市重点实验室;首都医科大学基础医学院细胞生物学系;肝脏保护与再生调节北京市重点实验室;首都医科大学基础医学院免疫学系【正文语种】中文【中图分类】Q503【相关文献】1.线粒体酶活性及线粒体肿胀与不同运动强度的关系 [J], 徐莉;曹颖;张敏2.提取线粒体DNA方法的比较及较纯线粒体基因获取方法的确立 [J], 李恋;沈晓玲;包丽丽;邢蕊;李文梅;崔建涛;吕有勇3.腺苷预处理对大鼠局灶性脑缺血再灌注后线粒体活性氧含量及线粒体呼吸链复合体Ⅰ、Ⅲ活性和脑组织总抗氧化能力的影响 [J], 赵欣;裴科阳;谭军4.模拟高原缺氧大鼠脑线粒体UCP活性与含量的变化及其对线粒体能量合成的影响 [J], 郜攀;柳君泽;夏琛5.草苁蓉提取物对肝脏癌前病变大鼠肝线粒体超氧化物歧化酶活性及丙二醛含量的影响 [J], 沈明花;朴春梅;全吉淑;柳明洙;尹宗柱因版权原因,仅展示原文概要,查看原文内容请购买。
三种植物线粒体基因低温差异表达比较分析

三种植物线粒体基因低温差异表达比较分析作者:王赛赛李锦祝建波来源:《广西植物》2020年第08期摘要:線粒体作为植物细胞的能量代谢中心,在植物响应逆境胁迫中有重要的作用。
该研究基于雪莲(Saussurea involucrata)、番茄(Lycopersicon esculentum)和拟南芥(Arabidopsis thaliana)三种不同低温耐受性植物的低温转录组。
通过blast比对和数据库检索筛选相关物种的线粒体基因,使用PlantCARE在线网站分析启动子,使用mega7软件对系统发育树构建分析。
结果表明:通过差异表达基因筛选,分别在雪莲、拟南芥、番茄中筛选出2、24、15个显著差异表达基因,主要包括线粒体核糖体亚基和电子传递链各复合体亚基,其中部分基因的低温差异表达情况如NAD1和NAD5,可能与植物的低温适应性有关;通过表达模式的聚类分析,雪莲与拟南芥在基因的表达模式上相对于番茄更为相近,且不同类别的基因表达模式在不同物种间差异较大;雪莲与其他菊科植物的呼吸链相关基因的蛋白序列具有很大差异,与万年藓(Climacium dendroides)、牛舌藓(Anomodon minor)等高山植物的进化距离较近。
在整体上拟南芥、番茄和雪莲三种植物线粒体基因在低温响应上具有很大差异,表明线粒体基因及其表达调控与植物的低温耐受性之间存在一定的关联性。
关键词:低温耐受性,植物,线粒体基因,表达模式中图分类号:Q943文献标识码:A文章编号:1000-3142(2020)08-1140-11Abstract:As the energy metabolism center of plant cells, mitochondria play an important role in plant response to stress. To analyze difference in expression mode of mitochdria gene from the Arabidopsis thaliana, Lycopersicon esculentum and Saussurea involucrata, the differential expression genes (DEGs) was filtered in the three low temperature transcriptomes and comparison analysis was performed on the DEGs from three plants. All the mitochondria genes were filtered through blast against the mitochondria genomes that was downloaded from the NCBI database. Promoter analysis was performed through PlantCARE online website and the mega software was used to phylogenetic tree construction. The results were as follows:In total, there were 2, 24 and 15 DEGs were found in Saussurea involucrata, Arabidopsis thaliana and Lycopersicon esculentum,and these genes were mainly focused on mitochondrial ribosomal and electron transfer chain complex subunits; A few genes were seemed to relate to the cold adaptation that the expression level was positive to the ability of cold tolerance of the three plants, especially for the NAD1 and NAD5 gene; Through cluster analysis of expression patterns, Saussurea involucrata and Arabidopsis thaliana were more similar in genes expression mode than Lycopersicon esculentum, and the expression mode of different genes had a quite difference between different plants; Further analysis on the conserved motif sequence of these genes, the sequences of Saussurea involucrata showed more close relationship with the alpine plants such as Climacium dendroides and Anomodon minor than the other compositae plants. In general, the mitochondrial genes had a quite difference on the sequence of conserved motif and expression mode under the cold condition between the Arabidopsis thaliana,Lycopersicon esculentum and Saussurea involucrata. It was concluded that the mitochondria genes and its expressional regulation could be implicated in the cold adaptation of plants.Key words:low temperature tolerance, plants, mitochondrial gene, expression mode植物线粒体通过氧化磷酸化提供生命活动所需的各种能量,在光呼吸代谢、C4植物的光合作用和景天酸代谢(Picault et al., 2004)等途径中发挥着重要作用。
线粒体基因序列定位

线粒体基因序列定位是指确定线粒体基因组中特定基因或基因区域的位置。
线粒体基因组是一种环状DNA 分子,其中包含了编码线粒体蛋白质所需的基因以及其他调控元素。
要进行线粒体基因序列定位,可以采取以下步骤:
1. 获取线粒体基因组序列:首先需要获取待定位基因的线粒体基因组序列。
这可以通过测序技术获取已知物种的线粒体基因组序列数据库,或者通过实验室内的测序方法获得。
2. 序列比对:将待定位基因的序列与已知线粒体基因组序列进行比对。
这可以使用生物信息学工具,如BLAST(基本局部序列比对工具)或其他序列比对算法来完成。
比对过程会找出两个序列之间的相似性和差异性。
3. 确定基因位置:根据比对结果,可以确定待定位基因在线粒体基因组中的位置。
通常,比对工具会提供一个匹配度高的最佳比对结果,其中包括待定位基因的起始位置和终止位置。
4. 验证和分析:一旦基因位置确定,可以进一步验证和分析该基因的功能、结构和可能的调控元素。
这可以通过进一步
的实验室研究、生物信息学分析和比较基因组学等方法来完成。
需要注意的是,线粒体基因组在不同物种之间有很大的差异,所以定位特定基因可能需要参考该物种的线粒体基因组序列。
此外,使用合适的分析工具和技术是确保准确性和可靠性的关键。
新疆雪莲线粒体基因组组装与分析

新疆雪莲线粒体基因组组装与分析新疆雪莲线粒体基因组组装与分析背景:线粒体是植物细胞中的一种重要细胞器,其主要功能为维持能量代谢、产生细胞内ATP。
线粒体基因组拥有自主复制和转录的能力,与植物的生长发育、环境适应等密切相关。
研究线粒体基因组有助于揭示植物的进化关系和基因功能。
近年来,随着高通量测序技术的快速发展,通过二代测序和第三代测序等技术手段,获取植物的线粒体基因组序列变得更加容易。
然而,对于一些特殊的物种,如新疆雪莲,由于其基因组特征的复杂性和缺乏相关研究的限制,线粒体基因组的组装和分析仍然面临一些挑战。
研究目的:为了揭示新疆雪莲的线粒体基因组结构和进化关系,本研究旨在使用高通量测序技术对新疆雪莲的线粒体基因组进行组装和分析,并对其基因组结构、基因组大小和基因组功能进行研究。
研究方法:1. 样品采集与DNA提取:在新疆雪莲生长期间,采集新鲜的叶片组织样品,并利用常规的DNA提取试剂盒进行DNA提取。
2. 基因组组装:将提取得到的DNA样本经过高通量测序,得到原始测序数据。
使用序列比对软件将原始测序数据与参考基因组进行比对,进行基因组组装。
3. 基因组注释与分析:通过在线的基因组注释平台,对新疆雪莲线粒体基因组的序列进行注释,并进行基因富集分析和功能预测。
研究结果:经过测序和比对,我们成功获取了新疆雪莲的线粒体基因组序列,并完成了基因组的注释和分析。
结果显示,新疆雪莲线粒体基因组大小约为X Mb,具有典型的环状结构。
基因组中包含多个编码线粒体蛋白质的基因、转移RNA基因和核糖体RNA基因等。
进一步的功能分析显示,新疆雪莲线粒体基因组在能量代谢和呼吸过程中起着重要作用。
讨论与展望:本研究利用高通量测序技术成功组装了新疆雪莲的线粒体基因组,并对其基因组进行了初步的注释和功能分析。
这些结果为进一步深入研究新疆雪莲的生长发育、环境适应机制和遗传进化提供了参考。
未来,可以结合线粒体基因组与核基因组的比较分析,进一步揭示新疆雪莲线粒体基因组的动态变化和进化机制。
细胞质内线粒体dna测量方法

细胞质内线粒体dna测量方法
细胞质内线粒体DNA的测量方法主要包括以下步骤:
1. 细胞中线粒体DNA的分离:采用适当的细胞分离技术将线粒体从细胞质中分离出来。
2. DNA扩增:采用聚合酶链式反应(PCR)技术对线粒体DNA进行扩增,以获得足够的DNA进行后续分析。
3. DNA序列分析:对扩增后的线粒体DNA进行序列分析,以确定基因序
列和突变的存在性及其相对频率。
4. 参考序列比对:将测得的线粒体DNA序列与已知的参考序列进行比对,以确定两者之间的差异。
5. 突变位点确定:通过比对结果,确定线粒体基因组中基因序列和突变的存在性及其相对频率,以及位点突变。
通过以上步骤,可以对细胞质内线粒体DNA进行测量和分析,以了解其在生物学和医学研究中的意义和应用。
如何利用生物大数据技术进行线粒体基因组分析

如何利用生物大数据技术进行线粒体基因组分析线粒体基因组是由线粒体内的DNA组成的,它在细胞的能量代谢和调控中起着重要的作用。
随着生物大数据技术的快速发展,我们可以利用这一技术对线粒体基因组进行全面的分析,从而揭示人类进化、疾病发病机制等方面的重要信息。
本文将介绍如何利用生物大数据技术进行线粒体基因组分析。
首先,进行线粒体基因组序列获取。
线粒体基因组测序可以通过对人体组织或生物样本进行DNA提取,然后使用高通量测序技术获取线粒体基因组序列。
随着高通量测序技术的不断发展和降低成本,现在已经可以轻松地获取大量的线粒体基因组序列数据。
除了人类的线粒体基因组,也可以对其他生物的线粒体基因组进行测序。
接下来,对线粒体基因组数据进行质量控制和预处理。
质量控制是用来筛除低质量测序数据的过程,可以通过检查测序数据的碱基质量分数、测序错误率等指标来评估测序数据的质量。
预处理的主要目的是去除污染的序列数据,并将测序数据转化为可用的文件格式。
然后,进行线粒体基因组序列的比对和组装。
比对是将测序数据与参考基因组进行比较,找出相同或相似的片段。
可以使用一些常见的比对工具,如Bowtie、BWA等。
组装是将比对后的片段重新拼接成完整的线粒体基因组序列。
线粒体基因组序列的组装可以使用一些常见的组装工具,如SOAPdenovo、Velvet等。
在得到完整的线粒体基因组序列后,可以进行基因组注释。
基因组注释是将基因组序列与已知的基因、外显子、转录本、调控序列等进行相对应的过程,旨在确定序列中的功能元件和基因区域。
可以使用一些常见的基因组注释工具,如GATK、ANNOVAR等。
进一步,可以进行线粒体基因组变异分析。
线粒体基因组变异可以包括单核苷酸多态性(SNP)、插入/缺失、结构变异等。
通过比对新测序数据与参考基因组的不同,可以检测出这些变异。
可以使用一些专门用于线粒体基因组变异分析的工具,如MitoSeek、MToolBox等。
除了基本的线粒体基因组分析,还可以利用生物大数据技术进行线粒体基因组功能预测和进化分析。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用昆虫学报Chinese Journal of Applied Entomology 2013,50(1):298-304.DOI :10.7679/j.issn.2095-1353.2013.040线粒体基因组数据的分析方法和软件*李雪娟杨婧王俊红任倩俐李霞黄原**(陕西师范大学生命科学学院西安710062)摘要线粒体基因组的研究已经普及,其正确的拼接和注释是所有后续研究的基础。
本文以Staden Package 软件为主介绍了拼接和注释的线粒体基因组的方法,同时介绍了其他常用的拼接软件ContigExpress 、DNAMAN 、DNASTAR、BioEdit 和Sequencher ,以及利用不同软件(包括DOGMA 、MOSAS 、MITOS 、GOBASE 、OGRe 、MitoZoa 、tRNAscan-SE 、ARWEN 、BLAST 和MiTFi 等)对线粒体基因组中的蛋白质编码基因、rRNA 、tRNA 和A +T 富集区进行注释的方法,最后介绍了利用MEGA5软件分析线粒体基因组的组成、Sequin 软件提交序列和线粒体基因组数据绘图工具(CG view 、MTviz 和OGDRAW )。
关键词线粒体基因组,拼接,注释Methods and software tools for mitochondrial genomeassembly and annotationLI Xue-JuanYANG JingWANG Jun-HongREN Qian-LiLI XiaHUANG Yuan **(School of Life Sciences ,Shaanxi Normal University ,Xi ’an 710062,China )Abstract With the increasing popularity of mitochondrial genome studies ,the correct assembly and annotation ofgenomes are the basis of all subsequent research into a species.Here we describe the protocols using Staden Package software to assemble and annotate the mitochondrial genome ,along with other commonly used software ,such as ContigExpress ,DNAMAN ,DNASTAR,BioEdit and Sequencher.In addition ,methods for the use of different software packages (including DOGMA 、MOSAS 、MITOS 、GOBASE 、OGRe 、MitoZoa 、tRNAscan-SE 、ARWEN 、BLAST and MiTFi )to annotate mitochondrial genomic protein-coding genes ,rRNA ,tRNA and the A +T region are briefly introduced.Finally ,application of MEGA5software to analyze the composition of mitochondrial genomes ,Sequin software to submit sequences to GenBank ,and mitochondrial genome data visualization tools (CG view 、MTviz and OGDRAW )are also briefly introduced.Key wordsmitochondrial genome ,assembly ,annotation*资助项目:国家自然科学基金(31172076,30970346)。
**通讯作者,E-mail :yuanh@snnu.edu.cn 收稿日期:2012-12-21,接受日期:2012-12-261引言线粒体基因组数据广泛应用于系统与进化生物学、群体遗传学和保护生物学等许多生物学研究领域。
随着测序技术的快速发展和测序费用的下降,大量的线粒体基因组序列被很快测出,拼接和注释这些线粒体基因组是所有下游系统分析的先决条件。
本文综述了目前可以利用的线粒体基因组拼接、注释、提交和绘图方法和软件。
线粒体基因组分析工具基本上可以分为本地和在线服务器二种,许多软件都是只能完成分析流程中的部分工作。
Staden Package (Bonfield et al.,1995)是可以安装在本地计算机上进行拼接和注释的测序项目管理软件包,主要由Pregap4、Trev 、Gap4和Spin 等模块组成,可以进行序列拼接、突变检测、序列注释和对序列峰图及读序文件进行操作等。
其中,Pregap4是Gap4的前处理,可以处理原始的峰图文件,对序列进行载体和污染检查,同时也可以进行Gap4组装。
经Pregap4处理所得到的结果,可以通过Gap4来进行查看和编1期李雪娟等:线粒体基因组数据的分析方法和软件·299·辑。
组装后的序列以*.seq格式输出用于在Spin 中线粒体序列的注释。
本文主要以该软件为主介绍对线粒体基因组序列进行拼接和注释的方法,同时介绍了线粒体基因组常用的其他拼接软件ContigExpress、DNAMAN、DNASTAR、BioEdit和Sequencher,以及利用不同软件对线粒体基因组中的蛋白质编码基因、rRNA、tRNA和A+T富集区进行注释的方法,最后介绍了序列提交软件Sequin和线粒体基因组数据绘图工具。
2线粒体基因组序列的拼接序列拼接是将测序生成的短读序片段通过重叠部分连接形成较长的片段,这样的较长片段称为叠连群(contig)。
DNA测序数据的固有特点(测序有误差、不完全覆盖性、序列所在链不确定)重复序列的干扰是解决实际序列拼接问题的难点所在。
采用传统Sanger法测定线粒体基因组通常需要至少28对以上的引物的双向测序反应,如果引物重叠区加长的话甚至需要更多对引物,这样双向测序可以获得比较高的覆盖度和准确性。
传统测序的拼接软件主要有ContigExpress、DNAMAN、DNASTAR、BioEdit、Sequencher和Staden Package 等。
新一代测序技术中得到的读序片段长度短、数量巨大、覆盖度高,针对高通量测序开发了大量拼接软件(如SOAPdenovo)等。
测序获得的序列首先进行同源性搜索确定其为线粒体序列,删除测序效果不好的测序文件,准备拼接。
ContigExpress作为Vector NTI的组件之一,是一款非常实用的序列拼接软件。
它将每个测序片段视为一个叠连群,当输入多个叠连群后,软件会自动寻找其中的公共序列,然后以图形方式呈现出拼接结果。
DNASTAR软件包的SeqMan II可进行多序列拼接,最多支持64000条序列的同时拼接,而且在拼接时可以修整质量差的序列并清除污染数据,还提供完善的编辑和输出功能。
Sequencher是序列拼接的行业标准软件,它以快速拼接叠连群、用户友好型的编辑工具以及精湛的技术支持等特点而众所周知。
Staden Package软件拼接的具体流程为:(1)打开Pregap4,将全部测序片断(测序源文件为*.abi格式)加载到Pregap4中。
(2)设置参数,在Configure Modules模块中选择各种参数,修改参数时,只需选择相应的选项,再据提示设置一定的参数,生成批处理文件*.0.aux。
(3)查看,在Gap4中打开文件*.0.aux,文件菜单含数据库打开和拷贝功能及保守序列文件产生的例行程序。
一旦一个数据库被载入Gap4,将以图形方式显示出Contig Selector。
当进行叠连群的比较分析时,Contig Selector自动转变为Contig Comparator,在这个对话框中选择所需的组装片段,依次察看相应叠连群的峰图,对峰图进行编辑。
(4)序列拼接结束后,还要对序列两头进行连接,看是否可以组成一个环状的DNA序列。
全线粒体基因组序列拼接时,序列会在覆盖度最小的位置断开,因此拼接时输出的一致性序列的第1个碱基不是全线粒体基因组序列的第1个碱基。
因为完整的线粒体基因组是一个环形结构,而断裂处的两条片断在连接时有一部分是重叠的,所以在输出的一致性全序列中,最前面和最后面一定数量的碱基是重复的,需要删除。
注释线粒体基因组时确定起始碱基的过程称为调零,昆虫线粒体基因组以tRNA-Ile的第一个碱基设置为1,在此位置之前的序列需要拼接在3'末端。
序列拼接完成后,要将输出的一致性序列输入到ClustalX 等软件中计算序列长度,并记录下来。
(5)修改拼接版本。
通常情况下拼接不是一次就能够完成的,在以后的序列注释过程中会发现一些错误,需要返回来仔细查看测序峰图,修改读序,或补充测序,重新拼接,产生一个新的拼接版本,直至所有注释顺利完成,才可以确定最终的拼接结果。
3线粒体基因组序列的注释线粒体基因组注释是确定已知的在绝大多数动物中存在的13个蛋白质编码基因、22个tRNA 基因、2个rRNA基因和1个D-loop区的位置和序列,在有些物种中也存在个别tRNA基因和D-loop 区的重复。
线粒体基因组注释的标准源是NCBI 的参考序列数据库(RefSeq),该数据库中基因组序列和注释结果是经过专家核对过的,可以为各种动物线粒体基因组的注释提供了很好的参考。
注释方法是通过与其近缘物种的线粒体基因组比较和分析来定位蛋白编码基因、tRNA基因、rRNA·300·应用昆虫学报Chinese Journal of Applied Entomology50卷基因和D-loop区。
进行注释时需要建一个序列注释记录文件,记录每一次翻译过程(包括序列起始位置、碱基长度、蛋白质序列的起始密码子、tRNA 的反密码子以及其起始位置、基因位于N或J 链),以便后续的提交序列、核对及查找。
线粒体基因组注释的工具很多,包括在线注释的网络服务器和本地计算机安装的注释软件。
DOGMA(http://dogma.ccbb.utexas.edu/)、MOSAS(http://mosas.byu.edu)和MITOS(http:// mitos.bioinf.uni-leipzig.de/)是近年来开发的3个线粒体基因组注释网络服务器。