可变剪接分析分析
利用转录组测序数据分析可变剪接的方法

利用转录组测序数据分析可变剪接的方法作者:***来源:《科学与信息化》2020年第08期摘要可变剪接是调节基因表达和产生蛋白组多样性的重要因素,同时参与调控细胞分裂、分化及凋亡等重要生物学过程,异常的可变剪接多与人类疾病有关。
随着新一代测序技术和生物信息学的快速发展,以及先进计算方法的提出,使得我们对可变剪接有了深入的认识。
并且基于剪接机制对于病的靶向药物设计,已得到了有效的临床治疗效果。
本文主要阐述了近年来基于二代测序技术开发的几种识别可变剪接的计算方法,并对未来的发展方向进行展望。
关键词可变剪接;二代测序技术;生物信息学;分析工具可变剪接,又称选择性剪接(Alternative Splicing,AS),是真核生物基因表达的普遍调节机制,是指一个前体mRNA经过不同的剪接形式产生多种不同剪接异构体的过程。
在1978年,Walter Gilbert提出了内含子和外显子命名[1],不同外显子组合产生特异的异构体。
二代测序技术的迅速发展极大地推动了人类对可变剪接的认识。
现有数据表明,人类大约有92%-94%的基因都会经历某种程度的可变剪接行为,并且在20000多种人类蛋白编码基因中,约37%的基因会编码产生不同的蛋白亚型,这表明可变剪接增加了蛋白质组的多样性和复杂性[2]。
AS对基因的功能起着重要调控作用,同一基因的不同亚型可能参与不同的生物学过程。
例如p53抑癌基因(TP53)在DNA受损细胞的调控中起着核心作用,然而其Δ133β亚型则可以抑制全长p53β亚型5和6从而诱导肿瘤细胞的凋亡[3]。
另外AS几乎参与了所有生物学过程,包括调节细胞的分裂和凋亡、神经系统的发育以及细胞对抗多种环境因素做出的免疫应激反应等[4]。
另一方面,AS的异常调节还与多种遗传性疾病和恶性肿瘤相关,包括神经退行性疾病、心血管疾病和代谢状况等。
据报道,与SNP相关的遗传性疾病多达一半是由于剪接受损引起的[5]。
AS的异常调节对癌症的发生发展有重要的作用,为疾病的发展提供了可能的新颖治疗靶标和生物标志物的来源,而AS位点的预测可以为药物设计提供很好的分子基础。
可变剪接分析综述

可变剪接的分析主要包括剪接体序列的 校正,剪接体之间的比较,以及剪接机 制的探索。
剪接体序列的校正
克隆试验得到的mRNA 往往不是全长, 测序反应也不能保证100%的正确,所以 拿到一条序列首先要对其进行校正,尽 可能保证使全长序列且无错误。 校正可以通过剪接体序列与EST数据及 基因组的比对进行。
Details 结果
图中显示有四个block, 即提交序列可以分为四个区段 与染色体上四个区域对应,即有四个外显子。蓝色区 域为完全匹配,浅蓝色为比对区域的边缘序列,可以 理解为外显子边界
Details 结果
点击每个block 可以看到对应的外显子序列, block之间可以认为是内含子序列,可以观察是否 符合GT-AG 或是GC-AG模式
可变剪接示意图
可变剪接是生物多样性的重要成因
高等生物与低等生物的基因数量并没有特别显著 的差别,如人的基因估计约30000-40000,小鼠 的基因也为30000左右,而且人鼠基因有很多存 在有很高的相似性。果蝇、线虫等基因约为 15000,基因数量的差别不足以解释以上物种间 存在的显著差异。
可变剪接与蛋白质组
Spliced EST
Total ESTs
EST 数据选择
整条序列在染色体上以单外显子形式出 现很可能是染色体污染。一般优先看已 剪接EST数据对基因的支持情况,如数 量不足再看包含未剪接EST的所有EST 集合
改变查看区域
在browser 里可以任意移动查看,改变位 置的方法有两种,一是直接输入定位数字, 二是通过窗口下方的方向箭头移动。
SR蛋白主要与外显子剪接增强元件ESE结合, 通过直接招募剪接体蛋白或是拮抗剪接抑制因 子的作用来发挥作用。 SR蛋白主要对5’位点的选择起作用: 通过招募剪接体蛋白如U2AF或是U1-70K,在 pre-mRNA的两个或多个5’可变剪接位点中促 进选择使用距内含子3’端较近的5’位点。
《肺腺癌特异性可变剪接事件的识别与分析》范文

《肺腺癌特异性可变剪接事件的识别与分析》篇一一、引言肺腺癌是一种常见的肺癌类型,其发病率和死亡率在全球范围内持续上升。
由于肺腺癌的复杂性和异质性,研究其发生发展的分子机制对治疗和预防具有重要意义。
随着新一代测序技术的发展,可变剪接事件在肺腺癌中的研究逐渐成为热点。
本文旨在探讨肺腺癌特异性可变剪接事件的识别与分析,以期为肺腺癌的诊疗提供新的思路和方法。
二、可变剪接事件概述可变剪接是指在基因转录过程中,由于内含子的保留或外显子的选择性拼接,导致同一基因产生多种不同的剪接产物。
这些剪接产物在蛋白质编码、转录调控等方面具有重要作用。
在肺腺癌中,可变剪接事件的发生与肿瘤的发生、发展和转移密切相关。
因此,研究肺腺癌中的可变剪接事件,有助于揭示肺腺癌的发病机制,为临床诊断和治疗提供新的靶点。
三、肺腺癌特异性可变剪接事件的识别为了识别肺腺癌特异性可变剪接事件,本研究采用RNA-Seq 等高通量测序技术,对肺腺癌组织及正常肺组织进行测序分析。
通过比对分析,我们发现肺腺癌组织中存在大量可变剪接事件。
其中,部分事件在肺腺癌中具有特异性,可能与肺腺癌的发生、发展密切相关。
我们通过生物信息学分析方法,对识别到的可变剪接事件进行分类和筛选。
首先,根据剪接事件的类型(如外显子跳跃、内含子保留等),将其分为不同类别。
然后,结合文献报道和数据库信息,对筛选出的特异性剪接事件进行功能注释和预测。
最后,通过实时荧光定量PCR和Western blot等技术,验证了部分剪接事件的表达情况。
四、肺腺癌特异性可变剪接事件的分析通过对识别到的肺腺癌特异性可变剪接事件进行分析,我们发现这些事件主要涉及肿瘤相关基因、信号通路和转录调控等方面。
其中,部分剪接事件可能导致蛋白质编码序列的改变,从而影响蛋白质的功能和结构。
此外,我们还发现这些剪接事件在肺腺癌的不同阶段和亚型中存在差异,提示其在肺腺癌发生、发展中的作用可能具有阶段性和亚型特异性。
五、结论本研究通过高通量测序技术和生物信息学分析方法,成功识别了肺腺癌特异性可变剪接事件。
利用转录组测序数据分析可变剪接的方法

利用转录组测序数据分析可变剪接的方法可变剪接(alternative splicing)是指在基因转录过程中,由于RNA的剪接方式的改变,导致最终产生的mRNA分子中不同的外显子结合模式,从而编码不同的蛋白质。
可变剪接是真核生物基因表达的重要调控机制之一,能够增加基因的功能复杂性和多样性。
然而,异常的可变剪接事件与多种疾病的发生和发展密切相关,因此对可变剪接事件进行准确的鉴定和分析对于揭示其生物学功能和研究疾病机制具有重要意义。
近年来,随着高通量测序技术的快速发展,转录组测序数据已成为可变剪接分析的重要数据源。
下面将介绍基于转录组测序数据分析可变剪接事件的方法。
首先,可变剪接事件的鉴定是可变剪接分析的基础。
对于每个基因,可变剪接事件主要包括外显子跳跃(exon skipping)、选择性包含(inclusion)、选择性起始/终止位点(alternative start/stop site)等。
通过比对RNA-seq数据到基因组参考序列,可以识别出转录组中的外显子覆盖情况,并进一步分析不同外显子组合的比例,从而鉴定可变剪接事件。
其次,可变剪接事件的定量分析是研究其生物学功能的关键。
对于定量分析,可以使用RPKM(reads per kilobase of exon model permillion mapped reads)或FPKM(fragments per kilobase of exon model per million mapped fragments)等方法计算各个外显子或外显子组合的表达量。
通过比较不同样本或不同组织中可变剪接事件的表达差异,可以筛选出与特定生物过程或疾病相关的事件。
然而,由于RNA-seq数据的获取和分析过程存在一定的偏差和误差,因此需要对可变剪接事件进行验证和筛选。
传统的PCR和RT-PCR技术可以用于验证一些特定可变剪接事件的存在和表达水平,而新兴的第三代测序技术,如PacBio和Oxford Nanopore,能够提供更长的读长和更准确的测序结果,有助于验证和鉴定具有低表达量或短外显子的可变剪接事件。
《肺腺癌特异性可变剪接事件的识别与分析》范文

《肺腺癌特异性可变剪接事件的识别与分析》篇一一、引言肺腺癌是一种常见的肺癌类型,其发病率和死亡率均居高不下。
近年来,随着基因组学和生物信息学技术的快速发展,对于肺腺癌的研究已经从传统的组织病理学研究逐渐转向了分子层面。
在肺腺癌的研究中,基因的异常表达和剪接变异成为了一个重要的研究方向。
其中,可变剪接事件是导致基因表达多样性的重要原因之一。
因此,对肺腺癌特异性可变剪接事件的识别与分析,对于深入了解肺腺癌的发病机制、诊断和治疗具有重要意义。
二、材料与方法(一)材料本研究选取了肺腺癌组织样本及正常肺组织样本,通过高通量测序技术获取了样本的基因表达数据。
(二)方法1. 数据预处理:对基因表达数据进行质量控制和标准化处理。
2. 可变剪接事件识别:利用生物信息学分析工具,对标准化处理后的数据进行可变剪接事件的识别。
3. 事件分类与筛选:根据可变剪接事件的类型和表达水平,进行事件分类与筛选,确定肺腺癌特异性可变剪接事件。
4. 统计分析:对筛选出的肺腺癌特异性可变剪接事件进行统计分析,分析其在肺腺癌发生、发展中的作用。
三、结果(一)可变剪接事件识别结果通过生物信息学分析,我们成功识别了大量可变剪接事件。
这些事件包括外显子跳跃、内含子保留、选择性5'剪接位点和选择性3'剪接位点等类型。
(二)肺腺癌特异性可变剪接事件筛选结果在所有识别出的可变剪接事件中,我们筛选出了一批在肺腺癌组织中特异性表达的剪接事件。
这些事件主要涉及一些与肺癌发生、发展相关的基因,如TP53、KRAS、EGFR等。
(三)统计分析结果通过对筛选出的肺腺癌特异性可变剪接事件进行统计分析,我们发现这些事件在肺腺癌组织中的表达水平与正常肺组织相比存在显著差异。
进一步分析表明,这些事件在肺腺癌的发生、发展过程中可能起着重要的调控作用。
四、讨论本研究通过高通量测序技术和生物信息学分析,成功识别了肺腺癌特异性可变剪接事件。
这些事件主要涉及一些与肺癌发生、发展相关的基因,表明可变剪接在肺腺癌的发病机制中起着重要作用。
《肺腺癌特异性可变剪接事件的识别与分析》范文

《肺腺癌特异性可变剪接事件的识别与分析》篇一一、引言肺腺癌是肺癌的主要亚型之一,具有高度异质性和复杂的遗传背景。
近年来,随着基因组学和生物信息学技术的不断发展,可变剪接事件在肺腺癌发生发展中的作用逐渐受到关注。
可变剪接是一种重要的转录后修饰过程,能够产生多种剪接异构体,从而影响基因的表达和功能。
因此,识别和分析肺腺癌特异性可变剪接事件对于深入了解肺腺癌的发病机制、诊断和治疗具有重要意义。
本文旨在通过生物信息学方法,对肺腺癌特异性可变剪接事件进行识别和分析,以期为肺腺癌的研究提供新的思路和方法。
二、材料与方法1. 数据来源本研究使用的肺腺癌基因表达数据和可变剪接事件数据来自公共数据库(如TCGA、GEO等)。
2. 生物信息学分析方法(1)基因表达谱分析:利用R语言和相关生物信息学软件,对肺腺癌基因表达数据进行预处理、标准化和差异表达分析,筛选出与肺腺癌相关的基因。
(2)可变剪接事件识别:采用已知的可变剪接事件数据库和新一代测序技术,对肺腺癌样本进行可变剪接事件的检测和识别。
(3)特异性可变剪接事件分析:结合基因表达谱分析和可变剪接事件识别结果,筛选出肺腺癌特异性可变剪接事件,并进行功能注释和通路分析。
(4)验证实验:通过RT-PCR、Western blot等实验方法,对部分关键可变剪接事件进行验证。
三、结果1. 基因表达谱分析结果通过对肺腺癌基因表达数据进行差异表达分析,我们筛选出了一批与肺腺癌相关的基因。
这些基因在肺腺癌组织中的表达水平与正常组织相比存在显著差异,可能参与了肺腺癌的发生发展过程。
2. 可变剪接事件识别结果通过新一代测序技术和已知的可变剪接事件数据库,我们检测和识别了大量的可变剪接事件。
这些事件涉及到的基因涵盖了多种生物学功能,包括细胞增殖、凋亡、侵袭和转移等。
3. 肺腺癌特异性可变剪接事件分析结果结合基因表达谱分析和可变剪接事件识别结果,我们筛选出了一批肺腺癌特异性可变剪接事件。
外显子可变剪接的控制和功能分析

外显子可变剪接的控制和功能分析外显子可变剪接是一种重要的生物学过程,它决定了基因表达的多样性和可变性。
在这种过程中,原本精准的RNA翻译变得更加复杂,因为同一基因可以通过剪接产生多个不同的转录本。
这些转录本具有不同的外显子组成,从而导致不同的蛋白质编码序列。
因此,外显子可变剪接对细胞功能和生理过程具有重要的影响。
控制外显子可变剪接的机制有许多,包括转录因子的结合、RNA切割复合物的招募和RNA结构阻碍。
其中,核糖核酸处理酶(hnRNP)是一种重要的RNA结构阻碍因子,它被认为是外显子可变剪接的主要调节器之一。
hnRNPs可以通过与RNA的不同部位结合来影响RNA的结构和可变剪接,因此具有重要的生物学功能。
hnRNPs具有相互竞争的关系,其中一些可以促进外显子含量的缩减,而其他一些则可以促进外显子含量的增加。
因此,不同组分的竞争,以及它们与其他RNA和蛋白质相互作用所形成的网络结构,是外显子可变剪接的主要调节机制之一。
在外显子可变剪接中,不同外显子的含量和组合对生物学过程具有不同的影响。
例如,一些转录本的细胞内稳定性可能较低,因而难以在细胞内累积。
其他转录本可能具有特定的功能域或修饰位点,因此对蛋白质功能具有重要的影响。
外显子可变剪接对以下生理过程具有重要的影响:免疫反应、细胞周期、细胞分化和发育、神经元功能和癌症等。
在免疫反应中,外显子可变剪接可以产生多种不同类型的T细胞和B细胞,每种类型都具有特定的功能和抗原识别特性。
在细胞周期中,外显子可变剪接可以影响几个关键的增殖和凋亡信号通路。
在细胞分化和发育中,外显子可变剪接可以促进细胞类型分化和组织发育。
在神经元功能中,外显子可变剪接可以调节神经元的活动和突触可塑性。
在癌症中,外显子可变剪接可以导致癌症细胞的增殖、转移和治疗抵抗。
总之,外显子可变剪接是一个复杂的生物学过程,它由多个调节因子和优选反应机制所控制。
深入了解这一过程的机理和功能,有助于识别新的调节因子和产生新的治疗方法,从而对广泛的生物学过程产生重要影响。
可变剪接的生物信息数据分析综述

可变剪接的生物信息数据分析综述章天骄【摘要】前体mRNA的可变剪接是扩大真核生物蛋白质组多样性的重要基因调控机制.可变剪接的错误调节可以引起多种人类疾病.由于高通量技术的发展,生物信息学成为可变剪接研究的主要手段.本文总结了可变剪接在生物信息学领域的研究方法,同时也分析并预测了可变剪接的发展方向.%Alternative pre - mRNA splicing is an important gene regulation mechanism for expanding proteomic diversity in higher eukaryotes. The misregulation of alternative splicing underlies many human diseases. With the development of high - throughput technology, bioinformatics becomes to the main method in study of alternative splicing. This article summarizes the bioinformatics methods in alternative splicing research, as well as analyzes and predicts the direction of alternative splicing.【期刊名称】《生物信息学》【年(卷),期】2012(010)001【总页数】4页(P61-64)【关键词】可变剪接;高通量技术;生物信息学【作者】章天骄【作者单位】哈尔滨工业大学计算机科学与技术学院,哈尔滨150001【正文语种】中文【中图分类】Q811可变剪接是指一个前体mRNA通过不同的剪接方式(选择不同的剪接位点组合)产生不同mRNA剪接异构体的过程。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
查看EST支持
Genome Browser 提供的一个重要资源 是EST在染色体上的定位信息,其基本 做法是把EST数据与基因组作比对后, 按照最好的匹配结果将EST唯一的定位 到基因组上。 通过EST可以对不同剪接体提供佐证
Genome browser 中的EST 数据
分为两个集合:
–已剪接EST集合(human ests that have been spliced) –包括未剪接EST的所有EST集合(human ests including unspliced) 后者包括前者。已剪接EST集合是与基因组比对后可 以被分成多个外显子结构,且外显子之间的序列符合 内含子剪接位点模式(GT-AG模式)的EST。全部 EST集合则不考虑是否含有剪接位点,其中可能有染 色体污染和一些未经剪接的EST数据。
FirstEF 结果
promoter 区为预测的启动子区域,exon 为预测的第一个 exon 区 域 , 点 击 可 查 看 具 体 位 置 信 息 。 该 程 序 预 测 66376104-66376673 为启动子区域,第一外显子区域为 66376604-66376834 或是 66376604-66377167 。第一组序 列的起始位置为66,376,615 , 第二组序列的起始位置为 66,376,969 。已有实验证明第一组序列的启动子可能在 其上游约 1.5Kb 处,故此处的启动子可能为第二组序列 的启动子。
使用Genome Browser 获得序列
出现的页面框中为要获得序列的位置,可以改变 范围或是包括任意长上游或下游序列,比如要分 析启动子序列,可以选取基因起始点上游1K的序 列。 (如果序列与基因组序列互补,应向后取)
2.2 可变剪接成因分析
从 Genome browser 中可以看到,上例 中不同剪接体的形成的主要原因可能是 采用了不同的启动子或是出现了外显子 的跳过现象。这就促使我们考虑采用不 同的手段预测可能导致这些剪接出现的 原因。
改变查看区域
查看其它性质
有些注释信息默认不显示,用户可以在 browser下方选择显示。比如查看spliced EST
使用Genome Browser 获得序列
使用genome browser除了可以浏览基因的相关信息外, 还可以很方便的获取想得到的基因组序列。方法是通过 browser 上方的DNA 连结。
SR蛋白主要与外显子剪接增强元件ESE结合, 通过直接招募剪接体蛋白或是拮抗剪接抑制因 子的作用来发挥作用。 SR蛋白主要对5’位点的选择起作用: 通过招募剪接体蛋白如U2AF或是U1-70K,在 pre-mRNA的两个或多个5’可变剪接位点中促 进选择使用距内含子3’端较近的5’位点。
其它反式作用蛋白
Genome Browser 中的结果
基因图中每个方块对应一个外显子,方块之间带有 箭头的连线对应基因组上的内含子序列。箭头的方 向代表序列转录的方向(5’-3’)。
Genome Browser 中的结果
基因跨度约12.7k。在该区域中有23个已知基因 (根据SWISS-PROT, TREMBL, Refseq数据库中 的注释),在本例中这23个基因都对应着一个基 因(cklfsf1)23个不同的剪接形式。
(1) 寻找潜在的启动子
Cold Spring Harbor的Michael Zhang 小组开发 的FirstEF程序针对第一外显子和启动子的预测, 其准确度在同类软件中较高,因此选用该程序对 我们序列进行预测。实际上在genome browser 中也包括firstexon 预测结果。 该软件网址/tools/FirstEF/
由于采用不同的外显子,导致编码蛋白 质的不同,有时会出现蛋白提前终止, 起到分子开关的作用。
1.3 可变剪接的调控
可变剪接的调控机制目前还不清楚。但 越来越多的研究表明,可变剪接的调控 是通过基因序列上的顺式作用元件和核 内反式作控
主要的顺式作用元件有:
– ESE: exon splicing enhancer 外显子剪接增强子 – ISE: intron splicing enhancer 内含子剪接增强子 – ESS: exon splicing silencer 外显子剪接沉默子 – ISS: intron splicing silencer 内含子剪接沉默子
FirstEF 预测
Genome Browser 简介
Genome Browser 可以理解为一个基因组的浏 览器,选择一定区域后,则会显示在该区域内 的一系列性质,如图谱信息(STS,FISH clone, chromosome band),定位在该区域的已知基因 情况以及通过基因预测软件预测的基因情况, 与该段基因组匹配的mRNA 与 EST信息,人 与其它物种如小鼠,大鼠,黑猩猩基因组的比 对情况等等,都直观的显示在一张图上。
反式作用因子
SR 蛋白
因富含serine/arginine 得名,该蛋白通常含有一至两
个RNA 识别模体(RRM,RNA Recognition Motif), 羧基端有RS结构域(RS 二肽富集区)。
RRM负责介导RNA结合,决定各SR蛋白的底物特异性。
RS结构域主要参与蛋白-蛋白相互作用。
SR 蛋白
内含子剪接信号
分支点(branch site)通常位于3‘剪接点 上游50bp,处于一段富含嘧啶的区域,分 支点腺嘌呤附近区域为YNYURAY 。
剪接识别信号
剪接体
剪接由剪接体(spliceosome)催化完成。剪 接体主要由几个核糖蛋白亚基组成,每个亚基 都由RNA链和蛋白组成。另外还有几十个小多 肽参与构成剪接体。 剪接体分主要剪接体(major spliceosome) 和次要剪接体(minor spliceosome)。前者主 要针对剪接信号为GU-AG模式的内含子,包括 U1,U2,U4,U5,U6等亚基,后者主要对应ATAC模式,由另外一组亚基组成 。
剪接过程,U1结合donor site, U2结合 branch site, U4,U5,U6连结U1,U2
1.2 可变剪接的主要模式
可变剪接主要有四种模式:
– 内含子不切割 – 5’或3’切点竞争 – 外显子跳过 – 外显子互斥
可变剪接的主要模式
内含子不剪切
切点竞争
外显子跳过
外显子互斥
可变剪接的结果
其它如hnRNP蛋白,多聚嘧啶序列结合蛋白(PTB), CELF蛋白家族等等也有各自不同的调节作用。
ESE 与SR 蛋白的作用模式可能是可变剪接调控中最 普遍的调控形式。已有实验表明由于外显子中剪接增 强子序列的突变不能与SR蛋白结合可以导致外显子的
跳过(exon skipping)。
二、可变剪接的分析
Genome Browser 中的结果
该组剪接体总体分为两组,第一组包括上方20条序列, 起始位点相同。第二组包括最后三条序列,其起始位 点在第一组序列中的内含子区域。两组序列共有7个外 显子区域。
Genome Browser 中的结果
从图上看造成不同剪接体的原因有三种: •转录起始位点不同。第二组序列起始点位于第一 组序列内含子区域,可能表明该附近区域可能有 启动子活性。 •外显子的跳越现象。3,4,5,6外显子均存在被 切除的现象。 •剪接位点的偏移。在同一外显子区域,外显子的 大小不同(对应方块的大小不同),可能是由于 内含子内存在多个相邻的剪接信号,导致不同的 剪接结果。
可变剪接分析
yup@
主要内容
可变剪接介绍 使用UCSC Genome browser分析 可变剪接成因分析 其它分析工具及数据库 基因表达谱
一、可变剪接介绍
可变剪接 (alternative splicing) 即一个 mRNA 前体通过不同的内含子去除方式可 以获得不同成熟mRNA 。
Genome Browser 使用
Genome Browser提供一个与基因组比对 的程序blat, 用户可以提交序列用blat进行 基因组定位。
Blat 提交界面
可以从下拉菜单中选择不同基因组
Blat 结果
可以看到QUERY AY174119为用户提交序列,比 对得分为742, 提交序列全长774,其中4-755的序 列可以匹配在16号染色体正链区域(6637661566389357),有99.6%的匹配序列与提交序列完 全相同。“details”为比对的文本显示, “browser”为在Genome Browser中查看结果
Details 结果
图中显示有四个block, 即提交序列可以分为四个区段 与染色体上四个区域对应,即有四个外显子。蓝色区 域为完全匹配,浅蓝色为比对区域的边缘序列,可以 理解为外显子边界
Details 结果
点击每个block 可以看到对应的外显子序列, block之间可以认为是内含子序列,可以观察是否 符合GT-AG 或是GC-AG模式
1.1 可变剪接背景知识
内含子剪接信号
内含子剪接需要区分外显子及内含子,识别信 号主要包括 内含子5‘ 及 3’ 末端序列及中间 分支点(branch site)附近的序列。
内含子剪接信号
内含子5‘ 剪接点称为供体点(donor site), 3’剪接点称为受体点(acceptor site)。 内含子开始和末尾的两对碱基最为保守,大多 数情况为 GU-AG (约占99.24%),少数为GCAG(约占0.7%), 极少数为AT-AC(0.05%)。除 了这两对保守碱基外,他们附近的碱基在不同 物种间存在差异,但在物种内有保守性。如如 脊椎动物5’剪接信号AG|GUAAGU 。
剪接体序列的校正
与EST及基因组的比对可以到NCBI使用 BLAST进行,根据多数原则进行修正。 但这样做每次只能查看一条序列,没有 一个总体的概念。因此我们推荐使用加 州大学圣克鲁兹分校提供的Genome Browser 进行。