生物信息学札记(第4版)
生物信息学通论

/bioinplant/《生物信息学札记》樊龙江第一章 生物信息学通论我们处在一个激动人心的时代——基因组时代。
科学的进步已使人类可以窥探生 命的秘密,甚至包括人类自身。
人类基因组在世纪之交被人类自己破译了。
这部由 30 亿个字符组成的人类遗传密码本已活生生地摆在了我们面前。
于此同时,来自其它生 物的基因组信息源源不断从自动测序仪中涌出,堆集如山,浩如烟海。
这些海量的生 物信息是用特殊的“遗传语言”——DNA 的四个碱基字符(A、T、G 和 C)和蛋白质的 20 个氨基酸字符(A、R、N、D、C、Q、E、G、H、I、L、K、M、F、P、S、T、W、Y 和 V)— —写成。
《科学》 Science)在 2001 年 2 月 16 日人类基因组专刊上配发了一篇题为“生 ( 物信息学:努力在数据的海洋里畅游”(Roos DS.Bioinformatics—Trying to swin in a sea of data.Science,2001,291:1260-1261)的文章。
文章写道: “我们身处急 速上涨的数据海洋中…,我们如何避免生物信息的没顶之灾呢?”一叶轻舟也许可以 救命!生物信息学便是我们找到的这样一条“轻舟” ,而且我们已在这条轻舟上安装了 诸如卫星定位系统等先进的电子设备。
也许在不久的将来,人类会造就一艘永不沉没 的航空母艇……生物信息学是一门年青的学科,学科虽然年青,但它充满挑战、机遇 且引人入胜。
第一节一、迅速膨胀的生物信息生物信息与生物信息学近 20 年来,分子生物学发展的一个显著特点是生物信息的剧烈膨胀,且迅速形成 了巨量的生物信息库。
这里所指的生物信息包括多种数据类型,如分子序列(核酸和蛋 白质),蛋白质二级结构和三维结构数据、蛋白质疏水性数据等等。
由实验获得的大量 核酸序列和三维结构数据被存在数据库中,这些数据库就是所谓的初级数据库 (primary databases);那些由原始数据分析而来的诸如二级结构、疏水位点和功能区 (domain)数据,则组成了所谓的二级数据库(secondary databases)。
生物信息学札记(第4版)

生物信息学札记(第4版)樊龙江浙江大学作物科学研究所浙江大学生物信息学研究所浙江大学IBM生物计算实验室2017年9月本材料已由浙江大学出版社出版:《生物信息学》,樊龙江主编,2017部分内容可通过下列网址获得:/bioinplant/札记前言第一版这份材料是我学习和讲授《生物信息学》课程时的备课笔记,材料大多是根据当时收集的一些外文资料翻译编辑而成。
学生在学习过程中经常要求我给他们提供一些中文的讲义或材料,这促使我把我的这份笔记整理并放到网上,供大家参考。
要提醒使用者的是,这份材料仅是根据我对生物信息学的一些浮浅的认识整理而成,其中的错误和偏颇只能请读者自鉴了。
2001年6月第二版自1999年开始接触生物信息学以来,一晃已近六年,而本札记也近四岁了。
2001和2002年中国科学院理论物理所的郝柏林院士在浙江大学首次开设生物信息学研究生课程,我作为他的助教系统地学习了生物信息学;同时,借着我国水稻基因组测序计划的机遇,在他的带领下从2001年开始从事水稻基因组分析,从此自己便完全投入到这一崭新、引人入胜的领域中来。
不断有来信向我索要本札记的电子版文件,同时在不少网站上看到推荐该札记的内容。
生物信息学、基因组学等发展很快,现在再回头审看该札记,有些部分已惨不忍读,这促使我下决心更新它。
但因时间和学识问题,还是有不少部分自己不甚满意,就只有待日后再努力了。
欢迎告诉我札记中的BUG,我的信箱*************.cn或******************.cn。
2005年3月30日第三版近年来高通量测序技术产生的序列数据大量出现(如小RNA和大规模群体SNP数据),本次更新根据这一进展增加了两章内容,分别是第七章有关小RNA的分析和第八章遗传多态性及正向选择检测。
两章内容由我的博士生王煜为主编写,李泽峰和刘云参与了文献整理。
另外还更新了第四章有关水稻基因组分析一节。
2010年1月第四版2014年浙江大学开展本科生教材建设工作,我当时作为系主任要带头,就承诺编写我主讲的《生物信息学》教材。
蛋白质的功能域、结构及其药物设计----6

第六章 蛋白质的功能域、结构及其药物设计随着人类基因组全序列测定的完成,预示着基因组研究从结构基因组(Structural Genomics)进入了功能基因组(Functional Genomics)研究时代。
研究基因组功能当然首先要研究基因表达的模式。
当前研究这一问题可以基于核酸技术,也可以基于蛋白质技术,即直接研究基因的表达产物。
测定一个有机体的基因组所表达的全部蛋白质的设想是由Williams于1994年正式提出的,而“蛋白质组”(proteome)一词是Wilkins于1995年首次提出。
蛋白质组是指由一个细胞或组织的基因组所表达的全部相应的蛋白质。
蛋白质组与基因组相对应,均是一个整体概念,但是两者又有根本的不同:一个有机体只有一个确定的基因组,组成该有机体的所有不同细胞都共享有一个基因组;但是,基因组内各个基因表达的条件、时间和部位等不同,因而它们的表达产物(蛋白质)也随条件、时间和部位的不同而有所不同。
因此,蛋白质组又是一个动态的概念。
由于以上原因,再加上由于基因剪接,蛋白质翻译后修饰和蛋白质剪接,基因遗传信息的表达规律更趋复杂,不再是经典的一个基因一个蛋白的对应关系,而是一个基因可以表达的蛋白质数目大于一。
由此可见,蛋白质组研究是一项复杂而艰巨的任务。
蛋白质结构与功能的研究已有相当长的历史,由于其复杂性,对其结构与功能的预测不论是方法论还是基础理论方面均较复杂。
统计学方法曾被成功地应用于蛋白质二级结构预测中,如Chou和Fasman提出的经验参数法便是最突出的例子。
该方法统计分析了各种氨基酸的二级结构分布特征,得出相应参数(Pа,Pβ和Pt)并用于预测。
本章将简要介绍蛋白质结构与功能预测的生物信息学途径。
第一节 蛋白质功能预测一、根据序列预测功能的一般过程如果序列重叠群(contig)包含有蛋白质编码区,则接下来的分析任务是确定表达产物——蛋白质的功能。
蛋白质的许多特性可直接从序列上分析获得,如疏水性,它可以用于预测序列是否跨膜螺旋(transmenbrane helix)或是前导序列(leader sequence)。
朱玉贤《现代分子生物学》(第4版)笔记和课后习题(含考研真题)详解

目录第1章绪论 (4)1.1复习笔记 (4)1.2课后习题详解 (5)1.3名校考研真题详解 (7)第2章染色体与DNA (10)2.1复习笔记 (10)2.2课后习题详解 (17)2.3名校考研真题详解 (22)第3章生物信息的传递(上)——从DNA到RNA (36)3.1复习笔记 (36)3.2课后习题详解 (44)3.3名校考研真题详解 (49)第4章生物信息的传递(下)——从mRNA到蛋白质 (62)4.1复习笔记 (62)4.2课后习题详解 (71)4.3名校考研真题详解 (78)第5章分子生物学研究法(上)——DNA、RNA及蛋白质操作技术 (90)5.1复习笔记 (90)5.2课后习题详解 (96)5.3名校考研真题详解 (101)第6章分子生物学研究法(下)——基因功能研究技术 (114)6.1复习笔记 (114)6.2课后习题详解 (120)6.3名校考研真题详解 (124)第7章原核基因表达调控 (132)7.1复习笔记 (132)7.2课后习题详解 (138)7.3名校考研真题详解 (140)第8章真核基因表达调控 (147)8.1复习笔记 (147)8.2课后习题详解 (154)8.3名校考研真题详解 (158)第9章疾病与人类健康 (168)9.1复习笔记 (168)9.2课后习题详解 (174)9.3名校考研真题详解 (177)第10章基因与发育 (182)10.1复习笔记 (182)10.2课后习题详解 (183)10.3名校考研真题详解 (185)第11章基因组与比较基因组学 (186)11.1复习笔记 (186)11.2课后习题详解 (189)11.3名校考研真题详解 (192)第1章绪论1.1复习笔记一、分子生物的概念分子生物学是从分子水平研究生物结构、组织和功能的一门学科,以核酸、蛋白质等生物大分子的结构、形态及其在遗传信息和细胞信息传递中的作用和功能为研究对象。
《生物信息学序列与基因组分析》随笔

《生物信息学序列与基因组分析》读书随笔目录一、内容概括 (1)二、第一章 (2)1. 生物信息学的定义与发展历程 (3)1.1 生物信息学的起源与定义 (4)1.2 发展现状及趋势 (5)1.3 生物信息学的重要性 (7)2. 生物信息学的研究内容及方法 (9)2.1 研究内容 (10)2.2 研究方法 (12)三、第二章 (13)1. 基因组序列分析 (14)1.1 基因组序列的获取方法 (16)1.2 基因组序列的特点与结构分析 (17)1.3 基因组序列变异研究 (18)2. 蛋白质序列分析 (19)2.1 蛋白质序列的获取方法 (20)2.2 蛋白质序列的功能预测与结构分析 (21)四、第三章 (23)一、内容概括在生物信息学的广阔领域中,序列与基因组分析犹如一把钥匙,能够打开理解生命奥秘的大门。
当我翻开《生物信息学序列与基因组分析》我仿佛进入了一个全新的世界,被那些复杂的生物序列和基因组数据深深吸引。
本书从基础序列分析入手,详细阐述了DNA、RNA和蛋白质序列的结构特征及其功能意义。
通过丰富的实例和算法介绍,我得以一窥生物信息学在基因组学研究中的应用。
基因组分析部分,则带领我走进了基因组的神秘世界,从基因组结构、基因预测到群体遗传学分析,每一个章节都充满了新奇和挑战。
在阅读过程中,我不禁为生物信息学的精妙和深邃所折服。
这些理论和方法不仅揭示了生命的本质,还为医学、农业等领域的应用提供了有力的工具。
我也深刻体会到了生物信息学作为一门交叉学科的魅力所在,它融合了生物学、数学、计算机科学等多个学科的知识和方法,展现了科学研究的多姿多彩。
《生物信息学序列与基因组分析》这本书为我提供了一个全面了解生物信息学基础理论与应用方法的平台。
它不仅拓宽了我的视野,也激发了我对生命科学的浓厚兴趣。
在未来的学习和研究中,这本书将成为我不可或缺的良师益友。
二、第一章《生物信息学序列与基因组分析》是一本关于生物信息学领域的重要教材,作者是国内外知名的生物信息学家和计算机科学家。
病毒高通量测序与生物信息学技术读书札记

《病毒高通量测序与生物信息学技术》读书札记一、病毒高通量测序技术概述在当今生物学研究领域中,病毒高通量测序技术已经成为探究病毒基因组结构、变异及进化等方面不可或缺的工具。
该技术基于大规模平行测序原理,可对大量病毒序列进行快速、高效的测序和分析。
病毒高通量测序技术的主要流程包括样本准备、文库构建、序列捕获、数据生成及生物信息学分析等环节。
样本准备:对采集的病毒样本进行质量控制,确保样本的纯净度和病毒载量满足测序要求。
文库构建:利用特定的酶和试剂,将病毒RNA或DNA转化为适合测序的文库。
在此过程中,需要确保文库的均一性和复杂性,以便后续测序的准确性。
序列捕获:通过高通量测序平台,如Illumina、Thermo Fisher 等,对构建的文库进行大规模平行测序,捕获大量的病毒序列信息。
数据生成:测序过程中产生大量的原始数据,这些数据需要经过初步的质量控制和数据处理,以去除低质量序列和可能的宿主背景噪声。
生物信息学分析:利用生物信息学方法和工具,对处理后的数据进行深入分析,包括病毒基因组的组装、注释、变异检测、进化分析等方面。
通过这些分析,我们可以了解病毒的基因组结构特点、进化历程、变异趋势等重要信息。
病毒高通量测序技术的优势在于其高灵敏度、高分辨率和高通量。
该技术能够快速准确地鉴定病毒种类和亚型,对于病毒溯源、疫情防控、疫苗研发等方面具有极其重要的应用价值。
该技术也为深入研究病毒的生物学特性、致病机制和进化提供了宝贵的数据资源。
在本书的后续章节中,我们将详细介绍病毒高通量测序技术的各个环节,以及与之相关的生物信息学方法和工具。
通过学习和掌握这些内容,将有助于我们更好地理解和应用病毒高通量测序技术,为病毒学研究做出更大的贡献。
1. 高通量测序技术的引入和发展随着生物科学的飞速发展,高通量测序技术已成为现代生物学研究的重要工具,特别是在病毒学领域,其应用更是日益广泛。
本书的第一章节重点介绍了高通量测序技术的引入和发展。
水稻基因组

第四节基因组分析列举:水稻基因组分析本节将结合我们近年来的一些研究结果,重点对第一个被基因组测序的作物——水稻的基因组研究和分析结果进行介绍。
水稻是第一个被全基因组测序的作物。
亚洲栽培稻(Oryza sativa)共有2个亚种(籼稻和粳稻),其中一个粳稻品种“日本晴”分别通过全基因组鸟枪法(Goff et al, 2002)和逐步克隆方法(Sasaki et al, 2002; Feng et al, 2002; The Rice Chromosome 10 Sequencing Consortium, 2003; The Rice Genome Sequencing Project, 2005)测序,另一个籼稻品种“9311”通过全基因组鸟枪法测序(Yu et al, 2002; Yu et al, 2005)。
除了核基因组外,水稻的叶绿体基因组序列早在15年前就已测序完成(Hiratsuka et al, 1989),同时,其线粒体基因组最近也被测序完成(Notsu et al. 2002)。
在获得基因组序列后,一项艰巨的研究任务是如何从巨量的水稻基因组序列中挖掘出潜藏的遗传事件、进化机制等重要生物信息。
为此本文结合我们自身的一些研究工作,重点介绍了近年来在水稻基因组序列分析中获得的几项最新的研究结果。
1 现代的二倍体,古老的多倍体2004年水稻基因组研究的一个重要进展,是获得清晰的证据表明水稻基因组曾发生过全基因组倍增。
Paterson等( 2004)、Guyot 等(2004)和我们(Fan et al, 2004;Zhang et al, 2005a)的研究结果也一致表明,在禾本科作物分化前发生过一次全基因组倍增(whole-genome duplication)。
早在2002年,根据最初的水稻基因组草图序列,Goff等(Goff et al, 2002)利用同义替换率分布方法(K s-based age distribution)提出水稻基因组可能发生过一次全基因组倍增。
小RNA分析-浙大教材

第七章小RNA分析内源性非蛋白质编码小RNA (small non-protein-coding RNA, 12-24nt)广泛存在于高等和低等生物体内,通过对靶标mRNA直接切除或抑制其翻译在转录后水平对基因表达起调节作用。
已知的小RNA主要分为两大类:一类是微小RNA (miRNA, microRNA),一类是小干扰RNA (siRNA, small interfering RNA)。
在植物和动物体内,miRNA与siRNA的产生机制和作用形式均有所不同,这里主要介绍植物体内的小RNA。
miRNA是由具有发夹结构的初级转录本(pri-miRNA)经过一系列加工过程,包括核酸内切酶DCL1加工后生成,而小干扰RNA则是通过核酸内切酶DCL2, DCL3和DCL4对具有较好互补结构的长双链RNA前体进行加工形成的(Vazquez 2006)。
目前发现的小干扰RNA种类很多,根据前体序列类型和形成机制可分为:ta-siRNAs (trans acting siRNAs),nat-siRNAs (natural antisense transcript-derived siRNAs), hc-siRNA (heterochromatic siRNA), ra-siRNAs(repeat-associated siRNAs),长茎环结构的miRNA-like位点(miRNA-like long hairpin)和nat-miRNA ( natural antisense miRNA)。
植物中发现的小RNA已有相当的数量,在水稻中至今已鉴定出451个miRNA (miRBase, /sequences/, Release 14.0)、一个ta-siRNA家族(TAS3)和一个mirtron (Zhu et al. 2008)。
由于小RNA表达的时空特异性,导致传统的实验方法研究小RNA效率很低,成本较高,因此借助计算方法研究小RNA是一个很好的补充,大大加速了该领域的研究进程。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生物信息学札记(第4版)樊龙江浙江大学作物科学研究所浙江大学生物信息学研究所浙江大学IBM生物计算实验室2017年9月本材料已由浙江大学出版社出版:《生物信息学》,樊龙江主编,2017部分内容可通过下列网址获得:/bioinplant/札记前言第一版这份材料是我学习和讲授《生物信息学》课程时的备课笔记,材料大多是根据当时收集的一些外文资料翻译编辑而成。
学生在学习过程中经常要求我给他们提供一些中文的讲义或材料,这促使我把我的这份笔记整理并放到网上,供大家参考。
要提醒使用者的是,这份材料仅是根据我对生物信息学的一些浮浅的认识整理而成,其中的错误和偏颇只能请读者自鉴了。
2001年6月第二版自1999年开始接触生物信息学以来,一晃已近六年,而本札记也近四岁了。
2001和2002年中国科学院理论物理所的郝柏林院士在浙江大学首次开设生物信息学研究生课程,我作为他的助教系统地学习了生物信息学;同时,借着我国水稻基因组测序计划的机遇,在他的带领下从2001年开始从事水稻基因组分析,从此自己便完全投入到这一崭新、引人入胜的领域中来。
不断有来信向我索要本札记的电子版文件,同时在不少网站上看到推荐该札记的内容。
生物信息学、基因组学等发展很快,现在再回头审看该札记,有些部分已惨不忍读,这促使我下决心更新它。
但因时间和学识问题,还是有不少部分自己不甚满意,就只有待日后再努力了。
欢迎告诉我札记中的BUG,我的信箱*************.cn或******************.cn。
2005年3月30日第三版近年来高通量测序技术产生的序列数据大量出现(如小RNA和大规模群体SNP数据),本次更新根据这一进展增加了两章内容,分别是第七章有关小RNA的分析和第八章遗传多态性及正向选择检测。
两章内容由我的博士生王煜为主编写,李泽峰和刘云参与了文献整理。
另外还更新了第四章有关水稻基因组分析一节。
2010年1月第四版2014年浙江大学开展本科生教材建设工作,我当时作为系主任要带头,就承诺编写我主讲的《生物信息学》教材。
编写教材的确不是一件容易的事,经过几番挣扎和多方努力,总算完成了编写,算是了却了一桩心思。
该教材内容比较完整,也跟踪了生物信息学领域的最新进展。
我就权且把该教材内容作为札记的第四版,也算给该札记一个完美的结尾。
2017年9月《生物信息学》前言自开始接触生物信息学以来,一晃已近二十年了。
我是在攻读博士期间开始注意并学习生物信息学的。
我的博士生导师胡秉民为应用数学专业教授,主要从事生态系统模型模拟研究。
虽然已具备一定数量统计和数量遗传学基础,但当时对于生物信息学,我还是非常陌生的,通过自学才开始一点点了解这门新兴学科。
2001-2003年间,中国科学院理论物理所郝柏林院士在浙江大学首次开设“生物信息学”研究生课程,我作为他的助教,系统地学习了生物信息学;同时,在他的带领下从事水稻基因组分析。
自那时起,浙江大学生物信息学学科和相应研究机构也逐步建立起来。
2004年郝院士离开杭州加入复旦大学,生物信息学研究生课程就由我和朱军教授承担下来。
现在该课程作为浙江大学全校性研究生公共课程,已成为一门重点建设课程,每年选课人数都在150人左右。
上个世纪末,我国生物信息学还处于起步阶段,学习资料很少。
学生时常索要学习材料,于是我整理了备课笔记,取名《生物信息学札记》,于2001年6月挂到实验室主页上供学生参考。
随着生物信息学发展,分别于2005年3月和2010年1月更新札记两次。
由于网络传播的作用,许多生物信息学初学者都读过该札记,在国内形成一定的影响。
本书是在该札记框架基础上,补充大量新材料编写而成。
生物信息学学科内容涵盖广且发展很快。
基于国内外生物信息学相关教材,以及自身对生物信息学的粗浅理解,我把生物信息学大致分为四部分(篇)内容:第一部分即基础篇,为生物信息学的基础知识。
这部分内容总体变化不大(与10-15年前比较),它是生物信息学的核心知识,生物信息学教学最重要部分,为应为必讲内容;第二部分高通量测序数据分析篇,最近十年才出现的生物信息学新内容。
2005年高通量测序技术突破后,针对该技术产生的序列数据,出现大量生物信息学新算法和新工具;第三部分生物信息学外延与交叉,重点介绍与生物信息学密切相关的其他生物学学科。
生物信息学引入了这些学科的部分核心技术(或反过来被引入),如数量遗传学、群体遗传学和新兴学科合成生物学;第四部分为生物信息学资源与实践篇。
生物信息学数据库和软件工具对生物学学科至关重要,所以这部分也是生物信息学重要组成部分。
同时,该篇中以实践为目的的生物信息学教学资源是课堂教学的一个很好补充。
我重点编写了本书第一部分基础篇。
我的学生参与撰写了有关章节,同时也邀请了相应领域研究者参与部分章节撰写(徐海明:数量遗传学;阮松林:蛋白质组学),最后由我统稿。
我们尽可能完整地列出参考书目,标注材料来源,但一定还会有所遗漏。
本书受浙江大学本科专业核心课程教材建设专项经费资助出版。
每次拿起书稿总是能发现一些错误或不准确的地方,但由于出版计划一再拖延,只好交稿付印了。
如果你发现书中问题,望赐教指正(*************.cn),以便我们再版时更正。
樊龙江2016年9月第1-1章生物信息类型及其产生途径第一节生物信息的类型第二节DNA测序技术一、第一代测序技术二、第二代测序技术三、第三代测序技术第三节高通量测序技术的应用一、DNA/RNA相关测序二、蛋白质-DNA/RNA互作三、甲基化/宏基因组第四节蛋白质序列及其结构测定一、蛋白质序列与蛋白质互作测定二、蛋白质结构测定第1-2章分子数据库和常见记录格式第一节分子序列数据库概述一、分子数据库概念二、数据库记录格式三、数据库冗余、序列递交和检索第二节核苷酸及其相关数据库一、DNA/RNA序列数据库二、基因组数据库三、非编码RNA数据库第三节蛋白质及其相关数据库第四节代谢途径等专业数据库一、代谢途径数据库二、代谢组学等数据库第1-3章两条序列联配及其算法第一节序列联配基本概念第二节计分矩阵一、计分矩阵的一般原理二、氨基酸替换矩阵四、位置特异性计分矩阵(PSSM)第三节两条序列联配算法一、Needleman-Wunsch算法二、Smith-Waterman算法第四节BLAST算法及数据库搜索一、BLAST算法二、利用BLAST进行数据库序列搜索三、序列相似性的统计推断第1-4章多条序列联配及功能域分析第一节多序列联配概念及其算法一、多序列联配概念二、多序列全局联配算法三、多序列局部联配算法第二节蛋白质序列功能域分析与模型一、功能域概念二、功能域模型第三节熵及矩阵信息量一、不确定性与信息量二、信息熵的应用第1-5章基因预测与功能注释第一节基因组序列构成与基因预测一、基因组序列的基本构成二、基因预测及其基本方法三、基因注释流程第二节从头预测——隐马尔可夫模型(HMM)方法一、马尔可夫和隐马尔可夫模型二、隐马尔可夫模型问题及其算法三、HMM基因预测模型及其应用第三节贝叶斯统计及其基因预测应用一、贝叶斯统计与生物信息学二、利用贝叶斯统计进行基因预测第四节基因功能注释一、利用序列和结构域数据库进行注释二、利用功能分类和代谢途径信息进行注释第五节基因序列构成分析一、碱基构成与分布二、DNA行走与Z曲线三、同向重复序列分析四、蛋白质序列跨膜等特征分析第1-6章系统发生树构建第一节系统发生树与遗传模型一、系统发生树概述二、遗传模型第二节距离法一、非加权平均连接聚类法(UPGMA法)二、Fitch-Margoliash算法三、邻接法第三节简约法第四节似然法一、DNA序列的似然模型二、两条序列系统发生树三、三条及多条序列系统发生树第五节基因组组分矢量方法二、基于德布鲁因图的拼接算法第三节第三代测序数据拼接方法第四节基于字符串(K-mer)的基因组调查与分析一、基因组大小估计二、基因组复杂度估计三、基因组“肖像”及缺失字符串分析第2-2章基因组变异与分析第一节基因组变异类型与检测方法一、基因组变异类型二、基因组变异检测方法第二节基因组重测序及其应用一、基因组重测序应用领域二、基因组重测序数据分析第2-3章转录组分析第一节转录组测序与拼接一、转录组及其技术平台二、转录组序列拼接第二节基因表达分析一、差异表达基因的鉴定二、差异表达基因富集分析第三节可变剪切和基因融合分析一、基因可变剪切二、融合基因第2-4章非编码RNA分析第一节非编码RNA简介一、非编码RNA类型与功能二、非编码RNA进化三、样品采集及其测序方法四、非编码RNA主要数据库第二节小RNA计算识别与靶基因预测一、miRNA主要特征及计算识别二、siRNA主要特征及计算识别三、miRNA和siRNA靶基因预测第三节长非编码RNA鉴定与功能分析一、线性lncRNA鉴定二、环化RNA鉴定三、lncRNA功能预测第2-5章甲基化与组蛋白修饰第一节表观遗传机制第二节甲基化测序与分析实验3抗性基因多序列联配及其功能域预测实验4蛋白质编码基因预测与功能注释实验5非编码miRNA二级结构及其靶基因预测实验6基因组浏览器GBrowser及其应用实验7系统发生树构建实验8蛋白质结构与功能预测参考文献。