生物信息学填空题(个人整理)

合集下载

生物信息学习题

一：名词解释1.生物信息学2.NCBI3.PubMed4.生物芯片5.BLAST6.UniProt7.电子克隆8.EMBL二：填空题1.基因芯片可以分为2. 人类基因组全序列分析分两大步骤即制图和测序，并最终绘制出四张图谱：3. 分子系统发生分析主要分为三个步骤即4. 国际上最主要的三大核酸序列数据库分别是5. 蛋白质得分矩阵有7. 文献是掌握科研进展的最直接方式，目前由NCBI维护的大型文献资源是。

3. 用于核酸序列比对中常见的三种得分矩阵，分别为4. 根据生物芯片探针分子类型的不同，可以将生物芯片哪三种，5. 核酸序列分析所获得的信息主要有（举例说明四个）6. 限制性酶切分析是分子生物学实验中的日常工作之一，这方面最好的限制酶数据库是三：选择题1、如果试图确定一个新蛋白质序列属于哪一个蛋白质家族，或该序列可能包含何种结构域或功能位点，应使用：（）A: PROSITE数据库 B: DDBJ数据库C: PIR数据库 D: PDB数据库2、构建序列进化树的一般步骤不包括：（）A：建立DNA文库 B：建立数据模型 C：建立取代模型 D：建立进化树3、BLAST教案所程序中，哪个方法是不存在的？（）A：BLASTP B：BLASTN C：BLASTX D:BLASTQ4. 以下常见的几个物种，哪一个目前还没有完成全基因组测序：（）A: 茶树 B: 玉米 C: 水稻 D: 小鼠5、向核酸序列数据库（GenBank/EMBL/DDBJ）提交数据，应该使用下面哪个软件：（）。

A： Blast B：Sequin C：SRS D：Swiss-Model6、在蛋白质序列数据库中比较查询手头未知的蛋白质序列，应使用Blast中哪个具体的算法：（）。

A：BLASTX B：tBLASTN C：BLASTP D：BLASTN7、下列中属于一级蛋白质结构数据库的是：（）A：EMBL B：DDBJ C：PDB D：SWISS-PROT8、下面不属于SWISS-PROT蛋白质数据库的注释范畴的是：（）A: 与其它蛋白质的相似性 B: 蛋白质的二级结构C: 由于缺乏该蛋白质而引起的疾病 D: 核酸的功能描述9、下列属于蛋白质二级结构预测的软件程序是（）A： BLASTX B：SOPMA C：DNAstar D：GO10. 如果做DNA结构分析，应该考虑用下面哪个数据库：（）A：GenBank B： PIR C：NDB D：UniProt四：简单题1．简述Entrez的设计概念和使用方法？2. 简述生物大分子PDB存储的生物分子种类和数据结构特点？3.简述生物信息学的研究意义？4 简述蛋白质序列分析的基本内容以及常用的软件？5. 简述Swiss-Prot的数据结构？6、简述序列多重比对的意义？7、简述生物信息学的发展历史？五：论述题1.论述蛋白质相互作用研究的意义，传统的实验方法和计算预测方法的应用？2.论述后基因组时代生物信息学面临的挑战和研究策略？3．论述生物信息学的应用？4. 论述如何利用基因芯片数据做聚类分析。

生物信息学考试试题

生物信息学考试试题生物信息学考试试题：一、选择题1. 以下哪种是常见的生物信息学数据库？A. NCBIB. AmazonC. GoogleD. Instagram2. 下列哪一个不是生物信息学中常见的序列比对软件？A. BLASTB. ClustalWC. PhotoshopD. MUSCLE3. 生物信息学中常用的数据分析工具是？A. Microsoft ExcelB. SPSSC. RD. Adobe Photoshop4. BLAST是用来做什么的？A. 序列比对B. 图像处理C. 文本编辑D. 网页设计5. NCBI是什么机构的缩写？A. National Center for Biotechnology InformationB. National Center for Business IntelligenceC. New York City Bureau of InvestigationD. North Carolina Biological Institute二、填空题1. 生物信息学的研究对象是________。

2. 为了识别蛋白质功能和结构，可以使用________软件进行序列比对。

3. 研究生物信息学常用的数据库之一是________。

4. 生物信息学中的图形工具有助于可视化________。

5. 生物信息学可以帮助人们理解________的基本原理。

三、简答题1. 请解释生物信息学在生物学研究中的重要性。

2. 什么是序列比对？它在生物信息学中有什么作用？3. 请举例说明生物信息学数据库的用途。

四、综合题根据以下序列，请使用BLAST软件进行在线比对，并分析结果：序列1：ATGGCCATAG序列2：ATGCCGATAG序列3：ATGGCTATAG序列4：ATGGTCATAG请写出每个序列与其他序列的比对结果，并解释相似性及差异性。

以上为生物信息学考试试题，希望您认真作答，祝您考试顺利！。

生物信息学习题

第六章分子系统发生分析（问题与练习）
1、构建系统发生树，应使用
A、BLAST
B、FASTA
C、UPGMA
D、Entrez
2、构建系统树的主要方法有
、
、
等。
3、根据生物分子数据进行系统发生分析有哪些优点？
4、在 5 个分类单元所形成的所有可能的有根系统发生树中，随机抽取一棵树是反映真实关
系的树的可能性是多少？从这些分类单元所有可能的无根系统发生树中，随机选择一棵
库
8、TreeBASE 系统主要用于
A、发现新基因 B、系统生物学研究 C、类群间系统发育关系研究 D、序列比对
二、问答题
1、为什么说 SWISS-PROT 是最重要的蛋白质一级数据库？
2、构建蛋白质二级数据库的基本原则是什么？
3、构建蛋白质二级数据库的主要方法有哪些？
4、叙述 SCOP 数据库对蛋白质分类的主要依据
第八章后基因组时代的生物信息学（问题与练习）
1、比较生物还原论与生物综合论的异同 2、简述“后基因组生物信息学”的基本研究思路 3、后基因组生物信息学的主要挑战是什么？ 4、功能基因组系统学的基本特征是什么？ 5、说明后基因组生物信息学对信息流动的最新理解 6、列举几种预测蛋白质-蛋白质相互作用的理论方法 7、解释从基因表达水平关联预测蛋白质-蛋白质相互作用的理论方法 8、解释基因保守近邻法预测蛋白质-蛋白质相互作用的理论方法 9、解释基因融合法预测蛋白质-蛋白质相互作用的理论方法 10、解释种系轮廓发生法预测蛋白质-蛋白质相互作用的理论方法
1、蛋白质得分矩阵类型有、
、、
和
等。
2、对位排列主要有局部比对和三、运算题 1、画出下面两条序列的简单点阵图。将第一条序列放在 x 坐标轴上，将第二条序列放在 y

生物信息学答案1111

一、名词解释（共15分，每个3分）1.生物信息学：（狭义）专指应用信息技术储存和分析基因组测序所产生的分子序列及其相关数据的学科；（广义）指生命科学与数学、计算机科学和信息科学等交汇融合所形成的一门交叉学科。

2.系统发生学：phylogenetics，研究物种之间的进化关系的一门学科，从生物信息的角度主要是利用核酸和蛋白质序列分析的方法进行。

3.BLAST：Basic Local Alignment Search Tool的缩写，基本的基于局部对准的搜索工具；一种快速查找与给定序列具有连续相同片断的序列的技术。

4.中心法则：是指遗传信息从DNA传递给RNA，再从RNA传递给蛋白质，即完成遗传信息的转录和翻译的过程。

也可以从DNA传递给DNA，即完成DNA的复制过程。

这是所有有细胞结构的生物所遵循的法则。

5.CHIP：又称微阵列（microarray），有多种形式，主要由大量cDNA、寡核苷酸探针或蛋白质密集排列所形成的探针阵列，其工作的基本原理是通过核酸或蛋白质杂交的远离了检测表达信息。

二、填空题（共10分，每空1分）1. 目前三大主要综合性基因序列数据库是：Genebank；DDBJ和EMBL。

2. 蛋白质的折叠预测方法：同源建模，折叠识别和从头预测。

3. 在Pubmed中进行如下检索W ANG ym [au]，表明检索是依据作者姓名；4. 进化树构建过程中采用的主要方法有：UPGMA；Neighbor joining；maximum likelihood；三、选择题（共10分，每个2分）1. 下列哪个选项不是微阵列实验设计的内容？（A）A：贝叶斯网络法B：对照组的选择C：重复样本的使用D：随机化原则2. 构建序列进化树的一般步骤不包括：（A）A：建立DNA文库B：建立数据模型C：建立取代模型D：建立进化树3. 下列中属于一级蛋白质结构数据库的是：（D）A. EMBLB. DDBJC. PDBD.SWISS-PROT4. 蛋白质结构预测分为：（C）A．一级和三级结构预测 B. 二级和空间结构预测C. 三级和空间结构预测D. 二级和三级结构预测5. Cy3/Cy5双色芯片主要用来研究：（D）A．蛋白的定位； B. 基因在染色体上的位置；C. 基因的可变剪接；D. 基因表达模式；四、简答题（共3题，15分）1.生物信息学分析的数据对象主要有哪几种？这些数据之间存在着什么关系？其研究重点主要落实在核酸和蛋白质两个方面，包括它们的序列、结构和功能（1分）。

生物信息学复习题

生物信息学复习题### 生物信息学复习题#### 一、选择题1. 生物信息学主要研究的是什么？A. 生物学数据的收集和存储B. 生物学数据的分析和解释C. 生物学实验的设计和执行D. 生物学仪器的操作和维护2. 下列哪一项不是生物信息学中常用的数据库？A. GenBankB. PDBC. PubMedD. Google Scholar3. 序列比对的目的是什么？A. 确定序列间的同源性B. 预测蛋白质的三维结构C. 鉴定基因的功能D. 计算基因的表达量#### 二、填空题1. 生物信息学中的BLAST工具主要用于__________。

2. 基因表达分析中常用的芯片技术包括__________和__________。

3. 在蛋白质结构预测中，同源建模依赖于__________数据库中的已知结构。

4. 转录组测序（RNA-Seq）可以用于研究__________和__________。

#### 三、简答题1. 描述基因组注释的一般流程。

2. 阐述生物信息学在药物设计中的应用。

3. 解释什么是系统发育树，并说明其在进化研究中的意义。

#### 四、计算题1. 给定一段DNA序列，计算其GC含量。

（示例序列：ATCGTACGTAGCTAGCTAG）2. 如果一个蛋白质序列的分子量为12345 Da，其氨基酸的平均分子量为110 Da，计算该蛋白质序列中氨基酸的数量。

#### 五、论述题1. 讨论生物信息学在个性化医疗中的作用和挑战。

2. 分析高通量测序技术对生物信息学领域的影响。

通过以上题目的复习，可以帮助学生掌握生物信息学的基础知识和技能，包括对生物数据的分析、解释和应用。

这些知识点不仅涵盖了生物信息学的基础理论，还涉及到实际应用，如药物设计、个性化医疗等，为学生提供了一个全面的复习框架。

生物信息学_复习题及答案（打印）（1）

生物信息学_复习题及答案（打印）（1）一、名词解释：1.生物信息学：研究大量生物数据复杂关系的学科，其特征是多学科交叉，以互联网为媒介，数据库为载体。

利用数学知识建立各种数学模型; 利用计算机为工具对实验所得大量生物学数据进行储存、检索、处理及分析，并以生物学知识对结果进行解释。

2.二级数据库：在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来，是对生物学知识和信息的进一步的整理。

3.FASTA序列格式：是将DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨基酸字符串，大于号（>）表示一个新文件的开始，其他无特殊要求。

4.genbank序列格式：是GenBank 数据库的基本信息单位，是最为广泛的生物信息学序列格式之一。

该文件格式按域划分为4个部分：第一部分包含整个记录的信息（描述符）；第二部分包含注释；第三部分是引文区，提供了这个记录的科学依据；第四部分是核苷酸序列本身，以“//”结尾。

5.Entrez检索系统：是NCBI开发的核心检索系统，集成了NCBI 的各种数据库，具有链接的数据库多，使用方便，能够进行交叉索引等特点。

6.BLAST：基本局部比对搜索工具，用于相似性搜索的工具，对需要进行检索的序列与数据库中的每个序列做相似性比较。

P947.查询序列（query sequence）：也称被检索序列，用来在数据库中检索并进行相似性比较的序列。

P988.打分矩阵（scoring matrix）：在相似性检索中对序列两两比对的质量评估方法。

包括基于理论（如考虑核酸和氨基酸之间的类似性）和实际进化距离（如PAM）两类方法。

P299.空位（gap）：在序列比对时，由于序列长度不同，需要插入一个或几个位点以取得最佳比对结果，这样在其中一序列上产生中断现象，这些中断的位点称为空位。

P2910.空位罚分：空位罚分是为了补偿插入和缺失对序列相似性的影响，序列中的空位的引入不代表真正的进化事件，所以要对其进行罚分，空位罚分的多少直接影响对比的结果。

生物信息学试题

生物信息学考题（2012版）一、填空题（共10分，每空一分）1、美国政府于1990年10月启动耗资30亿美元的15年研究计划，预期到2005年完成人类基因组大约30亿个碱基的全序列测定，这就是被称为生命科学“登月计划”的人类基因组计划。

2、生物信息学的研究目标：以核酸、蛋白质等生物大分子数据库为主要对象，以数学、信息学、计算机科学为主要手段，以计算机硬件、软件和计算机网络为主要工具，对浩瀚如海的原始数据进行存储、管理、注释、加工，使之成为具有明确生物意义的生物信息。

3、随着生物信息学的诞生及应用，今后生物学研究项目的起点将是理论的，一位科学家将从理论推测开始，然后转向试验去追踪或检验该假设。

4、生物信息学作为一门交叉学科，已经成为当今生命科学乃至整个自然科学的重大前沿领域之一，也将是21世纪自然科学的核心领域之一。

5、人类基因组计划、“曼哈顿原子计划”和“阿波罗登月计划”并称为20世纪的三大著名计划，中国在1999年承担了1%的研究任务，即对第3号染色体上3000万碱基对的测定。

6、人类基因组的主要任务是：人类基因组以及一些模式生物（细菌、酵母、线虫、果蝇等）基因组作图、测序和基因识别。

二、是非题（共10分，每小题1分）1、生物学就是实验科学，所有的研究结论从实验中来，于实验中得到验证。

（错）2、比较是科学研究中最常见的方法，在生物信息学研究中，比对是最常用和最经典的研究手段。

（对）3、两个蛋白质序列相似性超过30%就是同源蛋白。

（错）4、蛋白质序列相似性指一级序列中氨基酸残基相同。

（错）5、蛋白质序列相似性指氨基酸残基具有相似特性：侧链基团大小电荷性、疏水性等相同。

（对）6、核酸序列相似性指序列中相同碱基所占的比例。

（对）7、对一段未知功能DNA片段进行功能预测需对其进行3位翻译。

（错）8、对一段未知功能DNA片段进行功能预测需对其进行6位翻译。

（对）9、相似性是指一种很直接的数量关系，无需实验验证。

(完整word版)生物信息学填空题(个人整理)

1、BLAST教案所程序中，哪个方法是不存在的？（D）A：BLASTP B：BLASTN C：BLASTX D:BLASTQ2、下列哪个软件不是常用来观察蛋白质结构视图的？（D）A：AVS B：Chimera C:MICE D:HMM3、下列哪个不是点突变的类型?(A)A:染色体畸变 B：错义突变 C：无义突变 D：移码突变4、基因突变的效应不包括：（C）A：有利突变 B：中性突变 C：移码突变D：遗传多态现象5、人类基因组的结构特点不包括：（A）A：基因进化 B：基因数目 C：基因重复序列 D：基因组复制6、世界上三大数据库不包括：（B）A:NCBI B:BLAST C:UCSC D:Ensembl7、常用序列比对方法错误的是：（C）A：编辑距离 B：点阵描图 C：局部比对 D：记分模式8、下列哪个不是蛋白质结构模型？（D）A：同源性模型 B：折叠识别 C：ab initio折叠 D： MoLScript结构9、下列哪个选项不是微阵列实验设计的内容？（A）A：贝叶斯网络法 B：对照组的选择 C：重复样本的使用 D：随机化原则10、构建序列进化树的一般步骤不包括：（A）A：建立DNA文库 B：建立数据模型 C：建立取代模型 D：建立进化树11、下列中属于一级蛋白质结构数据库的是：（C）A. EMBLB. DDBJC. PDBD.SWISS-PROT12．蛋白质结构预测分为：（B）A．一级和三级结构预测 B. 二级和空间结构预测C. 三级和空间结构预测D. 二级和三级结构预测13．数据挖掘的四个步骤不包括下列哪个：（C）A. 数据选择B. 数据转换C. 数据记录D. 结果分析14．下列哪项不是生物学研究必备的工具：（A）A.数据分析Ｂ．数据统计Ｃ．因素分析Ｄ．多元回归分析15.Linux中rmdir 命令的功能是：（D）A．改变工作目录 B.删除工作目录C. 创建目录D.删除空目录16．BLAST教案所程序中，哪个方法是不存在的？（D）A：BLASTP B：BLASTN C：BLASTX D:BLASTQ17．下列哪个不是蛋白质结构模型？（D）A：同源性模型 B：折叠识别 C：ab initio折叠 D： MoLScript结构18．人类基因组的结构特点不包括：（A）A：基因进化 B：基因数目 C：基因重复序列 D：基因组复制19、下列哪个选项不是微阵列实验设计的内容？（A）A：贝叶斯网络法 B：对照组的选择 C：重复样本的使用 D：随机化原则20、构建序列进化树的一般步骤不包括：（A）A：建立DNA文库 B：建立数据模型 C：建立取代模型 D：建立进化树三、填空题1、数据格式的建立、数据的准确性和质量控制、方便的数据搜寻方式以及数据的及时更新是数据库建立和维护中的重要问题。

生物信息学习题

1、基序（motif）：通过多序列比对，将同源序列收集在一起，以得到保守区域。

这些保守区域称为基序(motifs)2、可读框（ORF）：没有终止密码子（TGA,TAA或TAG）打断的阅读框。

3、剪切变体：从同一DNA，转录得到不同mRNA，并最终翻译成不同的蛋白质称为剪接变体4、表达标签序列（EST）：是从cDNA文库中生成的一些很短的序列(300—500bp)，它们代表在特定组织或发育阶段表达的基因，有时可代表特定的cDNA.5、系统发生学：通过比较五种的特征，认为特征相似的五种在遗传学上相近，研究五种之见的进化关系二、填空题（共20分，每空1分）l、列举至少2种权威的核酸序列数据库Genbank 、EMBL 等。

2、列举至少3种权威的蛋白质序列数据库PIR 、Swiss-prot 、MIPs 等。

3、核酸序列比对使用的得分矩阵类型有等价矩阵、BLAST 、和转换-颠换矩阵等。

4、蛋白质结构分类数据库主要有SCOP 和CAH 和PDBsum 等。

5、构建系统树的主要方法有UPGMA法、邻近归并法、Fitch-Margoliash法、最小进化法（ME）、最大似然法（ML）、等。

6、列举至少4中NCBI的服务功能Pubmed 、Entrez 、BLAST 和OMIM 等。

1、为什么说Swiss-Prot是重要的蛋白质序列数据库?SwissProt数据库中的所有序列条目都经过有经验的分子生物学家和蛋白质化学家通过计算机工具并查阅有关文献资料仔细核实。

SIB和EBI共有70多人的研究队伍，专门从事蛋白质序列数据的搜集、整理、分析、注释、发布，力图提供高质量的蛋白质序列和注释信息。

SwissProt数据库的每个条目都有详细的注释，包括结构域、功能位点、跨膜区域、二硫键位置、翻译后修饰、突变体等。

该数据库中还包括了与核酸序列数据库EMBL/GenBank/DDBJ、蛋白质结构数据库PDB以及Prosite、PRINTTS等十多个二次数据库的交叉引用代码。

《生物信息学》题集

《生物信息学》题集一、选择题（每题3分，共30分）1.生物信息学的主要研究对象是什么？A. 蛋白质结构B. 基因序列C. 生态系统D. 细胞代谢2.下列哪项技术不是生物信息学中常用的数据库技术？A. BLASTB. GenBankC. PubMedD. SWISS-PROT3.在生物信息学中，进行多序列比对时常用的软件是什么？A. MATLABB. ClustalWC. ExcelD. PowerPoint4.哪种算法常用于基因表达数据的聚类分析？A. K-meansB. DijkstraC. A*D. Floyd5.生物信息学中，下列哪项不是常用的序列分析技术？A. PCRB. 测序C. 质谱分析D. 芯片技术6.下列哪项不是生物信息学在医学领域的应用？A. 疾病诊断B. 药物设计C. 天气预报D. 个性化医疗7.下列哪项技术常用于生物大分子的结构预测？A. NMRB. X射线衍射C. 同源建模D. 质谱分析8.在生物信息学中，下列哪项不是基因注释的内容？A. 基因功能B. 基因表达水平C. 基因在染色体上的位置D. 基因的长度9.下列哪项技术不是高通量测序技术？A. Sanger测序B. Illumina测序C. 454测序D. SOLiD测序10.下列哪项不是生物信息学在农业领域的应用？A. 作物育种B. 病虫害防治C. 土壤成分分析D. 农产品品质改良二、填空题（每题2分，共20分）1.生物信息学是一门交叉学科，它主要涉及______、计算机科学和数学等领域。

2.在生物信息学中，______技术常用于基因序列的相似性搜索。

3.生物信息学在药物研发中的主要应用包括______和药物靶点的预测。

4.在基因表达数据分析中，______是一种常用的数据标准化方法。

5.生物信息学中，______技术常用于蛋白质结构的预测和分析。

6.在生物信息学数据库中，GenBank主要存储的是______数据。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

1、BLAST教案所程序中，哪个方法是不存在的？（D）
A：BLASTP B：BLASTN C：BLASTX D:BLASTQ
2、下列哪个软件不是常用来观察蛋白质结构视图的？（D）
A：AVS B：Chimera C:MICE D:HMM
3、下列哪个不是点突变的类型?(A)
A:染色体畸变 B：错义突变 C：无义突变 D：移码突变
4、基因突变的效应不包括：（C）
A：有利突变 B：中性突变 C：移码突变D：遗传多态现象
5、人类基因组的结构特点不包括：（A）
A：基因进化 B：基因数目 C：基因重复序列 D：基因组复制
6、世界上三大数据库不包括：（B）
A:NCBI B:BLAST C:UCSC D:Ensembl
7、常用序列比对方法错误的是：（C）
A：编辑距离 B：点阵描图 C：局部比对 D：记分模式
8、下列哪个不是蛋白质结构模型？（D）
A：同源性模型 B：折叠识别 C：ab initio折叠 D： MoLScript结构9、下列哪个选项不是微阵列实验设计的内容？（A）
A：贝叶斯网络法 B：对照组的选择 C：重复样本的使用 D：随机化原则10、构建序列进化树的一般步骤不包括：（A）
A：建立DNA文库 B：建立数据模型 C：建立取代模型 D：建立进化树
11、下列中属于一级蛋白质结构数据库的是：（C）
A. EMBL
B. DDBJ
C. PDB
D.SWISS-PROT
12．蛋白质结构预测分为：（B）
A．一级和三级结构预测 B. 二级和空间结构预测
C. 三级和空间结构预测
D. 二级和三级结构预测
13．数据挖掘的四个步骤不包括下列哪个：（C）
A. 数据选择
B. 数据转换
C. 数据记录
D. 结果分析
14．下列哪项不是生物学研究必备的工具：（A）
A.数据分析Ｂ．数据统计Ｃ．因素分析Ｄ．多元回归分析
15.Linux中rmdir 命令的功能是：（D）
A．改变工作目录 B.删除工作目录
C. 创建目录
D.删除空目录
16．BLAST教案所程序中，哪个方法是不存在的？（D）
A：BLASTP B：BLASTN C：BLASTX D:BLASTQ
17．下列哪个不是蛋白质结构模型？（D）
A：同源性模型 B：折叠识别 C：ab initio折叠 D： MoLScript结构18．人类基因组的结构特点不包括：（A）
A：基因进化 B：基因数目 C：基因重复序列 D：基因组复制
19、下列哪个选项不是微阵列实验设计的内容？（A）
A：贝叶斯网络法 B：对照组的选择 C：重复样本的使用 D：随机化原则20、构建序列进化树的一般步骤不包括：（A）
A：建立DNA文库 B：建立数据模型 C：建立取代模型 D：建立进化树三、填空题
1、数据格式的建立、数据的准确性和质量控制、方便的数据搜寻方式以及数据的及时更新是数据库建立和维护中的重要问题。

2、按碱基配对原则将DNA分子的遗传信息拷贝到mRNA分子中，称为转录。

3、线粒体基因组含有细胞核基因组之外的遗传信息，有其独特的遗传特点表现为:mtDNA具有半自主性、线粒体基因组所用的遗传密码与核基因的通用密码有所不同、mtDNA呈母系遗传、mtDNA具有异质性与均质性、mtDNA具有阀值效应、mtDNA的进化率极高。

4、分子生物学数据库中的信息可以是DNA序列，保守的DNA结构域、基因组、基因表达、蛋白质序列、蛋白质家族、基因突变、基因多态性和代谢途径。

5、BLAST是一种快速序列比较工具，采用启发式方法根据优化的局部相似性构建比对关系。

6．药物基因组学中的三大技术平台：SNP分型，基因表达芯片和生物信息学7．数据格式的建立、数据的准确性和质量控制、方便的数据搜寻方式以及数据的及时更新是数据库建立和维护中的重要问题。

8．蛋白质的折叠预测方法：同源性模型，折叠识别和从头开始折叠
9．生物膜的特性：流动性和不对称性
10．分子生物学数据库中的信息可以是DNA序列，保守的DNA结构域、基因组、基因表达、蛋白质序列、蛋白质家族、基因突变、基因多态性和代谢途径。

1. 常用的三种序列格式：NBRF/PIR,FASTA和GDE
2. 初级序列数据库：GenBank，EMBL和DDBJ
3. 蛋白质序列数据库：SWISS-PROT和TrEMBL
4. 提供蛋白质功能注释信息的数据库：KEGG（京都基因和基因组百科全书）和PIR（蛋白
质信息资源）
5. 目前由NCBI维护的大型文献资源是PubMed
6. 数据库常用的数据检索工具：Entrez，SRS，DBGET
7. 常用的序列搜索方法：FASTA和BLAST
8. 高分值局部联配的BLAST参数是HSPs（高分值片段对），E（期望值）
9. 多序列联配的常用软件：Clustal
10. 蛋白质结构域家族的数据库有：Pfam，SMART
11. 系统发育学的研究方法有：表现型分类法，遗传分类法和进化分类法
12. 系统发育树的构建方法：距离矩阵法，最大简约法和最大似然法
13. 常用系统发育分析软件：PHYLIP
14. 检测系统发育树可靠性的技术：bootstrapping和Jack-knifing
15. 原核生物和真核生物基因组中的注释所涉及的问题是不同的
16.检测原核生物ORF的程序：NCBI ORF finder
17. 测试基因预测程序正确预测基因的能力的项目是GASP（基因预测评估项目）
18. 二级结构的三种状态：α螺旋，β折叠和β转角
19. 用于蛋白质二级结构预测的基本神经网络模型为三层的前馈网络，包括输入层，隐含层
和输出层
20. 通过比较建模预测蛋白质结构的软件有SWISS-PDBVIEWER（SWISS—MODEL网站）
21. 蛋白质质谱数据搜索工具：SEQUEST
22. 分子途径最广泛数据库：KEGG
23.聚类分析方法，分为有监督学习方法，无监督学习方法
24. 质谱的两个数据库搜索工具：SEQEST和Lutkefish
二填空题
1生物信息学的发展大致经历了3个阶段，分别为（前基因组时代）（基因组时代）和（后基因组时代）p2
2后基因组时代的标志性工作是（基因组分析）（蛋白质组分析）以及（各种数据的比较和整合）p3
3前基因组时代的标志性工作是（生物数据库的建立）（检索工具的开发）以及（DNA和蛋白质的序列分析）p2
4基因组时代的标志性工作是（基因寻找和识别）（网络数据库系统的建立）以及（交互界面的开发）p2
5遗传图谱的图距单位是（厘摩）代表（1%）的交换值，物理图谱的图距以（物理长度）为单位p155-156 如果两个遗传标记之间的重组率是1%，则他们之间的遗传距离就是（1cM）
6 人类基因组中大小约（3×109）对核苷酸，含（30000）个基因，人类基因组中编码DNA的序列占（10%），junkDNA占（）p151
7 人类基因组计划的目标是完成四张图，分别是（遗传图谱）（物理图谱）（序列图谱）和（基因图谱）
8 HGP由（六）个国家完成，我国完成了HGP的（1%，即３号染色体上３０００万个碱基）的测序工作。

9蛋白质组分析的关键技术主要有（双向凝胶电泳）和（蛋白质鉴定方法）p183 10国际著名的三大公共核苷酸数据库为（GenBank）（DDBJ）（EMBL）p56
11 Genebank由（NCBI）管理运行，（BLAST）是一种快速检索相似性序列的工具，（Entrez）是一个整合的数据查询系统p56
12最常用的序列相似性查询工具是（BLAST）和（FASTA），两个系统的服务分别由（NCBI）和（EBI）维护p73
13 BLAST系列程序有（序列对位排列）（序列同源性）（相似性记分）和（全局排列）p73
14 NCBI中主要的数据库有（DDBJ ）（EMBL）和（GenBank）？
15基因组浏览的数据库主要有（）和（）？
16蛋白质序列数据库主要有（PIR）和（SWISS-PROT）等，蛋白质结构数据库主要有（PDB）
17生物信息数据库分为（核酸和蛋白质一级结构数据库）（基因组数据库）和（生物大分子三维空间结构数据库）
18生物分子数据库专集每年均在（Nucleic Acids Research）杂志的第一期看出p52
19生物信息学数据常见的数据格式主要有（FASTA）（GenBank）和（SwissProt）等
20生物信息学数据库之间的联系方式有（相似性）和（硬链接）
21真核生物基因内含子一般以（GT）两个基因开始，以（AG）两个基因结束22生物信息学识别基因两种途径为（基因组外显子识别）和（EST策略的基因鉴定）
23人类基因组计划具体任务是建立四张图谱，分别为（遗传图谱）（物理图谱）（序列图谱）和（基因图谱）
24建立人类遗传图谱的关键是要有足够的高度多肽的遗传标记。

第一代遗传标
记为（RFLP），第二代遗传标记为（STR），第三代遗传标记为（SNP）。

25大规模基因组测序的基本策略主要有（逐个克隆法）和（全基因组鸟枪法）26距离矩阵法主要有（UPGMA）和（邻接法）
27基因诊断常用技术方法有（核酸分子杂交技术）（PCR技术）和（生物芯片）（基因测序）
28基因治疗的总体策略主要有（基因矫正）（基因置换）（基因增补）（基因失活）29序列比对相似性分支主要取决（取代矩阵）（空位罚分）
30构建系统树的三种主要方法是（距离矩阵法）（最大简约法）（最大似然法）31构建系统树的常用软件（PHYLIP）（TREE-PUZZLE）（MEGA）（PAUP）(课件上还有PAML和TreeView）。