生物信息学期末复习题
《小学生物教师信息科学》课程期末考察题库(全)

《小学生物教师信息科学》课程期末考察题库(全)一、选择题(每题2分,共计20分)1. 下列哪个软件不是生物信息学中常用的序列分析软件?- A. Clustal Omega- B. BLAST- C. MEGA- D. Microsoft Word2. 在进行生物信息学研究时,下列哪个数据库不是常用的基因组数据库?- A. NCBI GenBank- B. Ensembl- C. UCSC Genome Browser- D. UniProt3. 下列哪个生物信息学技术不是目前用于基因组组装的主要技术?- A. 基于测序的技术- B. 基于克隆的技术- C. 基于比较基因组学的技术- D. 基于转录组学的技术4. 在生物信息学中,哪种类型的数据通常被用于蛋白质结构预测?- A. 序列数据- B. 表达数据- C. 结构数据- D. 代谢数据5. 下列哪个工具不是生物信息学中用于生物标志物发现的主要工具?- A. Gene Ontology Enrichment Analysis- B. t-test- D. Random Forest二、简答题(每题5分,共计30分)1. 请简述生物信息学的定义及其主要研究内容。
2. 请简述基因组组装的主要方法和其优缺点。
3. 请简述生物信息学中的数据类型及其应用场景。
4. 请简述生物标志物的概念及其在生物信息学中的应用。
5. 请简述机器学习在生物信息学中的应用及其主要挑战。
三、案例分析题(共计30分)假设你是一名生物信息学研究员,现在手头有一份某生物样本的转录组数据,请列出你的研究步骤,以及每一步的主要任务和目标。
四、论述题(共计20分)1. 请论述生物信息学在现代生物科学研究中的作用和意义。
2. 请论述生物信息学在医学研究和应用中的前景。
生物信息学复习题

生物信息学复习题生物信息学是一门结合生物学、计算机科学、信息学和数学的交叉学科,它利用计算机技术来处理和分析生物数据。
以下是一些生物信息学复习题,供同学们参考:1. 生物信息学的定义和应用领域- 生物信息学是如何定义的?- 生物信息学在哪些领域有应用?2. 基因组学基础- 什么是基因组学?- 基因组测序的基本原理是什么?3. 序列比对- 序列比对的目的是什么?- 简述局部比对和全局比对的区别。
4. BLAST算法- BLAST算法的原理是什么?- 如何使用BLAST进行序列相似性搜索?5. 基因表达数据分析- 基因表达数据有哪些类型?- 描述基因表达数据的预处理步骤。
6. 蛋白质结构预测- 蛋白质结构预测的重要性是什么?- 简述几种常见的蛋白质结构预测方法。
7. 系统生物学和网络分析- 系统生物学研究的是什么?- 网络分析在系统生物学中的应用。
8. 生物信息学中的数据库- 列举几个常见的生物信息学数据库。
- 解释数据库在生物信息学研究中的作用。
9. 生物信息学中的编程语言- 哪些编程语言在生物信息学中常用?- 简述Python在生物信息学中的应用。
10. 伦理和隐私问题- 在生物信息学研究中可能遇到哪些伦理问题?- 如何保护生物信息数据的隐私?11. 案例研究- 描述一个生物信息学在医学研究中的应用案例。
- 分析该案例中使用的方法和技术。
12. 未来趋势- 预测生物信息学未来的发展趋势。
- 讨论生物信息学如何影响未来的科学研究和医疗保健。
通过这些问题的复习,同学们可以更全面地了解生物信息学的基础概念、关键技术和应用领域。
希望这些复习题能够帮助同学们更好地准备考试和理解生物信息学的重要性。
《生物工程与Bioinformatics基础》2020-2021期末试题及答案

《生物工程与Bioinformatics基础》2020-2021期末试题及答案一、选择题 (每题2分,共20分)1. 以下哪项是生物信息学的核心内容?A. 分子生物学B. 计算机科学C. 统计学D. 生物统计学答案:B. 计算机科学2. 以下哪个数据库是存储基因组序列的数据库?A. PubMedB. GenBankC. PDBD. SwissDock答案:B. GenBank3. 生物信息学中的数据分析方法不包括以下哪项?A. 机器学习B. 聚类分析C. 数据挖掘D. 量子化学计算答案:D. 量子化学计算4. 在生物信息学中,以下哪个工具用于序列比对?A. BLASTB. Clustal OmegaC. FASTAD. R答案:A. BLAST5. 以下哪个是生物信息学中的常用编程语言?A. PythonB. RC. MATLABD. C++答案:A. PythonB. R二、填空题 (每题2分,共20分)1. 生物信息学是运用计算机科学与生物学的交叉领域,旨在开发和应用计算机技术来理解生物数据。
2. 基因组学是研究生物体的全部基因及其表达和调控的学科。
3. 蛋白质组学是研究生物体内所有蛋白质的组成、结构、功能和相互作用的科学。
4. BLAST是一种常用的生物信息学工具,用于核酸或蛋白质序列的相似性搜索。
5. bioinformatics是一个跨学科领域,它结合了计算机科学、信息工程、分子生物学和统计学,以理解生物数据。
三、简答题 (每题10分,共30分)1. 请简要解释生物信息学的应用领域。
生物信息学的应用领域包括基因组学、蛋白质组学、系统生物学、药物设计和疾病建模等。
它被广泛应用于医学、生物学、农业和环境科学等领域,以推动科学发现和技术创新。
2. 请简要介绍生物信息学中的序列比对工具。
生物信息学中的序列比对工具用于比较两个或多个生物序列(如DNA、RNA或蛋白质序列)之间的相似性。
常用的序列比对工具包括BLAST(Basic Local Alignment Search Tool)、FASTA (FAST Allignment Search Tool for Proteins and Nucleotides)和Clustal Omega等。
生物信息学复习题

⽣物信息学复习题⼀、名词解释1.bioinformatics:⽣物信息学,指从事对基因组研究相关的⽣物信息的获取、加⼯、储存、分配、分析和解释的⼀门科学,是⼀门⽣物学,数学和计算机相互交叉融合⽽产⽣的新兴学科。
2.molecular bioinformatics:指综合应⽤信息科学、数学的理论、⽅法和技术,管理、分析和利⽤⽣物分⼦数据的科学。
3.GenBank:是美国全国卫⽣研究所维护的基因序列数据库,汇集并注释了所有公开的核酸序列,与⽇本的DNA数据库DDBJ以及欧洲分⼦实验室核酸序列数据库EMBL⼀起,都是国际核苷酸序列数据库合作的成员。
4.EMBL:EMBL实验室—欧洲分⼦⽣物学实验室,EMBL数据库—是⾮盈利性学术组织EMBL建⽴的综合性数据库,EMBL核酸数据库是欧洲最重要的核酸序列数据库,它定期地与美国的GenBank、⽇本的DDBJ数据库中的数据进⾏交换,并同步更新。
5.DDBJ:⽇本DNA数据库,主要向研究者收集DNA序列信息并赋予其数据存取号,信息来源主要是⽇本的研究机构,也接受其他国家呈递的序列。
6.BLAST:基本局部⽐对搜索⼯具的缩写,是⼀种序列类似性检索⼯具。
BLAST采⽤统计学⼏分系统,同时采⽤局部⽐对算法, BLAST程序能迅速与公开数据库进⾏相似性序列⽐较。
BLAST结果中的得分是对⼀种对相似性的统计说明。
7.BLASTn:是核酸序列到核酸库中的⼀种查询。
库中存在的每条已知序列都将同所查序列作⼀对⼀地核酸序列⽐对。
8.BLASTp:是蛋⽩序列到蛋⽩库中的⼀种查询。
库中存在的每条已知序列将逐⼀地同每条所查序列作⼀对⼀的序列⽐对。
9.Clustsl X:是CLUSTAL多重序列⽐对程序的Windows版本,是⽤来对核酸与蛋⽩序列进⾏多序列⽐较的程序,也可以对来⾃不同物种的功能或结构相似的序列进⾏⽐对和聚类,通过重建系统发⽣树判断亲缘关系,并对序列在⽣物进化过程中的保守性进⾏估计。
生物信息学_复习题及答案(打印)(1)

生物信息学_复习题及答案(打印)(1)一、名词解释:1.生物信息学:研究大量生物数据复杂关系的学科,其特征是多学科交叉,以互联网为媒介,数据库为载体。
利用数学知识建立各种数学模型; 利用计算机为工具对实验所得大量生物学数据进行储存、检索、处理及分析,并以生物学知识对结果进行解释。
2.二级数据库:在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来,是对生物学知识和信息的进一步的整理。
3.FASTA序列格式:是将DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨基酸字符串,大于号(>)表示一个新文件的开始,其他无特殊要求。
4.genbank序列格式:是GenBank 数据库的基本信息单位,是最为广泛的生物信息学序列格式之一。
该文件格式按域划分为4个部分:第一部分包含整个记录的信息(描述符);第二部分包含注释;第三部分是引文区,提供了这个记录的科学依据;第四部分是核苷酸序列本身,以“//”结尾。
5.Entrez检索系统:是NCBI开发的核心检索系统,集成了NCBI 的各种数据库,具有链接的数据库多,使用方便,能够进行交叉索引等特点。
6.BLAST:基本局部比对搜索工具,用于相似性搜索的工具,对需要进行检索的序列与数据库中的每个序列做相似性比较。
P947.查询序列(query sequence):也称被检索序列,用来在数据库中检索并进行相似性比较的序列。
P988.打分矩阵(scoring matrix):在相似性检索中对序列两两比对的质量评估方法。
包括基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如PAM)两类方法。
P299.空位(gap):在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最佳比对结果,这样在其中一序列上产生中断现象,这些中断的位点称为空位。
P2910.空位罚分:空位罚分是为了补偿插入和缺失对序列相似性的影响,序列中的空位的引入不代表真正的进化事件,所以要对其进行罚分,空位罚分的多少直接影响对比的结果。
生物信息学_复习题与答案(打印)

一、名词解释:1.生物信息学:研究大量生物数据复杂关系的学科,其特征是多学科交叉,以互联网为媒介,数据库为载体。
利用数学知识建立各种数学模型 ; 利用计算机为工具对实验所得大量生物学数据进行储存、检索、处理及分析,并以生物学知识对结果进行解释。
2.二级数据库:在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来,是对生物学知识和信息的进一步的整理。
3.FASTA序列格式:是将DNA 或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨基酸字符串,大于号(>)表示一个新文件的开始,其他无特殊要求。
4.genbank 序列格式:是GenBank数据库的基本信息单位,是最为广泛的生物信息学序列格式之一。
该文件格式按域划分为 4 个部分:第一部分包含整个记录的信息(描述符);第二部分包含注释;第三部分是引文区,提供了这个记录的科学依据;第四部分是核苷酸序列本身,以“//”结尾。
5.Entrez 检索系统:是NCBI开发的核心检索系统,集成了NCBI 的各种数据库,具有链接的数据库多,使用方便,能够进行交叉索引等特点。
6.BLAST :基本局部比对搜索工具,用于相似性搜索的工具,对需要进行检索的序列与数据库中的每个序列做相似性比较。
P947.查询序列( query sequence):也称被检索序列,用来在数据库中检索并进行相似性比较的序列。
P988.打分矩阵( scoring matrix ):在相似性检索中对序列两两比对的质量评估方法。
包括基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如PAM )两类方法。
P299.空位( gap):在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最佳比对结果,这样在其中一序列上产生中断现象,这些中断的位点称为空位。
P2910.空位罚分:空位罚分是为了补偿插入和缺失对序列相似性的影响,序列中的空位的引入不代表真正的进化事件,所以要对其进行罚分,空位罚分的多少直接影响对比的结果。
《生物信息学》题集

《生物信息学》题集一、选择题(每题3分,共30分)1.生物信息学的主要研究对象是什么?A. 蛋白质结构B. 基因序列C. 生态系统D. 细胞代谢2.下列哪项技术不是生物信息学中常用的数据库技术?A. BLASTB. GenBankC. PubMedD. SWISS-PROT3.在生物信息学中,进行多序列比对时常用的软件是什么?A. MATLABB. ClustalWC. ExcelD. PowerPoint4.哪种算法常用于基因表达数据的聚类分析?A. K-meansB. DijkstraC. A*D. Floyd5.生物信息学中,下列哪项不是常用的序列分析技术?A. PCRB. 测序C. 质谱分析D. 芯片技术6.下列哪项不是生物信息学在医学领域的应用?A. 疾病诊断B. 药物设计C. 天气预报D. 个性化医疗7.下列哪项技术常用于生物大分子的结构预测?A. NMRB. X射线衍射C. 同源建模D. 质谱分析8.在生物信息学中,下列哪项不是基因注释的内容?A. 基因功能B. 基因表达水平C. 基因在染色体上的位置D. 基因的长度9.下列哪项技术不是高通量测序技术?A. Sanger测序B. Illumina测序C. 454测序D. SOLiD测序10.下列哪项不是生物信息学在农业领域的应用?A. 作物育种B. 病虫害防治C. 土壤成分分析D. 农产品品质改良二、填空题(每题2分,共20分)1.生物信息学是一门交叉学科,它主要涉及______、计算机科学和数学等领域。
2.在生物信息学中,______技术常用于基因序列的相似性搜索。
3.生物信息学在药物研发中的主要应用包括______和药物靶点的预测。
4.在基因表达数据分析中,______是一种常用的数据标准化方法。
5.生物信息学中,______技术常用于蛋白质结构的预测和分析。
6.在生物信息学数据库中,GenBank主要存储的是______数据。
生物信息学期末期末复习

■一、选择题:1.以下哪一个是mRNA条目序列号:A.J01536■.NM_15392C.NP_52280D.AAB1345062.确定某个基因在哪些组织中表达的最直接获取相关信息方式是:■.UnigeneB.EntrezC.LocusLinkD.PCR3.一个基因可能对应两个Unigene簇吗?■可能B.不可能4.下面哪种数据库源于mRNA信息:■dbESTB.PDBC.OMIMD.HTGS5.下面哪个数据库面向人类疾病构建:A.ESTB.PDB■.OMIMD.HTGS6.Refseq和GenBank有什么区另1J:A.Refseq包括了全世界各个实验室和测序项目提交的DNA序列B.GenBank提供的是非冗余序列■.Refseq源于GenBank,提供非冗余序列信息D.GenBank源于Refseq7.如果你需要查询文献信息,下列哪个数据库是你最佳选择:A.OMIMB.Entrez■PubMedD.PROSITE8.比较从Entrez和ExPASy中提取有关蛋白质序列信息的方法,下列哪种说法正确:A.因为GenBank的数据比EMBL更多,Entrez给出的搜索结果将更多B.搜索结果很可能一样,因为GenBank和EMBL的序列数据实际一样■搜索结果应该相当,但是ExPASy中的SwissProt记录的输出格式不同9.天冬酰胺、色氨酸和酪氨酸的单字母代码分别对应于:■N/W/YB.Q/W/YC.F/W/YD.Q/N/W10.直系同源定义为:■不同物种中具有共同祖先的同源序列B.具有较小的氨基酸一致性但是有较大的结构相似性的同源序列C.同一物种中由基因复制产生的同源序列D.同一物种中具有相似的并且通常是冗余的功能的同源序列11.下列那个氨基酸最不容易突变:A.丙氨酸B.谷氨酰胺C.甲硫氨酸■半胱氨酸12.PAM250矩阵定义的进化距离为两同源序列在给定的时间有多少百分比的氨基酸发生改变:A.1%B.20%■.80%D.250%13.下列哪个句子最好的描述了两个序列全局比对和局部比对的不同:A.全局比对通常用于比对DNA序列,而局部比对通常用于比对蛋白质序列B.全局比对允许间隙,而局部比对不允许C.全局比对寻找全局最大化,而局部比对寻找局部最大化■全局比对比对整体序列,而局部比对寻找最佳匹配子序列14.假设你有两条远源相关蛋白质序列。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1)生物信息学研究意义?
答案:
(1)认识生物本质
了解生物分子信息的组织和结构,破译基因组信息,阐明生物信息之间的关系。
(3)现代生命科学的里程碑。
3)什么是序列比对?及其基本分类?
答案:序列比对(Sequence Alignment)是通过在序列中搜索一系列单个性状或性状模式来比较2个(双序列比对)或更多(多重序列比对)序列的方法。
序列比对的分类:A、双序列比对:两条序列的比对。B、多序列比对:三条或以上序列的比对
7)敏感性与特异性:昆虫对某些低剂量的化学物质或其他物理因子能迅速地引起反应的特性。特异性是指成对、成组对象相互之间的必然对应选择关系。
8)序列相似性比较与序列同源性分析:
9)数据库搜索和数据库查询:数据库搜索在生物信息学中有特定的含义,它是指通过特定的序列相似性比对算法,找出核酸或蛋白质序列数据库中与检测序列具有一定程度相似性的序列。而所谓数据库查询,是指对序列、结构以及各种二次数据库中的注释信息进行关键词匹配查找。数据库查询有时也称为数据库检索,它和互联网上通过搜索引擎查找需要的信息是一个概念。
2、人类基因组计划:是由美国科学家于1985年率先提出,于1990年正式启动的。美国、英国、法兰西共和国、德意志联邦共和国、日本和我国科学家共同参与了这一预算达30亿美元的人类基因组计划。
3、基因芯片:又叫DNA芯片,是一种高密度的寡聚核苷酸阵列。它采用原位组合合成化学和微电子芯片的光蚀刻技术等方法,将大量特定序列的DNA片段直接固定在玻璃或硅衬底上,从而构成存储有大量信息的DNA芯片。
12)生物信息学在基因芯片中的应用有哪些?答案:(1)确定芯片检测目标。(2)芯片设计。(3)实验数据管理与分析。
13)生物信息学分析的数据对象主要有哪几种?这些数据之间存在着什么关系?答案:其研究重点主要落实在核酸和蛋白质两个方面,包括它们的序列、结构和功能。生物信息学以基因组DNA序列信息分析作为出发点,破译遗传语言,认识遗传信息的组织规律,辨别隐藏在DNA序列中的基因,掌握基因调控信息,对蛋白质空间结构进行模拟和预测,依据蛋白质结构和功能的关系进行药物分子设计。
16)为什么要进行序列片段组装?在进行序列片段组装时会遇到哪些问题?答案:大规模基因组测序得到待测序列的一系列序列片段,这些序列片段覆盖待测序列,序列片段之间也存在着相互覆盖或者重叠。遇到的问题:碱基标识错误;不知道片段的方向;存在重复区域;缺少覆盖。
17)序列分析的任务和目的分别是什么?答案:任务(1)发现序列之间的相似性;(2)辨别序列之间的差异。目的:(1)相似序列:相似的结构,相似的功能(2)判别序列之间的同源性(3)推测序列之间的进化关系
15)在基因组序列分析方面,科学家关注哪些信息?答案:就人类基因组而言,编码区域在人类基因组所占的比例不超过3%。其余97%是非编码序列。对于非编码序列,人们了解得比较少,尚不清楚其含义或功能。然而,非编码区域对于生命活动具有重要的意义。这部分序列主要包括内含子、简单重复序列、移动元件(mobile element)及其遗留物、伪基因(pseudo gene)等。
(2)改变生物学的研究方式
改变传统研究方式,引进现代信息学方法
(3)在医学上的重要意义
为疾病的诊断和治疗提供依据,为设计新药提供依据
2)DNA双螺旋结构模型的意义
(1)为合理解释遗传物质的各种功能、解释生物的遗传和变异、揭示自然界色彩纷纭的生命现象奠定了理论基础;
(2)揭示了生命世界多样性和生命本质的一致性的辨正统一;
8)为什么要构建生物分子数据库。答案:(1)生物分子数据高速增长(2)分子生物学及相关领域研究人员迅速获得最新实验数据。
9)预测基因的一般步骤是什么?答案:⑴获取DNA目标序列⑵查找ORF并将目标序列翻译成蛋白质序列,利用相应工具查找ORF并将DNA序列翻译成蛋白质序列⑶在数据库中进行序列搜索,利用BLAST进行ORF核苷酸序列和ORF翻译的蛋白质序列搜索⑷进行目标序列与搜索得到的相似序列的全局对比⑸查找基因家族进行多序列比对,获得比对区段的基因家族信息⑹查找目标序列中的特定模序,分别在Prosite、BLOCK、Motif数据库中进行profile、模块(block)、模序(motif)检索⑺预测目标序列蛋白质结构,利用PredictProtein(EMBL)、NNPREDICT等预测目标序列的蛋白质二级结构。
4)生物信息学数据库的要求和基本特征是什么?答案:
5)生物信息学的基本方法有哪些?答案略
6)生物信息学的目标和任务?答案:收集和管理生物分子数据;数据分析和挖掘;开发分析工具和实用软件:生物分子序列比较工具、基因识别工具、生物分子结构预测工具、基因表达数据分析工具。
7)生物信息学主要研究内容。答案(1)生物分子数据的收集与管理;(2)数据库搜索及序列比较;(3)基因组序列分析;(4)基因表达数据的分析与处理;(5)蛋白质结构预测。
论述题
1)简述人类基因组计划与生物信息nome Project, HGP)是美国在1990年提出实施的一项伟大的科学计划,与阿波罗登月计划、曼哈顿原子弹计划同称为人类自然科学史上的三大计划。自实施以来,该计划在世界各国引起了很大反响。在人类基因组计划中,人们准备用15年时间,投入30亿美元,完成人类全部24条染色体中3×109个碱基对(bp,base pair)的序列测定,其主要任务包括作图(遗传图谱、物理图谱的建立及转录图谱的绘制)、测序和基因识别,还包括模式生物(如大肠杆菌、酵母、线虫、小鼠等)基因组的作图和测序,以及信息系统的建立。
5)CDS与cDNA:CDS是内容分发服务的缩写,内容分发服务是互联网的一项新技术。与RNA链互补的单链DNA,以其RNA为模板,在适当引物的存在下,由RNA与DNA进行一定条件下合成的,就是cDNA。
6)直系同源与旁系同源:直系同源指的是不同物种之间的同源性,例如蛋白质的同源性,DNA序列的同源性。旁系同源是那些在一定物种中的来源于基因复制的蛋白,可能会进化出新的与原来有关的功能。用来描述在同一物种内由于基因复制而分离的同源基因。
生物信息学复习题
名词解释
1、生物信息学 :广义指生命科学与数学、计算机科学和信息科学等交汇融合所形成的一门交叉学科。它应用先进的数据管理技术、数学分析模型和计算软件对各种生物信息(特别是分子生物学信息)进行提取、储存、处理和分析,旨在掌握复杂生命现象的形成于演化规律。狭义专指应用信息技术储存和分析分子生物学数据,尤其是基因组序列产生的分子序列机器相关数据,也被称为分子生物信息学。
随着人类基因组计划的提出和实施,实验数据和可利用信息急剧增加,人类基因组计划提供了以往不可想象的巨量的生物学信息资源。基因组信息的收集、储存、分发、分析显得越来越紧迫和重要,信息的管理和分析成为人类基因组计划实施过程中的一项重要工作,人类基因组计划向信息学提出了巨大的挑战。值得庆幸的是,人类基因组计划一开始就与计算机技术、信息高速公路同步发展,信息技术为生物信息学的发展提供了非常好的条件,为生物信息学的研究和应用提供了非常好的支撑。生物信息学与人类基因组计划紧密结合,互相渗透,生物信息学成为基因组计划不可分割的一部分。事实证明,人类基因组计划在生物信息学的支持下,前进步伐大大加快,已经提前完成计划,功能基因组研究也已经全面展开。而人类基因组计划反过来又大大促进了生物信息学的发展,HGP丰富了生物信息学的研究内容,促进生物信息学新思想、新方法的产生,生物信息学在最近10年迅速发展的历程证明了这一点。
2)基因与基因组:基因是指具有遗传效应的DNA片段。而基因组指的是单倍体细胞中的全套染色体,或是单倍体细胞中的全部基因。
3)相似性与同源性:相似性是指不同染色体之间基因序列的相似或相异程度。同源性是指两个核酸分子的核苷酸序列或两个蛋白质分子的氨基酸序列间的相似程度。
4)Blastn与Tblastn:blastn方法是用检测序列核酸搜索核酸序列数据库,它适合寻找分值较高的匹配,不适合远源关系。而tblastn是用检测序列蛋白质搜索由核酸序列数据库按6条链翻译成的蛋白质序列数据库。它适合寻找数据库中尚未标注的编码区。
18)PCR引物设计有哪些原则?答案:⑴产物不能形成二级结构;⑵引物长度一般在15~30个碱基之间;⑶G+C含量在40%~60%之间;⑷碱基要随机分布;⑸引物自身不能有连续4个碱基互补;⑹引物之间不能有连续4个碱基的互补;⑺引物 端可以修饰;⑻引物 不可修饰;⑼引物 端要避开密码子的第三位。
19)生物分子数据类型有哪些?答案:DNA序列数据、蛋白质序列数据、生物分子结构数据、生物分子功能数据、
14)基因芯片对于生物分子信息检测的作用和意义?答案:在生命科学领域中,基因芯片为分子生物学、生物医学等研究提供了强有力的手段。利用基因芯片技术,可研究生命体系中不同部位、不同生长发育阶段的基因表达,比较不同个体或物种之间的基因表达,比较正常和疾病状态下基因及其表达的差异。基因芯片技术也有助于研究不同层次的多基因协同作用的生命过程,发现新的基因功能,研究生物体在进化、发育、遗传过程中的规律。
10)生物信息学所用的方法和技术。答案(1)数学统计方法;(2)动态规划方法;(3)机器学习与模式识别技术;(4)数据库技术及数据挖掘;(5)人工神经网络技术;(6)专家系统;(7)分子模型化技术;(8)量子力学和分子力学计算;(9)生物分子的计算机模拟;(10)因特网(Internet)技术。
11)国际上权威的核酸序列数据库有那些?答案(1)欧洲分子生物学实验室的EMBL。(2)美国生物技术信息中心的GenBank。(3)日本遗传研究所的DDBJ。
简答题
1)生物信息学数据库的组成包括哪些部分?数据库有哪些类型?答案:生物信息学数据库的组成包括一级数据库和二级数据库。数据库的类型包括核算和蛋白质一级结构序列数据库、基因组数据库、生物大分子三维空间结构数据库、以上述3类数据库和文献资料为基础构建的二次数据库。