生物信息学考试试卷终审稿)
生物信息考试题及答案

生物信息考试题及答案生物信息学是一门结合生物学、计算机科学、信息技术和数学的交叉学科,它利用计算机技术来分析和解释生物数据。
以下是一份生物信息学考试题及答案的示例。
生物信息学考试题一、选择题(每题2分,共20分)1. 生物信息学中,用于存储DNA序列的文件格式是:A. FASTAB. JPEGC. MP3D. DOCX2. 以下哪项不是生物信息学分析的基本步骤?A. 数据收集B. 数据预处理C. 数据解释D. 数据存储3. 在蛋白质序列分析中,BLAST工具用于:A. 序列比对B. 序列组装C. 序列克隆D. 序列合成4. 以下哪个数据库不是用于存储基因表达数据的?A. NCBIB. GEOC. PDBD. ArrayExpress5. 以下哪个算法不是用于基因预测的?A. GeneMarkB. BLASTC. GlimmerD. Fgenesh二、简答题(每题10分,共30分)6. 简述生物信息学在现代生物学研究中的重要性。
7. 解释什么是基因组学,并说明其在医学研究中的应用。
8. 描述序列比对的基本原理及其在生物信息学中的作用。
三、计算题(每题15分,共30分)9. 假设你有一个DNA序列,其组成为:ATCGTA。
请计算其互补序列。
10. 给定两个蛋白质序列,序列A:A-B-C-D-E,序列B:A-C-E-B-D。
请使用Needleman-Wunsch算法计算它们的全局比对得分。
四、论述题(每题20分,共20分)11. 论述生物信息学在新药开发中的作用及其面临的挑战。
答案一、选择题1. A2. C3. A4. C5. B二、简答题6. 生物信息学在现代生物学研究中的重要性体现在它能够处理和分析大量的生物数据,如基因组序列、蛋白质结构等,帮助科学家快速发现生物现象的规律,推动生物学的发展。
7. 基因组学是研究生物基因组的结构、功能和演化的科学。
在医学研究中,基因组学可以帮助我们了解疾病的遗传基础,为个性化医疗提供理论基础。
《生物信息学》试卷(A)

武汉大学2007—2008学年度高校教师研修班《生物信息学》试卷(A)及答案一、翻译下列名词并解释。
(每题5分,共25分)1. EST2. ORF3. BLAST4. ANN5. HGP二、填空(每空2分,共20分)1、蛋白质空间结构测定常用的方法有和二维核磁共振技术。
2、BLAST对序列格式的要求是常见的格式。
3、系统发育树由一系列和组成,其中每个代表一个分类单元,而代表物种之间的进化关系。
、、等。
6. 目前已经是最广泛使用的系统发育程序。
三、解释说明: 请按要求对下列GenBank文件作解释说明。
(每小题4分,共20分)1、LOCUS行中的第3项mRNA linear表示,这里是。
2、DEFINITION行在GenBank记录中用以3 ACCESSION 是,是从数据库中检索一个记录的主要。
4. FEATURES后面部分是,直接表达了记录的生物背景知识,5 CDS 30…533 表示。
四、问答。
(共35分)1简述国际上有哪几个著名的核酸序列数据库?(10分)2何谓序列比对的相似性和同源性,它们之间有何联系和区别(10分)3试述发现基因的一般过程(15分)《生物信息学》试卷(A)答案一、翻译下列名词并解释。
(每题5分,共25分)1. EST expressed sequence tag 表达序列标签2. ORF Open Reading Frame, 开放阅读框3. BLAST Basic Local Alignment Search T ool 局部相似性基本查询工具4. ANN Artificial Neural Network, 人工神经网络5. HGP Human genome project 人类基因组计划二、填空(每空2分,共20分)1、蛋白质空间结构测定常用的方法有X射线晶体衍射法和二维核磁共振技术。
2、BLAST对序列格式的要求是常见的FASTA格式。
3、系统发育树由一系列节点和分支组成,其中每个节点代表一个分类单元,而节点之间的连线代表物种之间的进化关系。
生物信息技术考试试题

生物信息技术考试试题一、选择题(每题 3 分,共 30 分)1、以下哪个不是生物信息学的主要研究内容?()A 基因组学B 蛋白质组学C 细胞学D 代谢组学2、生物信息学中用于序列比对的常用算法是()A 动态规划算法B 贪心算法C 分治算法D 回溯算法3、在基因表达数据分析中,常用的标准化方法是()A RPKMB TPMC FPKMD 以上都是4、以下哪种数据库主要用于存储蛋白质结构信息?()A GenBankB PDBC UniProtD Ensembl5、进行系统发育分析时,常用的构建进化树的方法是()A 邻接法B 最大简约法C 最大似然法D 以上都是6、以下哪个软件不是用于基因序列分析的?()A Primer PremierB SPSSC DNAStarD Vector NTI7、生物信息学中,预测蛋白质二级结构的方法不包括()A 基于同源建模B 基于机器学习C 基于物理化学原理D 基于经验规则8、在生物信息学中,BLAST 程序主要用于()A 序列比对B 进化分析C 基因预测D 蛋白质结构预测9、以下哪种编程语言在生物信息学中应用较为广泛?()A JavaB PythonC C++D Fortran10、用于分析基因芯片数据的软件包是()A R 语言中的 BioconductorB MATLABC StataD SAS二、填空题(每题 3 分,共 30 分)1、生物信息学中的三大核心数据库是_____、_____、_____。
2、基因序列的相似性搜索常用的工具是_____。
3、蛋白质的一级结构是指_____。
4、常见的基因注释数据库有_____、_____等。
5、系统发育树的构建基于_____的原理。
6、生物信息学中常用的数据格式有_____、_____等。
7、预测蛋白质三级结构的方法主要有_____、_____。
8、基因表达数据的差异分析常用的方法有_____、_____。
9、用于分析高通量测序数据的软件有_____、_____。
生物信息学试题及答案

广东海洋大学 2013—— 2014 学年第 一 学期《生物信息学 》课程试题答案课程号: 13432210 √ 考试 √ A 卷 √ 闭卷 □ 考查□ B 卷□ 开卷一、 简答题(一) 生物信息学及主要内容?(3)生物信息学是生物和信息技术的结合,这一学科包括了用来管理、分析和操作大量生物数据集的任何计算工具和方法。
(二) 生物信息学主要由哪三个组成部分?(6)1、 建立可以存放和管理大量生物信息学数据集的数据库;2、 开发确定大数据集中各成员关系的算法和统计方法;3、 使用这些工具来分析和解释不同类型的生物数据,包括DNA ,RNA 和蛋白质序列、蛋白质结构、基因表达以及生化途径。
(三) 存储在GenBank 中DNA 序列的类型?(6) 1、基因组DNA 2、cDNA 3、重组DNA(四) 解释下图说明基因组测序的策略?(6)1、霰弹测序法(shot gun sequencing):随机打碎大DNA 分子,通过很多测序反应来覆盖整个分子,完整的序列通过使用计算机搜索重叠区来重新拼接。
2、克隆重叠群(clone contig)的方法中,DNA 片段用推理的方法亚克隆,并且进行系统的测序直到整个序列完成。
(五) 按制备方式分DNA 芯片的主要类型?(6)1、 原位合成芯片:采用显微光蚀刻等技术在特定部位原位合成寡核苷酸而制备的芯片。
探针较短;2、 DNA 微集阵列:将预先制备的DNA 片段以显微打印的方式有序地固化于支持物表面而制成的芯班级:姓名:学号:试题共页加白纸 2张密封线GDOU-B-11-302片。
探针的来源较灵活。
(六) 解释下图说明用芯片如何测定不同组织中基因表达的差异?(8)1、将要检测的基因用芯片点样仪芯片上2、提取待测样品和对照样品的RNA,分别用用Cy3标定一种RNA,而用Cy5标定另一种RNA。
Cy3发红色荧光,Cy5发绿色荧光。
3、用不同的激发光照射,测定两种样品中DNA的表达量。
内蒙古科技大学2009-2010学年第一学期《生物信息学》考试试题A卷

第 1 页 共 1 页内蒙古科技大学2009/2010学年第一学期《生物信息学》考试试题课程号:66149304 考试方式:开卷 使用专业、年级:生技06,生工07 任课教师:蔡禄 考试时间:2009年1月8日备 注:A 卷一、名词解释(共5题,每题3分,共15分)1. 序列比对2. 基序(motif )3. 表达序列标签(EST )4. 电子克隆5.开放阅读框(ORF ) 二、填空题(共6题,每空1分,共20分)1. 目前国际上最常用的核酸序列数据库有 、 和 。
2. 目前国际上最常用的蛋白序列数据库有 、 和 。
3. 列举至少五种NCBI 的服务项目 、 、 、 和 等。
4. 蛋白质得分矩阵类型有等价矩阵 、 、 、 和 等。
5. 预测蛋白质-蛋白质相互作用的理论方法主要有 、 、 和 等。
6. 对位排列主要有局部比对和 。
三、单项选择题(共5题,每题2分,共10分) 1. 如果我们试图做蛋白质亚细胞定位分析,应使用A. NDB 数据库B. SWISS-PROT 数据库C. GenBank 数据库D. PDB 数据库 2. Profiles 数据库是A. 蛋白质序列数据库B. 核酸序列数据库C. 蛋白质二级数据库D. 蛋白质结构数据库 3. 在蛋白质序列数据库中比较查询蛋白质序列,应使用学生班级________________学生学号:□□□□□□□□□□□□学生姓名:________________………………装订线………装订线………装订线…………试卷须与答题纸一并交监考教师…………装订线………装订线………装订线………………A. BLASTnB. BLASTpC. tBLASTnD. BLASTx 4. 构建系统发生树,应使用:A. BLASTB. FASTAC. UPGMAD. Entrez 5. 美国国家生物技术中心简称:A. SIBB. EBIC. NCBID. MIPS四、问答题(共3题,每题5分,共15分)1. 解释正则表达式C-Y-X2-[DG]-G-X-[ST]的含义2. 构建蛋白质二级数据库的主要方法有哪些?3. 总结基因融合法预测蛋白质相互作用的基本原理。
生物信息学考试试题

生物信息学考试试题一、选择题(每题 3 分,共 30 分)1、以下哪种不是常见的生物信息学数据库?()A GenBankB SWISSPROTC PubMedD Baidu2、在 DNA 序列分析中,以下哪个不是用于序列比对的算法?()A NeedlemanWunsch 算法B SmithWaterman 算法C BLAST 算法D Fourier 变换算法3、蛋白质结构预测的方法不包括()A 同源建模B 从头预测C 折叠识别D 随机模拟4、以下哪种不是基因表达数据分析的常用方法?()A 聚类分析B 主成分分析C 判别分析D 回归分析5、生物信息学中,用于预测蛋白质功能的方法有()A 基于序列相似性B 基于结构相似性C 基于基因共表达D 以上都是6、在基因组学中,以下哪个不是测序技术?()A Sanger 测序B 二代测序C 三代测序D 四代测序7、系统发生树构建的方法不包括()A 距离法B 最大简约法C 最大似然法D 最小二乘法8、以下哪种不是生物信息学中常用的编程语言?()A PythonB JavaC C++D Visual Basic9、以下哪个不是生物信息学在医学领域的应用?()A 疾病诊断B 药物研发C 医疗美容D 个性化医疗10、生物信息学中,处理大规模数据常用的工具是()A ExcelB R 语言C SPSSD Word二、填空题(每题 2 分,共 20 分)1、生物信息学是一门融合了生物学、计算机科学和()的交叉学科。
2、常见的核酸序列格式有 FASTA 和()。
3、蛋白质的二级结构包括α螺旋、β折叠和()等。
4、基因芯片技术是一种()分析技术。
5、序列比对的目的是寻找两个或多个序列之间的()。
6、人类基因组计划的主要目标是测定人类基因组的()序列。
7、生物信息学中的隐马尔可夫模型主要用于()。
8、系统发生分析中,外群的作用是()。
9、蛋白质相互作用网络分析有助于理解()。
10、生物信息学数据库可以分为一级数据库和()数据库。
《生物信息学》试卷(B)

武汉大学2007—2008学年度高校教师研修班《生物信息学》试卷(B)及答案一、翻译下列名词并解释。
(每题5分,共25分)1. HGP2. SRS3. Markov Chain4. ANN5. CDS二、填空(每空2分,共20分)1、生物信息学主要研究的两种信息载体是和。
2、目前国际上主要的核酸数据库是由建立和维护的、由维护的,和日本遗传研究所建立和维护的。
每个机构负责收集来自不同地理分布的数据, 3 个数据库所有信息并向世界开放,3、在进行序列两两比对时,有两方面问题直接影响相似性分值:和。
三、解释说明:请按要求对下列GenBank文件作解释说明。
(每小题4分,共20分)1、LOCUS行中的第3项mRNA linear表示,这里是。
2、DEFINITION行在GenBank记录中用以3 ACCESSION 是,是从数据库中检索一个记录的主要。
4. FEATURES后面部分是,直接表达了记录的生物背景知识,5 CDS 30…533 表示。
四、问答。
(共35分)1、DNA测序有哪些方法?其基本原理是什么?(10分)2、简述蛋白质结构预测的基本思想和方法。
(10分)3、试述人类基因组计划与生物信息学的关系。
(15分)《生物信息学》试卷(B)答案一、翻译下列名词并解释。
(每题5分,共25分)1. HGP Human genome project人类基因组计划2. SRS Sequence Retrieval System 序列检索系统3. 马尔科夫链(Markov Chain),对于生物分子序列分析,马尔科夫链是一个很好的数学统计模型,因为马尔科夫链本身就是相继发生事件的序列,其特征是对于事件序列中的任何一个事件都有一个发生概率,而这个概率依赖于该事件之前的若干个事件。
4. ANN Artificial Neural Network, 人工神经网络5. CDS指的是编码序列,从起始密码子到终止密码子二、填空(每空2分,共20分)1、生物信息学主要研究的两种信息载体是DNA分子和蛋白质分子2、目前国际上主要的核酸数据库是由美国国立生物技术信息中心建立和维护的Genbank库、由欧洲生物信息学研究所(EBI)维护的EMBL-Bank,和日本遗传研究所建立和维护的日本DNA 数据仓库(DDBJ)。
生物信息考试题及答案

生物信息考试题及答案一、选择题(每题2分,共20分)1. 基因组学研究的核心是()。
A. 基因克隆B. 基因表达C. 基因组序列D. 基因功能答案:C2. 下列哪项不是生物信息学的主要研究内容?()A. 基因组序列分析B. 蛋白质结构预测C. 植物分类学D. 基因表达分析答案:C3. 转录组学研究的是()。
A. 基因组中的所有基因B. 特定细胞或组织中的所有RNA分子C. 特定细胞或组织中的所有蛋白质分子D. 特定细胞或组织中的所有DNA分子答案:B4. 下列哪个数据库主要用于存储蛋白质序列信息?()A. GenBankB. PDBC. Swiss-ProtD. EMBL答案:C5. 以下哪个不是生物信息学中常用的序列比对工具?()A. BLASTB. FASTAC. ClustalWD. PCR答案:D6. 以下哪个是用于蛋白质三维结构预测的软件?()A. Swiss-ProtB. PDBC. MODELLERD. GenBank答案:C7. 以下哪个是用于基因表达分析的高通量技术?()A. Sanger测序B. 微阵列C. PCRD. 质谱分析答案:B8. 下列哪个是用于基因组关联研究的统计方法?()A. 聚类分析B. 系统发育分析C. 连锁不平衡分析D. 多态性分析答案:C9. 以下哪个是用于蛋白质-蛋白质相互作用网络分析的工具?()A. STRINGB. BLASTC. ClustalWD. GenBank答案:A10. 下列哪个是用于生物信息学数据可视化的工具?()A. R语言B. PythonC. CytoscapeD. Perl答案:C二、填空题(每题2分,共20分)1. 生物信息学是一门结合了__________、__________和__________的交叉学科。
答案:生物学、计算机科学、信息技术2. 基因组学中的“组”指的是__________的集合。
答案:基因3. 转录组学研究的RNA分子包括__________、__________和__________。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生物信息学考试试卷文稿归稿存档编号:[KKUY-KKIO69-OTM243-OLUI129-G00I-FDQS58-
一、名词解释(每小题4分,共20分)
1、生物信息学
广义:生命科学中的信息科学。
生物体系和过程中信息的存贮、传递和表达;细胞、组织、器官的生理、病理、药理过程的中各种生物信息。
狭义:生物分子信息的获取、存贮、分析和利用。
2、人类基因组计划
人类基因组计划准备用15年时间,投入30亿美元,完成人类全部24条染色体的3×109脱氧核苷酸对(bp)的序列测定,主要任务包括作图(遗传图谱、物理图谱的建立及转录图谱的绘制)、测序和基因识别。
其中还包括模式生物(如大肠杆菌、酵母、线虫、小鼠等)基因组的作图和测序,以及信息系统的建立。
作图和测序是基本的任务,在此基础上解读和破译生物体生老病死以及和疾病相关的遗传信息。
3、蛋白质的一级结构
蛋白质的一级结构是指多肽链中氨基酸的序列
4、基因
基因--有遗传效应的DNA片断,是控制生物性状的基本遗传单位。
5、中心法则
是指遗传信息从传递给,再从RNA传递给,即完成遗传信息的转录和翻译的过程。
也可以从DNA传递给DNA,即完成DNA的复制过程。
这是所有有细胞结构的生物所遵循的法则。
6 、DNA序列比较
序列比较的根本任务是:(1)发现序列之间的相似性;(2)辨别序列之间的差异
目的:
相似序列相似的结构,相似的功能
判别序列之间的同源性
推测序列之间的进化关系
7、一级数据库
数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释
8、基因识别
基因识别,是生物信息学的一个重要分支,使用生物学实验或计算机等手段识别DNA 序列上的具有生物学特征的片段。
基因识别的对象主要是蛋白质编码基因,也包括其他具有一定生物学功能的因子,如RNA基因和调控因子。
9、系统发生学
系统发生学(phylogenetics)——研究物种之间的进化关系。
10、基因芯片
基因芯片(gene chip),又称DNA微阵列(microarray),是由大量cDNA或寡核苷酸探针密集排列所形成的探针阵列,其工作的基本原理是通过杂交检测信息。
二、综合题(共60分)
1 生物信息学分析的数据对象主要有哪几种这些数据之间存在着什么关系
其研究重点主要落实在核酸和蛋白质两个方面,包括它们的序列、结构和功能。
生物信息学以基因组DNA序列信息分析作为出发点,破译遗传语言,认识遗传信息的组织规律,辨
别隐藏在DNA序列中的基因,掌握基因调控信息,对蛋白质空间结构进行模拟和预测,依据蛋白质结构和功能的关系进行药物分子设计。
2 生物信息学的主要研究任务是什么目前生物信息学的主要研究内容是什么
A.收集和管理生物分子数据;数据分析和挖掘;开发分析工具和实用软件:生物分子序列比较工具、基因识别工具、生物分子结构预测工具、基因表达数据分析工具。
B.(1)生物分子数据的收集与管理;(2)数据库搜索及序列比较;(3)基因组序列分析;
(4)基因表达数据的分析与处理;(5)蛋白质结构预测。
5 在基因组序列分析方面,科学家关注哪些信息?
就人类基因组而言,编码区域在人类基因组所占的比例不超过3%。
其余97%是非编码序列。
对于非编码序列,人们了解得比较少,尚不清楚其含义或功能。
然而,非编码区域对于生命活动具有重要的意义。
这部分序列主要包括内含子、简单重复序列、移动元件(mobile element)及其遗留物、伪基因(pseudo gene)等。
6掌握蛋白质结构有什么意义为什么要进行蛋白质结构预测
(1)研究蛋白质的结构意义重大,分析蛋白质结构、功能及其关系是蛋白质组计划中的一个重要组成部分。
研究蛋白质结构,有助于了解蛋白质的作用,了解蛋白质如何行使其生物功能,认识蛋白质与蛋白质(或其它分子)之间的相互作用,这无论是对于生物学还是对于医学和药学,都是非常重要的。
(2)对于未知功能或者新发现的蛋白质分子,通过结构分析,可以进行功能注释,指导设计进行功能确认的生物学实验。
通过分析蛋白质的结构,确认功能单位或者结构
域,可以为遗传操作提供目标,为设计新的蛋白质或改造已有蛋白质提供可靠的依据,同时为新的药物分子设计提供合理的靶分子结构。
简述分子生物学中的“中心法则”。
“中心法则”的核心是什么
(1)DNA是遗传物质,是携带遗传信息的载体。
信息从基因的核苷酸序列中被提取出,用来指导蛋白质合成的过程对地球上的所有生物都是相同的,分子生物学家称之为中心法则(central dogma)。
(2)“中心法则”的核心:DNA分子中的遗传信息转录(transcription)到RNA分子中(即RNA聚合酶以DNA为模板合成RNA),再由RNA翻译(translation)生成体内各种蛋白质,行使特定的生物功能。
若一条 mRNA 序列 5 '- AUG GGA UGU CGC CGA AAC - 3 '被核糖体翻译,将形成怎样的氨基酸的序列若将第一个核苷酸删掉而将另一个 A 加到 mRNA 序列的 3 ' - 端,又将形成怎样的氨基酸序列
(1) 画出下面两条序列的简单点阵图。
将第一条序列放在 x 坐标轴上,将第二条序列放在 y 坐标轴上。
TGAACTCCCTCAGATATTA
CGAACCCTCACATATTAGCG
(11) 为什么要进行序列片段组装在进行序列片段组装时会遇到哪些问题
大规模基因组测序得到待测序列的一系列序列片段,这些序列片段覆盖待测序列,序列片段之间也存在着相互覆盖或者重叠。
遇到的问题:碱基标识错误;不知道片段的方向;存在重复区域;缺少覆盖。
(1) 国际上有哪几个着名的核酸序列数据库
(1)欧洲分子生物学实验室的EMBL 。
(2)美国生物技术信息中心的GenBank。
(3)日本遗传研究所的DDBJ
(3) 具有简并性的密码子一共有多少个什么是基因的密码子使用偏性造成密码子使用偏性可能的原因有哪些
(9) 假设给你一条蛋白质序列,要求预测该蛋白质的结构。
你计划采用什么策略来预测该蛋白质的结构
画出四个分类单元 A 、 B 、 C 和 D 所有可能的无根树和有根树。
三、论述题(两个小题,共20分)
1、简述人类基因组计划与生物信息学之间的相互促进关系。
人类基因组计划(Human Genome Project, HGP)是美国在1990年提出实施的一项伟大的科学计划,与阿波罗登月计划、曼哈顿原子弹计划同称为人类自然科学史上的三大计划。
自实施以来,该计划在世界各国引起了很大反响。
在人类基因组计划中,人们准备用15年时间,投入30亿美元,完成人类全部24条染色体中3×109个碱基对(bp,base pair)的序列测定,其主要任务包括作图(遗传图谱、物理图谱的建立及转录图谱的绘制)、测序和基因识别,还包括模式生物(如大肠杆菌、酵母、线虫、小鼠等)基因组的作图和测序,以及信息系统的建立。
随着人类基因组计划的提出和实施,实验数据和可利用信息急剧增加,人类基因组计划提供了以往不可想象的巨量的生物学信息资源。
基因组信息的收集、储存、分发、分析显得越来越紧迫和重要,信息的管理和分析成为人类基因组计划实施过程中的一项重要工作,人类基因组计划向信息学提出了巨大的挑战。
值得庆幸的是,人类基因组计划一开始就与计算机技术、信息高速公路同步发展,信息技术为生物信息学的发展提供了非常好的
条件,为生物信息学的研究和应用提供了非常好的支撑。
生物信息学与人类基因组计划紧密结合,互相渗透,生物信息学成为基因组计划不可分割的一部分。
事实证明,人类基因组计划在生物信息学的支持下,前进步伐大大加快,已经提前完成计划,功能基因组研究也已经全面展开。
而人类基因组计划反过来又大大促进了生物信息学的发展,HGP丰富了生物信息学的研究内容,促进生物信息学新思想、新方法的产生,生物信息学在最近10年迅速发展的历程证明了这一点。