生物信息学复习要点.docx
一、名词解释(每小题3分,共30分)
1.生物信息学
2.数据库技术
3.数据仓库
4.EST
5.概念性翻译
6.同源性
7.讥系类群
8.全局排列
9.基因作图
10.直系同源体簇
二、填空题(每空1分,共10分)
1.生物信息学主要研究的两种信息载体是_________________ 和
2.国际上的三大核甘酸序列数据库分别是—
和 ___________ 0
3.数据挖掘的三大技术支柱是 _____________ 、 ______________ 和
4.____________________________________________ 相同类型核甘酸的替换称为,不同类型核井酸的替换称
为____________ 。
三、单项选择题(每小题1分,共10分)
1.在对模式主物进行全基因组的测定中,作为真菌模式生物的是__________ 0
A、大肠杆菌
B、青霉菌
C、酵母菌
D、线虫
2.NCBI成立于 _____ o
A、1988 年
B、1989 年
C、1990 年
D、1992 年
3.根据数据库管理系统所支持的基木数据模型的不同,町以将数据库分为五类,其中第二
代数据库是______ o
A、层次数据胯
13、网状数据库
C、关系数据库
D、分布式数据库
4.在向GenBank投送序列的工具中,________ 是标准的序列投送工具。
A、Cn3D
B、tbl2asn
C、BankIt
D、Sequin
5.kl前最为常用和注释最全的蛋白质序列数据库是_________ o
A、Identify
B、OWL
C、PIR
D、SWISS-PROT
6.下列选项中根据蛋白质三维折叠模式和进化关系划分的结构分类数据库是__________ 。
A> PDBsum
B、GDB
C、SCOP
I)、CATH
7.构建系统发牛树的方法很多,其中耗时最短的是_________ o
A、进化简约法
B、最人简约法
C^最大似然法
D、距离矩阵法
8.下列数据库选项中不属于蛋白质序列二次数据库的是一
A、PROSTTE
B、PRINTS
C、BLOCKS
D、PDB
9.在系统发生树的检验中,较为常川的方法是_________
A、MP 法
B、重复取样法
C、NJ 法
D、ML 法
10.下列工具中川于发现开放阅读框的软件是___________
A、Translatc Tool
B、ORF Finder
C、Gene Wise
D、E-PCR
四、多项选择题(每小题2分,共20分)
1.生物人分子携带的三种信息是________ o
A、遗传信息
B、功能信息
C、调控信息
I)、进化信息
2.为实现3个抽彖级别间的数据转换,DBMS提供的两层映射是
A、外模式/概念模式映射
B、外模式/内模式映射
C、概念模式/内模式映射
D、概念模式/外模式
3.数据挖掘和知识发现一般可用于发现________ o
A、广义知识
B、关联知识
C、聚类知识
D、预测性知识
4.用于检测DNA序列中潜在的CDS的儿种特征是__________ 。
A、ORF长度
B、Kozak 序列
C、密码子用法
D、密码子使川偏性
5.__________________________________________________ 下列数据库选项中属于蛋白质结构二次数据库的是____________________________________ °
A、DSSP
B、FSSP
C^ Profiles
D、HSSP
6.下列选项中属于整合牛物信息学数据系统_________ 。
A、SRS
B、Entrez
C、Genera
D、FLYBASE
7.公用的EST的分析工具有________ o
A、序列相似性杳询
B、序列分类
C、序列组装
D、序列聚类
8.根据有无外类群,可以将系统树分为_________ o
A、有根树
B、无根树
C、基因树
D、标度树
9.在构建系统发牛树的软件包中,基丁?最大似然法的构树软件包是.
A、MOLPHY软件包
B、TreeVi ew 软件包
C、PAM软件包
D、PUZZLE软件包
10.双向凝胶电泳技术的双向是指__________ 。
A、正向
B>等电聚焦
C>反向
D、SDS-聚丙烯酰胺凝胶电泳
五、问答题(第1、2、3题每小题6分,第4题12分,共30分)
1.简述蛋白质组分析的主要过程和关键技术?
2.比较BLAST系列软件。
3.简述基于计算的比较棊因组学的各研究方法及其原理?
4.请举例分析某属真菌的分子系统学研究结果并联系其各口的地理分布、牛态、经纬度、海拔
等信息分析其生物信息学和生态学意义。
一、名词解释(每小题3分,共30分)
1.基因芯片
2.数据库系统
3.数据挖掘
4.相似性度量
5.电子克隆
6.并系类群
7.系统发牛树
8.局部排列
9.基因组
10.育?系同源体簇
二、填空题(每空1分,共10分)
1.牛物信息学产牛于20世纪__________ 年代。
2.系统树中具有外类群作为树根的系统树称为
,没有外类群作为树根的系统树称为____________ o
3.根据数据管理的特点,数据库管理按其发展的先后顺序对划分为三个阶段,分别
是_____________ 、______________ 、 ____________ 。
4.国际上的三大核背酸序列数据库分别是_____________ 、____________ 、
。
5.世界上第一个蛋白质组研究中心是______________ =
三、单项选择题(每小题1分,共10分)
1.__________________________ 人类基因组计划开始于。
A、1985
B、1988
C、1990
D、1998
2 .第一个细菌全基因组测序完成于_________ 。
A、1988 年
B、1992 年
C、1995 年
D、1998 年
3.下列选项中那一个不是模式牛物基因组数据库________ o
A、YEASTS
B N Arabinet
C> FlyBase
D、 AceDB
4.蛋口质三维空间结构数据库有很多,其屮皋于网络的概要数据库是__________
PDBsum
B、CATH
C、SCOP
D、PDB
5 ?下列选项中根据蛋白质结构域划分的结构分类数据库是 ________ o
A、PTR
B、SWISS-PROT
C、SCOP
D、CATH
6.概念性翻译将产生条与核甘酸对应的蛋白质序列。
A、4
B、5
C、6
D、7
7.在进行序列对位排列时,当序列间的关系较为疏远时,采川_________ 矩阵进行相似性记分更为合理。
A、Dayhof f 矩阵
B、BL0SUM 矩阵
C、VGA矩阵
D、RGB矩阵
8.在系统发生树的检验中,使用较为广泛的检验方法是_________ 。
A、刀切法
B、重复取样法
C、自展法
D、ML 法
9.Kimura双参数模型中,颠换是指 ________ 。
A、嚓吟或唸喘转变成U密噪或嚓吟
B、喘咙变U密喘
C、喋吟变喋吟
D、喘曉变成咳唳
10?下列工具中用于DNA序列翻译的软件是________ o
A、E-PCR
B、ORF Finder
C^ Translate Tool
D^ Gene Wise
四、多项选择题(每小题2分,共20分)
1.生物信息学主要研究的两种信息载体是_________
A、多糖
B、核酸
C、蛋白质
D、脂类
2.数据库体系的3个抽象级别是________ o
A、外部级
B、概念级
C、内部级
D、屮间级
3.数据挖掘的技术支柱是。
人、数据库
B、人工智能
C、数理统计
D、数据分析
4.人工神经网络有以下儿种主要功能________ c
A、联想记忆
B、非线性映射
C、分类与识别
D、优化计算
5.分析EST的要索有_________ o
A、EST字母表
B、插入/缺失或移码
C、剪接变体
D、非编码区EST
6._______________________________________ 下列选项中属于蛋白质序列二次数据库______________________________________________ o
A、PRINTS
B、BLOCKS
C、Profiles
D^ Pfam
7._______________________________________ 下列选项中属于蛋白质结构二次数据库______________________________________________ 。
A、FSSP
B、DSSP
C、HSSP
D、BioDW
8.根据系统发生树分枝所代表的性状状态的变异数量,可以将系统树分为_______
A、物种树
B、标度树
C、非标度树
D、基因树
9.在构建系统发生树的软件包中,基于最大似然法的构树的软件包有___________
A、M0LPHY软件包
B、PAUP软件包
C、PAML软件包
Tree View 软件包
10.根据使用的标,忐和手段不同,基因作图的类型有_________ o
A、遗传连锁图
B、物理图
C、STS 图
D、表达图
五、问答题(第1、2、3题每小题6分,第4题12分,共30分)
1.简述责口质序列数据库SWISS-PR0T的使用方法?
2.在评价序列对位排列的优劣中,采用了那些记分方法,这些方法的优缺点是什么?
3.比较BLAST系列软件。
4.阐述NJ法构建分子系统树的基木思想及策略,并结合构树的参数模型和构树软件举例说
明系统发牛树构树及检验的完整过程