生物信息学考试参考题目

合集下载

大学生生物信息学考试模拟题及解析

大学生生物信息学考试模拟题及解析

大学生生物信息学考试模拟题及解析一、单选题(每题 3 分,共 30 分)1、生物信息学中,用于分析 DNA 序列的常见软件是()A BLASTB ClustalWC Primer PremierD MEGA2、以下哪种数据库主要存储蛋白质结构信息()A GenBankB PDBC UniProtD SWISSPROT3、在基因预测中,开放阅读框(ORF)是指()A 从起始密码子到终止密码子的一段序列B 具有特定功能的一段基因序列C 编码蛋白质的基因序列D 以上都不对4、进行系统发育分析时,常用的构建进化树的方法是()A 邻接法B 最大简约法C 最大似然法D 以上都是5、以下哪种算法常用于序列比对()A 动态规划算法B 贪心算法C 分治法D 回溯算法6、生物信息学中,用于分析基因表达数据的常用方法是()A 聚类分析B 回归分析C 方差分析D 以上都是7、以下哪个不是常见的生物信息学文件格式()A FASTAB GenBankC PDBD CSV8、在蛋白质序列分析中,用于预测蛋白质二级结构的方法是()A 同源建模B 从头预测C 基于机器学习的方法D 以上都是9、进行基因功能注释时,常用的数据库是()A GOB KEGGC ReactomeD 以上都是10、以下哪种技术可以用于大规模测序()A Sanger 测序B 二代测序C 三代测序D 以上都是答案及解析:1、答案:A解析:BLAST(Basic Local Alignment Search Tool)是用于比较生物序列相似性的工具,常用于分析 DNA 序列。

ClustalW 主要用于多序列比对;Primer Premier 常用于设计引物;MEGA 用于构建进化树。

2、答案:B解析:PDB(Protein Data Bank)是主要存储蛋白质结构信息的数据库。

GenBank 主要存储核酸序列;UniProt 和 SWISSPROT 主要存储蛋白质序列信息。

生物信息学复习题

生物信息学复习题

生物信息学复习题生物信息学是一门结合生物学、计算机科学、信息学和数学的交叉学科,它利用计算机技术来处理和分析生物数据。

以下是一些生物信息学复习题,供同学们参考:1. 生物信息学的定义和应用领域- 生物信息学是如何定义的?- 生物信息学在哪些领域有应用?2. 基因组学基础- 什么是基因组学?- 基因组测序的基本原理是什么?3. 序列比对- 序列比对的目的是什么?- 简述局部比对和全局比对的区别。

4. BLAST算法- BLAST算法的原理是什么?- 如何使用BLAST进行序列相似性搜索?5. 基因表达数据分析- 基因表达数据有哪些类型?- 描述基因表达数据的预处理步骤。

6. 蛋白质结构预测- 蛋白质结构预测的重要性是什么?- 简述几种常见的蛋白质结构预测方法。

7. 系统生物学和网络分析- 系统生物学研究的是什么?- 网络分析在系统生物学中的应用。

8. 生物信息学中的数据库- 列举几个常见的生物信息学数据库。

- 解释数据库在生物信息学研究中的作用。

9. 生物信息学中的编程语言- 哪些编程语言在生物信息学中常用?- 简述Python在生物信息学中的应用。

10. 伦理和隐私问题- 在生物信息学研究中可能遇到哪些伦理问题?- 如何保护生物信息数据的隐私?11. 案例研究- 描述一个生物信息学在医学研究中的应用案例。

- 分析该案例中使用的方法和技术。

12. 未来趋势- 预测生物信息学未来的发展趋势。

- 讨论生物信息学如何影响未来的科学研究和医疗保健。

通过这些问题的复习,同学们可以更全面地了解生物信息学的基础概念、关键技术和应用领域。

希望这些复习题能够帮助同学们更好地准备考试和理解生物信息学的重要性。

生物技术应用与生物信息学测试 选择题 60题

生物技术应用与生物信息学测试 选择题 60题

1. 生物技术的核心技术之一是:A. 基因工程B. 细胞工程C. 发酵工程D. 酶工程2. 下列哪项不是生物信息学的研究内容?A. 基因组测序B. 蛋白质结构预测C. 生物伦理学D. 分子进化3. 基因克隆的主要步骤包括:A. 基因分离B. 基因扩增C. 基因表达D. 以上都是4. 下列哪种软件主要用于DNA序列分析?A. BLASTB. PymolC. MATLABD. R5. CRISPR-Cas9技术主要用于:A. 基因编辑B. 基因表达C. 基因测序D. 基因克隆6. 下列哪项不是高通量测序技术的应用?A. 全基因组重测序B. 转录组分析C. 蛋白质组分析D. 代谢组分析7. 生物信息学中的BLAST工具主要用于:A. 序列比对B. 结构预测C. 功能注释D. 进化分析8. 下列哪种技术可以用于检测单个细胞的基因表达?A. RNA-SeqB. ChIP-SeqC. 单细胞测序D. 微阵列9. 蛋白质结构预测的主要方法包括:A. 同源建模B. 从头预测C. 折叠识别D. 以上都是10. 下列哪项不是生物信息学数据库?A. GenBankB. PDBC. PubMedD. KEGG11. 基因组学研究的主要内容包括:A. 基因组结构B. 基因组功能C. 基因组进化D. 以上都是12. 下列哪种技术可以用于研究基因的表观遗传学修饰?A. ChIP-SeqB. RNA-SeqC. 微阵列D. 蛋白质组学13. 生物信息学中的序列比对主要用于:A. 发现同源序列B. 预测蛋白质结构C. 分析基因功能D. 以上都是14. 下列哪种技术可以用于研究基因的表达调控?A. RNA-SeqB. ChIP-SeqC. 微阵列D. 以上都是15. 生物信息学中的功能注释主要用于:A. 预测基因功能B. 分析蛋白质结构C. 研究基因表达D. 以上都是16. 下列哪种技术可以用于研究基因的单核苷酸多态性?A. SNP芯片B. RNA-SeqC. ChIP-SeqD. 微阵列17. 生物信息学中的进化分析主要用于:A. 研究基因进化B. 分析蛋白质结构C. 预测基因功能D. 以上都是18. 下列哪种技术可以用于研究基因的转录后修饰?A. RNA-SeqB. ChIP-SeqC. 微阵列D. 蛋白质组学19. 生物信息学中的结构预测主要用于:A. 预测蛋白质结构B. 分析基因功能C. 研究基因表达D. 以上都是20. 下列哪种技术可以用于研究基因的表观遗传学修饰?A. ChIP-SeqB. RNA-SeqC. 微阵列D. 蛋白质组学21. 生物信息学中的序列比对主要用于:A. 发现同源序列B. 预测蛋白质结构C. 分析基因功能D. 以上都是22. 下列哪种技术可以用于研究基因的表达调控?A. RNA-SeqB. ChIP-SeqC. 微阵列D. 以上都是23. 生物信息学中的功能注释主要用于:A. 预测基因功能B. 分析蛋白质结构C. 研究基因表达D. 以上都是24. 下列哪种技术可以用于研究基因的单核苷酸多态性?A. SNP芯片B. RNA-SeqC. ChIP-SeqD. 微阵列25. 生物信息学中的进化分析主要用于:A. 研究基因进化B. 分析蛋白质结构C. 预测基因功能D. 以上都是26. 下列哪种技术可以用于研究基因的转录后修饰?A. RNA-SeqB. ChIP-SeqC. 微阵列D. 蛋白质组学27. 生物信息学中的结构预测主要用于:A. 预测蛋白质结构B. 分析基因功能C. 研究基因表达D. 以上都是28. 下列哪种技术可以用于研究基因的表观遗传学修饰?A. ChIP-SeqB. RNA-SeqC. 微阵列D. 蛋白质组学29. 生物信息学中的序列比对主要用于:A. 发现同源序列B. 预测蛋白质结构C. 分析基因功能D. 以上都是30. 下列哪种技术可以用于研究基因的表达调控?A. RNA-SeqB. ChIP-SeqC. 微阵列D. 以上都是31. 生物信息学中的功能注释主要用于:A. 预测基因功能B. 分析蛋白质结构C. 研究基因表达D. 以上都是32. 下列哪种技术可以用于研究基因的单核苷酸多态性?A. SNP芯片B. RNA-SeqC. ChIP-SeqD. 微阵列33. 生物信息学中的进化分析主要用于:A. 研究基因进化B. 分析蛋白质结构C. 预测基因功能D. 以上都是34. 下列哪种技术可以用于研究基因的转录后修饰?A. RNA-SeqB. ChIP-SeqC. 微阵列D. 蛋白质组学35. 生物信息学中的结构预测主要用于:A. 预测蛋白质结构B. 分析基因功能C. 研究基因表达D. 以上都是36. 下列哪种技术可以用于研究基因的表观遗传学修饰?A. ChIP-SeqB. RNA-SeqC. 微阵列D. 蛋白质组学37. 生物信息学中的序列比对主要用于:A. 发现同源序列B. 预测蛋白质结构C. 分析基因功能D. 以上都是38. 下列哪种技术可以用于研究基因的表达调控?A. RNA-SeqB. ChIP-SeqC. 微阵列D. 以上都是39. 生物信息学中的功能注释主要用于:A. 预测基因功能B. 分析蛋白质结构C. 研究基因表达D. 以上都是40. 下列哪种技术可以用于研究基因的单核苷酸多态性?A. SNP芯片B. RNA-SeqC. ChIP-SeqD. 微阵列41. 生物信息学中的进化分析主要用于:A. 研究基因进化B. 分析蛋白质结构C. 预测基因功能D. 以上都是42. 下列哪种技术可以用于研究基因的转录后修饰?A. RNA-SeqB. ChIP-SeqC. 微阵列D. 蛋白质组学43. 生物信息学中的结构预测主要用于:A. 预测蛋白质结构B. 分析基因功能C. 研究基因表达D. 以上都是44. 下列哪种技术可以用于研究基因的表观遗传学修饰?A. ChIP-SeqB. RNA-SeqC. 微阵列D. 蛋白质组学45. 生物信息学中的序列比对主要用于:A. 发现同源序列B. 预测蛋白质结构C. 分析基因功能D. 以上都是46. 下列哪种技术可以用于研究基因的表达调控?A. RNA-SeqB. ChIP-SeqC. 微阵列D. 以上都是47. 生物信息学中的功能注释主要用于:A. 预测基因功能B. 分析蛋白质结构C. 研究基因表达D. 以上都是48. 下列哪种技术可以用于研究基因的单核苷酸多态性?A. SNP芯片B. RNA-SeqC. ChIP-SeqD. 微阵列49. 生物信息学中的进化分析主要用于:A. 研究基因进化B. 分析蛋白质结构C. 预测基因功能D. 以上都是50. 下列哪种技术可以用于研究基因的转录后修饰?A. RNA-SeqB. ChIP-SeqC. 微阵列D. 蛋白质组学51. 生物信息学中的结构预测主要用于:A. 预测蛋白质结构B. 分析基因功能C. 研究基因表达D. 以上都是52. 下列哪种技术可以用于研究基因的表观遗传学修饰?A. ChIP-SeqB. RNA-SeqC. 微阵列D. 蛋白质组学53. 生物信息学中的序列比对主要用于:A. 发现同源序列B. 预测蛋白质结构C. 分析基因功能D. 以上都是54. 下列哪种技术可以用于研究基因的表达调控?A. RNA-SeqB. ChIP-SeqC. 微阵列D. 以上都是55. 生物信息学中的功能注释主要用于:A. 预测基因功能B. 分析蛋白质结构C. 研究基因表达D. 以上都是56. 下列哪种技术可以用于研究基因的单核苷酸多态性?A. SNP芯片B. RNA-SeqC. ChIP-SeqD. 微阵列57. 生物信息学中的进化分析主要用于:A. 研究基因进化B. 分析蛋白质结构C. 预测基因功能D. 以上都是58. 下列哪种技术可以用于研究基因的转录后修饰?A. RNA-SeqB. ChIP-SeqC. 微阵列D. 蛋白质组学59. 生物信息学中的结构预测主要用于:A. 预测蛋白质结构B. 分析基因功能C. 研究基因表达D. 以上都是60. 下列哪种技术可以用于研究基因的表观遗传学修饰?A. ChIP-SeqB. RNA-SeqC. 微阵列D. 蛋白质组学答案:1. A2. C3. D4. A5. A6. C7. A9. D10. C11. D12. A13. A14. D15. A16. A17. A18. D19. A20. A21. A22. D23. A24. A25. A26. D27. A28. A29. A30. D31. A32. A33. A34. D35. A36. A37. A38. D39. A40. A41. A42. D43. A44. A45. A46. D47. A48. A49. A50. D51. A52. A53. A54. D55. A56. A57. A59. A60. A。

生物信息学试题

生物信息学试题

生物信息学试题一、选择题1. 生物信息学主要研究的是:A. 生物实验技术B. 生物统计学C. 生物大数据分析与计算D. 生物体内生化反应2. 在生物信息学中,常用的序列比对工具是:A. BLASTB. PCRC. ELISAD. SDS-PAGE3. 下列哪个数据库主要用于存储核酸序列信息?A. PDBB. GenBankC. UniProtD. KEGG4. 以下哪种方法不是用于蛋白质结构预测的?A. 同源建模B. 折叠识别C. 从头预测D. 实验测定5. 生物信息学中的“基因家族”是指:A. 一组具有相似序列和功能的基因B. 一组来自同一物种的基因C. 一组通过基因复制产生的基因D. 一组控制同一生物过程的基因二、简答题1. 简述生物信息学在现代医学研究中的应用。

2. 描述PCR技术的原理及其在分子生物学中的重要性。

3. 解释什么是基因编辑技术,以及CRISPR-Cas9系统是如何工作的。

三、论述题1. 论述生物信息学在新药发现和开发中的作用。

2. 分析比较RNA测序技术与DNA测序技术的优势和局限性。

四、计算题1. 给定一个DNA序列:“ATGCGATACCTGAGCTG”,计算其碱基组成的比例。

2. 假设某种生物的基因组大小为200 Mb,每个碱基对的平均质量为650 Da,计算该基因组的大致质量。

五、案例分析题1. 根据给定的某种疾病的基因组数据,分析可能的致病基因,并讨论其可能的生物机制。

2. 通过分析某物种的转录组数据,探讨其在特定环境下的适应性变化。

请注意,以上试题仅供参考,具体题目应根据实际教学大纲和考试要求进行调整。

在实际考试中,题目可能会包含更多的细节和复杂性,要求考生具备扎实的生物信息学知识和分析能力。

生物信息学考试参考题目

生物信息学考试参考题目

1. 在NCBI进行BLAST序列比对时,需要输入查询序列的信息,以下错误的格式是( C )A. 序列的accession numberB. 序列的giC. 序列对应基因的IDD. FASTA 格式的序列2. 下面这段序列是: ( B )>gi||ref|| Drosophila melanogaster RNA-binding protein 4 CG9654-RA, transcript variant A (Rbp4),mRNAGGATTTTCTTGCCTGTCA TTCAA TTTGTGGTTGGCTTCACCTGAGTGCTGTAGT。

A. DNA序列B. RNA序列C. 蛋白质序列D. 基因3. ExPASy上的工具软件ProtParam提供的是哪一种类型的服务?( B )A.蛋白质三级结构分析B.蛋白质序列理化性质预测C.蛋白质二级结构分析D.跨膜结构分析4. 假设你有两条远相关的蛋白,为了比较它们,最好利用下列哪个记分矩阵(A )A. BLOSUM45或PAM250B. BLOSUM45或PAM1C. BLOSUM80或PAM250D. BLOSUM10或PAM15. 构建系统发生树,应利用CA. BLASTB. FASTAC. UPGMAD. Entrez6. 下面这段蛋白质序列是什么格式? ( D )>gi|4506183|ref|| proteasome alpha 3 [Homo sapiens]MSSIGTGYDLSASTFSPDGRVFQVEYAMKA VENSSTAIGIRCKDGVVFGVEKLVLS KL YEEGSNKRLFNVDRHVGMA V AGLLADARSLADIAREEASNFRSNFGYNIPLKHLADRV AMYVHAYTL YSA VRPFGCSFMLGS。

A. GBFFB. TEXTC. PDBD. FASTA7. 直系同源物概念为(A )A.不同物种中具有一路先人的同源序列B.具有较小的氨基酸一致性可是有较大的结构相似性的同源序列C.同一物种中由基因复制产生的同源序列D.同一物种中具有相似的而且一般是冗余功能的同源序列8. 美国NIH保护提供的DNA序列数据库是:( A )A. GenBankB. ProteinC. dbESTD. dbSNP9. 高分派对片段的英文缩写为(A )A. HSPB. HMPC. HCPD. HDP10. BLAST比对结果报告中有一统计数值E值,该值大小与匹配度的关系是( B )A. 值越小说明匹配度越低B. 值越小说明匹配度越高C. 二者无内在关系D. 以上说法都不对11. NCBI提供了大量的序列分析工具,其顶用来寻觅DNA序列潜在的蛋白质编码区的工具是:(A )A. ORF FinderB. BLASTC. Scan PrositeD. SAGEmap12. Entrez是哪个网站数据库的检索系统(A )A.NCBIB.PROSITEC.EBID.PDB13. 若是想找一个和查询蛋白远源的蛋白质,下面哪一种方式最可能成功? BA.采用PHI-BLAST,因为你能自己选择一个和搜索蛋白质有关的信号序列B.采用PSI-BLAST,因为那个算法利用位点特异性打分矩阵最为敏感C.采用BLASTP,因为你能够调整你的打分矩阵从而使得搜索敏感度最大D.采用专门的物种数据库,因为他们中可能含有这种远源序列。

生物信息学考试题

生物信息学考试题

生物信息学bioinformatics一、名词解释Silicon cloning:利用公共数据库信息, 借助计算机软件分析, 推测目的基因的编码区序列, 辅助全长cDNA克隆的方法BLAST:即基本局域联配搜索工具,Basic Local Alignment Search Tool,是一个局部比对搜索工具,用来确定一条查询序列和一个数据库的比对,最早的版本不引入间隙,但现在所用的版本已经允许比对中引入间隙。

Entrez :是由NCBI 主持的一个数据库检索系统,它包括核酸,蛋白以及Medline 文摘数据库,在这三个数据库中建立了非常完善的联系。

因此,可以从一个DNA 序列查询到蛋白产物以及相关文献,而且,每个条目均有一个类邻(neighboring)信息,给出与查询条目接近的信息。

Entrez 中的数据库包括:Entrez 中核酸数据库为:GenBank, EMBL, DDBJ 蛋白质数据库为:Swiss-Prot, PIR, PFR, PDBPSI-BLAST:是一种迭代的搜索方法,可以提高BLAST 和FASTA 的相似序列发现率。

ORF:开放阅读框(ORF)是基因序列的一部分,包含一段可以编码蛋白的碱基序列,不能被终止子打断。

编码一个蛋白质的外显子连接成为一个连续的ORF。

当一个新基因被识别,其DNA 序列被解读,人们仍旧无法搞清相应的蛋白序列是什么。

这是因为在没有其它信息的前提下,DNA 序列可以按六种框架阅读和翻译(每条链三种,对应三种不同的起始密码子)ORF 识别包括检测这六个阅读框架并决定哪一个包含以启动子和终止子为界限的DNA 。

序列而其内部不包含启动子或终止子,符合这些条件的序列有可能对应一个真正的单一的基因产物。

ORF 的识别是证明一个新的DNA 序列为特定的蛋白质编码基因的部分或全部的先决条件。

相似性(similarity)/(identify):相似性是指序列比对过程中用来描述检测序列和目标序列之间相同DNA碱基或氨基酸残基顺序所占比例的高低。

生物信息学习题

生物信息学习题

1单选(以下哪位科学家获得了两次诺贝尔奖?A.桑格(Frederick Sanger)B.沃森(James Waston)C.霍利(Robert W.Holley)D.克里克(Francis Crick)2单选(‍被称为“DNA之父”的是哪位科学家?A.摩尔根(Thomas H.Morgen)B.沃森(James Waston)C.查加夫(Erwin Chargaff)D.桑格(Frederick Sanger)3单选(被称为“计算机之父,人工智能之父”的是哪位科学家?A.莱布尼兹(Gottfried W Leibniz)B.图灵(Alan Mathison Turing)C.帕斯卡(Blaise Pascal)D.桑格(Frederick Sanger)4单选(‍被称为“现代实验生物学奠基人”的是哪位科学家?A.摩尔根(Thomas H.Morgen)B.达尔文(Charles Darwin)C.桑格(Frederick Sanger)D.孟德尔(Gregor J.Mendel)5单选(被称为“遗传学的奠基人,现代遗传学之父”的是哪位科学家A.孟德尔(Gregor J.Mendel)B.沃森(James Waston)C.查加夫(Erwin Chargaff)D.摩尔根(Thomas H.Morgen)1单选(‍从GenBank的哪一项注释中可以找到关于编码蛋白的信息?A.CDSB.SOURCEC.RBSD.ORIGIN2单选(以下关于GenBank的描述,哪个是正确的?A.GenBank里的一条数据库记录对应一个完整的基因。

B.真核生物的基因经常是分段存储在多条GenBank数据库记录里。

C.真核生物的基因都是整个存储在GenBank的一条数据库记录里。

D.原核生物的基因都是分片段存储在多条GenBank数据库记录里。

3多选(以下关系式正确的是?A.1T=1,000GB.1G=1,000MC.1G=1,000,000KD.1T=1,000,000M4(GenBank数据库中的检索号(Accession)和基因座名(Locus)指的都是一条序列在数据库中的编号,他们永远都是相同的。

生物信息学测试题

生物信息学测试题

生物信息学测试题1. 1以下哪一个是mRNA条目序列号() [单选题]2. 如果你需要查询文献信息,下列哪个数据库是你最佳选择() [单选题]3. EMBL的含义是() [单选题]4. accession number的含义是() [单选题]5. 5以下关于PubMed的描述错误的是() [单选题]6. NCBI的含义是() [单选题]7. 7GenBank中分类码PLN表示是() [单选题]8. PIR是() [单选题]9. 1以下数据库不能用于检索核酸序列的是() [单选题]10. 蛋白质结构数据库常保存为下面哪一种格式为后缀的文件() [单选题]11. 进行多序列对比常使用哪种软件() [单选题]12. 对于蛋白质同源结构模建,通常要求待模建序列与模板序列一致性超过()[单选题]13. 5人类基因组大小大约是多少Mb() [单选题]14. 如果有一段DNA序列,它可能编码多少种蛋白质序列() [单选题]15. UTR的含义是() [单选题]16. 如果你需要查询文献信息,下列哪个数据库是你最佳选择() [单选题]17. 给定一段核酸序列,可通过什么方法查找上面蛋白质编码区() [单选题]18. 构建进化树最直接的错误来源是() [单选题]19. 1初级序列数据库 [填空题]_________________________________(答案:undefined) 20. 2,OMIM是 [填空题]_________________________________(答案:undefined) 21. 1常用的序列搜索方法 [填空题]_________________________________(答案:undefined) 22. 2人类基因组计划完成的四张图是 [填空题]_________________________________(答案:undefined) 23. 3系统发育树的构建方法 [填空题]_________________________________(答案:undefined) 24. 4系统发育树的两个特征是 [填空题]_________________________________(答案:undefined) 25. 5初级序列数据库是 [填空题]_________________________________(答案:undefined) 26. 6蛋白质二级结构的三种状态 [填空题]_________________________________(答案:undefined)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1. 在NCBI进行BLAST序列比对时,需要输入查询序列的信息,以下错误的格式是( C )A. 序列的accession numberB. 序列的giC. 序列对应基因的IDD. FASTA 格式的序列2. 下面这段序列是: ( B )>gi|24646620|ref|NM_057587.3| Drosophila melanogaster RNA-binding protein 4 CG9654-RA, transcript variant A (Rbp4), mRNAGGATTTTCTTGCCTGTCA TTCAA TTTGTGGTTGGCTTCACCTGAGTGCTGTAGT。

A. DNA序列B. RNA序列C. 蛋白质序列D. 基因3. ExPASy上的工具软件ProtParam提供的是哪种类型的服务?( B )A.蛋白质三级结构分析B.蛋白质序列理化性质预测C.蛋白质二级结构分析D.跨膜结构分析4. 假如你有两条远相关的蛋白,为了比较它们,最好使用下列哪个记分矩阵(A )A. BLOSUM45或PAM250B. BLOSUM45或PAM1C. BLOSUM80或PAM250D. BLOSUM10或PAM15. 构建系统发生树,应使用CA. BLASTB. FASTAC. UPGMAD. Entrez6. 下面这段蛋白质序列是什么格式? ( D )>gi|4506183|ref|NP_002779.1| proteasome alpha 3 [Homo sapiens]MSSIGTGYDLSASTFSPDGRVFQVEYAMKAVENSSTAIGIRCKDGVVFGVEKLVLS KL YEEGSNKRLFNVDRHVGMA V AGLLADARSLADIAREEASNFRSNFGYNIPLKHLADRV AMYVHAYTL YSA VRPFGCSFMLGS。

A. GBFFB. TEXTC. PDBD. FASTA7. 直系同源物定义为(A )A.不同物种中具有共同祖先的同源序列B.具有较小的氨基酸一致性但是有较大的结构相似性的同源序列C.同一物种中由基因复制产生的同源序列D.同一物种中具有相似的并且通常是冗余功能的同源序列8. 美国NIH维护提供的DNA序列数据库是:( A )A. GenBankB. ProteinC. dbESTD. dbSNP9. 高分配对片段的英文缩写为(A )A. HSPB. HMPC. HCPD. HDP10. BLAST比对结果报告中有一统计数值E值,该值大小与匹配度的关系是( B )A. 值越小说明匹配度越低B. 值越小说明匹配度越高C. 两者无内在关系D. 以上说法都不对11. NCBI提供了大量的序列分析工具,其中用来寻找DNA序列潜在的蛋白质编码区的工具是:(A )A. ORF FinderB. BLASTC. Scan PrositeD. SAGEmap12. Entrez是哪个网站数据库的检索系统(A )A.NCBIB.PROSITEC.EBID.PDB13. 如果想找一个和查询蛋白远源的蛋白质,下面哪种方法最可能成功? BA.采用PHI-BLAST,因为你能自己选择一个和搜索蛋白质有关的信号序列B.采用PSI-BLAST,因为这个算法使用位点特异性打分矩阵最为敏感C.采用BLASTP,因为你能够调整你的打分矩阵从而使得搜索敏感度最大D.采用专门的物种数据库,因为他们中可能含有这种远源序列。

下列哪个不是Entrez的逻辑运算符(D )A AND B OR C BUT D NO下面对进化树理解错误的是(D)A从根节点到任何一个节点的唯一路径和方向代表了进化方向B根是树中所有物种的共同祖先C根节点上的物种我们认为比树中其他所有的物种分化更早D从根节点到任何一个节点的路径与物种的进化程度相关检测核酸序列是否受到了载体污染的最主要方法是( A )A在载体数据中做相似性搜索B搜索序列中的限制性酶切位点C检索细胞数据库D检索宿主序列数据库利用ExPASy网站的AACompIdent工具软件进行蛋白质鉴定的时候不能输入的数据是(B) A要鉴定的蛋白质氨基酸组成比例B对应的核酸组成比例C限定搜索的物种范围D蛋白质序列的pI关于蛋白质序列数据库以下说法错误的是(C)A UniProtKB/TrEMBL是Swiss-Prot数据库的一个由计算机自动注释的增补版B. PIR PSD是非冗余的蛋白质序列数据库C. PDB数据库同样包含了蛋白质序列的详细信息D. NCBI同样提供了蛋白质序列子数据ExPASy上的工具软件TMpred提供的是哪种类型的服务(D)A蛋白质三级结构分析B蛋白质序列理化性质预测C蛋白质二级结构分析D蛋白质跨膜结构分蛋白质序列的描述行>gi|28435532|gb|AAO41714.1| NPC-associated peptide [Homo sapiens]中的AAO41714.1是什么意思(A)A AAO41714是NCBI中序列的ACCESSION小数点后的1是版本号B序列在Swiss-Prot中的ACCESSIONC序列的motif数据库中的ACCESSIOND序列对应的基因ID号14.解释生物信息名词BLAST、CDS(GBFF格式中的特性关键词)、NCBI、UPGMA、EBI。

BLAST:Basic Local Alignment Search Tool基本局部相似性对比搜索工具;CDS:Coding sequence蛋白编码区信息;NCBI:National Center of Biotechnology Information 美国国立生物技术信息中心;UPGMA:unweighted pair group method with arithmetic mean 非加权算术平均组对法;EBI:European Bioinformatics Institute欧洲生物信息学中心。

15.NCBI的BLAST工具有5个基本程序,分别为nucleotide blast,protein blast,blastx,tblastn,tblastx,请分别说明每个程序解决的问题。

tblastn,tblastx,请分别说明每个程序解决的问题。

Blastn:用核酸序列搜索核算数据库;Blastp:用蛋白质序列搜索蛋白质数据库;Blastx:用核酸序列搜索蛋白质数据可库(先将核酸序列按6个可读框翻译成蛋白质序列);Tblastn:用蛋白质序列搜索核算数据库(先将核酸数据库的序列按6个可读框翻译成蛋白质序列);Tblastx:将查询序列和数据库里的核酸序列都按6个可读框翻译成蛋白质序列再对比,每两条序列进行36次对比。

16.如果我们想知道一个基因组DNA数据库中是否有某个蛋白的直系同源物,该采用什么样的序列分析工具。

采用tblastn序列分析工具。

17.通过BLAST比对,发现两个序列相似度是90%,能不能认定两个序列同源性是90%,为什么。

不能,因为同源性是序列同源或者不同源的一种论断,而相似性或者一致性是一个序列相关性的量化,是两个不同的概念。

18.在NCBI中检索的时候,在检索框中输入“AAO41714[ACCN]”能返回一个怎样的结果?返回唯一一条序列号为AA41714的相关信息。

19.对核酸序列进行BLAST的时候,选择的字(WORD)越长精度越高还是越短精度越高,为什么?搜索速度跟字长有什么关系?字越长精度越高。

因为blast程序在进行序列数据库相似性搜索时,查询序列可选择过滤掉低复杂度的区域,然后按字长参数(DNA序列一般为11,蛋白质一般为3)将序列分解成小的字串。

然后程序再找出查询序列和目标序列间所有单个或多个连续匹配的字串。

字串越长,所要求匹配的序列越长,所要求序列的匹配度越高,所以越精确。

增加字长可以提高搜索的特异性和速度。

20.这是某蛋白质的一个pattern:GXW[YF][EA][IVLM],请说明其含义。

Gly-any-Trp-[Tyr or Phe]-[Glu or Ala]-[Ile or Val or Leu or Met]举例:( 1:PA [AC]-x-V-x(4)-{ED}:[Ala or Cys]-any-Val-any-any-any-any-{any but Glu or Asp}2 :PA <A-x-[ST](2)-x(0,1)-V. Ala-any-[Ser or Thr]-[Ser or Thr]-(any or none)-Val )21. 简单介绍NCBI Reference Sequences数据库(其他上课讲过的如PROSITE数据库等)。

The Reference Sequence (RefSeq) collection aims to provide a comprehensive, integrated, non-redundant, well-annotated set of sequences, including genomic DNA, transcripts, and proteins. RefSeq is a foundation for medical, functional, and diversity studies; they provide a stable reference for genome annotation, gene identification and characterization, mutation and polymorphism analysis (especially RefSeqGene records), expression studies, and comparative analyses.参考序列数据库旨在提供全面的、综合的非冗余的和注释清楚的组序列,包括基因组DNA,转录产物和蛋白质。

RefSeq是研究医学、功能学和多样性的基础;它为基因组注释、基因鉴定和特性描述,突变和多态性分析(特别是RefSeqGene records),表达研究和对比分析提供稳定的参考。

Prosite数据库:PROSITE数据库收集了生物学有显著意义的蛋白质位点和序列模式,并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。

22. 翻译并简单介绍该工具:The Basic Local Alignment Search Tool (BLAST) finds regions of local similarity between sequences. The program compares nucleotide or protein sequences to sequence databases and calculates the statistical significance of matches. BLAST can be used to infer functional and evolutionary relationships between sequences as well as help identify members of gene families。

相关文档
最新文档