生物信息学复习参考题

合集下载

生物信息学课程复习题(南医大)

生物信息学课程复习题(南医大)

生物信息学课程习题第一章绪论一、填空1、在年,美国国会批准启动人类基因组计划,拟用年时间测定人类全部条染色体上共个碱基序列的测定。

2、是遗传信息的携带者。

3、蛋白质三维结构测定主要方法有和。

4、理想的抗生素靶标应为微生物细胞所必须,在病原体中高度,且在人体中或与人类基因有。

5、下图例举了一个计算机辅助药物设计的实例,从a图中我们得到了配体上R基团附近的受体上有和残基,具有性,因此可以将R基团设计为性基团,如图b中所示的基团,使得抑制活性比改造前提高了近5000倍。

二、名词HGP(human genome project),EST(expressed sequence tag), SNP(single nucleotide polymorphism),生物信息学(Bioinformatics),药物基因组学(Pharmacogenomics),intron,“Junk DNA”,比较基因组学,蛋白质组学,分子进化树(evolutionary tree),基因组,基因组药物三、简答1、简述生物信息学在药物研究开发领域的应用可体现在哪些方面?2、如何利用基因组信息寻找新的药物作用靶标?3、如何利用人类基因组信息实现个性化治疗,其基于的原理是什么?4、试叙述基因芯片用于疾病诊断的原理,并说明其优缺点。

5、最近甲型流感流行,请设计甲型流感的分子诊断方法,说明其原理。

第二、三章数据库一、单选题1、以下数据库不能用于检索核酸序列的是( B )A. GenBankB. PDBC. EMBLD.DDBJ2、蛋白质结构数据常保存为下面哪一种格式为后缀的文件()A. PDBB. txtC. SeqD. mdb3、下列格式属于FASTA格式的是()A. >seq1B. <seq1C. ATGCCATAD. > ATGCCATAATGCCATA ATGCCATA二、填空题1、阅读以下数据格式,写出以下标注的含义:LOCUS是,DEFINITION是,ACCESSION是,VERSION是,SOURCE是在论文中使用了NCBI数据库中的该序列,应标注该序列的编号,应填。

生物信息学复习题

生物信息学复习题

生物信息学复习题生物信息学是一门结合生物学、计算机科学、信息学和数学的交叉学科,它利用计算机技术来处理和分析生物数据。

以下是一些生物信息学复习题,供同学们参考:1. 生物信息学的定义和应用领域- 生物信息学是如何定义的?- 生物信息学在哪些领域有应用?2. 基因组学基础- 什么是基因组学?- 基因组测序的基本原理是什么?3. 序列比对- 序列比对的目的是什么?- 简述局部比对和全局比对的区别。

4. BLAST算法- BLAST算法的原理是什么?- 如何使用BLAST进行序列相似性搜索?5. 基因表达数据分析- 基因表达数据有哪些类型?- 描述基因表达数据的预处理步骤。

6. 蛋白质结构预测- 蛋白质结构预测的重要性是什么?- 简述几种常见的蛋白质结构预测方法。

7. 系统生物学和网络分析- 系统生物学研究的是什么?- 网络分析在系统生物学中的应用。

8. 生物信息学中的数据库- 列举几个常见的生物信息学数据库。

- 解释数据库在生物信息学研究中的作用。

9. 生物信息学中的编程语言- 哪些编程语言在生物信息学中常用?- 简述Python在生物信息学中的应用。

10. 伦理和隐私问题- 在生物信息学研究中可能遇到哪些伦理问题?- 如何保护生物信息数据的隐私?11. 案例研究- 描述一个生物信息学在医学研究中的应用案例。

- 分析该案例中使用的方法和技术。

12. 未来趋势- 预测生物信息学未来的发展趋势。

- 讨论生物信息学如何影响未来的科学研究和医疗保健。

通过这些问题的复习,同学们可以更全面地了解生物信息学的基础概念、关键技术和应用领域。

希望这些复习题能够帮助同学们更好地准备考试和理解生物信息学的重要性。

生物信息考试题及答案

生物信息考试题及答案

生物信息考试题及答案生物信息学是一门结合生物学、计算机科学、信息技术和数学的交叉学科,它利用计算机技术来分析和解释生物数据。

以下是一份生物信息学考试题及答案的示例。

生物信息学考试题一、选择题(每题2分,共20分)1. 生物信息学中,用于存储DNA序列的文件格式是:A. FASTAB. JPEGC. MP3D. DOCX2. 以下哪项不是生物信息学分析的基本步骤?A. 数据收集B. 数据预处理C. 数据解释D. 数据存储3. 在蛋白质序列分析中,BLAST工具用于:A. 序列比对B. 序列组装C. 序列克隆D. 序列合成4. 以下哪个数据库不是用于存储基因表达数据的?A. NCBIB. GEOC. PDBD. ArrayExpress5. 以下哪个算法不是用于基因预测的?A. GeneMarkB. BLASTC. GlimmerD. Fgenesh二、简答题(每题10分,共30分)6. 简述生物信息学在现代生物学研究中的重要性。

7. 解释什么是基因组学,并说明其在医学研究中的应用。

8. 描述序列比对的基本原理及其在生物信息学中的作用。

三、计算题(每题15分,共30分)9. 假设你有一个DNA序列,其组成为:ATCGTA。

请计算其互补序列。

10. 给定两个蛋白质序列,序列A:A-B-C-D-E,序列B:A-C-E-B-D。

请使用Needleman-Wunsch算法计算它们的全局比对得分。

四、论述题(每题20分,共20分)11. 论述生物信息学在新药开发中的作用及其面临的挑战。

答案一、选择题1. A2. C3. A4. C5. B二、简答题6. 生物信息学在现代生物学研究中的重要性体现在它能够处理和分析大量的生物数据,如基因组序列、蛋白质结构等,帮助科学家快速发现生物现象的规律,推动生物学的发展。

7. 基因组学是研究生物基因组的结构、功能和演化的科学。

在医学研究中,基因组学可以帮助我们了解疾病的遗传基础,为个性化医疗提供理论基础。

河大生科院生物信息学考试复习题答案完整版

河大生科院生物信息学考试复习题答案完整版

名词解释1)生物信息学:生物信息学(Bioinformatics)是研究生物信息的采集,处理,存储,传播,分析和解释等各方面的一门学科,它通过综合利用生物学,计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。

2)人类基因组计划: 是由美国科学家于1985年率先提出,于1990年正式启动的,宗旨在于测定组成人类染色体(指单倍体)中所包含的30亿个碱基对组成的核苷酸序列,从而绘制人类基因组图谱,并且辨识其载有的基因及其序列,达到破译人类遗传信息的最终目的。

3)基因芯片:又称DNA阵列或DNA芯片是一块带有DNA微阵列(micorarray)的特殊玻璃片或硅芯片片,在数平方厘米之面积上布放数千或数万个核酸探针;检体中的DNA、cDNA、RNA等与探针结合后,借由荧光或电流等方式侦测。

4)中心法则:是指遗传信息从DNA传递给RNA,再从RNA传递给蛋白质,即完成遗传信息的转录和翻译的过程。

也可以从DNA传递给DNA,即完成DNA的复制过程。

5)一级数据库:一级数据库主要包括原始数据,例如DNA序列、蛋白质序列和蛋白质结构等信息。

数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释。

名词辨析1)信息技术与生物信息学:信息技术是研究信息的获取、传输和处理的技术,由计算机技术、通信技术、微电子技术结合而成,即是利用计算机进行信息处理,利用现代电子通信技术从事信息采集、存储、加工、利用以及相关产品制造、技术开发、信息服务的新学科。

生物信息学是研究生物信息的采集,处理,存储,传播,分析和解释等各方面的一门学科,它通过综合利用生物学,计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。

2)基因与基因组:基因是指具有遗传效应的DNA片段。

而基因组指的是单倍体细胞中的全套染色体,或是单倍体细胞中的全部基因。

3)相似性与同源性:相似性是指不同染色体之间基因序列的相似或相异程度。

同源性是指两个核酸分子的核苷酸序列或两个蛋白质分子的氨基酸序列间的相似程度。

生物信息学复习题

生物信息学复习题

生物信息学复习题### 生物信息学复习题#### 一、选择题1. 生物信息学主要研究的是什么?A. 生物学数据的收集和存储B. 生物学数据的分析和解释C. 生物学实验的设计和执行D. 生物学仪器的操作和维护2. 下列哪一项不是生物信息学中常用的数据库?A. GenBankB. PDBC. PubMedD. Google Scholar3. 序列比对的目的是什么?A. 确定序列间的同源性B. 预测蛋白质的三维结构C. 鉴定基因的功能D. 计算基因的表达量#### 二、填空题1. 生物信息学中的BLAST工具主要用于__________。

2. 基因表达分析中常用的芯片技术包括__________和__________。

3. 在蛋白质结构预测中,同源建模依赖于__________数据库中的已知结构。

4. 转录组测序(RNA-Seq)可以用于研究__________和__________。

#### 三、简答题1. 描述基因组注释的一般流程。

2. 阐述生物信息学在药物设计中的应用。

3. 解释什么是系统发育树,并说明其在进化研究中的意义。

#### 四、计算题1. 给定一段DNA序列,计算其GC含量。

(示例序列:ATCGTACGTAGCTAGCTAG)2. 如果一个蛋白质序列的分子量为12345 Da,其氨基酸的平均分子量为110 Da,计算该蛋白质序列中氨基酸的数量。

#### 五、论述题1. 讨论生物信息学在个性化医疗中的作用和挑战。

2. 分析高通量测序技术对生物信息学领域的影响。

通过以上题目的复习,可以帮助学生掌握生物信息学的基础知识和技能,包括对生物数据的分析、解释和应用。

这些知识点不仅涵盖了生物信息学的基础理论,还涉及到实际应用,如药物设计、个性化医疗等,为学生提供了一个全面的复习框架。

生物信息技术考试试题

生物信息技术考试试题

生物信息技术考试试题一、选择题(每题 3 分,共 30 分)1、以下哪个不是生物信息学的主要研究内容?()A 基因组学B 蛋白质组学C 细胞学D 代谢组学2、生物信息学中用于序列比对的常用算法是()A 动态规划算法B 贪心算法C 分治算法D 回溯算法3、在基因表达数据分析中,常用的标准化方法是()A RPKMB TPMC FPKMD 以上都是4、以下哪种数据库主要用于存储蛋白质结构信息?()A GenBankB PDBC UniProtD Ensembl5、进行系统发育分析时,常用的构建进化树的方法是()A 邻接法B 最大简约法C 最大似然法D 以上都是6、以下哪个软件不是用于基因序列分析的?()A Primer PremierB SPSSC DNAStarD Vector NTI7、生物信息学中,预测蛋白质二级结构的方法不包括()A 基于同源建模B 基于机器学习C 基于物理化学原理D 基于经验规则8、在生物信息学中,BLAST 程序主要用于()A 序列比对B 进化分析C 基因预测D 蛋白质结构预测9、以下哪种编程语言在生物信息学中应用较为广泛?()A JavaB PythonC C++D Fortran10、用于分析基因芯片数据的软件包是()A R 语言中的 BioconductorB MATLABC StataD SAS二、填空题(每题 3 分,共 30 分)1、生物信息学中的三大核心数据库是_____、_____、_____。

2、基因序列的相似性搜索常用的工具是_____。

3、蛋白质的一级结构是指_____。

4、常见的基因注释数据库有_____、_____等。

5、系统发育树的构建基于_____的原理。

6、生物信息学中常用的数据格式有_____、_____等。

7、预测蛋白质三级结构的方法主要有_____、_____。

8、基因表达数据的差异分析常用的方法有_____、_____。

9、用于分析高通量测序数据的软件有_____、_____。

《生物信息学》题集

《生物信息学》题集

《生物信息学》题集一、选择题(每题3分,共30分)1.生物信息学的主要研究对象是什么?A. 蛋白质结构B. 基因序列C. 生态系统D. 细胞代谢2.下列哪项技术不是生物信息学中常用的数据库技术?A. BLASTB. GenBankC. PubMedD. SWISS-PROT3.在生物信息学中,进行多序列比对时常用的软件是什么?A. MATLABB. ClustalWC. ExcelD. PowerPoint4.哪种算法常用于基因表达数据的聚类分析?A. K-meansB. DijkstraC. A*D. Floyd5.生物信息学中,下列哪项不是常用的序列分析技术?A. PCRB. 测序C. 质谱分析D. 芯片技术6.下列哪项不是生物信息学在医学领域的应用?A. 疾病诊断B. 药物设计C. 天气预报D. 个性化医疗7.下列哪项技术常用于生物大分子的结构预测?A. NMRB. X射线衍射C. 同源建模D. 质谱分析8.在生物信息学中,下列哪项不是基因注释的内容?A. 基因功能B. 基因表达水平C. 基因在染色体上的位置D. 基因的长度9.下列哪项技术不是高通量测序技术?A. Sanger测序B. Illumina测序C. 454测序D. SOLiD测序10.下列哪项不是生物信息学在农业领域的应用?A. 作物育种B. 病虫害防治C. 土壤成分分析D. 农产品品质改良二、填空题(每题2分,共20分)1.生物信息学是一门交叉学科,它主要涉及______、计算机科学和数学等领域。

2.在生物信息学中,______技术常用于基因序列的相似性搜索。

3.生物信息学在药物研发中的主要应用包括______和药物靶点的预测。

4.在基因表达数据分析中,______是一种常用的数据标准化方法。

5.生物信息学中,______技术常用于蛋白质结构的预测和分析。

6.在生物信息学数据库中,GenBank主要存储的是______数据。

生物信息学期末期末复习

生物信息学期末期末复习

■一、选择题:1.以下哪一个是mRNA条目序列号:A.J01536■.NM_15392C.NP_52280D.AAB1345062.确定某个基因在哪些组织中表达的最直接获取相关信息方式是:■.UnigeneB.EntrezC.LocusLinkD.PCR3.一个基因可能对应两个Unigene簇吗?■可能B.不可能4.下面哪种数据库源于mRNA信息:■dbESTB.PDBC.OMIMD.HTGS5.下面哪个数据库面向人类疾病构建:A.ESTB.PDB■.OMIMD.HTGS6.Refseq和GenBank有什么区另1J:A.Refseq包括了全世界各个实验室和测序项目提交的DNA序列B.GenBank提供的是非冗余序列■.Refseq源于GenBank,提供非冗余序列信息D.GenBank源于Refseq7.如果你需要查询文献信息,下列哪个数据库是你最佳选择:A.OMIMB.Entrez■PubMedD.PROSITE8.比较从Entrez和ExPASy中提取有关蛋白质序列信息的方法,下列哪种说法正确:A.因为GenBank的数据比EMBL更多,Entrez给出的搜索结果将更多B.搜索结果很可能一样,因为GenBank和EMBL的序列数据实际一样■搜索结果应该相当,但是ExPASy中的SwissProt记录的输出格式不同9.天冬酰胺、色氨酸和酪氨酸的单字母代码分别对应于:■N/W/YB.Q/W/YC.F/W/YD.Q/N/W10.直系同源定义为:■不同物种中具有共同祖先的同源序列B.具有较小的氨基酸一致性但是有较大的结构相似性的同源序列C.同一物种中由基因复制产生的同源序列D.同一物种中具有相似的并且通常是冗余的功能的同源序列11.下列那个氨基酸最不容易突变:A.丙氨酸B.谷氨酰胺C.甲硫氨酸■半胱氨酸12.PAM250矩阵定义的进化距离为两同源序列在给定的时间有多少百分比的氨基酸发生改变:A.1%B.20%■.80%D.250%13.下列哪个句子最好的描述了两个序列全局比对和局部比对的不同:A.全局比对通常用于比对DNA序列,而局部比对通常用于比对蛋白质序列B.全局比对允许间隙,而局部比对不允许C.全局比对寻找全局最大化,而局部比对寻找局部最大化■全局比对比对整体序列,而局部比对寻找最佳匹配子序列14.假设你有两条远源相关蛋白质序列。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

生物信息学复习参考题1、国外常用生物信息站点包括哪些?2、生物信息学定义与应用领域。

3、蛋白序列比对常使用的两种打分矩阵及其不同打分矩阵选择。

4、序列比对常用的软件。

5、同源性6、序列比对分为网上比对与本地比对,各项比对参数的意义。

7、蛋白质一级序列,二级结构和三级结构,及维系空间构象的作用力。

8、常用蛋白质结构预测网站9、常用蛋白序列特征识别工具与数据库10、mRNA的表达水平不能完全反应蛋白质的表达水平,为什么?11、基因预测的信号特征12、基因组注释的基本流程13、人类基因组计划14、蛋白质编码基因的3中注释策略15、GO功能注释16、功能基因组学17、构建系统发生树常用的方法和软件18、实验部分(数据库信息词条含义,序列比对结果分析,蛋白质结构预测常用的网站和工具)生物信息学的大体定义是什么?利利用应用数学、信息学、统计学和算机科学的方法研究生物学的问题。

目前的生物信息学基本上只是分子生物学与信息技术(尤其是互联网技术)的结合体。

生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算机,研究方法包括对生物学数据的搜索(收集和筛选)、处理(编辑、整理、管理和显示)及利用(计算、模拟)。

目前主要的研究方向有:序列比对、基因识别、基因重组、蛋白质结构预测、基因表达、蛋白质反应的预测,以及建立进化模型。

请论述生物信息学的研究内容有哪些?生物分子数据的收集与管理:①基因组数据库(EMBL、GenBank、DDBJ)②蛋白质序列数据库(SWTSS-PROT、PIR)③蛋白质结构数据库(PDB)数据库搜索及序列比较搜索同源序列在一定程度上就是通过序列比较寻找相似序列①序列比较的一个基本操作就是比对(Alignment),即将两个序列的各个字符(代表核苷酸或者氨基酸残基)按照对应等同或者置换关系进行对比排列,其结果是两个序列共有的排列顺序,这是序列相似程度的一种定性描述。

②多重序列比对研究的是多个序列的共性。

序列的多重比对可用来搜索基因组序列的功能区域,也可用于研究一组蛋白质之间的进化关系。

基因组序列分析:①遗传语言分析——天书②基因组结构分析③基因识别④基因功能注释⑤基因调控信息分析⑥基因组比较基因表达数据的分析与处理:基因表达数据分析是目前生物信息学研究的热点和重点。

目前对基因表达数据的处理主要是进行聚类分析,将表达模式相似的基因聚为一类,在此基础上寻找相关基因,分析基因的功能。

所用方法主要有:①相关分析方法②模式识别技术中的层次式聚类方法③人工智能中的自组织映射神经网络④主元分析方法5)蛋白质结构预测。

蛋白质的生物功能由蛋白质的结构所决定,蛋白质结构预测成为了解蛋白质功能的重要途径。

蛋白质结构预测分为:(1)二级结构预测: 在一定程度上二级结构的预测可以归结为模式识别问题在二级结构预测方面主要方法有:立体化学方法、图论方法、统计方法、最邻近决策方法、基于规则的专家系统方法、分子动力学方法、人工神经网络方法预测准确率超过70%的第一个软件是基于神经网络的PHD系统(2)空间结构预测在空间结构预测方面,比较成功的理论方法是同源模型法该方法的依据是:相似序列的蛋白质倾向于折叠成相似的三维空间结构,运用同源模型方法可以完成所有蛋白质10-30%的空间结构预测工作NCBI的Entrez检索包含了哪些方面的信息。

Entrez是NCBI为用户提供整合的访问序列、定位、分类及结构数据的搜索和检索的系统,是一个用以整合NCBI数据库中信息的搜寻和检索的工具,包括核酸序列、蛋白质序列、蛋白质三维结构、基因组图谱和通过PubMed检索的MEDLINE。

其中,Entrez可以整合检索的序列数据库包括GenBank、EMBI—DDBJ、RefSeq、PIR-International、PRF、Swiss—Prot和PDB等。

Entrez有两个显著的特点:第一是对每个数据库中的记录都预先做相似性比较,产生一个列表,包括序列、结构和MEDLINE文献记录等信息;第二是对某个数据库的记录与其他数据库的相关记录做了链接,使对不同数据库的访问得以整合。

所以Entrez是通过相近性和硬连接来提供集成的信息检索。

Entrez可以用很广泛的文本方式搜索,比如作者名字、杂志名字、基因或蛋白名、物种、单一的检索号(如:accession number、序列ID、PubMed ID、MEDLNE UID)和其他的术语,因此,Entrez是一个强大的检索相关序列、结构和参考文献的信息检索工具。

请概述基因组注释的大体流程。

(1)基因组注释(Genome annotation) 是利用生物信息学方法和工具,对基因组所有基因的生物学功能进行高通量注释,是当前功能基因组学研究的一个热点。

基因组注释的研究内容包括基因识别和基因功能注释两个方面。

基因识别的核心是确定全基因组序列中所有基因的确切位置。

从基因组序列预测新基因,现阶段主要是3 种方法的结合: (1) 分析mRNA 和EST数据以直接得到结果; (2) 通过相似性比对从已知基因和蛋白质序列得到间接证据; (3) 基于各种统计模型和算法从头预测。

对预测出的基因进行高通量功能注释可以借助于以下方法,利用已知功能基因的注释信息为新基因注释: (1) 序列数据库相似性搜索; (2) 序列模体(Motif) 搜索; (3) 直系同源序列聚类分析(Cluster of orthologousgroup ,COG). (2)基因组注释系统是MGAP 的核心,整合了许多常用的基因识别和蛋白质功能预测软件,包括GeneMarks、IPRsearch、BLASTPGP 和FASTA3 等,以及多个数据库,如非冗余蛋白质序列数据库(Non redundant , NR) 、已知三维空间结构的蛋白质序列数据库(PDBSeq) 、国际蛋白质资源信息系统( InterPro)和直系同源蛋白质家族数据库(Cluster of orthologousgroups ,COG) 等,编写了相应的模块进行自动操作,并把每一步注释结果导入数据库中。

MGAP 整合的一般模块,可以被其他任何一种微生物基因组直接使用。

1、国外常用生物信息站点包括哪些?NCBI—美国国家生物技术信息中心EBI—欧洲生物信息研究所EMBnet—欧洲分子生物学信息网络2、生物信息学定义与应用领域。

利用应用数学、信息学、统计学和计算机科学的方法研究生物学的问题应用领域:生物信息学数据库(数据库建设、数据库整合和数据挖掘)序列分析(序列比对、基因序列注释)其它主要应用(比较基因组学、基因和蛋白质的表达分析、生物芯片大规模功能表达谱分析、蛋白质结构预测、蛋白质与蛋白质相互作用、生物系统模拟、代谢网络建模分析、计算进化生物学、生物多样性研究、合成生物学)3、蛋白序列比对常使用的两种打分矩阵及其不同打分矩阵选择。

PAM矩阵:基于进化原理;根据氨基酸理化性质分组;优点:模型采用观察突变推算的计分方法,有一定的合理性;缺点:初始模型构建时候利用了有限的蛋白序列;突变值是通过统计方法推算出来的,有一定的局限性;根据不同相似性选择不同的矩阵。

BLOSUM矩阵:通过设置不同的百分比(相似性)产生不同的矩阵与PAM相比,细节有所不同p51优点:来源较丰富的序列局部比对结果建立的矩阵缺点:对含不同进化距离的序列中高度保守的残基会造成结果的偏倚。

4、序列比对常用的软件。

FASTA工具、BLAST工具5、同源性:从某个共同祖先经趋异进化而形成的不同序列,也就是从一些数据中推断出的两个基因在进化上具有共同祖先的结论,它是质的判断。

6、序列比对分为网上比对与本地比对,各项比对参数的意义。

1,网络版本NCBI在线的blast服务;方便,容易操作,数据库同步更新;不利于操作大批量的数据;不能自己定义搜索的数据库。

2,单机版有适合不同平台的版本(包括linux,dos等);必须获取相应的数据库;处理大批的数据;可以自己定义数据库;耗费本地机的大量资源;没有网络版直观、方便;需要一定的计算机操作水平。

Score:1、使用打分矩阵对匹配的片段进行打分; 2、这是对各对氨基酸残基(或碱基)打分求和的结果;3、匹配片段越长、相似性越高则Score值越大。

E value:1、在相同长度的情况下,两个氨基酸残基(或碱基)随机排列的序列进行打分,得到上述Score值的概率的大小;2、E值综合考虑了真实匹配和随机匹配的相对概率、序列长度、数据库的大小、序列组分的偏向性;3、E=1e-6表示这组匹配是随机巧合而不具有生物学意义匹配概率为百万分值一;4、E值越小表示随机情况下得到该Score值的可能性越低。

7、蛋白质一级序列,二级结构和三级结构,及维系空间构象的作用力。

一级结构:多肽链的氨基酸残基的排列顺序,它是由氨基酸个体通过肽键共价连接而成。

肽键二级结构:多肽链主链原子借助于氢键沿一维方向排列成具有周期性的结构现象,是多肽链局部的空间结构,主要有α螺旋、β折叠、β转角、无规卷曲等。

氢键三级结构:整条多肽链的三维结构,包括骨架和侧链在内的所有原子的空间排列。

二硫键等维系空间构象的作用力:疏水键、静电引力、氢键、构象熵、范德华力、共价键8、常用蛋白质结构预测网站一级:ProParam:/tools/protparam.html二级:PredictProtein /螺旋卷曲:Colis /software/COILS_form.html结构域:InterPro /interpro/三维:Phyre /~phyre/观察和修改分子的三维结构:SWISS-PdbView /spdbv/。

相关文档
最新文档