生物信息学名词解释(个人整理)汇编

生物信息学名词解释(个人整理)汇编
生物信息学名词解释(个人整理)汇编

一、名词解释:

1.生物信息学:研究大量生物数据复杂关系的学科,其特征是多学科交叉,以互联网为媒介,数据库为载体。利用数学知识建立各种数学模型; 利用计算机为工具对实验所得大量生物学数据进行储存、检索、处理及分析,并以生物学知识对结果进行解释。

2.二级数据库:在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来,是对生物学知识和信息的进一步的整理。

3.FASTA序列格式:是将DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨基酸字符串,大于号(>)表示一个新文件的开始,其他无特殊要求。

4.genbank序列格式:是GenBank 数据库的基本信息单位,是最为广泛的生物信息学序列格式之一。该文件格式按域划分为4个部分:第一部分包含整个记录的信息(描述符);第二部分包含注释;第三部分是引文区,提供了这个记录的科学依据;第四部分是核苷酸序列本身,以“//”结尾。

5.Entrez检索系统:是NCBI开发的核心检索系统,集成了NCBI的各种数据库,具有链接的数据库多,使用方便,能够进行交叉索引等特点。

6.BLAST:基本局部比对搜索工具,用于相似性搜索的工具,对需要进行检索的序列与数据库中的每个序列做相似性比较。P94

7.查询序列(query sequence):也称被检索序列,用来在数据库中检索并进行相似性比较的序列。P98

8.打分矩阵(scoring matrix):在相似性检索中对序列两两比对的质量评估方法。包括基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如PAM)两类方法。P29 9.空位(gap):在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最佳比对结果,这样在其中一序列上产生中断现象,这些中断的位点称为空位。P29

10.空位罚分:空位罚分是为了补偿插入和缺失对序列相似性的影响,序列中的空位的引入不代表真正的进化事件,所以要对其进行罚分,空位罚分的多少直接影响对比的结果。P37 11.E值:衡量序列之间相似性是否显著的期望值。E值大小说明了可以找到与查询序列(query)相匹配的随机或无关序列的概率,E值越接近零,越不可能找到其他匹配序列,E 值越小意味着序列的相似性偶然发生的机会越小,也即相似性越能反映真实的生物学意义。P95

12.低复杂度区域:BLAST搜索的过滤选项。指序列中包含的重复度高的区域,如poly(A)。

13.点矩阵(dot matrix):构建一个二维矩阵,其X轴是一条序列,Y轴是另一个序列,然后在2个序列相同碱基的对应位置(x,y)加点,如果两条序列完全相同则会形成一条主对角线,如果两条序列相似则会出现一条或者几条直线;如果完全没有相似性则不能连成直线。

14.多序列比对:通过序列的相似性检索得到许多相似性序列,将这些序列做一个总体的比对,以观察它们在结构上的异同,来回答大量的生物学问题。

15.分子钟:认为分子进化速率是恒定的或者几乎恒定的假说,从而可以通过分子进化推断出物种起源的时间。

16.系统发育分析:通过一组相关的基因或者蛋白质的多序列比对或其他性状,可以研究推断不同物种或基因之间的进化关系。

17.进化树的二歧分叉结构:指在进化树上任何一个分支节点,一个父分支都只能被分成两个子分支。

系统发育图:用枝长表示进化时间的系统树称为系统发育图,是引入时间概念的支序图。

18.直系同源:指由于物种形成事件来自一个共同祖先的不同物种中的同源序列,具有相似或不同的功能。(书:在缺乏任何基因复制证据的情况下,具有共同祖先和相同功能的同源基因。)

19.旁系(并系)同源:指同一个物种中具有共同祖先,通过基因重复产生的一组基因,这些基因在功能上可能发生了改变。(书:由于基因重复事件产生的相似序列。)

20.外类群:是进化树中处于一组被分析物种之外的,具有相近亲缘关系的物种。

21.有根树:能够确定所有分析物种的共同祖先的进化树。

22.除权配对算法(UPGMA):最初,每个序列归为一类,然后找到距离最近的两类将其归为一类,定义为一个节点,重复这个过程,直到所有的聚类被加入,最终产生树根。23.邻接法(neighbor-joining method):是一种不仅仅计算两两比对距离,还对整个树的长度进行最小化,从而对树的拓扑结构进行限制,能够克服UPGMA算法要求进化速率保持恒定的缺陷。

24.最大简约法(MP):在一系列能够解释序列差异的的进化树中找到具有最少核酸或氨基酸替换的进化树。

25.最大似然法(ML):它对每个可能的进化位点分配一个概率,然后综合所有位点,找到概率最大的进化树。最大似然法允许采用不同的进化模型对变异进行分析评估,并在此基础上构建系统发育树。

26.一致树(consensus tree):在同一算法中产生多个最优树,合并这些最优树得到的树即一致树。

27.自举法检验(Bootstrap):放回式抽样统计法。通过对数据集多次重复取样,构建多个进化树,用来检查给定树的分枝可信度。

28.开放阅读框(ORF):开放阅读框是基因序列的一部分,包含一段可以编码蛋白的碱基序列。

29.密码子偏好性(codon bias):氨基酸的同义密码子的使用频率与相应的同功tRNA的水平相一致,大多数高效表达的基因仅使用那些含量高的同功tRNA所对应的密码子,这种效应称为密码子偏好性。

30.基因预测的从头分析:依据综合利用基因的特征,如剪接位点,内含子与外显子边界,调控区,预测基因组序列中包含的基因。

31.结构域(domain):保守的结构单元,包含独特的二级结构组合和疏水内核,可能单独存在,也可能与其他结构域组合。相同功能的同源结构域具有序列的相似性。

32.超家族:进化上相关,功能可能不同的一类蛋白质。

33.模体(motif):短的保守的多肽段,含有相同模体的蛋白质不一定是同源的,一般10-20个残基。

34.序列表谱(profile):是一种特殊位点或模体序列,在多序列比较的基础上,氨基酸的权值和空位罚分的表格。

35.PAM矩阵:PAM指可接受突变百分率。一个氨基酸在进化中变成另一种氨基酸的可能性,通过这种可能性可以鉴定蛋白质之间的相似性,并产生蛋白质之间的比对。一个PAM单位是蛋白质序列平均发生1%的替代量需要的进化时间。

36.BLOSUM矩阵:模块替代矩阵。矩阵中的每个位点的分值来自蛋白比对的局部块中的替代频率的观察。每个矩阵适合特定的进化距离。例如,在BLOSUM62矩阵中,比对的分值来自不超过62%一致率的一组序列。

37.PSI-BLAST:位点特异性迭代比对。是一种专门化的的比对,通过调节序列打分矩阵(scoring matrix)探测远缘相关的蛋白。

38.RefSeq:给出了对应于基因和蛋白质的索引号码,对应于最稳定、最被人承认的Genbank 序列。

39.PDB(Protein Data Bank):PDB中收录了大量通过实验(X射线晶体衍射,核磁共振NMR)测定的生物大分子的三维结构,记录有原子坐标、配基的化学结构和晶体结构的描

述等。PDB数据库的访问号由一个数字和三个字母组成(如,4HHB),同时支持关键词搜索,还可以FASTA程序进行搜索。

40.GenPept:是由GenBank中的DNA序列翻译得到的蛋白质序列。数据量很大,且随核酸序列数据库的更新而更新,但它们均是由核酸序列翻译得到的序列,未经试验证实,也没有详细的注释。

41.折叠子(Fold):在两个或更多的蛋白质中具有相似二级结构的大区域,这些大区域具有特定的空间取向。

42.TrEMBL:是与SWISS-PROT相关的一个数据库。包含从EMBL核酸数据库中根据编码序列(CDS)翻译而得到的蛋白质序列,并且这些序列尚未集成到SWISS-PROT数据库中。

43.MMDB(Molecular Modeling Database):是(NCBI)所开发的生物信息数据库集成系统Entrez的一个部分,数据库的内容包括来自于实验的生物大分子结构数据。与PDB相比,对于数据库中的每一个生物大分子结构,MMDB具有许多附加的信息,如分子的生物学功能、产生功能的机制、分子的进化历史等,还提供生物大分子三维结构模型显示、结构分析和结构比较工具。

44.SCOP数据库:提供关于已知结构的蛋白质之间结构和进化关系的详细描述,包括蛋白质结构数据库PDB中的所有条目。SCOP数据库除了提供蛋白质结构和进化关系信息外,对于每一个蛋白质还包括下述信息:到PDB的连接,序列,参考文献,结构的图像等。可以按结构和进化关系对蛋白质分类,分类结果是一个具有层次结构的树,其主要的层次依次是类(class)、折叠子(fold)、超家族(super family)、家族(family)、单个PDB蛋白结构记录。

45.PROSITE:是蛋白质家族和结构域数据库,包含具有生物学意义的位点、模式、可帮助识别蛋白质家族的统计特征。PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等;PROSITE还包括根据多序列比对而构建的序列统计特征,能更敏感地发现一个序列是否具有相应的特征。

46.Gene Ontology 协会:编辑一组动态的、可控的基因产物不同方面性质的字汇的协会。从3个方面描述基因产物的性质,即,分子功能,生物过程,细胞区室。

47.表谱(PSSM):指一张基于多序列比对的打分表,表示一个蛋白质家族,可以用来搜索序列数据库。

48.比较基因组学:是在基因组图谱和测序的基础上,利用某个基因组研究获得的信息推测其他原核生物、真核生物类群中的基因数目、位置、功能、表达机制和物种进化的学科。

49.简约信息位点:指基于DNA或蛋白质序列,利用最大简约法构建系统发育树时,如果每个位点的状态至少存在两种,每种状态至少出现两次的位点。其它位点为都是非简约性信息位点。

1.生物信息学:(狭义)专指应用信息技术储存和分析基因组测序所产生的分子序列及其相关数据的学科;(广义)指生命科学与数学、计算机科学和信息科学等交汇融合所形成的一门交叉学科。

2.人类基因组测序计划:

3基因组学p150:以基因组分析为手段,研究基因组的结构组成、时序表达模式和功能,并提供有关生物物种及其细胞功能的进化信息。

4基因组p150:是指一个生物体、细胞器或病毒的整套基因。

5.比较基因组学p166:是指基因组学与生物信息学的一个重要分支。通过模式生物基因组之间或模式生物基因组与人类基因组之间的比较与鉴别,可以为研究生

物进化和分离人类遗传病的候选基因以及预测新的基因功能提供依据。

6功能基因组:表达一定功能的全部基因所组成的DNA序列,包括编码基因和调控基因。功能基因组学:利用结构基因组学研究所得的各种来源的信息,建立与发展各种技术和实验模型来测定基因及基因组非编码序列的生物学功能。

7蛋白质组p179:是指一个基因组中各个基因编码产生的蛋白质的总体,即一个基因组的全部蛋白产物及其表达情况。

8蛋白质组学:指应用各种技术手段来研究蛋白质组的一门新兴科学,其目的是从整体的角度分析细胞内动态变化的蛋白质组成成分、表达水平与修饰状态,了解蛋白质之间的相互作用与联系,揭示蛋白质功能与细胞生命活动规律。

9功能蛋白质组学:(课件上只能找到功能蛋白质组,即细胞在一定阶段或与某一生理现象相关的所有蛋白)。

10序列对位排列:通过插入间隔的方法使不同长度的序列对齐,达到长度一致。11分子系统树:是表达类群(或序列)间系统发育关系的一种树状图。

12 BLAST搜索p73:是一种基本的局部对位排列搜索工具。

13 SNP p152:即单核酸多态性,是指基因组内特定核苷酸位点上存在两种不同碱基,其中每种在群体中的频率不小于1%。SNP大多数为转换置换。

14 EST p91:即表达序列标签,是从cDNA文库中生成的一些很短的序列(300~500bp),它们代表在特定组织或发育阶段表达的基因,有时可代表特定的cDNA。

16 基因组作图p155:是确定界标或基因在构成基因组的每条染色体上的位置,以及同条染色体上各个界标或基因之间的相对距离。

17 后基因组时代p3:其标志是大规模基因组分析、蛋白质组分析以及各种数据的比较和整合。

18 电子克隆p98:又称虚拟克隆,其原理是依据大量EST具有相互重叠的性质,通过计算机法获得cDNA全长序列。电子克隆是由一个查询序列开始,依靠EST 数据库在计算机上对EST进行两端延伸,从而获得全长的cDNA序列。

19 遗传连锁图p155:是用遗传模式来描述DNA标记(基因和其他确定DNA 序列)在染色体上的相对位置。

20 物理图谱p156:是标明一些界标(如限制酶切点、单一序列、基因等)在DNA分子或染色体上锁处位置的图,图距以物理长度为单位(如核苷酸对的数目)。

1. 生物信息学:

1)生物信息学包含了生物信息的获取、处理、分析、和解释等在内的一门交叉学科;

2)它综合运用了数学、计算机学和生物学的各种工具来进行研究;

3)目的在于阐明大量生物学数据所包含的生物学意义。

2. BLAST(Basic Local Alignment Search Tool)

直译:基本局部排比搜索工具

意译:基于局部序列排比的常用数据库搜索工具

含义:蛋白质和核酸序列数据库搜索软件系统及相关数据库

3. PSI-BLAST:是一种迭代的搜索方法,可以提高BLAST和FASTA的相似序列发现率。

4. 一致序列:这些序列是指把多序列联配的信息压缩至单条序列,主要的缺点是除了在特

定位置最常见的残基之外,它们不能表示任何概率信息。

5. HMM 隐马尔可夫模型:一种统计模型,它考虑有关匹配、错配和间隔的所有可能的组合

来生成一组序列排列。(课件定义)是蛋白质结构域家族序列的一种严格的统计模型,包括序列的匹配,插入和缺失状态,并根据每种状态的概率分布和状态间的相互转换来生成蛋白质序列。

6. 信息位点:由位点产生的突变数目把其中的一课树与其他树区分开的位点。

7. 非信息位点:对于最大简约法来说没有意义的点。

8. 标度树:分支长度与相邻节点对的差异程度成正比的树。

9. 非标度树:只表示亲缘关系无差异程度信息。

10. 有根树:单一的节点能指派为共同的祖先,从祖先节点只有唯一的路径历经进化到达其

他任何节点。

11. 无根树:只表明节点间的关系,无进化发生方向的信息,通过引入外群或外部参考物种,

可以在无根树中指派根节点。

12. 注释:指从原始序列数据中获得有用的生物学信息。这主要是指在基因组DNA中寻找基

因和其他功能元件(结构注释),并给出这些序列的功能(功能注释)。

13. 聚类分析:一种通过将相似的数据划分到特定的组中以简化大规模数据集的方法。

14. 无监督分析法:这种方法没有内建的分类标准,组的数目和类型只决定于所使用的算法

和数据本身的分析方法。

15. 有监督分析法:这种方法引入某些形式的分类系统,从而将表达模式分配到一个或多个

预定义的类目中。

16. 微阵列芯片:将探针有规律地排列固定于载体上,与标记荧光分子的样品进行杂交,通

过扫描仪扫描对荧光信号的强度进行检测,从而迅速得出所要的信息。

17. 虚拟消化:是基于已知蛋白序列和切断酶的特异性的情况下进行的理论酶切(课件定

义)。是在已知蛋白质序列和蛋白外切酶之类切断试剂的已知特异性的基础上,由计算机进行的一种理论上的蛋白裂解反应。

19. 分子途径是指一组连续起作用以达到共同目标的蛋白质。

20. 虚拟细胞:一种建模手段,把细胞定义为许多结构,分子,反应和物质流的集合体。

21. 先导化合物:是指具有一定药理活性的、可通过结构改造来优化其药理特性而可能导致

药物发现的特殊化合物。就是利用计算机在含有大量化合物三维结构的数据库中,搜索能与生物大分子靶点匹配的化合物,或者搜索能与结合药效团相符的化合物,又称原型物,简称先导物,是通过各种途径或方法得到的具有生物活性的化学结构

22. 权重矩阵(序列轮廓):它们表示完全结构域序列,多序列联配中每个位点的氨基酸都

有分值,并且特定位置插入或缺失的可能性均有一定的衡量方法(课件定义)。基础上针对特定的应用目标而建立的数据库。

23. 系统发育学(phylogenetic):确定生物体间进化关系的科学分支。

24. 系统生物学(systems biology):是研究一个生物系统中所有组分成分(基因、mRNA、

蛋白质等)的构成以及在特定条件下这些组分间的相互关系,并分析生物系统在一定时间内的动力学过程

25. 蛋白质组(proteome):是指一个基因组、一种生物或一个细胞/组织的基因组所表达

的全套蛋白质。

1、生物信息学

广义:生命科学中的信息科学。生物体系和过程中信息的存贮、传递和表达;细胞、组织、器官的生理、病理、药理过程的中各种生物信息。

狭义:生物分子信息的获取、存贮、分析和利用。

2、基因:有遗传效应的DNA片断,是控制生物性状的基本遗传单位。

3、中心法则

是指遗传信息从DNA传递给RNA,再从RNA传递给蛋白质,即完成遗传信息的转录和翻译的过程。也可以从DNA传递给DNA,即完成DNA的复制过程。这是所有有细胞结构的生物所遵循的法则。

4、一级数据库

数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释5、基因芯片

基因芯片(gene chip),又称DNA微阵列(microarray),是由大量cDNA或寡核苷酸探针密集排列所形成的探针阵列,其工作的基本原理是通过杂交检测信息。

6、推动生物信息学快速发展的学科

核心和灵魂:生物学

基本工具:数学与计算机技术

7、“组”学的主要创新点对生命科学发展的作用与意义

21世纪是生物技术和信息技术的时代,基因组研究由结构基因组研究转向功能基因组研究,蛋白质组学已成为当前研究的热点和重点,生物信息学加快了生命科学的发展步伐。蛋白组研究的兴起和发展,在揭示生命运动的本质及疾病的诊断、治疗等方面发挥着重要作用。随着基因组学研究的不断深入,在基因组测序、蛋白质序列测定和结构解析等实验的基础上,产生了大量有关生物分子的原始数据,这些原始的数据需要利用现代计算机技术进行收集、整理、管理以便检索使用,生物信息学应用而生,其研究重点集中在核酸和蛋白质两个方面。所谓组学,即从一个整体的角度来研究。相对于传统生命科学零敲碎打的研究手段,研究单个的基因或蛋白的功能、结构,而组学则是着眼于大局,将单个的基因、蛋白以“组”的水平进行研究,从而对于生命科学能够有一个大局的把握。

作用:(1) 从学科角度方面:生命科学进入了新的发展时期;研究体系的突破:局部到整体;学科性质:经验型、资料积累到总结规律

(2) 从研究人员角度:提高研究效率、深化研究成果、显著增加论文“厚度”与“重量”

意义:正对生命科学产生深远的影响,极大提高科研的效率、质量、促进生命科学实现跨越式的发展。数据处理、分析能力直接影响当今生命科学研究机构的科研能力与研究成果水平。

8、世界上最权威的四大生物数据平台

美国人工蛋白质数据库:1960年

GenBank数据库:1979年

欧洲分子生物学实验室(EMBL):1982年

日本核酸序列数据库(DDBJ): 1984年

19、分子钟

蛋白质同系物的替换率,在几百万至几千万年的时间跨度上是基本保持恒定的,因此将氨基酸的匀速变异现象比作分子钟。

基本规律:

(1)不同类的基因间的氨基酸替换率的存在显著差异

(2)同类的分子进化速率则几乎完全一致,同源蛋白质的差异取决于它们独立分化的时间

20、进化树构建的主要方法、各自的原理及优缺点

距离建树方法:利用双重序列比对的差异程度进行建树;

最大简约法:进化往往会走最短的路-----DNA序列发生的碱基替换数量最少

最大似然法:进化会走可能性最大的路

1)距离建树方法(非加权组平均法UPGMA,相邻归并法Neighbor-joining, NJ(优点:快速),Fitch-Margoliash(FM)( 优点:允许OTU(操作分类单位)间存在不同的进化速率))

原理:根据双重序列比对的差异程度(距离)

优点:使用序列进化模型、计算强度较小

缺点:屏蔽了真实的特征符数据。

2)最大简约法

原理:最能反映进化历史的树具有最短的树长(tree length),即进化步数(性状在系统树中状态改变的次数)最少。即:DNA序列发生的碱基替换数最少。

3)最大似然法

原理:首先选定一个进化模型,计算该模型下,各种分支树产生现有数据的可能性。具有最大可能性的系统树为最优。即一个树的似然性(likelihood)等于每一个性状的似然性之和或每一个性状的似然性对数之和。

优点:完全基于统计,在每组序列比对中考虑了每个核苷酸替换的概率,使用越来越普遍

缺点:计算量非常大,缺乏普遍适用的替换模型(不同的替换模型给出不同的结果)

21、domain, fold, motif31、蛋白质的各级结构的定义

Domain: 指具有特定且相对独立的三维立体结构、而且能够独立完成某种功能的蛋白质的一部分,但有时候也泛指蛋白质序列的一部分。

Fold: 蛋白质基本三维结构,包括:(1) 二级结构元件(2)元件之间的顺序连接(3)元件之间的相对空间位置

Motif:模体,在DNA或蛋白质序列上保守的短片段,或蛋白质结构上普遍存在的保守立体结构元件。

一级结构:氨基酸序列;

二级结构:局部多肽链借助氢键排成特有的规则结构;如α螺旋,β-折叠等等三级结构:由远程肽段折叠而产生,一般指多肽链的独立折叠单位经多重盘绕、折叠形成由各种次级键维持的球状结构。简单蛋白质的三维空间结构,或复杂蛋白质亚基的三维空间结构。

四级结构:由若干亚基组装成复杂蛋白

22、蛋白质家族、蛋白质超家族

蛋白质家族(family): are groups of proteins that demonstrate sequence homology or have similar sequences.(一般成员之间的序列相似性超过40-50%以上,进化上可能共同起源于同一祖先蛋白)。主要是从量上面讲,即序列相似性很强的一系列蛋白质

蛋白质超家族(superfamily):Consist of proteins that have similar folding motifs but do not exhibit sequence similarity.成员之间的几乎不存在序列相似性,但在结构组成上有相似的折叠模体构成。主要是从性上面讲,即序列功能、结构很相似,但序列却不相似的一类蛋白质

23、一级数据库:数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释

24、序列基序:指的是一组序列所共有的一段局部保守区域或短的序列模式

25.分子系统学:从生物大分子(氨基酸、核苷酸)的遗传信息推断生物进化的历史,并以系统树(谱系)的形式表达出来。

26.动态规划:是一种解决多阶段决策过程的最优化方法或复杂空间的优化搜索方法。

27.TDT分析:比较某些特殊等位基因由亲代向子代的传递频率的差别的方法。

28.蛋白质结构视观:是在实验测定其结构或通过结构生物信息学进行结构预测的基础上,对蛋白质结构利用计算机图形处理方法显现出来,便于研究人员对其二维或三维结构有一感性认识,更重要的是有助于理解蛋白与蛋白或其配体的相互作用。

29.基因芯片:又称DNA微阵列,是由大量DNA或寡核苷酸探针密集排列所形成的探针阵列,其工作的基本原理是通过杂交检测信息。

生物信息学期末考试重点

第一讲 生物信息学(Bioinformatics)是20世纪80年代末随着人类基因组计划的启动而兴起的一门新型交叉学科,它体现了生物学、计算机科学、数学、物理学等学科间的渗透与融合。 生物信息学通过对生物学实验数据的获取、加工、存储、检索与分析,达到揭示数据所蕴含的生物学意义从而解读生命活动规律的目的。 生物信息学不仅是一门学科,更是一种重要的研究开发平台与工具,是今后进行几乎所有生命科学研究的推手。 生物技术与生物信息学的区别及联系 生物信息学的发展历史 ?人类基因组计划(HGP) ?人类基因组计划由美国科学家于1985年提出,1990年启动。根据该计划,在2015年要把人体约4万个基因的密码全部揭开,同时绘制出人类基因的谱图,也就是说,要揭开组成人体4万个基因的30亿个碱基对的秘密。HGP与曼哈顿原子弹计划和阿波罗计划并称为三大科学计划,被誉为生命科学的登月计划。(百度百科) 随着基因组计划的不断发展,海量的生物学数据必须通过生物信息学的手段进行收集、分析和整理后,才能成为有用的信息和知识。换句话说,人类基因组计划为生物信息学提供了兴盛的契机。上文所说的基因、碱基对、遗传密码子等术语都是生物信息学需要着重研究的地方。 :

】 第二讲回顾细胞结构 细胞是所有生命形式结构和功能的基本单位 细胞组成 细胞膜主要由脂类和蛋白质组成的环绕在细胞表面的双层膜结构 细胞质细胞膜与细胞核之间的区域:包含液体流质,夹杂物存储的营养、分泌物、天然色素和细胞器 细胞器细胞内完成特定功能的结构:线粒体、核糖体、高尔基体、溶酶体等 细胞核最大的细胞器 DNA的结构 碱基(腺嘌呤A、鸟嘌呤G、胞嘧啶C、胸腺嘧啶G) 。 核苷酸 核苷酸是构成DNA分子的重要模块。每个核苷酸分子由一分子称作脱氧核糖的戊 糖(五碳糖)、一分子磷酸和一分子碱基构成。每种核苷酸都有一个碱基对,也就 是A、T、C、G 基因是什么 基因是遗传物质的基本单位 基因就是核苷酸序列。 大部分的基因大约是1000-4000个核苷酸那么长。 基因通过控制蛋白质的合成,从微观和宏观上影响细胞、组织和器官的产生。 基因在染色体上。

生理学重点名词解释

第一章绪论 1. 内环境指机体细胞生存的液体环境,由细胞外液构成,如血浆、组织液、脑脊液、房水、淋巴等。 2. 稳态指内环境的理化性质及各组织器官系统功能在神经体液因素的调节下保持相对的恒定状态。 3. 反射指机体在中枢神经系统的参与下对环境变化作出的规律性反应,是神经活动的基本方式。 4. 负反馈反馈信息与控制信息的作用(方向)相反,即负反馈,是使机体生理功能保持稳态的重要调节方式 5. 正反馈反馈信息与控制信息作用(方向)一致,以加强控制部分的活动,即正反馈;典型的正反馈有分娩、血液凝固、排便等。 第二章细胞的基本功能 1.液态镶嵌模型是关于细胞膜结构的学说,认为膜的结构是以液态的脂质双分子层为基架,其中镶嵌着具有不同生理功能的蛋白质。 2. 易化扩散指水溶性小分子物质或离子借助膜上的特殊蛋白质(载体或通道)的帮助而进行的顺电-化学梯度的跨膜转运。有载体介导和通道介导两种 3. 主动转运需要细胞膜消耗能量、将分子或离子逆电-化学梯度的跨膜转运。 4. 静息电位指静息状态下细胞膜两侧的电位差,同类型细胞的静息电位数值常不相等。 5. 极化指细胞保持稳定的内负外正的状态。此时,细胞处于静息电位水平。 6. 去极化指膜内电位朝着正电荷增加的方向变化,去极化后的膜电位的绝对值小于静息电位的绝对值。 7. 超极化指在静息电位的基础上,膜内电位朝着正电荷减少的方向变化,超极化后的膜电位的绝对值大于静息电位的绝对值。 8. 阈电位使再生性Na+内流足以抵消K+外流而爆发动作电位,膜去极化所必须达到的临界水平;也可以说是能引起动作电位的临界膜电位。 9. 动作电位指可兴奋细胞受刺激时,在静息电位基础上产生的短暂而可逆的,可扩布的膜电位倒转。动作电位是兴奋的标志。 10. 复极化去极完毕后膜内电位朝着正电荷减少,即静息电位的方向变化。 11. 绝对不应期组织接受一次刺激而兴奋的一个较短时间内,无论接受多强的刺激也不能再产生动作电位,这一时期称为绝对不应期。在绝对不应期内兴奋性为零。 12. 局部兴奋阈下刺激引起的膜部分去极化的状态称为局部兴奋。 13. 量子式释放神经末梢囊泡内所含递质的量大致相等,而递质释放又是以囊泡为最小单位,成批地释放,故称量子式释放。 14. 终板电位指终板膜上N2胆碱能受体与ACh结合后,化学门控的Na+、K+通道开放,Na+内流、K+外流,尤其是以Na+内流为主,使终板膜局部产生去极化电位。终板电位属局部电位 15. 兴奋-收缩耦联将肌膜动作电位为标志的电兴奋与以肌丝滑行为基础的机械收缩衔接起来的中介过程。耦联因子是Ca2+。 16. 等长收缩肌肉长度不变而张力增加的收缩形式。 17. 等张收缩肌肉收缩时表现为张力不变而只有长度缩短的收缩形式。 第三章血液 1. 等渗溶液指渗透压与血浆渗透压相等的溶液,约为313m Osm/L,例如0. 9%的NaCl溶液。

生物信息学复习题及答案

生物信息学复习题 名词解释 1. Homology (同源):来源于共同祖先的序列相似的序列及同源序列。序列相似序列并不一定是同源序列。 (直系同源):指由于物种形成的特殊事件来自一个共同祖先的不同物种中的同源序列,它们具有相似的功能。 (旁系(并系)同源):指同一个物种中具有共同祖先,通过基因复制产生的一组基因,这些基因在功能上的可能发生了改变。基因复制事件是促进新基因进化的重要推动力。 (异同源):通过横向转移,来源于共生或病毒侵染而产生的相似的序列,为异同源。 Score:The sum of the number of identical matches and conservative (high scoring) substitutions in a sequence alignment divided by the total number of aligned sequence characters. Gap总是不计入总数中。 6.点矩阵(dot matrix):构建一个二维矩阵,其X轴是一条序列,Y轴是另一个序列,然后在2个序列相同碱基的对应位置(x,y)加点,如果两条序列完全相同则会形成一条主对角线,如果两条序列相似则会出现一条或者几条直线;如果完全没有相似性则不能连成直线。 7. E值:得分大于等于某个分值S的不同的比对的数目在随机的数据库搜索中发生的可能性。衡量序列之间相似性是否显著的期望值。E值大小说明了可以找到与查询序列(query)相匹配的随机或无关序列的概率,E值越小意味着序列的相似性偶然发生的机会越小,也即相似性越能反映真实的生物学意义,E值越接近零,越不可能找到其他匹配序列。 值:得分为所要求的分值比对或更好的比对随机发生的概率。它是将观测得到的比对得分S,与同样长度和组成的随机序列作为查询序列进行数据库搜索进行比较得到的HSP(高分片段对)得分的期望分布联系起来计算的。通常使用低于来定义统计的显著性。P=1-e-E 9.打分矩阵(scoring matrix):在相似性检索中对序列两两比对的质量评估方法。包括基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如PAM)两类方法,是序列相似性分析的基础,其不同的选择将会出现不同的分析结果。 10.空位(gap):在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最佳比对结果,这样在其中一序列上产生中断现象,这些中断的位点称为空位。 :美国国家生物技术信息学中心,属于美国国立医学图书馆的一部分,具有BLAST, Entrez ,GenBank等工具,还具有PubMed文献数据库。另外还具有Genome, dbEST, dbGSS , dbSTS, MMDB, OMIM, UniGene, Taxonomy, RefSeq, etc. 序列格式:是将DNA或者蛋白质序列表示为一个带有大于号(>)开始的核苷酸或者氨基酸序列的新文件,其中大于号后可以跟上序列的相关信息,其他无特殊要求。 13genbank序列格式:是GenBank 数据库的基本信息单位,是最为广泛的生物信息学序列格式之一。该文件格式按域划分为4个部分:第一部分包含整个记录的信息(描述符);第二部分包含注释,主要包含生物功能或数据库信息;第三部分是feature,对序列的注释;第四部分是序列本身,以“统发生树(Phylogenetic tree )是研究生物进化和系统发育过程中的一种用树状分支图来概括各种生物之间亲缘关系,是一种亲缘分支分类方法。在树中,每个节点代表其各分支的最近共同祖先,而节点间的线段长度对应演化距离(如估计的演化时间)。是用来研究物种进化与多样性的基础,是相近物种相关生物学数据的来源。17.基因树与物种树:物种树反映一组物种进化历程的系统树,其中每一个内部节点就代表一个物种形成的过程,而基因树则是代表来源于不同物种的单个同源基因的差异构建的系统树,而其内部的一个节点则代表一个祖先基因分化为两个新的独特的基因序列的事件。基因

生物信息学考试试卷修订稿

生物信息学考试试卷 WEIHUA system office room 【WEIHUA 16H-WEIHUA WEIHUA8Q8-

一、名词解释(每小题4分,共20分) 1、生物信息学 广义:生命科学中的信息科学。生物体系和过程中信息的存贮、传递和表达;细胞、组织、器官的生理、病理、药理过程的中各种生物信息。 狭义:生物分子信息的获取、存贮、分析和利用。 2、人类基因组计划 人类基因组计划准备用15年时间,投入30亿美元,完成人类全部24条染色体的3×109脱氧核苷酸对(bp)的序列测定,主要任务包括作图(遗传图谱、物理图谱的建立及转录图谱的绘制)、测序和基因识别。其中还包括模式生物(如大肠杆菌、酵母、线虫、小鼠等)基因组的作图和测序,以及信息系统的建立。作图和测序是基本的任务,在此基础上解读和破译生物体生老病死以及和疾病相关的遗传信息。 3、蛋白质的一级结构 蛋白质的一级结构是指多肽链中氨基酸的序列 4、基因 基因--有遗传效应的DNA片断,是控制生物性状的基本遗传单位。 5、中心法则 是指遗传信息从传递给,再从RNA传递给,即完成遗传信息的转录和翻译的过程。也可以从DNA传递给DNA,即完成DNA的复制过程。这是所有有细胞结构的生物所遵循的法则。 6 、DNA序列比较 序列比较的根本任务是:(1)发现序列之间的相似性;(2)辨别序列之间的差异 目的: 相似序列相似的结构,相似的功能 判别序列之间的同源性 推测序列之间的进化关系 7、一级数据库 数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释 8、基因识别 基因识别,是生物信息学的一个重要分支,使用生物学实验或计算机等手段识别DNA序列上的具有生物学特征的片段。基因识别的对象主要是蛋白质编码基因,也包括其他具有一定生物学功能的因子,如RNA基因和调控因子。 9、系统发生学 系统发生学(phylogenetics)——研究物种之间的进化关系。 10、基因芯片 基因芯片(gene chip),又称DNA微阵列(microarray),是由大量cDNA或寡核苷酸探针密集排列所形成的探针阵列,其工作的基本原理是通过杂交检测信息。

生理学重点名词解释

名词解释: 1.内环境:细胞直接接触和赖以生存的液体环境 2.稳态:细胞外液的理化性质保持相对稳定动态平衡 3.易化扩散:在膜蛋白的帮助下,非极性分子和小离子顺浓度或顺电子梯度的跨膜转运, 包括经通道的易化扩散和经载体的易化扩散 4.原发性主动转运:在膜蛋白的帮助下,细胞代谢供能的逆浓度梯度或逆电子梯度跨膜转 运 5.去极化:细胞膜的极化状态减弱,静息电位降低的过程 6.超计划;细胞膜的极化状态增强,静息电位增强的过程 7.静息电位:在安静状态下细胞膜两侧存在外正内负且相对稳定的电位差 8.动作电位:细胞在静息电位的前体下接受刺激产生一次迅速、可逆的、可向两侧传播的 电位变化 9.“全”或”无”的现象:要使细胞产生动作电位,必须一定的刺激。当刺激不够时,无 法引起动作电位的形成,若达到一定刺激时,便会产生动作电位且幅度达到最高值不会随刺激强度增强而增强 10.阈电位:触发动作电位的膜电位临界值 11.兴奋-收缩偶联:将横纹肌产生动作的电兴奋过程与肌丝滑动的机械收缩联系起来的中 心机制 12.等长收缩:肌肉收缩时长度不变张力增加的过程 13.前负荷:肌肉收缩前所受到的负荷,决定肌节的初长度,在一定范围内,随肌节长度的 增加,肌肉收缩的张力越大 14.血细胞比容:血细胞在血液中的所占的容积之比

15.血浆胶体渗透压:由血浆中蛋白质所决定的渗透压,影响血液与组织液之间的水平衡和 维持血浆的容量 16.血沉:将抗凝血放入血沉管中垂直静置,红细胞由于密度较大而下沉。通常以红细胞在 第一小时末下沉的距离表示红细胞的沉降速度,称为红细胞沉降率,即血沉 17.生理性止血:正常情况下,小血管损伤后出血一段时间便会自行停止的过程。包括血管 收缩、.血小板止血栓的形成、血液凝固 18.心动周期:心脏的一次收缩和舒张构成一个机械活动周期,包括舒张期和收缩期。由于 心室在心脏泵血起主要作用,又成心室活动周期 19.射血分数:博出量与心室收缩末期容积的比值,能明显体现心脏的泵血功能 20.心指数:心输出量与机体表面积的比值,放映心功能的重要指数 21.异长自身调节:通过改变心肌的初长度而引起的心肌收缩力改变的调节 22.期前损伤:在心室肌有效不应期后到下一次窦房结兴奋到来之前额外使心肌受到一次刺 激,产生的兴奋和收缩 23.房室延搁:兴奋由心房经房室结至心室的过程中出现的一个时间间隔:此处兴奋传导速 度仅有s 24.自动节律性:心肌在无外界刺激条件下自动产生节律性兴奋的能力 25.正常起搏点:窦房结是心传导系统中自律性最高的部分,故窦房结称为正常起搏点,其 他的称为潜在起搏点 26.中心静脉压:右心房和胸腔内大静脉的血压,其高低取决于心脏的射血能力和经脉回血 血量。 27.收缩压:心室收缩中期血压达到最高值时的血压 28.平均动脉压:一个心动周期每一瞬间血压的平均值

生物信息学名词解释资料

1.生物信息学:研究大量生物数据复杂关系的学科,其特征是多学科交叉,以互联网为媒介,数据库为载体。利用数学知识建立各种数学模型; 利用计算机为工具对实验所得大量生物学数据进行储存、检索、处理及分析,并以生物学知识对结果进行解释。 2.二级数据库:在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来,是对生物学知识和信息的进一步的整理。 3.FASTA序列格式:是将DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨基酸字符串,大于号(>)表示一个新文件的开始,其他无特殊要求。 4.genbank序列格式:是GenBank 数据库的基本信息单位,是最为广泛的生物信息学序列格式之一。该文件格式按域划分为4个部分:第一部分包含整个记录的信息(描述符);第二部分包含注释;第三部分是引文区,提供了这个记录的科学依据;第四部分是核苷酸序列本身,以“//”结尾。 5.Entrez检索系统:是NCBI开发的核心检索系统,集成了NCBI 的各种数据库,具有链接的数据库多,使用方便,能够进行交叉索引等特点。 6.BLAST:基本局部比对搜索工具,用于相似性搜索的工具,对需要进行检索的序列与数据库中的每个序列做相似性比较。P94 7.查询序列(query sequence):也称被检索序列,用来在数据库中检索并进行相似性比较的序列。P98 8.打分矩阵(scoring matrix):在相似性检索中对序列两两比对的质量评估方法。包括基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如PAM)两类方法。P29 9.空位(gap):在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最佳比对结果,这样在其中一序列上产生中断现象,这些中断的位点称为空位。P29 10.空位罚分:空位罚分是为了补偿插入和缺失对序列相似性的影 响,序列中的空位的引入不代表真正的进化事件,所以要对其进行 罚分,空位罚分的多少直接影响对比的结果。P37 11.E值:衡量序列之间相似性是否显著的期望值。E值大小说明了 可以找到与查询序列(query)相匹配的随机或无关序列的概率,E 值越接近零,越不可能找到其他匹配序列,E值越小意味着序列的 相似性偶然发生的机会越小,也即相似性越能反映真实的生物学意 义。P95 12.低复杂度区域:BLAST搜索的过滤选项。指序列中包含的重复 度高的区域,如poly(A)。 13.点矩阵(dot matrix):构建一个二维矩阵,其X轴是一条序列, Y轴是另一个序列,然后在2个序列相同碱基的对应位置(x,y) 加点,如果两条序列完全相同则会形成一条主对角线,如果两条序 列相似则会出现一条或者几条直线;如果完全没有相似性则不能连 成直线。 14.多序列比对:通过序列的相似性检索得到许多相似性序列,将这 些序列做一个总体的比对,以观察它们在结构上的异同,来回答大 量的生物学问题。 15.分子钟:认为分子进化速率是恒定的或者几乎恒定的假说,从而 可以通过分子进化推断出物种起源的时间。 16.系统发育分析:通过一组相关的基因或者蛋白质的多序列比对或 其他性状,可以研究推断不同物种或基因之间的进化关系。 17.进化树的二歧分叉结构:指在进化树上任何一个分支节点,一个 父分支都只能被分成两个子分支。 系统发育图:用枝长表示进化时间的系统树称为系统发育图,是 引入时间概念的支序图。 18.直系同源:指由于物种形成事件来自一个共同祖先的不同物种中 的同源序列,具有相似或不同的功能。(书:在缺乏任何基因复制 证据的情况下,具有共同祖先和相同功能的同源基因。) 19.旁系(并系)同源:指同一个物种中具有共同祖先,通过基因重 复产生的一组基因,这些基因在功能上可能发生了改变。(书:由于 基因重复事件产生的相似序列。) 20.外类群:是进化树中处于一组被分析物种之外的,具有相近亲缘 关系的物种。 21.有根树:能够确定所有分析物种的共同祖先的进化树。 22.除权配对算法(UPGMA):最初,每个序列归为一类,然后找 到距离最近的两类将其归为一类,定义为一个节点,重复这个过程, 直到所有的聚类被加入,最终产生树根。 23.邻接法(neighbor-joining method):是一种不仅仅计算两两比 对距离,还对整个树的长度进行最小化,从而对树的拓扑结构进行 限制,能够克服UPGMA算法要求进化速率保持恒定的缺陷。 24.最大简约法(MP):在一系列能够解释序列差异的的进化树中 找到具有最少核酸或氨基酸替换的进化树。 25.最大似然法(ML):它对每个可能的进化位点分配一个概率, 然后综合所有位点,找到概率最大的进化树。最大似然法允许采用 不同的进化模型对变异进行分析评估,并在此基础上构建系统发育 树。 26.一致树(consensus tree):在同一算法中产生多个最优树,合并 这些最优树得到的树即一致树。 27.自举法检验(Bootstrap):放回式抽样统计法。通过对数据集多 次重复取样,构建多个进化树,用来检查给定树的分枝可信度。 精品文档

生物信息学试题整理

UTR的含义是(B ) A.编码区 B. 非编码区 C. motif的含义是(D )。 A.基序 B. 跨叠克隆群 C. algorithm 的含义是(B )。 A.登录号 B. 算法 C. RGR^ (D )。 A.在线人类孟德尔遗传数据 D.水稻基因组计划 下列Fasta格式正确的是(B) 低复杂度区域 D. 幵放阅读框 碱基对 D. 结构域 比对 D. 类推 B. 国家核酸数据库 C. 人类基因组计划 A. seql: agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta B. >seq1 agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta C. seq1:agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta D. >seq1agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta 如果我们试图做蛋白质亚细胞定位分析,应使用(D) A. NDB 数据库 B. PDB 数据库 C. GenBank 数据库 D. SWISS-PROT 数

据库 Bioinformatics 的含义是(A )。 A. 生物信息学 B. 基因组学 C. 蛋白质组学 D. 表观遗传学 Gen Bank中分类码PLN表示是(D )。 A.哺乳类序列 B. 细菌序列 C.噬菌体序列 D. 植物、真菌和藻类序列 ortholog 的含义是(A)0 A.直系同源 B.旁系同源 C.直接进化 D.间接进化 从cDNA文库中获得的短序列是(D )o A. STS B. UTR C. CDS D. EST con tig的含义是(B )o A.基序 B. 跨叠克隆群 C. 碱基对 D. 结构域 TAIR (AtDB)数据库是(C)o A.线虫基因组 B. 果蝇基因组 C. 拟南芥数据库 D. 大肠杆菌基因组ORF的含义是(D )o A.调控区 B. 非编码区 C.低复杂度区域 D. 幵放阅读框

生物化学名词解释

生物化学名解解释 1、肽单元(peptide unit):参与肽键的6个原子Cα1、C、O、N、H、Cα2位于同一平面,Cα1和Cα2在平面上所处的位置为反式构型,此同一平面上的6个原子构成了肽单元,它是蛋白质分子构象的结构单元。Cα是两个肽平面的连接点,两个肽平面可经Cα的单键进行旋转,N—Cα、Cα—C是单键,可自由旋转。 2、结构域(domain):分子量大的蛋白质三级结构常可分割成1个和数个球状或纤维状的区域,折叠得较为紧密,具有独立的生物学功能,大多数结构域含有序列上连续的100—200个氨基酸残基,若用限制性蛋白酶水解,含多个结构域的蛋白质常分成数个结构域,但各结构域的构象基本不变。 3、模体(motif):在许多蛋白质分子中,二个或三个具有二级结构的肽段,在空间上相互接近,形成一个特殊的空间构象。一个模序总有其特征性的氨基酸序列,并发挥特殊功能,如锌指结构。 4、蛋白质变性(denaturation):在某些物理和化学因素作用下,其特定的空间构象被破坏,也即有序的空间结构变成无序的空间结构,从而导致其理化性质的改变和生物活性的丧失。主要发生二硫键与非共价键的破坏,不涉及一级结构中氨基酸序列的改变,变性的蛋白质易沉淀,沉淀的蛋白质不一定变性。 5、蛋白质的等电点( isoelectric point, pI):当蛋白质溶液处于某一pH时,蛋白质解离成正、负离子的趋势相等,即成为兼性离子,蛋白质所带的正负电荷相等,净电荷为零,此时溶液的pH称为蛋白质的等电点。 6、酶(enzyme):酶是一类对其特异底物具有高效催化作用的蛋白质或核酸,通过降低反应的活化能催化反应进行。酶的不同形式有单体酶,寡聚酶,多酶体系和多功能酶,酶的分子组成可分为单纯酶和结合酶。酶不改变反应的平衡,只是通过降低活化能加快反应的速度。(不考) 7、酶的活性中心 (active center of enzymes):酶分子中与酶活性密切相关的基团在空间结构上彼此靠近,组成具有特定空间结构的区域,能与底物特异结合并将底物转化为产物。参与酶活性中心的必需基团有结合底物,使底物与酶形成一定构象复合物的结合基团和影响底物中某些化学键稳定性,催化底物发生化学反应并将其转化为产物的催化基团。活性中心外还有维持酶活性中心应有的空间构象的必需基团。 8、酶的变构调节 (allosteric regulation of enzymes):一些代谢物可与某些酶分子活性中心外的某部分可逆地结合,使酶构象改变,从而改变酶的催化活性,此种调节方式称酶的变构调节。被调节的酶称为变构酶或别构酶,使酶发生变构效应的物质,称为变构效应剂,包括变构激活剂和变构抑制剂。 9、酶的共价修饰(covalent modification of enzymes):在其他酶的催化作用下,某些酶蛋白肽链上的一些基团可与某种化学基团发生可逆的共价结合,从而改变酶的活性,此过程称为共价修饰。主要包括:磷酸化—去磷酸化;乙酰化—脱乙酰化;甲基化—去甲基化;腺苷化—脱腺苷化;—SH与—S—S—互变等;磷酸化与脱磷酸是最常见的方式。 10、酶原和酶原激活(zymogen and zymogen activation):有些酶在细胞内合成或初分泌时只是酶的无活性前体,必须在一定的条件下水解开一个或几个特定的肽键,使构象发生改变,表现出酶的活性,此前体物质称为酶原。由无活性的酶原向有活性酶转化的过程称为酶原激活。酶原的激活,实际是酶的活性中心形成或暴露的过程。 11、同工酶(isoenzyme isozyme):催化同一化学反应而酶蛋白的分子结构,理化性质,以及免疫学性质都不同的一组酶。它们彼此在氨基酸序列,底物的亲和性等方面都存在着差异。由同一基因或不同基因编码,同工酶存在于同一种属或同一个体的不同组织或同一细胞的不同亚细胞结构中,它使不同的组织、器官和不同的亚细胞结构具有不同的代谢特征。 12、糖酵解(glycolysis):在机体缺氧条件下,葡萄糖经一系列酶促反应生成丙酮酸进而还原生成乳酸的过程称为糖酵解(糖的无氧氧化)。糖酵解的反应部位在胞浆。主要包括由葡萄糖分解成丙酮酸的糖酵解途径和由丙酮酸转变成乳酸两个阶段,1分子葡萄糖经历4次底物水平磷酸化,净生成2分子ATP。关键酶主要有己糖激酶,6-磷酸果糖激酶-1和丙酮酸激酶。它的意义是机体在缺氧情况下获取能量的有效方式;某些细胞在氧供应正常情况下的重要供能途径。 13、糖异生(gluconeogenesis):是指从非糖化合物(乳酸、甘油、生糖氨基酸等)转变为葡萄糖或糖

生理学重要名词解释

生理学重要名词解释医教园考研 1、潮气量(tidal volume):平静呼吸时,每次吸入或呼出的气量。 2、余气量(residual volume):在尽量呼气后,肺内仍保留的气量。 3、功能余量(functional residual capacity)=余气量补呼气量。 4、肺总容量(total lung capacity)=潮气量补吸气量(expiratory reserve volume,ERV) 补呼气量(inspiratory reser volume) 余气量。 5、肺活量(vital capacity):最大吸气后,从肺内所能呼出的最大气量。 6、时间肺活量:是评价肺通气功能的较好指标,正常人头3秒分别为83%、96%、99%的肺活量。时间肺活量比肺活量更能反映肺通气状况,时间肺活量反映的为肺通气的动态功能,测定时要求以最快的速度呼出气体。 7、每分肺通气量(minute ventilation volume)=潮气量×呼吸频率。 8、每分钟肺泡通气量(alveolar ventilation)=(潮气量-无效腔气量)×呼吸频率。 9、生理无效腔(physiological dead space)=肺泡无效腔(alveolar dead space) 解剖无效腔(anatomical dead space) P126-128 10、每搏输出量(stroke volume)及射血分数(ejection fraction): 一侧心室每次收缩所输出的血量,称为每搏输出量,人体安静状态下约为60~80ml. 射血分数=每搏输出量/心室舒张末期容积 人体安静时的射血分数约为55%~65%.射血分数与心肌的收缩能力有关,心肌收缩能力越强,则每搏输出量越多,射血分数也越大。 11、每分输出量(minute volume/cardiac output)与心指数(cardiac index): 每分输出量=每搏输出量×心率,即每分钟由一侧心室输出的血量,约为5~6L. 心输出量不与体重而是与体表面积成正比。 12、心指数:以单位体表面积(m2)计算的心输出量。 13、心脏作功 每搏功(stroke work)P128每分功(minute work)=每搏功(stroke work)X心率P128

生物信息学名词解释(原创)

名词解释(笔者承认偷了点懒,只是把能在网上找到的都整合在一张上面了,此整理仅适合开卷考试) 基因表达(gene expression):基因通过转录和翻译,产生蛋白质产物和直接转录RNA参与生物功能的过程。 基因调控:涉及基因的启动关闭、活性的增加或减弱,发生在转录阶段、转录后加工阶段和翻译阶段。 负调控(Negative control):阻遏蛋白(repressor protein)结合在受控基因上时不表达,不结合时就表达的形式。 正调控(Positive control):基因表达的活化物( activators )结合在受控基因上时,激活基因表达,不结合时就不表达的形式。 一次数据库:记录实验的结果和一些初步的解释。 二次数据库:对一次数据库的数据进行分析和提炼加工后形成的、便于使用的数据库。 空位罚分 (gap penalty ):序列比对分析时为了反映核酸或氨基酸的插入或缺失等而插入空位并进行罚分,以控制空位插入的合理性。 Consensus sequence:共有序列,指多种原核基因启动序列特定区域内,通常在转录起始点上游-10及-35区域存在一些相似序列。 FASTA序列格式:是将DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨基酸字符串,大于号(>)表示一个新文件的开始,其他无特殊要求。 Similarity相似性:是直接的连续的数量关系,是指序列比对过程中用来描述检测序列和目标序列之间相同DNA碱基或氨基酸残基顺序所占比列的高低。 genbank序列格式:是GenBank 数据库的基本信息单位,是最为广泛的生物信息学序列格式之一。该文件格式按域划分为4个部分:第一部分包含整个记录的信息(描述符);第二部分包含注释;第三部分是引文区,提供了这个记录的科学依据;第四部分是核苷酸序列本身,以“//”结尾。 模体(motif):短的保守的多肽段,含有相同模体的蛋白质不一定是同源的,一般10-20个残基。 查询序列(query sequence):也称被检索序列,用来在数据库中检索并进行相似性比较的序列。 打分矩阵(scoring matrix):在相似性检索中对序列两两比对的质量评估方法。包括基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如PAM)两类方法。 空位(gap):在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最佳比对结果,这样在其中一序列上产生中断现象,这些中断的位点称为空位。 PDB:PDB中收录了大量通过实验(X射线晶体衍射,核磁共振NMR)测定的生物大分子的三维结构,记录有原子坐标、配基的化学结构和晶体结构的描述等。PDB数据库的访问号由一个数字和三个字母组成(如,4HHB),同时支持关键词搜索,还可以FASTA程序进行搜索。 Prosite:是蛋白质家族和结构域数据库,包含具有生物学意义的位点、模式、可帮助识别蛋白质家族的统计特征。 PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等;PROSITE还包括根据多序列比对而构建的序列统计特征,能更敏感地发现一个序列是否具有相应的特征。 PIR:是一个集成了关于蛋白质功能预测数据的公共资源的数据库,其目的是支持基因组蛋白质研究。SWLSS—MODE:是目前最著名的蛋白质三级结构预测服务器,建立在已知生物大分子结构基础上,利用同源建模的方法对未知序列的蛋白质三级结构进行预测。 E值:衡量序列之间相似性是否显著的期望值。E值大小说明了可以找到与查询序列(query)相匹配的随机或无关序列的概率,E值越接近零,越不可能找到其他匹配序列,E值越小意味着序列的相似性偶然发生的机会越小,也即相似性越能反映真实的生物学意义。 点矩阵(dot matrix):构建一个二维矩阵,其X轴是一条序列,Y轴是另一个序列,然后在2个序列相同碱基的对应位置(x,y)加点,如果两条序列完全相同则会形成一条主对角线,如果两条序列相似则会出现一条或者几条直线;如果完全没有相似性则不能连成直线。 多序列比对:通过序列的相似性检索得到许多相似性序列,将这些序列做一个总体的比对,以观察它们在

最新生物信息学考试复习

——古A.名词解释 1. 生物信息学:广义是指从事对基因组研究相关的生物信息的获取,加工,储存,分配,分析和解释。狭义是指综合应用信息科学,数学理论,方法和技术,管理、分析和利用生物分子数据的科学。 2. 基因芯片:将大量已知或未知序列的DNA片段点在固相载体上,通过物理吸附达到固定化(cDNA芯片),也可以在固相表面直接化学合成,得到寡聚核苷酸芯片。再将待研究的样品与芯片杂交,经过计算机扫描和数据处理,进行定性定量的分析。可以反映大量基因在不同组织或同一组织不同发育时期或不同生理条件下的表达调控情况。 3. NCBI:National Center for Biotechnology Information.是隶属于美国国立医学图书馆(NLM)的综合性数据库,提供生物信息学方面的研究和服务。 4. EMBL:European Molecular Biology Laboratory.EBI为其一部分,是综合性数据库,提供生物信息学方面的研究和服务。 5. 简并引物:PCR引物的某一碱基位置有多种可能的多种引物的混合体。 6. 序列比对:为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。

7. BLAST:Basic Local Alignment Search Tool.是通过比对(alignment)在数据库中寻找和查询序列(query)相似度很高的序列的工具。 8. ORF:Open Reading Frame.由起始密码子开始,到终止密码子结束可以翻译成蛋白质的核酸序列,一个未知的基因,理论上具有6个ORF。 9. 启动子:是RNA聚合酶识别、结合并开始转录所必须的一段DNA序列。原核生物启动子由上游调控元件和核心启动子组成,核心启动子包括-35区(Sextama box)TTGACA,-10区(Pribnow Box)TATAAT,以及+1区。真核生物启动子包括远上游序列和启动子基本元件构成,启动子基本元件包括启动子上游元件(GC岛,CAAT盒),核心启动子(TATA Box,+1区帽子位点)组成。 10. motif:模体,基序,是序列中局部的保守区域,或者是一组序列中共有的一小段序列模式。 11. 分子进化树:通过比较生物大分子序列的差异的数值重建的进化树。 12. 相似性:序列比对过程中用来描述检测序列和目标序列之间相似DNA碱基或氨基酸残基序列所占的比例。 13. 同源性:两个基因或蛋白质序列具有共同祖先的结论。

生物化学名词解释完全版

第一章 1,氨基酸(amino acid):就是含有一个碱性氨基与一个酸性羧基的有机化合物,氨基一般连在α-碳上。 2,必需氨基酸(essential amino acid):指人(或其它脊椎动物)(赖氨酸,苏氨酸等)自己不能合成,需要从食物中获得的氨基酸。 3,非必需氨基酸(nonessential amino acid):指人(或其它脊椎动物)自己能由简单的前体合成 不需要从食物中获得的氨基酸。 4,等电点(pI,isoelectric point):使分子处于兼性分子状态,在电场中不迁移(分子的静电荷为零)的pH值。 5,茚三酮反应(ninhydrin reaction):在加热条件下,氨基酸或肽与茚三酮反应生成紫色(与脯氨酸反应生成黄色)化合物的反应。6,肽键(peptide bond):一个氨基酸的羧基与另一个的氨基的氨基缩合,除去一分子水形成的酰氨键。 7,肽(peptide):两个或两个以上氨基通过肽键共价连接形成的聚合物。 8,蛋白质一级结构(primary structure):指蛋白质中共价连接的氨基酸残基的排列顺序。 9,层析(chromatography):按照在移动相与固定相 (可以就是气体或液体)之间的分配比例将混合成分分开的技术。 10,离子交换层析(ion-exchange column)使用带有固定的带电基团的聚合树脂或凝胶层析柱 11,透析(dialysis):通过小分子经过半透膜扩散到水(或缓冲液)的原理,将小分子与生物大分子分开的一种分离纯化技术。 12,凝胶过滤层析(gel filtration chromatography):也叫做分子排阻层析。一种利用带孔凝胶珠作基质,按照分子大小分离蛋白质或其它分子混合物的层析技术。 13,亲合层析(affinity chromatograph):利用共价连接有特异配体的层析介质,分离蛋白质混合物中能特异结合配体的目的蛋白质或其它分子的层析技术。 14,高压液相层析(HPLC):使用颗粒极细的介质,在高压下分离蛋白质或其她分子混合物的层析技术。 15,凝胶电泳(gel electrophoresis):以凝胶为介质,在电场作用下分离蛋白质或核酸的分离纯化技术。 16,SDS-聚丙烯酰氨凝胶电泳(SDS-PAGE):在去污剂十二烷基硫酸钠存在下的聚丙烯酰氨凝胶电泳。SDS-PAGE只就是按照分子的大小,而不就是根据分子所带的电荷大小分离的。 17,等电聚胶电泳(IFE):利用一种特殊的缓冲液(两性电解质)在聚丙烯酰氨凝胶制造一个pH梯度,电泳时,每种蛋白质迁移到它的等电点(pI)处,即梯度足的某一pH时,就不再带有净的正或负电荷了。 18,双向电泳(two-dimensional electrophorese):等电聚胶电泳与SDS-PAGE的组合,即先进行等电聚胶电泳(按照pI)分离,然后再进行SDS-PAGE(按照分子大小分离)。经染色得到的电泳图就是二维分布的蛋白质图。 19,Edman降解(Edman degradation):从多肽链游离的N末端测定氨基酸残基的序列的过程。N末端氨基酸残基被苯异硫氰酸酯修饰,然后从多肽链上切下修饰的残基,再经层析鉴定,余下的多肽链(少了一个残基)被回收再进行下一轮降解循环。 20,同源蛋白质(homologous protein):来自不同种类生物的序列与功能类似的蛋白质,例如血红蛋白。 第二章 1,构形(configuration):有机分子中各个原子特有的固定的空间排列。这种排列不经过共价键的断裂与重新形成就是不会改变的。构形的改变往往使分子的光学活性发生变化。 2,构象(conformation):指一个分子中,不改变共价键结构,仅单键周围的原子放置所产生的空间排布。一种构象改变为另一种构象时,不要求共价键的断裂与重新形成。构象改变不会改变分子的光学活性。 3,肽单位(peptide unit):又称为肽基(peptide group),就是肽键主链上的重复结构。就是由参于肽链形成的氮原子,碳原子与它们的4个取代成分:羰基氧原子,酰氨氢原子与两个相邻α-碳原子组成的一个平面单位。 4,蛋白质二级结构(protein在蛋白质分子中的局布区域内氨基酸残基的有规则的排列。常见的有二级结构有α-螺旋与β-折叠。二级结构就是通过骨架上的羰基与酰胺基团之间形成的氢键维持的。5,蛋白质三级结构(protein tertiary structure): 蛋白质分子处于它的天然折叠状态的三维构象。三级结构就是在二级结构的基础上进一步盘绕,折叠形成的。三级结构主要就是靠氨基酸侧链之间的疏水相互作用,氢键,范德华力与盐键维持的。 6,蛋白质四级结构(protein quaternary structure):多亚基蛋白质的三维结构。实际上就是具有三级结构多肽(亚基)以适当方式聚合所呈现的三维结构。 7,α-螺旋(α-heliv):蛋白质中常见的二级结构,肽链主链绕假想的中心轴盘绕成螺旋状,一般都就是右手螺旋结构,螺旋就是靠链内氢键维持的。每个氨基酸残基(第n个)的羰基与多肽链C端方向的第4个残基(第4+n个)的酰胺氮形成氢键。在古典的右手α-螺旋结构中,螺距为0、54nm,每一圈含有3、6个氨基酸残基,每个残基沿着螺旋的长轴上升0、15nm、 8, β-折叠(β-sheet): 蛋白质中常见的二级结构,就是由伸展的多肽链组成的。折叠片的构象就是通过一个肽键的羰基氧与位于同一个肽链的另一个酰氨氢之间形成的氢键维持的。氢键几乎都垂直伸展的肽链,这些肽链可以就是平行排列(由N到C方向)或者就是反平行排列(肽链反向排列)。 9,β-转角(β-turn):也就是多肽链中常见的二级结构,就是连接蛋白质分子中的二级结构(α-螺旋与β-折叠),使肽链走向改变的一种非重复多肽区,一般含有2~16个氨基酸残基。含有5个以上的氨基酸残基的转角又常称为环(loop)。常见的转角含有4个氨基酸残基有两种类型:转角I的特点就是:第一个氨基酸残基羰基氧与第四个残基的酰氨氮之间形成氢键;转角Ⅱ的第三个残基往往就是甘氨酸。这两种转角中的第二个残侉大都就是脯氨酸。 10,超二级结构(super-secondary structure):也称为基元(motif)、在蛋白质中,特别就是球蛋白中,经常可以瞧到由若干相邻的二级结构单元组合在一起,彼此相互作用,形成有规则的,在空间上能辨认的二级结构组合体。 11,结构域(domain):在蛋白质的三级结构内的独立折叠单元。结构

生理学名词解释 (3)

第一章绪论 1.内环境(internal environment):细胞外液是细胞直接接触和赖以生存的环境,称为机体的内环境。 2.稳态(homeostasis):细胞外液理化性质和化学成分相对恒定的状态。 3.负反馈(negative feedback):受控部分发出的反馈信息调整控制部分的活动,最终使受控部分的活动向相反的方向改变,以减弱或抑制过强的功能活动。 4.正反馈(positive feedback):受控部分发出的反馈信息促进和加强控制部分的活动,最终使受控部分的活动逐渐加强,使某种功能活动不断加强。 5.反射(reflex):在中枢神经系统的参与下,机体对内、外环境的变化所作出的规律性应答。 6.自身调节(autoregulation):组织细胞不依赖神经或体液因素,自身对环境刺激发生的一种适应性反应。 7.神经调节(neuroregulation):通过反射而影响生理功能的一种调节方式,是人体生理功能调节中最主要的形式。 8.体液调节( humoral regulation ) 第二章细胞的基本功能 1.钠泵(sodium pump):又称钠-钾泵(sodium-potassium pump),由α和β两个亚单位组成的二聚体蛋白质,具有ATP酶的活性。每分解一分子ATP将3个Na+移出胞外,将2个K+移入胞内,保持膜内高钾

膜外高钠的不均匀离子分布。作用:细胞内高钾是许多代谢反应进行的必需条件;防止细胞水肿;势能贮备。 2.静息电位(resting potential, RP):细胞在静息状态下(即未受到刺激时),存在于细胞膜内外两侧的电位差,称为静息电位。表现为膜外带正电,膜内带负电。 3.极化(polarization):平稳的静息电位存在时,细胞跨膜电位为内负外正的状态。 4.去极化(depolarization):静息电位减小的过程或状态。 5.复极化(repolarization):膜电位去极化后再向静息电位方向恢复的过程。 6.超极化(hyperpolarization):静息电位增大的过程或状态。 7.动作电位(action potential,AP):可兴奋细胞受到适当的刺激时,细胞膜在静息电位的基础上产生一个迅速的、可逆的、可传导的电位变化。 8.阈电位(threshold potential, TP):能引起Na+通道大量开放,形成正反馈性Na+内流,并引发动作电位的临界膜电位。 9.阈强度(threshold intensity):是刺激的持续时间和强度-时间变化率不变,引起组织兴奋所需要的最小刺激强度。 10.局部电位(local potential): 由少量钠通道激活而产生的去极化膜电位波动。 第三章血液 1.血细胞比容(hematocrit):血细胞在全血中所占的容积百分比,称为血

相关文档
最新文档