生物信息研究中常用蛋白质数据库的总结

生物信息研究中常用蛋白质数据库的总结
生物信息研究中常用蛋白质数据库的总结

生物信息研究中常用蛋白质数据库简述

内蒙古工业大学理学院呼和浩特孙利霞 2010.1.5

摘要:在后基因组时代生物信息学的研究当中,离不开各种生物信息学数据库。尤其在蛋白质从序列到功能的研究当中,目前各种行之有效的方法都是基于各种层次和结构的蛋白质数据库。随着计算机技术及网络技术的发展,目前的蛋白质数据库不论是所包含数据量还是功能都日新月异,新的数据库层出不穷。一个新手面对如此浩瀚的数据量往往无从下手。本文粗浅地为目前蛋白质数据库的使用勾画出一个轮廓,作为自己蛋白质研究入门的一个引导。

关键词:蛋白质;数据库

0 引言

随着科技的发展,个人的知识往往赶不上快速膨胀的信息量,人们为了解决这个问题,便创建了形形色色的数据库。蛋白质数据库是指:在蛋白质研究领域根据实际需要,对蛋白质序列、蛋白质结构以及文献等数据进行分析、整理、归纳、注释,构建出具有特殊生物学意义和专门用途的数据库。蛋白质数据库总体上可分为两大类:蛋白质序列数据库和蛋白质结构数据库,蛋白质序列数据库来自序列测定,结构数据库来自X-衍射和核磁共振结构测定(详见图1)。这些数据库是分子生物信息学的基本数据资源。上世纪90年代,我国从事蛋白质研究的学者使用的蛋白质数据库储存介质还是国外实验室发布的激光光盘[1]。信息的传播储存甚为不便。随着蛋白质研究的发展飞快,同时伴随着计算机和因特网发展,蛋白质数据库的储存传播方式也发生的巨大的变化。进入21世纪后,我们所用的各种蛋白质数据库都发展成为存储在网络服务器上,基于“服务器—客户机”的访问查询方式。伴随着计算机及物理测试技术的发展数据库的容量和功能成数量级膨胀。但是面对如此浩瀚的数据,新手往往感到无从下手,在需要时找不到自己需要的合适数据库。

本文从目前蛋白质数据库建立的的逻辑层次出发,系统地简绍了常用蛋白质数据的概况,它们的查询方法以及它们相互之间的联系。同时尽量不涉及数据库建设和维护方面的计算机和网络这些数据库底层的技术,为蛋白质研究的入门者及对蛋白质感兴趣的人员的一个引导。

图1 两大类蛋白质数据库

1 建库方式的分类

蛋白质数据库种类繁多。一个的数据库记录通常包括两部分:原始数据和对这些数据进行的生物学意义的注释。以建库的方式而论,大致可以分为四类:

一、最基础的一级数据库。这些数据库一般是由国家或国际组织建设和维护的数据库。如EMBL ,PDB 等。这样的数据库的优点是完整,更新及时,并提供了一些较好的服务软件和平台计算条件。缺点是对于数据的创新性,精确性和准确性没有权威的评价,数据过多,重复,分类较粗。

二、二级数据库,(如图2)。二级数据库是在一级库德基础上,结合工作的需要将部分数据从一级库中取出,重新组合而成的特定数据库。这类数据库专一性强,数据量相对较少,但质量高。数据库结构设计精致。

三、专家库。这是一种特殊的二级库。与一般二级库不同之处在于它是经过有经验的专家进行人工校对标识之后建立的。这样的库质量很高,使用方便可靠,但是更新发展较为缓慢。这类库的典型代表是SWISS-PORT 。[2]

图2 蛋白质二级结构数据库的逻辑结构

????????????????????蛋白质功能位点数据库:Prosite 蛋白质序列指纹图谱数据库:Prints 以蛋白质序列数据库为基础构建的二级库同源蛋白质家族数据库:Pfam 同源蛋白质结构域数据库:Blocks 免疫球蛋白数据库:Kabat 蛋白质二级库以具有特殊功能的蛋白质为基础构建的二级库蛋白激酶数据库:Pkinase 蛋白质二级结构构象参数数据库DSSP 以三维结构原子坐标为基础构建的二级库已????????????????????????????????????????????

知空间结构的蛋白质家族数据库FSSP 已知空间结构的蛋白质及其同源蛋白质数据库HSSP

2蛋白质序列数据库:UniProt数据库

UniProt属于蛋白质序列数据库。如今的蛋白质序列数据库中,有的收集实验测定的序列,有的收集根据DNA序列等翻译预测的蛋白质序列,有的这两者都有收录。SWISS-PROT、TrEMBL、PIR是曾经用的很广泛的蛋白质序列数据库。而今都并入了UniProt中。

现在UniProt有三个层次的数据库:UniParc(UniProt Archive)收录所有UniProt数据库子库中的蛋白质序列,虽然很大,但是信息比较粗糙。既包括重复的序列也包括未加注释的序列;UniRef(UniProt Reference Clusters)是归纳UniProt几个主要数据库并将重复的序列去除后的数据库。其中UniRef100是只去除完全重复的序列的数据库,UniRef90是去除相似性在90%以上的相似序列数据库;UinProtKB(UniProt Knowledgebase)是有详细注释并与其他数据库及文献有链接的数据库,分为UinProtKB/SWISS-PROT与UinProtKB/TrEMBL两部分。

2.1 SWISS-PROT

SWISS-PORT是含有详细注释内容的蛋白质序列数据库。1987年由日内瓦大学医学生物化学系(Department of Medical Biochemistry of the University of Geneva )与EMBL共同维护,现由EMBL的分支机构EBI进行维护。网址为:http://www.expasy.ch/sprot/sprot-top.html。一般地,任何蛋白质序列数据的搜索和比较都应从SWISS-PORT开始[3]。

2.2 TrEMBL (Translated EMBL)

EMBL是指实验室欧洲分子生物学实验室EMBL(The European Molecular Biology Laboratory),TrEMBL 是EMBL-DNA数据库中的核算序列翻译后产生的核酸序列数据库。EMBL-DNA数据库于1982年由EMBL建立,全球性的国际DNA数据库,近年来发展很快,可进行核苷酸序列检索及序列相似性查询。

传统的蛋白质序列数据库的一种来源是通过对核酸序列数据库中的核算按照密码子人工翻译后,再用实验核实。但是对于EMBL-DNA数据库中的核酸序列翻译进行核实远远落后EMBL-DNA数据库中数据量的发展。EMBL-DNA数据库中含有众多的由计算机直接分析得到的在SWISS-PORT数据库中并不存在

的氨基酸序列。为了克服这一缺点,人们又开发了另一个数据库—EMBL核酸序列翻译数据库,即TrEMBL(Translated EMBL)。该数据库中包含了EMBL数据库中的所有编码序列的信息。网址为:http://www.expasy.ch/sprot/sprot-top.html。这是SWISS-PROT数据库的重要补充,但是其中的数据质量要有所保留。

TrEMBL是从EMBL库中的核酸序列翻译出来的氨基酸序列,它们已经完成自动注释。分为两部分:SP-TrEMBL的条目已经由专家人工分类并且赋予了SWISS-PORT库的索取号,但是还没有通过人工审读并最终收入SWISS-PORT。REM-TrEMBL(REMaining TrEMBL)包含了由于某种原因没有被收入到SWISS

-PORT的条目。

2.3 PIR数据库

蛋白质信息资源数据库PIR(Protein Information Resource)是在很多文献中都要简绍的一个蛋白质序列数据库,其主要目的是提供按同源性和分类学组织的综合性,非冗余数据库。不过目前它的大部分服务已经停止使用。1984年建成PIR数据库,在2005年其序列信息相应并入UniProt中的SWISS-PROT与TrEMBL中。

3蛋白质结构数据库

蛋白质结构的内容为被测定的蛋白质分子空间结构原子坐标,PDB数据库、SCOP数据库、CATH数据库是几个常用的交重要的蛋白质结构数据库。

3.1 PDB

蛋白质数据库(Protein databank, PDB)由美国自然科学基金会,能源部和国立卫生研究院共同投资建立。主要由X射线晶体衍射和核磁共振(NMR)测得的生物大分子三维结构所组成。用户可直接查询,调用和观察库中所收录的任何大分子三维结构。网址为:https://www.360docs.net/doc/2f14573405.html,/pdb/。随着晶体衍射技术的不断改进,结构测定的速度和精度也逐步提高。90年代以来,随着多维核磁共振溶液构象测定方法的成熟,使那些难以结晶的蛋白质分子的结构测定成为可能。蛋白质分子结构数据库的数据量迅速上升。据2000年5月统计,PDB数据库中已经存放了1万2千多套原子坐标,其中大部分为蛋白质,包括多肽和病毒。此外,还有

核酸、蛋白和核酸复合物以及少量多糖分子。近年来,核酸三维结构测定进展迅速。

PDB数据库以文本文件的方式存放数据,每个分子各用一个独立的文件。除了原子坐标外,还包括物种来源、化合物名称、结构递交以及有关文献等基本注释信息。此外,还给出分辨率、结构因子、温度系数、蛋白质主链数目、配体分子式、金属离子、二级结构信息、二硫键位置等和结构有关的数据。

每个PDB文件可能分割成一系列行,由行终止符终止。在记录文件中每行由80列组成。每条PDB记录末尾标志应该是行终止符。PDB文件中每行都是自我识别的。每行的前六列存放记录名称,左对齐空格补足.必须和规定的记录名称一致。PDB文件也可看成是各种记录类型的总和。每个记录类型包括一行或多行又被更深一层分成各字段。以下是PDB文件存储数据格式的一个完整简洁的说明:

一、标题部分

1 HEADER(分子类,公布日期、ID号)

2 OBSLTE (注明此ID号已改为新号)

3 TITLE(说明实验方法类型)

4 CA VEA T(可能的错误提示)

5 COMPND(化合物分子组成)

6 SOURCE(化合物来源)

7 KEYWDS(关键词)8 EXPDTA(测定结构所用的实验方法)

9 AUTHO(结构测定者)10 REVDA T(修订日期及相关内容)

11 SPRSDE(已撤销或更改的相关记录)12 JRNL(发表坐标集的文献)

13 REMARK:REMARK 1(有关文献)、REMARK 2(最大分辨率)、REMARK 3(用到的

程序和统计方法)、REMARK 4-999。

二、一级结构

1 DBREF(其他序列库的有关记录)

2 SEQADV ( PDB与其他记录的出入)

3 SEQRES(残基序列)

4 MODRES (对标准残基的修饰)

三、杂因子

1 HET (非标准残基)

2 HETNAM(非标准残基的名称)

3 HETSNY (非标准残基的同义字)

4 FORMOL(非标准残基的化学式)

四、二级结构

1 HELIX(螺旋)

2 SHEET(折叠片)

3 TURN(转角)

五、连接注释

1 SSBOND (二硫键)

2 LINK(残基间化学键)

3 HYDBND(氢键)

4 SLTBRG(盐桥)

5 CISPEP(顺式残基)

六、簿记

1 MASTER (版权拥有者)

2 END(文件结束)

另外,使用Rosmol程序可以利用PDB中的数据直接观察蛋白质的三维结构[3](如图3)。

图3 Rosmol 显示的蛋白质三维结构图

3.2 SCOP

SCOP(Structural Classification of Proteins Database)是收录蛋白质结构域的数据库。SCOP根据数据结构与进化关系用人工及计算机自动处理,将蛋白质空间结构的组成部分结构域分为类(Class)、折叠(Folds),超家族(Superfamoly),家族(family)四个等级。其中按空间结构分出类与折叠。按进化关系分出超家族与家族。2004年SCOP有超过4万个蛋白质结构域,分为7类,800个折叠,1294个家族,2327个超家族。

3.3CATH

CATH 是收录蛋白质结构域的数据库。CATH根据结构与同源性将蛋白质结构域分为C(class)A(architecture)T(topology)H(homologous)S(sequence

family)等几个层次。按空间结构分为C、A、T从层,按同源性分为H、S两层。2005年CATH中有3229个蛋白质结构域,分为4个C层、37个A层、813个T 层和1467个H层[4]。

4结语

由于时间仓促,本文在创新性方面略显单薄,并且没有对蛋白质二级库进行简绍。甚为遗憾。但资料收集整理颇为繁琐,仅以此文作为自己研一上半学期入门课程的一次总结和梳理。同时感谢胡老师的谆谆教导。

参考文献:

[1]李伍举,吴加令. 蛋白质功能位点预测. 生物化学与生物物理进展, 1993,

20:60~62

[2]赵国屏.生物信息学.北京:科学出版社,2002

[3]张成岗,贺福初.生物信息学方法与实践.北京:科学出版社,2002

[4]许忠能. 生物信息学. 北京:清华大学出版社,2008

9个常用的国外英文文献数据库

9个常用的国外英文论文文献数据库 9个论文文献数据库,科研搬砖,阅读涨姿势,论文写作小帮手!先说说什么是数据库:学术科研中说的「数据库」和「文献数据库」,往往是一种的形式,这个的贮存了大量文献数据(比如论文)可以简单的理解为一个网络图书馆。 数据库中的论文往往都是耗费了大量的时间和精力整理出来的,还有很多是需要购买才可以放在互联网上的,再加上维护这个本身就耗费颇多,因此这些数据库通常不是完全免费的,你可以在上面免费查找文献,浏览摘要等简介容,但是如果你要下载文献,就要付钱。 大学因为科研和教学需要,常年要下载大量的论文材料,所以就会和数据库的经营者签订很多协议,例如包年,就是给一定量的钱,然后就可以无限制下载论文。也有按照下载的数量进行计费。那英语作为世界第一学术语言,有哪些数据库是值得大家分享的呢?1、Wiley InterScience(英文文献期刊)Wiley InterScience是John Wiely & Sons公司创建的动态在线容服务,1997年开始在网上开通。通过InterScience,Wiley公司以许可协议形式向用户提供在线访问全文容的服务。Wiley InterScience收录了360多种科学、工程技术、医疗领域及相关专业期刊、30多种大型专业

参考书、13种实验室手册的全文和500多个题目的Wiley 学术图书的全文。网址:onlinelibrary.wiley./其中被SCI 收录的核心期刊近200种。期刊具体学科划分为:Business,Finance & Management (商业、金融和管理)、Chemistry (化学)、Computer Science(计算机科学)、Earth Science (地球科学)、Education (教育学)、Engineering (工程学)、Law(法律)、Life and Medical Sciences (生命科学与医学)、Mathematics and Statistics(数学统计学)、Physics (物理)、Psychology (心理学)。 2. ICPSRICPSR全称为Inter-university Consortium for Political and Social Research,即美国校际社会科学数据共享联盟。成立于1962年,位于美国密西根大学安娜堡分校(University of Michigan- Ann Arbor, 1817-),储存超过17000种调查研究资料,如军队官兵总名册,遗嘱、遗嘱查验与税收纪录,是现在世界上最大的社会科学数据中心,拥有600多个成员机构,包括大学和各种研究中心。网址:https://www.360docs.net/doc/2f14573405.html,/icpsrweb/landing.jsp其中400多个成员机构在美国,我国的国家人口发展研究战略课题组,大学,大学,科技大学,浸会大学也是成员之一。 3. IEEE 电气电子工程师学会IEEE(Institute of Electrical & Electronics Engineers)是电子信息领域最著名的跨国性学

细胞生物学常用研究方法

Southern杂交: 是体外分析特异DNA序列的方法,操作时先用限制性内切酶将核DNA或线粒体DNA切成DNA片段,经凝胶电泳分离后,转移到醋酸纤维薄膜上,再用探针杂交,通过放射自显影,即可辨认出与探针互补的特殊核苷序列。 将RNA转移到薄膜上,用探针杂交,则称为Northern杂交。 RNAi技术: 是指在进化过程中高度保守的、由双链RNA(double-stranded RNA,dsRNA)诱发的、同源mRNA高效特异性降解的现象。由于使用RNAi技术可以特异性剔除或关闭特定基因的表达,所以该技术已被广泛用于探索基因功能和传染性疾病及恶性肿瘤的基因治疗领域。可以利用siRNA或siRNA表达载体快速、经济、简便的以序列特异方式剔除目的基因表达,所以现在已经成为探索基因功能的重要研究手段。 Southern杂交一般利用琼脂糖凝胶电泳分离经限制性内切酶消化的DNA片段,将胶上的DNA变性并在原位将单链DNA片段转移至尼龙膜或其他固相支持物上,经干烤或者紫外线照射固定,再与相对应结构的标记探针进行杂交,用放射自显影或酶反应显色,从而检测特定DNA分子的含量]。 扫描电镜技术:是用一束极细的电子束扫描样品,在样品表面激发出次级电子,次级电子的多少与样品表面结构有关,次级电子由探测器收集,信号经放大用来调制荧光屏上电子束的强度,显示出与电子束同步的扫描图像。 细胞显微分光光度计:用来描述薄膜、涂层厚度超过1微米的物件的光学性能的显微技术。 免疫荧光技术:将免疫学方法(抗原抗体特异结合)与荧光标记技术结合起来研究特异蛋白抗原在细胞内分布的方法。由于荧光素所发的荧光可在荧光显微镜下检出,从而可对抗原进行细胞定位。 电镜超薄切片技术:超薄切片是为电镜观察提供极薄的切片样品的专门技术。用当代较好的超薄切片机,大多数生物材料,如果固定、包埋处理得合适,可以切成50-100微米的超薄切片。 Northern印迹杂交(Northern blot)。这是一种将RNA从琼脂糖凝胶中转印到硝酸纤维素膜上的方法。 放射自显影技术:放射自显影技术是利用放射性同位素的电离辐射对乳胶(含AgBr或AgCl)的感光作用,对细胞内生物大分子进行定性、定位与半定量研究的一种细胞化学技术。放射自显影技术(radioautography;autoradiography)用于研究标记化合物在机体、组织和细胞中的分布、定位、排出以及合成、更新、作用机理、作用部位等等。其原理是将放射性同位素(如14C和3H)标记的化合物导入生物体内,经过一段时间后,将标本制成切片或涂片,涂上卤化银乳胶,经一定时间的放射性曝光,组织中的放射性即可使乳胶感光。 核磁共振技术:可以直接研究溶液和活细胞中相对分子质量较小(20,000 道尔顿以下)的蛋白质、核酸以及其它分子的结构,而不损伤细胞。 DNA序列分析:在获得一个基因序列后,需要对其进行生物信息学分析,从中尽量发掘信

【高中生物】功能基因的克隆及生物信息学分析

(生物科技行业)功能基因的克隆及生物信息学分析

功能基因的克隆及其生物信息学分析 摘要:随着多种生物全基因组序列的获得,基因组研究正从结构基因组学(structuralgenomics)转向功能基因组学(functionalgenomics)的整体研究。功能基因组学利用结构基因组学研究获得的大量数据与信息评价基因功能(包括生化功能、细胞功能、发育功能、适应功能等),其主要手段结合了高通量的大规模的实验方法、统计和计算机分析技术[1],它代表了基因分析的新阶段,已成为21世纪国际生命科学研究的前沿。功能基因组学是利用基因组测序获得的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使生物学研究从对单一基因或蛋白的研究转向多个基因或蛋白同时进行系统的研究,是在基因组静态的组成序列基础上转入对基因组动态的生物学功能学研究[2]。如何研究功能基因,也成为我们面临的一个课题,本文就克隆和生物信息学分析在研究功能基因方面的应用做一个简要的阐述。 关键词:功能基因、克隆、生物信息学分析。 1.功能基因的克隆 1.1图位克隆方法 图位克隆又称定位克隆,它是根据目标基因在染色体上确切位置,寻找与其紧密连锁的分子标记,筛选BCA克隆,通过染色体步移法逐步逼近目的基因区域,根据测序结果或用BAC、YAC克隆筛选cDNA表达文库寻找候选基因,得到候选基因后再确定目标基因。优点是无需掌握基因产物的任何信息,从突变体开始,逐步找到基因,最后证实该基因就是造成突变的原因。通过图位克隆许多

控制质量性状的单基因得以克隆,最近也有报道某些控制数量性状的主效基因(控制蕃茄果实大小的基因克隆[3]、控制水稻成熟后稻谷脱落基因克隆[4]以及小麦VRN2基因克隆[5]等)也通过图位克隆法获得。 1.2同源序列克隆目的基因 首先根据已知的基因序列设计PCR引物,在已知材料中扩增到该片段,并经克隆测序验证,利用放射性同位素标记或其他非同位素标记该PCR片段作为探针,与待研究材料的cDNA文库杂交,就可以获得该基因cDNA克隆,利用克隆进一步筛选基因组文库,挑选阳性克隆,亚克隆并测序,从中就可以筛选到该基因的完整序列。 1.3结合连锁和连锁不平衡的分析方法 结合连锁和连锁不平衡的分析方法是未知基因克隆研究领域发展的新方向[6]。(Linkagedisequilibrium,LD)。与连锁分析不同,连锁不平衡分析可以利用自然群体中历史发生的重组事件。历史上发生的重组使连锁的标记渐渐分布到不同的同源染色体上,这样就只有相隔很近的标记才能不被重组掉,从而形成大小不同的单倍型片段(Haplotypeblock)。这样经过很多世代的重组,只有相隔很近的基因,才能仍处在相同的原始单倍型片段上,基因间的连锁不平衡才能依然存在。所以基于连锁不平衡分析,可以实现目的基因的精细定位。林木大多为自由授粉的异交物种,所以连锁不平衡程度很低,林木基因组中的LD可能会仅局限于非常小的区域,这就为目的基因的精细定位提供了可能,结合SNP检测技术,科学家甚至可以将效应位点直接与单个的核苷酸突变关联起来,进行数量性状寡核苷酸

蛋白质数据库

生物芯片北京国家工程研究中心 湖南中药现代化药物筛选分中心 暨湖南涵春生物有限公司 常用数据库名录 1、蛋白质数据库 PPI - JCB 蛋白质与蛋白质相互作用网络 ?Swiss-Prot - 蛋白质序列注释数据库 ?Kabat - 免疫蛋白质序列数据库 ?PMD - 蛋白质突变数据库 ?InterPro - 蛋白质结构域和功能位点 ?PROSITE - 蛋白质位点和模型 ?BLOCKS - 生物序列分析数据库 ?Pfam - 蛋白质家族数据库 [镜像: St. Louis (USA), Sanger Institute, UK, Karolinska Institutet (Sweden)] ?PRINTS - 蛋白质 Motif 数据库 ?ProDom - 蛋白质结构域数据库 (自动产生) ?PROTOMAP - Swiss-Prot蛋白质自动分类系统 ?SBASE - SBASE 结构域预测数据库 ?SMART - 模式结构研究工具 ?STRING - 相互作用的蛋白质和基因的研究工具

?TIGRFAMs - TIGR 蛋白质家族数据库 ?BIND - 生物分子相互作用数据库 ?DIP - 蛋白质相互作用数据库 ?MINT - 分子相互作用数据库 ?HPRD - 人类蛋白质查询数据库 ?IntAct - EBI 蛋白质相互作用数据库 ?GRID - 相互作用综合数据库 ?PPI - JCB 蛋白质与蛋白质相互作用网络 2、蛋白质三级结构数据库 ?PDB - 蛋白质数据银行 ?BioMagResBank - 蛋白质、氨基酸和核苷酸的核磁共振数据库?SWISS-MODEL Repository - 自动产生蛋白质模型的数据库 ?ModBase - 蛋白质结构模型数据库 ?CATH - 蛋白质结构分类数据库 ?SCOP - 蛋白质结构分类 [镜像: USA | Israel | Singapore | Australia] ?Molecules To Go - PDB数据库查询 ?BMM Domain Server - 生物分子模型数据库 ?ReLiBase - 受体/配体复合物数据库 [镜像: USA] ?TOPS - 蛋白质拓扑图 ?CCDC - 剑桥晶体数据中心 (剑桥结构数据库 (CSD))

最新生物信息学考试复习

——古A.名词解释 1. 生物信息学:广义是指从事对基因组研究相关的生物信息的获取,加工,储存,分配,分析和解释。狭义是指综合应用信息科学,数学理论,方法和技术,管理、分析和利用生物分子数据的科学。 2. 基因芯片:将大量已知或未知序列的DNA片段点在固相载体上,通过物理吸附达到固定化(cDNA芯片),也可以在固相表面直接化学合成,得到寡聚核苷酸芯片。再将待研究的样品与芯片杂交,经过计算机扫描和数据处理,进行定性定量的分析。可以反映大量基因在不同组织或同一组织不同发育时期或不同生理条件下的表达调控情况。 3. NCBI:National Center for Biotechnology Information.是隶属于美国国立医学图书馆(NLM)的综合性数据库,提供生物信息学方面的研究和服务。 4. EMBL:European Molecular Biology Laboratory.EBI为其一部分,是综合性数据库,提供生物信息学方面的研究和服务。 5. 简并引物:PCR引物的某一碱基位置有多种可能的多种引物的混合体。 6. 序列比对:为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。

7. BLAST:Basic Local Alignment Search Tool.是通过比对(alignment)在数据库中寻找和查询序列(query)相似度很高的序列的工具。 8. ORF:Open Reading Frame.由起始密码子开始,到终止密码子结束可以翻译成蛋白质的核酸序列,一个未知的基因,理论上具有6个ORF。 9. 启动子:是RNA聚合酶识别、结合并开始转录所必须的一段DNA序列。原核生物启动子由上游调控元件和核心启动子组成,核心启动子包括-35区(Sextama box)TTGACA,-10区(Pribnow Box)TATAAT,以及+1区。真核生物启动子包括远上游序列和启动子基本元件构成,启动子基本元件包括启动子上游元件(GC岛,CAAT盒),核心启动子(TATA Box,+1区帽子位点)组成。 10. motif:模体,基序,是序列中局部的保守区域,或者是一组序列中共有的一小段序列模式。 11. 分子进化树:通过比较生物大分子序列的差异的数值重建的进化树。 12. 相似性:序列比对过程中用来描述检测序列和目标序列之间相似DNA碱基或氨基酸残基序列所占的比例。 13. 同源性:两个基因或蛋白质序列具有共同祖先的结论。

最新生物学常见模式生物资料

模式生物 生物学家通过对选定的生物物种进行科学研究,用于揭示某种具有普遍规律的生命现象。此时,这种被选定的生物物种就是模式生物。比如:孟德尔在揭示生物界遗传规律时选用豌豆作为实验材料,而摩尔根选用果蝇作为实验材料,在他们的研究中,豌豆和果蝇就是研究生物体遗传规律的模式生物。由于进化的原因,许多生命活动的基本方式在地球上的各种生物物种中是保守的,这是模式生物研究策略能够成功的基本基础。选择什么样的生物作为模式生物首先依赖于研究者要解决什么科学问题,然后寻找能最有利于解决这个问题的物种。19世纪末20世纪初,人们就发现,如果把关注的焦点集中在相对简单的生物上则发育现象的难题可以得到部分解答。因为这些生物更容易被观察和实验操作,因此,除了在遗传学研究外,模式生物研究策略在发育生物学中获得了非常广泛的应用,一些物种被大家公认为优良的模式生物,如线虫、果蝇、非洲爪蟾、蝾螈、小鼠等。 随着人类基因组计划的完成和后基因组研究时代的到来,模式生物研究策略得到了更加的重视;基因的结构和功能可以在其它合适的生物中去研究,同样人类的生理和病理过程也可以选择合适的生物来模拟。 目前在人口与健康领域应用最广的模式生物包括,噬菌体、大肠杆菌、酿酒酵母、秀丽隐杆线虫、海胆、果蝇、斑马鱼、爪蟾和小鼠。在植物学研究中比较常用的有,拟南芥、水稻等。随着生命科学研究的发展,还会有新的物种被人们用来作为模式生物。但它们会有一些基本共同点: 1)有利于回答研究者关注的问题,能够代表生物界的某一大类群; 2)对人体和环境无害,容易获得并易于在实验室内饲养和繁殖; 3)世代短、子代多、遗传背景清楚; 4)容易进行实验操作,特别是具有遗传操作的手段和表型分析的方法。 背景 早在20世纪最初的20年中,甚至更早到19世纪,人们就发现,如果把关注的焦点集中在相对简单的生物上则发育的现象难题可以得到部分解答。因为这些生物的细胞数量更少,分布相对单一,变化也较好观察。由于进化的原因,细胞生命在发育的基本模式方面具有相当大的同一性,所以利用位于生物复杂性阶梯较低级位置上的物种来研究发育共通规律是可能的。尤其是当在有不同发育特点的生物中发现共同形态形成和变化特征时,发育的普

生物信息研究中常用蛋白质数据库的总结

生物信息研究中常用蛋白质数据库简述 内蒙古工业大学理学院呼和浩特孙利霞 2010.1.5 摘要:在后基因组时代生物信息学的研究当中,离不开各种生物信息学数据库。尤其在蛋白质从序列到功能的研究当中,目前各种行之有效的方法都是基于各种层次和结构的蛋白质数据库。随着计算机技术及网络技术的发展,目前的蛋白质数据库不论是所包含数据量还是功能都日新月异,新的数据库层出不穷。一个新手面对如此浩瀚的数据量往往无从下手。本文粗浅地为目前蛋白质数据库的使用勾画出一个轮廓,作为自己蛋白质研究入门的一个引导。 关键词:蛋白质;数据库 0 引言 随着科技的发展,个人的知识往往赶不上快速膨胀的信息量,人们为了解决这个问题,便创建了形形色色的数据库。蛋白质数据库是指:在蛋白质研究领域根据实际需要,对蛋白质序列、蛋白质结构以及文献等数据进行分析、整理、归纳、注释,构建出具有特殊生物学意义和专门用途的数据库。蛋白质数据库总体上可分为两大类:蛋白质序列数据库和蛋白质结构数据库,蛋白质序列数据库来自序列测定,结构数据库来自X-衍射和核磁共振结构测定(详见图1)。这些数据库是分子生物信息学的基本数据资源。上世纪90年代,我国从事蛋白质研究的学者使用的蛋白质数据库储存介质还是国外实验室发布的激光光盘[1]。信息的传播储存甚为不便。随着蛋白质研究的发展飞快,同时伴随着计算机和因特网发展,蛋白质数据库的储存传播方式也发生的巨大的变化。进入21世纪后,我们所用的各种蛋白质数据库都发展成为存储在网络服务器上,基于“服务器—客户机”的访问查询方式。伴随着计算机及物理测试技术的发展数据库的容量和功能成数量级膨胀。但是面对如此浩瀚的数据,新手往往感到无从下手,在需要时找不到自己需要的合适数据库。 本文从目前蛋白质数据库建立的的逻辑层次出发,系统地简绍了常用蛋白质数据的概况,它们的查询方法以及它们相互之间的联系。同时尽量不涉及数据库建设和维护方面的计算机和网络这些数据库底层的技术,为蛋白质研究的入门者及对蛋白质感兴趣的人员的一个引导。

《中国生物医学文献数据库》的检索与利用

《中国生物医学文献数据库》的检索与利用 解放军医学图书馆杜永莉 一、数据库概况 CBM 数据库共收录了 1978 年以来国内出版的 160 多种中国生物医学期刊以及汇编、会议论文的文献题录。截至到 2009 年底已累积了 530 余万篇文献,年增长量约 40 万篇,数据库每月都要更新。 CBM 数据库还具有收录广泛、数据规范、具有多种词表辅助检索的特点。它的全部题录都是美国国立医学图书馆最新版的医学主题词表,也就是 mesh 词表。 2004 年 CBM 实现了与数据库全文的链接功能,在检索结果中,可以查找 1989 年以来的所有全文。它的版本也不断更新, 1994 年 CBM 出版的 dos 版, 2000 年 CBM 改版为CBMwin 版, 2004 年 CBM 出版了 CBM web 版, 2009 年又推出了 SinoMed ,中国生物医学文献辅助系统。 CBM 数据库对两个以上的检索词提供三种逻辑算符,分别为 AND 、 OR 、 NOT ,代表逻辑与、逻辑或和逻辑非。 AND 表示检索记录中同时有检索词 A 和检索词 B ; OR 表示检索记录中含有检索词 A 或者检索词 B ; NOT 表示在检索词 A 的记录中去掉检索词 B 的记录。另外, CBM 数据库还提供了通配符,主要的通配符有两个:一个是“?”,代表一个单字;“ % ”代表任何字符,如:输入“血 ? 动力”,可检索出含有:血液动力、血流动力字符的文献;输入“肝炎 % 疫苗”,可检索出:肝炎疫苗、肝炎病毒基因疫苗、肝炎减毒活疫苗、肝炎灭活疫苗等字符的文献。 二、主要检索途径 CBM 数据库的主要检索途径有:基本检索、主题检索、分类检索、期刊检索和作者检索。 (一)基本检索

蛋白质结构预测和序列分析软件

蛋白质结构预测和序列分析软件蛋白质数据库及蛋白质序列分析 第一节、蛋白质数据库介绍 一、蛋白质一级数据库 1、 SWISS-PROT 数据库 SWISS-PROT和PIR是国际上二个主要的蛋白质序列数据 库,目前这二个数据库在EMBL和GenBank数据库上均建 立了镜像 (mirror) 站点。 SWISS-PROT数据库包括了从EMBL翻译而来的蛋白质序 列,这些序列经过检验和注释。该数据库主要由日内瓦大 学医学生物化学系和欧洲生物信息学研究所(EBI)合作维 护。SWISS-PROT的序列数量呈直线增长。 2、TrEMBL数据库: SWISS-PROT的数据存在一个滞后问题,即 进行注释需要时间。一大批含有开放阅读 了解决这一问题,TrEMBL(Translated E 白质数据库,它包括了所有EMBL库中的 质序列数据源,但这势必导致其注释质量 3、PIR数据库: PIR数据库的数据最初是由美国国家生物医学研究基金 会(National Biomedical Research Foundation, NBRF) 收集的蛋白质序列,主要翻译自GenBank的DNA序列。 1988年,美国的NBRF、日本的JIPID(the Japanese International Protein Sequence Database日本国家蛋 白质信息数据库)、德国的MIPS(Munich Information Centre for Protein Sequences摹尼黑蛋白质序列信息 中心)合作,共同收集和维护PIR数据库。PIR根据注释 程度(质量)分为4个等级。 4、 ExPASy数据库: 目前,瑞士生物信息学研究所(Swiss I 质分析专家系统(Expert protein anal 据库。 网址:https://www.360docs.net/doc/2f14573405.html, 我国的北京大学生物信息中心(www.cbi.

生物医学类外文数据库

PubMed Central PubMed Central由美国国家医学图书馆建立的生命科学期刊全文免费数据库,目前加入P MC的期刊108种,另有8种期刊即将加入,这些期刊免费全文访问的时间延迟是出版后0 -2个月,所有文献的浏览、检索、下载均是无需注册的。 网站地址:https://www.360docs.net/doc/2f14573405.html,/ 创建者:U.S. National Library of Medicine eScholarship Repository eScholarship是由加利福尼亚数字图书馆创立的,包括已发表的论文专著、本校学术期刊、连续出版物、研究生研讨课资料等。提供免费全文浏览和下载,目前已有6953种,140万篇文献可提供下载。 网站地址:https://www.360docs.net/doc/2f14573405.html,/escholarship/ 创建者:California Digital Library, University of California DOAJ DOAJ是由瑞典的隆德大学图书馆建立的。目前收录的开放存取期刊超过1500种、文章7万多篇。该系统收录的均为学术性、研究性期刊,具有免费、全文、高质量的特点,对学术研究有很高的参考价值。 网站地址:https://www.360docs.net/doc/2f14573405.html,/ 创建者:Lund University Libraries BioMed Centeral BioMed Central以出版网络版期刊为主,目前出版120种生物学和医学领域的期刊,少量期刊同时出版印刷版。BMC网站免费为读者提供信息服务,其出版的网络版期刊可供世界各国的读者免费检索、阅读和下载全文。 网站地址:https://www.360docs.net/doc/2f14573405.html,/browse/journals 创建者:BioMed Centeral The Free Medical Journals The Free Medical Journals提供了全部免费的医学生物学相关期刊的全文链接,包括1 350种免费的英文和非英文(15种语言)的生物医学全文期刊。检索Freemedicaljournal s期刊有专业(specialty)和字顺二种途径。 网站地址:https://www.360docs.net/doc/2f14573405.html,/ 创建者:AmedeoGroup. 美国国家学术出版社所有PDF图书开放免费下载(附:全球部分免费开放的电子图书馆)来源:张文鼎的日志 美国的国家学术出版社(National Academies Press,NAP)于2011年6月2日宣布,将其出版的所有PDF版图书对所有读者免费开放下载,并且将这

蛋白常用数据库

搞蛋白质的童鞋们,甭要只查NCBI了~蛋白质相关数据库启蒙~ ★ 小木虫(金币+1):奖励一下,谢谢提供资源 qinhy:恭喜,您的帖子被版主审核为资源贴了,别人回复您的帖子对资源进行评价后,您就可以获得金币了理由:资源贴2011-11-26 16:56 本来是带图的,可是弄过来就变成米图了,附件里面一个是PDF版、一个是WORD版均是带图的,童鞋们看带图的可能比较方便点哦~ 基于蛋白质序列的蛋白质相互作用位点预测(闲谈版) 这个不是论文不是论文啊~~这个是应某某的要求帮他找的,所以都是用现成的免费的网站数据库做的预测分析。无论文为依托,无原理为根据,纯粹就是流连各大网站作个的闲谈。 1、用这些网站先查查你要研究的蛋白质的底细。 这些网站的数据库大多数是实验或者一些相关文献报道的数据的组成。 ★String http://string.embl.de/ 输入你要搜寻的蛋白,它就把这个蛋白相关的数据反映给你,分confidence、evidence的数据可信度参考,同时还具有actions选项,反应它们之间可能是激活/抑制的关系。按按+、-号可以扩大缩小关联蛋白的数量范围。 往下拉一点点就是数据,哈哈,我们都要看数据吃饭啊~~ 分析的数据源自Neighborhood、Fusion、Occurrence、Coexpression、Experiments Database、Textminin及Homology,表示点得证明有数据,根据各项数据给出综合评分。评分越高相互存在关系可能性越高。点击下方各项图标等详细看到各项数据内容。 设条件确定筛选范围。 ★DIP https://www.360docs.net/doc/2f14573405.html,/dip/Main.cgi 跟上面的大同小异的功能,装上它附带的软件可能操作性会好一点,不过我米有试过哦。倒是跟它有链接的几个数据库都很强大,大家可以点击看看。 ★BIND http://www.bind.ca 文献有介绍的网站,不过我不能理解为什么我注册就注不了……. 2、继续查,用这些网站将要研究的蛋白质的家庭背景,月收入也大起底。 这里的网站可能跟相互作用方面的关系不大,但是如果知道这些,可以对研究的蛋白有更深的了解。 ★PDB https://www.360docs.net/doc/2f14573405.html,/pdb/home/home.do 要查3D结构就往这里查~通常说的PDB号为文献号末4位。 ★PIR https://www.360docs.net/doc/2f14573405.html,/pirwww/index.shtml 在蛋白质方面如NCBI般强大的网站,去上面晃荡下吧,会有收获滴。 ★KEGG http://www.genome.jp/kegg/ 粉强大的一个网站,我只说说它的KEGG PA THW AY子项,能迅速掌握一个蛋白质的功能通路,对于小白的偶们来说,很有用,有木有。 3、正题正题,做完上面那些后,接着就是纯预测的成分。也因为如此,要找着这些网站是很悲催的一件事。就算你找着了,你不懂语言,不懂算法,到底结果的可靠性怎样,见人见智。 需要PDB号作分析: promate http://bioinfo.weizmann.ac.il/promate/

蛋白质结构预测在线软件

蛋白质预测分析网址集锦? 物理性质预测:? Compute PI/MW?? ?? SAPS?? 基于组成的蛋白质识别预测? AACompIdent???PROPSEARCH?? 二级结构和折叠类预测? nnpredict?? Predictprotein??? SSPRED?? 特殊结构或结构预测? COILS?? MacStripe?? 与核酸序列一样,蛋白质序列的检索往往是进行相关分析的第一步,由于数据库和网络技校术的发展,蛋白序列的检索是十分方便,将蛋白质序列数据库下载到本地检索和通过国际互联网进行检索均是可行的。? 由NCBI检索蛋白质序列? 可联网到:“”进行检索。? 利用SRS系统从EMBL检索蛋白质序列? 联网到:”,可利用EMBL的SRS系统进行蛋白质序列的检索。? 通过EMAIL进行序列检索?

当网络不是很畅通时或并不急于得到较多数量的蛋白质序列时,可采用EMAIL方式进行序列检索。? 蛋白质基本性质分析? 蛋白质序列的基本性质分析是蛋白质序列分析的基本方面,一般包括蛋白质的氨基酸组成,分子质量,等电点,亲水性,和疏水性、信号肽,跨膜区及结构功能域的分析等到。蛋白质的很多功能特征可直接由分析其序列而获得。例如,疏水性图谱可通知来预测跨膜螺旋。同时,也有很多短片段被细胞用来将目的蛋白质向特定细胞器进行转移的靶标(其中最典型的例子是在羧基端含有KDEL序列特征的蛋白质将被引向内质网。WEB中有很多此类资源用于帮助预测蛋白质的功能。? 疏水性分析? 位于ExPASy的ProtScale程序(?)可被用来计算蛋白质的疏水性图谱。该网站充许用户计算蛋白质的50余种不同属性,并为每一种氨基酸输出相应的分值。输入的数据可为蛋白质序列或SWISSPROT数据库的序列接受号。需要调整的只是计算窗口的大小(n)该参数用于估计每种氨基酸残基的平均显示尺度。? 进行蛋白质的亲/疏水性分析时,也可用一些windows下的软件如,bioedit,dnamana等。? 跨膜区分析? 有多种预测跨膜螺旋的方法,最简单的是直接,观察以20个氨基酸为单位的疏水性氨基酸残基的分布区域,但同时还有多种更加复杂的、精确的算法能够预测跨膜螺旋的具体位置和它们的膜向性。这些技术主要是基于对已知

第一节常用的生物学研究方法

科学探究专题复习 成都石室蜀都中学刘玮琦 一.教学目标 1.知识目标:掌握科学探究及其基本方法。 2.能力目标:能够提出问题,作出假设,设计实验以及得出结论。 3.情感目标:体会实事求是、严谨求实的科学态度,确立关爱生命、关爱环境的情感意识。 二.教学重难点 1.教学重点:掌握科学探究的基本步骤 2.教学难点:掌握科学探究的基本步骤 三.教学准备 收集相关资料,整理科学探究相关考题。 四.教学过程 (一)复习要点: 1、尝试书面表达问题:尝试根据日常生活、资料信息发现问题、提出问题、表达问题。其中的提出问题要紧扣题目,采用一般疑问句,并应考虑是否可以开展。 2、应用已有的知识,对问题的答案提出可能的设想——即作出假设。作出假设要紧扣问题,可有正面或反面(肯定或否定)两种截然不同的假设。 3、拟定探究计划,列出所需要的材料与用具,选出控制变量,设计对照实验。⑴要使实验结果具有说服力,关键是要设置对照实验。而一组对照实验应包括一个实验组和一个对照组,凡是没有设置对照实验的实验设计都是不合理的。⑵设计对照实验时,实验组与对照组控制的变量(即实验组与对照组不同的条件)只允许一个(即注意控制单一变量),而控制的变量往往在题干或提出的问题中有体现。如要“探究光对叶绿素形成的影响”,该实验控制的变量就是光(或光照)。在控制变量的过程中,变量要相对立,而且要尖锐(如光照充足与黑暗、适温与低温、有水与无水等),对照实验中,除变量外,其它因素(条件)要完全相同(即等量原则)。⑶为排除偶然性,减少实验误差,使实验结果更真实,还要考虑设置重复实验。重复实验可进行多次实验过程;也可用多只动物、多粒种子(或多棵生长情况相同的幼苗)等进行一次实验。以上①②③三点是我们改正实验设计的有关不足之处的原理和依据。 4、描述现象,处理数据,得出结论。科学探究中的描述现象与得出结论是不相同的:描述现象是把实验组与对照组产生的现象用文字(或用表格数据统计)形式描述出来。其中的实验结果预测(或预测实验结果)和描述实验现象往往是一样的。而得出结论是必须经过有关数据的处理、有关现象分析讨论后得出的该探究活动最终的实验结论,该结论往往与假设相同或相反。 (二)经典中考题目点拨 《科学探究》专题复习 1.实验“验证绿叶在光下合成淀粉” 知识背景: (1)实验前2一3天,把盆栽的天竺葵放于暗处。(目的:消耗掉叶片中的淀粉) (2)在经过黑暗处理的实验材料上选1-2片生长 健壮的

蛋白质相互作用数据库和分析方法

蛋白质相互作用数据库和分析方法 1. 蛋白质相互作用的数据库 蛋白质相互作用数据库见下表所示: 数据库名 说明 网址 BIND 生物分子相互作用数据库 http://bind.ca/ DIP 蛋白质相互作用数据库 https://www.360docs.net/doc/2f14573405.html,/ IntAct 蛋白质相互作用数据库 https://www.360docs.net/doc/2f14573405.html,/intact/index.html InterDom 结构域相互作用数据库 https://www.360docs.net/doc/2f14573405.html,.sg/ MINT 生物分子相互作用数据库 http://mint.bio.uniroma2.it/mint/ STRING 蛋白质相互作用网络数据库 http://string.embl.de/ HPRD 人类蛋白质参考数据库 https://www.360docs.net/doc/2f14573405.html,/ HPID 人类蛋白质相互作用数据库 http://wilab.inha.ac.kr/hpid/ MPPI 脯乳动物相互作用数据库 http://fantom21.gsc.riken.go.jp/PPI/ biogrid 蛋白和遗传相互作用数据,主要来自于酵母、线虫、果蝇和人 https://www.360docs.net/doc/2f14573405.html,/ PDZbase 包含PDZ 结构域的蛋白质相互作用数据库 https://www.360docs.net/doc/2f14573405.html,/services/pdz/start Reactome 生物学通路的辅助知识库 https://www.360docs.net/doc/2f14573405.html,/ 2. 蛋白质相互作用的预测方法 蛋白质相互作用的预测方法很非常多,以下作了简单的介绍 1) 系统发生谱 这个方法基于如下假定:功能相关的(functionally related)基因,在一组完全测序的基因组中预期同时存在或不存在,这种存在或不存在的模式(pattern)被称作系统发育谱;如果两个基因,它们的序列没有同源性,但它们的系统发育谱一致或相似.可以推断它们在功能上是相关的。

分子生物学数据库

陈成 一、国内的一些有针对性的数据库 BIOSINO 我国的核酸序列公共数据库 更像是一个论坛,有一些提问,互动等功能,信息的筛选也不是特别的严格。但是规模较小 0条记录可以看出网站的维护和使用都不怎么频繁。 其他许多网站也没有明显的巨大差距。 二、国内的一些大型数据库 中国知网

大部分高校已经购买了它的资源,是国内较权威、全面的数据库。主要是文献下载,不针对我们实验过程中对数据遇到问题时的解答。

冀鼎觉SciFinder SciFinder使用简介 SciFinder Scholar是美国化学学会(ACS)旗下的化学文摘服务社CAS(Chemical Abstract Service)所出版的《Chemical Abstract》化学文摘的在线版数据库学术版。其内容涵盖应用化学、化学工程、普通化学、物理、生物学、生命科学、医学、聚合体学、材料学、地质学、食品科学和农学等诸多领域。 https://www.360docs.net/doc/2f14573405.html,/products/scifinder/ SciFinder是可以与交大图书馆相连的,在找到文献时,可以直接连接到交大图书馆进行检索帮助。 下面以检索Molecular Dynamics为例简单解释其使用。 在登进SciFinder之后会进入检索界面。上图即为SciFinder的文献检索界面,可以对文件类型,语言,作者等信息作初步筛选。除此之外也可以看到左面可以选择对作者,公司,杂志,专利进行直接检索。

在搜索之后会出现题目和内容相关两种文献分类,如我们选择内容相关Molecular dynamics,点进Get Reference。 这是检索完成的结果。我们可以看到,在Reference字样之后又Getsubstances等字样,我们可以通过这些选项获取选定文献中相关的物质、反应、相关的引用及被引用等。在右侧可以看到Analysis以及Refine选项。现在显示的是Analysis中的Journal Name选项,可以看到对于MD来说,JCP, JPC, Biochemistry, JACS等杂志具有较多的信息。除此之外,还有对作者,公司的分析,为我们对相关内容的行业情况的了解提供了方便。

15神经生物学研究的常用方法

1.神经生物学研究的常用方法 神经科学的发展与的研究方法的进步密切相关。总体上,神经生物学的研究 方法有六大类:形态学方法、生理学方法、电生理学方法、生物化学方法、分子 生物学方法及脑成像技术。 7.1形态学方法 神经生物学研究中常用的形态学方法有束路追踪、免疫组化和原位杂交,其 他还有受体定位、神经系统功能活动形态定位等方法。 7.1.1束路追踪法 追踪神经元之间的联系是神经解剖学研究中的重大目标,它对研究神经元的功能、神经系统的发育和成熟都具有重要意义。这种方法学的建立始于19世纪末的逆行和顺性溃变(顺行溃变指胞体或轴突损伤后的轴突终末的溃变,逆行溃变指去除靶区之后神经元胞体的溃变)研究。20世纪40年代主要手段是镀银染色法,根据变性纤维的形态变化来判断变性纤维。20世纪50年代发展了Nanta法,能遏制正常纤维的染色而仅镀染出变性纤维。但该法不易显示细纤维,1971年Kristenson等将辣根过氧化物酶(HRP)注入幼鼠的腓肠肌及舌肌结果在脊髓和延脑的相应部分运动神经元胞体内发现HRP的积累。不久LaVail正式使用HRP作为轴突逆行追踪,以后遂广泛应用于中枢神经系统的研究。HRP可被神经末梢、胞体和树突吸收,轴突损伤部分也可摄入。在胞体内,HRP的活性可持续4~5天,在溶酶体内对联苯胺呈阳性反应而显现出来。被标记的神经元可以清晰的显示胞体、树突及轴突。 除了HRP标记法,还有荧光物质标记法、毒素标记法、注射染料等方法。 7.1.2免疫组织化学 免疫组织化学术是应用抗原与抗体结合的免疫学原理,检测细胞内多肽、蛋白质及膜表面抗原和受体等大分子物质的存在与分布。这种方法特异性强,敏感度高,进展迅速,应用广泛,成为生物学和医学众多学科的重要研究手段。近年随着纯化抗原和制备单克隆抗体的广泛开展以及标记技术不断提高,免疫组织化学的进展更是日新月异,不仅用于许多基本理论的研究,并取得重大突破,而且也用于疾病的早期快速诊断等临床实际。 组织的多肽和蛋白质种类繁多,具有抗原性。分离纯化人或动物组织某种蛋白质,作为抗原注入另一种动物体内,后者即产生相应的特异性抗体(免疫球蛋白)。从被免疫动物的血清中提取出该抗体,再以荧光素、酶、铁蛋白或胶体金标记,用这种标记抗体处理组织切片或细胞,标记抗体即与细胞的相应蛋白质(抗原)发生特异性结合。常用的荧光素是异硫氰酸荧光素(FITC)和四甲基异硫氰酸罗丹明(TRITC),在荧光显微镜下可观察荧光抗体抗原复合物。常用的酶是辣根过氧化物酶(horseradish peroxidase,HRP,从辣根菜中提取的),它的底物是3,3'-二氨基、联苯胺(DAB)和H2O2,HRP使DAB氧化形成棕黄色产物,可在光镜和电镜下观察。铁蛋白和胶体金标记抗体与抗原的结合,也可在光镜和电镜下观察。 标记抗体被检抗原的结合方式有两种。一是直接法,即如上述用标记抗体与样品中的抗原直接结合。这种方法操作简便,但敏感度不及间接法。间接法是将分离的抗体(第一抗体简称一抗)再作为抗原免疫另一种动物,制备该抗体(抗原)的抗体(第二抗体简称二抗),再以标记物标记二抗。先后以一抗和标记二抗处理样品,最终形成抗原一抗-标记二抗复合物。间接法中的一个抗原分子可通过一抗与多个标记二抗相结合,因此它的敏感度较高,而且目前国内外均有多种标记二抗商品供应,使用方便。间接法中较常用的是一种称之为过氧化物酶-抗过氧化物酶复合物法(peroxidase-antiperoxidase complex

第三讲:Uniprot蛋白数据库及其他蛋白质分析工具

第三讲 Uniprot蛋白数据库及其他蛋白质 分析工具
2013/03/19

Uniprot数据库
? Uniprot(Universal?protein?resource)是蛋白 质序列的联合数据库。
– SIB:?Swiss?Institute?of?Bioinformatics – EBI:?European?Bioinformatics?Institute – PIR:?Protein?Information?Resource – 2002年三家联合形成了Uniprot

Swiss‐Prot
? 1986年建立 ? 低冗余度 ? 功能导向 ? 由Swiss?Institute?of?Bioinformatics?和EBI共同 建立并维护

TrEMBL
? TrEMBL=Translation?from?EMBL ? EBI建立并维护 ? 是一个自动数据库 ? 冗余度高,可信度低

UniprotKB
? 部分经过专家注释的数据库 ? 具有很高的可信度 ? 包括两部分UniprotKB/Swiss‐Prot和 UniprotKB/TrEMBL ? UniprotKB/Swiss‐Prot包括539,165条序列 ? UniprotKB/TrEMBL包括29,769,971?条序列 ? 具有非冗余性

Uniparc
? 非冗余性 ? 给予序列的特异性,非同一物种的相同序 列被认为是同一个蛋白质 ? 每一条序列被給予一个特异的编号

(完整word版)中国生物医学文献数据库(下)

1、中国生物医学文献数据库(CBM)中,最多可以保存多少条检索式?(B) * ? A.一百 ? B.两百 ? C.三百 ? D.四百 2、以下说法正确的是(D)。 * ? A.中国生物医学文献数据库(CBM)和CNKI都有主题词表。 ? C.中国生物医学文献数据库(CBM)和PubMed均采用医学主题词表和中医药学主题词表进行主题标引。 ? D.在中国生物医学文献数据库(CBM)高级检索的检索入口中,常用字段是中文标题、摘要、关键词、主题词的组合项。 3、中国生物医学文献数据库(CBM)的检索有关某个课题“Meta分析”方面的文章可以从以下哪类限定里选择?(C) * ? A.年代范围 ? B.对象类型 ? C.文献类型 ? D.年龄组 4、可以区分“第一作者机构分布”的是以下哪种检索途径?(C) * ? A.主题检索 ? B.期刊检索 ? C.作者检索 ? D.高级检索 5、以下说法正确的是(A)。 * ? A.检索中国生物医学文献数据库(CBM)有关研究对象是65岁以上老年人的文章可以利用限定检索功能。 ? 6、中国生物医学文献数据库(CBM)中,以下哪项检索式是不正确的?(A) * ? A.国家*基金 ? B.国家%基金 7、在中国生物医学文献数据库(CBM)中检索“高血压的并发症”方面的核心期刊文献,下列哪个选项是正确的?(D) * ? A.主题检索,选择主题词“ 高血压”,选择副主题词“并发症”,执行检索 ? B.基本检索,输入“高血压的并发症”,执行检索 ? C.主题检索,选择主题词“高血压”,选择副主题词“并发症”,检索结果界面,限定条件设置文献类型为综述 ? D.主题检索,选择主题词“高血压”,选择副主题词“并发症”,检索结果界面,限定条件设置文献类型为核心期刊 8、在中国生物医学文献数据库(CBM)中检索“肥厚性胃炎的预防”方面的综述文献,最优的检索策略是(C)。 *

相关文档
最新文档