PIR-PSD 蛋白质序列数据库

合集下载

生物信息研究中常用蛋白质数据库的总结

生物信息研究中常用蛋白质数据库简述内蒙古工业大学理学院呼和浩特孙利霞2010.1.5摘要：在后基因组时代生物信息学的研究当中，离不开各种生物信息学数据库。

尤其在蛋白质从序列到功能的研究当中，目前各种行之有效的方法都是基于各种层次和结构的蛋白质数据库。

随着计算机技术及网络技术的发展，目前的蛋白质数据库不论是所包含数据量还是功能都日新月异，新的数据库层出不穷。

一个新手面对如此浩瀚的数据量往往无从下手。

本文粗浅地为目前蛋白质数据库的使用勾画出一个轮廓，作为自己蛋白质研究入门的一个引导。

关键词：蛋白质；数据库0 引言随着科技的发展，个人的知识往往赶不上快速膨胀的信息量，人们为了解决这个问题，便创建了形形色色的数据库。

蛋白质数据库是指：在蛋白质研究领域根据实际需要，对蛋白质序列、蛋白质结构以及文献等数据进行分析、整理、归纳、注释，构建出具有特殊生物学意义和专门用途的数据库。

蛋白质数据库总体上可分为两大类：蛋白质序列数据库和蛋白质结构数据库，蛋白质序列数据库来自序列测定，结构数据库来自X-衍射和核磁共振结构测定（详见图1）。

这些数据库是分子生物信息学的基本数据资源。

上世纪90年代，我国从事蛋白质研究的学者使用的蛋白质数据库储存介质还是国外实验室发布的激光光盘[1]。

信息的传播储存甚为不便。

随着蛋白质研究的发展飞快，同时伴随着计算机和因特网发展，蛋白质数据库的储存传播方式也发生的巨大的变化。

进入21世纪后，我们所用的各种蛋白质数据库都发展成为存储在网络服务器上，基于“服务器—客户机”的访问查询方式。

伴随着计算机及物理测试技术的发展数据库的容量和功能成数量级膨胀。

但是面对如此浩瀚的数据，新手往往感到无从下手，在需要时找不到自己需要的合适数据库。

本文从目前蛋白质数据库建立的的逻辑层次出发，系统地简绍了常用蛋白质数据的概况，它们的查询方法以及它们相互之间的联系。

同时尽量不涉及数据库建设和维护方面的计算机和网络这些数据库底层的技术，为蛋白质研究的入门者及对蛋白质感兴趣的人员的一个引导。

蛋白质工程原理与技术

蛋白质工程原理与技术蛋白质工程与原理技术1、什么是蛋白质工程？P1答：蛋白质工程（Protein engineering ）是通过对蛋白质结构与功能关系的了解，借助于生物信息学的知识和手段，利用基因定点诱变和基因重组等技术特异性地改造蛋白质的结构基因，产生具有新的特性的蛋白质的技术。

2、什么是基因定点诱变？答：就是在DNA水平上，通过对蛋白质结构基因中某个或某些氨基酸编码顺序加以改变，从而改变蛋白质结构的技术。

该技术不仅可用于改造天然蛋自质，而且可以用于确定蛋白质中每一个氨基酸在结构和功能上的作用，以收集有关氨基酸线形顺序与其空间构象和生物学活性之间的对应关系，为人工改造蛋白质提供理论依据。

3、什么是表达载体？P27答：表达载体：就是在克隆载体基本骨架的基础上增加表达元件（转录和翻译所必需的DNA序列，如启动子、终止子等），使外源DNA片段能够在宿主细胞中表达蛋白质。

包括原核细胞表达载体和哺乳动物细胞表达载体两类。

4、什么是克隆载体？P27答：克隆载体：在载体上插入合适大小的外源DNA片段，并引入到宿主细胞中进行大量繁殖，使外源DNA片段得到大量扩增。

5、基因克隆的基本程序？P29答：（1）获得目的基因；（2）与克隆载体连接，形成新的重组DNA分子；（3）用重组DNA分子转化受体细胞，并能在受体细胞中复制和遗传；（4）对转化子筛选和鉴定；（5）对获得外源基因的细胞或生物体通过培养，获得所需的遗传性状或表达出所需要的产物。

6、真核基因在大肠杆菌中的表达方式？（条件）P34答：基本条件：①大肠杆菌没有剪切内含子的功能，所以，真核细胞的目的基因必须来自于cDNA;②真核基因mRNA缺乏结合细菌核糖体的SD序列，因此cDNA的起始密码子(ATG)上游部分(5‘端非编码区)是无用的，必须除去。

对于一些分泌性蛋白，还应除去信号肽部分；③表达载体应是含有大肠杆菌RNA聚合酶所能识别的启动子和SD序列的大肠杆菌表达载体; ④载体上只能用大肠杆菌启动子，将外源基因克隆在启动子下游，以便大肠杆菌RNA聚合酶识别启动子，并带动真核基因在大肠杆菌细胞中转录。

Uniprot数据库介绍及信息检索下载指南

UniProt数据库一、UniProt数据库简介蛋白质组常用数据库——UniProt数据库，是信息最丰富、资源最广的蛋白质数据库。

它由Swiss-Prot、TrEMBL 和PIR-PSD三大数据库的数据整合而成，数据主要来自于基因组测序项目完成后，后续获得的蛋白质序列，并包含了大量来自文献的蛋白质生物功能的信息。

一般蛋白质组搜库首选数据库也是UniProt，所以对于通过UniProt库搜库的组学数据，可以在此网站中进行蛋白功能查询。

UniProt数据库可以提供的信息包括蛋白功能描述、GO条目、细胞定位、组织特异性表达情况、生理病理情况描述、互作蛋白、Domain、翻译后修饰位点等信息。

蛋白的信息描述段落均会标出引用文章，并且可以跳转到PubMed界面进行浏览。

UniProt 数据库由UniProt 知识库（UniProtKB ）、UniProt 档案（UniParc ）、UniProt 参考资料库（UniRef）以及UniProt元基因组学与环境微生物序列数据库（UniMES）构成。

UniProtKB全称 UniProt Knowledgebase（UniProt知识库）它是经过专家校验的数据集，主要由两部分组成：UniProtKB/Swiss-Prot (包含检查过的、手工注释的条目) 和 UniProtKB/TrEMBL (包含未校验的、自动注释的条目)。

Swiss-Prot 数据库特点高质量的、手工注释的、非冗余的数据集；主要来自文献中的研究成果和E-value校验过计算分析结果。

有质量保证的数据才被加入该数据库！TrEMBL数据集包含高质量的计算分析结果，一般都在自动注释中富集，主要应对基因组项目获得的大量数据流以人工校验在时间上和人力上的不足。

它能注释所有可用的蛋白序列。

在三大核酸数据库（EMBL-Bank/GenBank/DDBJ）中注释的编码序列都被自动翻译并加入该数据库中。

它也有来自PDB数据库的序列，以及Ensembl、Refeq和CCDS基因预测的序列。

蛋白质数据库

蛋白质数据库1. PIR和PSDPIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库，可在这里下载。

这是一个全面的、经过注释的、非冗余的蛋白质序列数据库，其中包括来自几十个完整基因组的蛋白质序列。

所有序列数据都经过整理，超过99%的序列已按蛋白质家族分类，一半以上还按蛋白质超家族进行了分类。

PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引，以及数据库内部条目之间的索引，这些内部索引帮助用户在包括复合物、酶－底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。

每季度都发行一次完整的数据库，每周可以得到更新部分。

PSD数据库有几个辅助数据库，如基于超家族的非冗余库等。

PIR提供三类序列搜索服务：基于文本的交互式检索；标准的序列相似性搜索，包括BLAST、FASTA等；结合序列相似性、注释信息和蛋白质家族信息的高级搜索，包括按注释分类的相似性搜索、结构域搜索GeneFIND等。

2. SWISS-PROTSWISS-PROT是经过注释的蛋白质序列数据库，由欧洲生物信息学研究所(EBI)维护。

数据库由蛋白质序列条目构成，每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等，注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。

SWISS-PROT中尽可能减少了冗余序列，并与其它30多个数据建立了交叉引用，其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。

利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。

SWISS-PROT只接受直接测序获得的蛋白质序列，序列提交可以在其Web页面上完成。

3. PROSITEPROSITE数据库收集了生物学有显著意义的蛋白质位点和序列模式，并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。

生物信息学中的数据库资源及其应用

生物信息学中的数据库资源及其应用摘要：伴随着生物信息学的发展，生物信息数据库日趋完善。

现对生物信息学、数据库的建设及其应用情况进行了综述，并展望生物信息学的发展前景。

关键词：生物信息学；数据库的建设及其应用生物信息学(Bioinformatics)是80年代末随着人类基因组计划的启动而兴起的一门新的交叉学科，最初常被称为基因组信息学。

广义地说，生物信息学是一门采用计算机技术和信息论方法对蛋白质及其核酸序列等多种生物信息采集、加工、储存、传递、检索、分析和解读的科学，是现代生命科学与信息科学、计算机科学、数学、统计学、物理学和化学等学科相互渗透而形成的交叉学科。

美国人类基因组计划中[1]，对基因组信息学有这样的定义：它是一个学科领域，包含着基因组信息的获取、处理、存储、分配、分析和解释的所有方面。

这一定义包含着两方面的内容，一方面是发展有效的信息分析工具，构建适合于基因组研究的数据库，用于搜集，管理，使用人类基因组和模式生物基因组的巨量信息。

另一方面是配合实验研究，确定约30亿个碱基对的人类基因组完整核苷酸顺序，找出全部约10万个人类基因在染色体上的位置以及包括基因在内的各种DNA片段的功能，也就是“读懂”人类基因组[2]。

正如基因组信息学的定义所确定的，它的研究内容主要包含两个部分，一是基因组相关数据的收集与管理，另一个是基因组数据内涵的分析与解释，也就是遗传密码的破译。

生物信息学自产生以来大致经历了前基因组时代、基因组时代和后基因组时代三个发展阶段。

前基因组时代的标志性工作包括生物数据库的建立、检索工具的开发以及DNA和蛋白质序列分析等；基因组时代的标志性工作包括基因识别与发现、网络数据库系统的建立和交互界面工具的开发等；后基因组时代的标志则是大规模基因组分析、蛋白质组分析以及各种数据的比较与整合。

三个阶段虽无明显的界限，却真实地反映了整个研究重心的转移变化历程[3]。

1 生物信息学数据库简介近年来随着大量生物学实验数据的积累，众多的生物学数据库也相继出现，它们各自按照一定的标准收集和处理生物学实验数据，并提供相关的数据查询、处理等服务。

检验实验室试题-第6期

检验实验室试题姓名：（）成绩：（）一、单项选择题（每题1分，共100分）1.单核吞噬细胞系统功能不包含以下哪个A.诱导免疫反应B. 移植排斥反应C. 吞噬和杀灭某些病原体D.吞噬红细胞和清除损伤组织及死亡的细胞E. 抗肿瘤活性2.目前临床上最常用的尿酮体筛检方法是A.胶体金法B. 片剂法C. 滴定法D. 湿化学法E. 试带法3.不符合尿沉渣镜检标准化的是A.10ml尿液离心后保留0.2ml尿沉渣B.先用低倍镜,再用高倍镜观察C.检查细胞应观察10个高倍视野D.检查管型应观察20个高倍视野E.以观察视野的细胞.管型的平均值报告4.肾小管上皮细胞来自A.远曲小管和近曲小管B. 输尿管C. 膀胱D. 尿道E. 肾盂5.正常人可偶见的是A.颗粒管型B. 脂肪管型C. 蜡样管型D. 透明管型E. 宽大管型6.诊断泌尿系统感染的尿液革兰氏阴性菌的菌落计数应大于A.10cfu/mlB. 10 2cfu/mlC. 103cfu/mlD. 104 cfu/mlE. 10 5cfu/ml7.特异性最好的粪便隐血试验是A.免疫学法B. 还原酚酞法C. 邻-甲苯胺法D. 无色孔雀绿法E. 愈创木酯法8.正常婴儿粪便细菌主要为A.变形杆菌B. 大肠埃希菌C. 产气杆菌D. 葡萄球菌E. 绿脓杆菌9.棕褐色痰常见于A.阿米巴肺脓肿B. 支气管哮喘C. 支气管扩张症D. 肺癌E. 细菌性肺脓肿10.输血时主要考虑A.供血者红细胞不被受血者红细胞所凝集B.供血者红细胞不被受血者血浆所凝集C.供血者血浆不使受血者血浆所凝集D.供血者血浆不被受血者红细胞所凝集E.受血者红细胞不与其血浆发生凝集11.主要组织相容性复合体是A.MHCB. MHAC. HLAD. H-2E. RLA12.免疫系统不包括A.免疫细胞B.免疫分子C.免疫原D.中枢免疫器官E.外周免疫器官13.最早用人痘苗预防天花的国家是A.美国B. 英国C. 中国D. 日本E. 俄国14.补体结合试验的判断终点是A.25%溶血B. 50%溶血C. 75%溶血D. 85%溶血E. 100%溶血15.福氏完全佐剂的组成A.液体石蜡+羊毛脂B. 羊毛脂+氢氧化铝C. 液体石蜡+羊毛脂+卡介苗D. 卡介苗+氢氧化铝+羊毛脂E. 液体石蜡+羊皮脂+卡介苗16.下列不属于抗核抗体的是A.抗DNA抗体B. 抗组蛋白抗体C. 抗非组蛋白抗体D.抗核仁抗体E. 抗蛋白酶抗体17.关于单参数直方图的描述正确的是A.能显示两个独立的参数与细胞的关系B.通过十字门进行测定C.只能表明一个参数与细胞数量的关系D.只能用于定性资料的分析E.不是通过线性门进行测量18.三磷酸肌醇可使胞浆内哪一种离子升高A.MgB. CaC. KD. NaE. 以上选项都不是19.最严重的Ⅰ型超敏反应是A.消化道过敏反应B. 皮肤过敏反应C. 过敏性皮炎D.呼吸道过敏反应E. 过敏性休克20.目前公认类风湿关节炎的标志抗体是A.抗Sm抗体B. 抗SSB抗体C. 抗环瓜氨酸抗体D.抗dsDNA抗体E. 抗RNP抗体21.可见-紫外分光光度法的理论基础为A.Rayleigh方程式B. Nernst方程式C. Lambert-Beer定律D. Heidelberger曲线E. ROC曲线22.酶的活性国际单位(U)是指A.在25℃及其他最适条件下,每分钟催化1mmol底物反应所需的酶量B.在规定条件下,每秒钟催化1mol底物反应所需的酶量C.在37℃条件下,每分钟催化1mmol底物发生反应所需的酶量D.在特定的条件下,每分钟催化1μmol底物发生反应所需的酶量E.在最适条件下,每秒钟催化1mol底物发生反应所需的酶量23.前列腺癌诊断首选的生化指标是A.ACPB. ALPC. GGTD. PSAE. ALT24.具有冷变性特点的酶是A.AMYB. LDHC. ALPD. ASTE. CK25.以下会出现胆酶分离的疾病是A.急性心肌梗死B. 胆石症C. 肝坏死D. 脂肪肝E. 肝癌26.妊娠定性试验的标本最好是A.首次晨尿B. 随机尿液C. 午后尿液D. 夜间10~12时尿E.夜间3~4时尿27.正常条件下作为脑组织惟一能量来源的物质是A.糖B. 氨基酸C. 甘油D. 蛋白质E. 酮体28.现国内外推荐的甲状腺功能紊乱的首选筛查项目是A.FT3，FT4B. TBGC. TSHD. TRHE. TT3，TT429.诊断糖尿病的金标准是A.OGTT试验,2小时血糖>11.1mmol/LB.空腹血糖浓度>7.0mmol/LC.随机取样血糖浓度>11.1mmol/LD.餐后2小时血糖浓度>11.1mmoL/LE.尿糖浓度>1.1mmoL/L30.AMI发生后最先出现于血液中的标志物是A.MbB. CK-MBC. cTNTD. CKE. cTnI31.食物中缺碘会引起A.Graves病B. 桥本甲状腺炎C. 急性甲状腺炎D. 地方性甲状腺肿E. 甲状腺癌.32.间隔用药时治疗药物监测的标本,采集时间一般选择在A.任一次用药后1个半衰期时B.血药浓度达稳态浓度后任一次用药后C.血药浓度达稳态浓度后任一次用药后1个半衰期时D.血药浓度达稳态浓度后任一次用药前E.随机取样33.IFCC建议将缩短测定周期控制在多长时间之内A.4hB. 3hC. 2hD. 1hE. 0.5h34.我国室间质评中的标准优良的变异指数得分是A.VIS<50B. VIS<80C. VIS<100D. VIS<150E. VIS<20035.为消除内源性干扰自动生化分析仪可以利用下列哪种方法A.双试剂B. 单试剂C. 双波长D. 单波长E. 多通道36.可用荚膜肿胀试验鉴定的菌株是A.甲型链球菌B. 粪肠球菌C. D群链球菌D. B群链球菌E. 肺炎链球菌37.下列哪项是引起DIC的主要物质A.透明质酸酶B. 荚膜多糖C. 内毒素D. 菌毛E. 外毒素38.保存菌种的方法不属于培养基保存法的是A.普通琼脂斜面保存法B. 血琼脂斜面保存法C. 干燥保存法D. 巧克力琼脂斜面保存法E. 半固体穿刺保存法39.青霉素对细菌的作用机制是A.切断β-1,4糖苷键B.干扰四肽侧链与五肽交联桥的连接C.影响细胞膜的合成D.干扰磷壁酸的活性E.干扰细菌DNA的复制40.细菌合成细胞组分和获得能量的基质主要是A.蛋白质B. 淀粉C. 脂类D. 糖类E. 糖原41.属于条件致病菌的细菌是A.破伤风梭菌B. 产气荚膜梭菌C. 难辨梭菌D. 肉毒梭菌E. 丙酸梭菌42.血液增菌培养结果呈均匀混浊生长并有胶胨状凝块者,可能为A.伤寒沙门菌B. 金黄色葡萄球菌C. 铜绿假单胞菌D. 肺炎链球菌E. 粪产碱杆菌43.呈沉淀生长的革兰阳性需氧杆菌是A.白喉棒状杆菌B. 产单核细胞李斯特菌C. 蜡样芽胞杆菌D. 阴道加特纳菌E. 炭疽芽胞杆菌44.在碱性培养基中生长良好的细菌是A.葡萄球菌B. 大肠埃希菌C. 霍乱弧菌D. 结核分枝杆菌E. 厌氧菌45.卵磷脂酶试验用于下面哪个菌的鉴定A.肉毒梭菌B. 铜绿假单胞菌C. 产气荚膜梭菌D. 蜡样芽胞杆菌E. 结核杆菌46.冷凝集试验阳性时,抗体效价应≥A.1:128B. 1:64C. 1:32D. 1:16E. 1:847.新型隐球菌与白色假丝酵母菌最重要的鉴别点是A.22℃及37℃均能生长B. 尿素酶试验阳性C. 对鼠有致病性D. 形成酵母样菌落E. 芽管形成试验48.伤寒发病第一周时阳性检出率最高的是A.粪便培养B. 血液培养C. 尿液培养D. 肥达反应E. 呕吐物培养49.葡萄球菌A蛋白是一种细菌表面蛋白,其英文简称是A.HRPB. SAPC. SPAD. SSPE. ASP50.采集脑脊液标本不能分离的病毒是A.柯萨奇病毒B. 肝炎病毒C. 肠道病毒D. ECHO病毒E. 腮腺炎病毒51.Ⅰ型异形淋巴细胞是指哪种细胞A.不规则型B. 幼淋巴细胞样型C. 幼稚型D. 浆细胞型E. 单核细胞样型52.鉴别慢性粒细胞性白血病和类白血病最有价值的细胞染色法是A.特异性酯酶染色B. 非特异性酯酶染色C. 过氧化物酶染色D. 中性粒细胞碱性磷酸酶染色E. 糖原染色53.尼曼-匹克病会导致下列什么物质在细胞中堆积A.鞘磷脂B. 糖原C. 葡萄糖脑苷脂酶D. 葡萄糖脑苷脂E. 鞘磷脂酶54.淋巴细胞型类白血病反应最常见的致病原因是下列哪项A.细菌感染B. 大面积烧伤C. 恶性肿瘤D. 恶性肿瘤E. 病毒感染55.下列哪项符合嗜酸性粒细胞增多症A.外周血中嗜酸性粒细胞>4%,以成熟型为主B.骨髓中红系.巨系常受抑C.本病的主要诊断依据是骨髓检查D.外周血不可见幼稚细胞E.骨髓中以幼稚嗜酸性粒细胞增多为主,且有形态异常56.骨髓涂片中的哪一项特点对诊断霍奇金淋巴瘤最有价值A.可见尼曼-匹克细胞B. 淋巴细胞增多C. 非造血细胞增多D. 嗜酸性粒细胞增多E. 可见Reed-Sternberg细胞57.诊断温抗体型自身免疫性溶血性贫血最重要的实验室检查是A.Ham试验B. 免疫球蛋白试验C. 血红蛋白电泳D. 游离血红蛋白测定E. Coombs试验58.内源性凝血系统最常用的筛检试验是A.APTTB. 复钙时间C. CTD. ACTE. BT59.临床上IgG型多发性骨髓瘤约占百分数为A.80%B. 70%C. 60%D. 40%E. 20%60.诊断慢性血管内溶血最有意义的阳性结果是A.尿胆原阳性B. 黄疸C. 血清间接胆红素阳性D. 抗人球蛋白试验阳性E. 尿含铁血黄素试验阳性61.阴道毛滴虫可引起的疾病是A.黑热病B. 睡眠病C. 恰加斯病D. 旅游者腹泻E. 阴道炎62.钩虫感染方式主要是A.经口传播B. 经皮肤传播C. 自体传播D. 经胎盘传播E. 经呼吸道传播63.急性阿米巴痢疾最常用的实验诊断方法是A.直接涂片法B. 饱和盐水浮聚法C. 透明胶纸法D. 厚.薄血膜涂片法E. 碘液染色法64.钩虫对宿主的最主要危害是A.皮炎B. 肠炎C. 肺部病变D. 异嗜症E. 贫血65.诊断蛲虫感染的首选方法是A.粪便直接涂片法B. 粪便饱和盐水漂浮法C. 粪便水洗沉淀法D. 肛门拭子法E. 免疫法66.在中国流行最广泛的疟原虫是A.恶性疟原虫B. 间日疟原虫C. 三日疟原虫D. 卵形疟原虫E. 以上都对67.PIR和PSD数据库是A.世界上最大的蛋白质序列数据库B.中国最大的蛋白质序列数据库C.欧洲最大的蛋白质序列数据库D.美国最大的蛋白质序列数据库E.日本最大的蛋白质序列数据库68.分子生物学检验技术不能用于以下临床实验诊断的哪些方面A.病毒的检测B. 支原体的检测C. 亲子关系的鉴定D. 个体身份的识别E. 细菌感染能力的鉴定69.生物芯片作用的原理是A.分子杂交B. 抗原抗体反应C. 生物分子间特异性相互作用D. 荧光定量E. 亲和层析70.细胞内寿命最短的RNA是A.tRNAB. mRNAC. snRNAD. rRNAE. 环状RNA71.目前室间质量评价活动主要评价的是A.精密度B. 灵敏度C. 准确度D. 特异性E. 总误差72.按NCCLSEP5文件进行精密度评价时,每天实验时,各批之间至少间隔几小时A.2B. 3C. 4D. 5E. 673.二级参考测量方法所用的校准物质一般是A.一级参考物质B. 二级参考物质C. 常规测量方法D. 一级参考测量方法E. 二级参考测量方法74.危急值指的是指A.急诊患者检测结果B. 医学决定水平C. 异常结果D. 危重患者抢救时检测结果E. 一些检测项目的测定值过高.过低时可能危及患者生命的值75.临床实验室建立质量管理体系的首要原则是A.领导作用B. 以患者为中心C. 全员参与D. 持续改进E. 决策方法76.准确性和一致性的来源是A.法制性B. 有效性C. 溯源性D. 确定性E. 可靠性77.国际上最早建立.最完善.成效最显著的临床检验参考系统是A.甘油三酯参考系统B. 胆固醇参考系统C. 糖化血红蛋白参考系统D. 高密度脂蛋白参考系统E. 低密度脂蛋白参考系统78.正态曲线下面积有一定的规律,μ±3σ的面积占总面积的A.80.7%B. 80.5%C. 98.7%D. 99.7%E. 99.9%79.用EDTA抗凝血作下列检验,影响检验结果最大的是A.RBCB.HCTC. CaD. TPE. HBsAg80.测得血糖20天室内质量控制数据,计算出其均值为5.0mmol/L,标准差为0.25mmol/L,其变异系数应为A.1%B. 2%C. 3%D. 4%E. 5%81.男性,64岁,因低热.乏力3月余就诊,两侧颈部可触及多个蚕豆大小淋巴结,脾肋下2cm，RBC 4.25×10 12/L，Hb 134g/L，WBC 19.1×10 9 /L，白细胞分类:中性分叶核细胞15%，中性杆状核细胞2%，淋巴细胞83%，PLT 152×10 9 /L。

蛋白质序列数据库

▪ PIR-PSD的另一个重要特征是其对蛋白质超家族的分类，提供序列的等级聚类信息，揭示序列间的进化关系。
4 UniPro
▪ 蛋白质信息资源（PIR）、欧洲生物信息学研究所（EBI）和瑞士生物信息学研究所（SIB）合作，于2002年共同组建世界蛋白质资源（the Universal Protein Resource， UniPro）。
▪ UniPro把Swiss-Prot、TrEMBL和PIR等蛋白质数据库整合在一起，是目前国际上最全面的蛋白质信息库。
综上所述，蛋白质序列数据库种类多且各有特色，因此，用户在分析蛋白质序列时，应根据实际情况，尽可能选择几个不同的数据库，并对结果加以比较。
The Universal Protein Resource (Uபைடு நூலகம்iProt)
属性。
5 序列描述:
是在生物和（或）生物文献的上下文中描述一个生物序列或生物序列集；
生物源（BioSource）－来源生物的信息；分子信息（MolInfo）－－描述器指示分子类型，如基因，
mRNA，EST，肽链信息。
蛋白质数据分析
由于传统的用X光晶体衍射和核磁共振技术测定蛋白质的三维结构、用生化方法研究蛋白质功能的效率不高，无法适应由基因组测序所带来的蛋白质序列数量飞速增长的需要，近年来，许多科学家致力于用理论计算的方法预测蛋白质的三维结构和功能，提高蛋白质功能研究的效率，并取得了一定的成果。
信息、注释、蛋白质序列等(如：Acetyltransferase)。
3D structure
c. 蛋白质注释
包括蛋白质的功能、翻译后修饰（如糖基化和磷酸化）、结构域和结合位点、二级结构（如α- 螺旋和β- 片层）、四级结构（如同聚体和异聚体）、与其它蛋白质序列的相似性、蛋白质序列残缺与疾病的关系、序列冲突和变异体等信息。

蛋白质组学研究中常用的网站和数据库

蛋白质组学研究中常用的网站和数据库蛋白质, 数据库, 研究本帖引用网址：/thread-35586-1-1.html一、蛋白质数据库1.UniProt (The Universal Protein Resource) 网址：//uniprot/简介：由EBI(欧洲生物信息研究所)、PIR(蛋白信息资源)和SIB(瑞士生物信息研究所)合作建立而成，提供详细的蛋白质序列、功能信息，如蛋白质功能描述、结构域结构、转录后修饰、修饰位点、变异度、二级结构、三级结构等，同时提供其他数据库，包括序列数据库、三维结构数据库、2-D凝聚电泳数据库、蛋白质家族数据库的相应链接。

2.PIR(Protein Information Resource) 网址：/简介：致力于提供及时的、高质量、最广泛的注释，其下的数据库有iProClass、PIRSF、PIR-PSD、PIR-NREF、UniPort，与90多个生物数据库(蛋白家族、蛋白质功能、蛋白质网络、蛋白质互作、基因组等数据库)存在着交叉应用。

3.BRENDA(enzyme database) 网址：简介：酶数据库，提供酶的分类、命名法、生化反应、专一性、结构、细胞定位、提取方法、文献、应用与改造及相关疾病的数据。

4.CORUM(collection of experimentally verifiedmammalian protein complexes) 网址：http://mips.gsf.de/genre/proj/corum/index.html简介：哺乳动物蛋白复合物数据库，提供的数据包括蛋白复合物名称、亚基、功能、相关文献等5.CyBase(cyclic protein database) 网址：.au/cybase简介：环状蛋白数据库，提供环状蛋白的序列、结构等数据，提供环化蛋白预测服务。

6.DB-PABP 网址：/DB_PABP/简介：聚阴离子结合蛋白数据库。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

PIR的产生
PIR（Protein Information resouce, 蛋白质数据库）的出现先于核酸数据库。在 1960年左右，Dayhoff （1925 - 1983）和其同事们搜集了当时所有已知的氨基酸序列，编著了《蛋白质序列与结构图册》。从这本图册中的数据，演化为后来的蛋白质信息资源数据库
谢谢观赏
Make Presentation much more fun
PIR是由美国国家生物医学基金会（NBRF）于1984年建立，位于乔治敦大学。
PIR是一个集成了关于蛋白质功能预测数据的公共资源的数据库，其目的是支持基因组/蛋白质组研究。 PIR与其他组织合作，共同构成了PIR-国际蛋白质序列数据库（PSD）.
发展至今日830,000条非冗余蛋白质序列，提供了36,000多PIR蛋白质超家族， 145,000多蛋白质家族，4,000多蛋白质结构域，13,000多模体和555,000多相似的蛋白质聚类信息。
PIR的功能
目的：帮助研究者鉴别和解释蛋白质序列信息，
研究分子进化、功能基因组。
它是一个全面的、经过注释的、非冗余的蛋白质序列数据库。
所有序列数据都经过整理，超过99%的序列已按蛋白质家族分类，一半以上还按蛋白质超家族进行了分
除了蛋白质序列数据之外，PIR还包含以下信息： (1)蛋白质名称、蛋白质的分类、蛋白质的来源； (2)关于原始数据的参考文献； (3)蛋白质功能和蛋白质的一般特征，包括基因表达、翻译后处理、活化等； (4)序列中相关的位点、功能区域。
蛋白质一般信息
交叉引用文献
相关蛋白质家族信息
点击此处
此处链接 UniProt databases.
在UniProt database 搜索中的结果
蛋白质基本信息
蛋白质家族信息
Entry name 标题/序列名称序列物种来源拉丁名（常用名）记录注册、修改日期
注册号及参考来源
物种分类型序列长度序列顺序文献发表作者/刊名/发表时间/文章名/文献数据库记录号
PIR-PSD 蛋白质序列数据库
韩硕徐飞薛刚费文斌
PIR 国际蛋白质序列数据库(PSD) （）是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库。是一个支持基因组学、蛋白质组学和系统生物学检索和科学研究的综合公共生物信息学资源。 PIR免费为科学界提供包括蛋白序列数据库（PSD）在内的蛋白数据库和分析工具。的交互式查询用户通过关键字进行数据查询。二是标准的序列相似性搜索，包括BLAST、FastA等。
三是结合序列相似性、注释信息和蛋白质家族信息的高级搜索包括按注释分类的相似性搜索、结构域搜索等。
网站搜索
蛋白质搜索
G00016
主页的导航条有五大类：
Abrout PIR：对网站的历史、发展、刊物等的介绍； Databases：包括Proclass、 Pirsf、PIR—PSD、 PIR— NREF 、Uniprot等数据库集合； Search/Analysis：对蛋白质序列分析的多种途径； Dowload：网站提供的蛋白质序列；
Support：一些帮助及其它连接.