蛋白质分析数据库

合集下载

蛋白质分析相关数据库及网站

蛋白质分析相关数据库及网站

蛋⽩质分析相关数据库及⽹站表1蛋⽩质相互作⽤分析相关数据库及⽹站蛋⽩质序列分析和结构预测【实验⽬的】1、掌握蛋⽩质序列检索的操作⽅法;2、熟悉蛋⽩质基本性质分析;3、熟悉基于序列同源性分析的蛋⽩质功能预测,了解基于motif、结构位点、结构功能域数据库的蛋⽩质功能预测;4、了解蛋⽩质结构预测。

【实验内容】1、使⽤Entrez或SRS信息查询系统检索⼈脂联素(adiponectin)蛋⽩质序列;2、使⽤BioEdit软件对上述蛋⽩质序列进⾏分⼦质量、氨基酸组成、和疏⽔性等基本性质分析;3、对⼈脂联素蛋⽩质序列进⾏基于NCBI/Blast软件的蛋⽩质同源性分析;4、对⼈脂联素蛋⽩质序列进⾏motif结构分析;5、对⼈脂联素蛋⽩质序列进⾏⼆级结构和三维结构预测。

【实验⽅法】1、⼈脂联素蛋⽩质序列的检索:(1)调⽤Internet浏览器并在其地址栏输⼊Entrez⽹址(/doc/9364f7ae783e0912a3162a12.html/Entrez);(2)在Search后的选择栏中选择protein;(3)在输⼊栏输⼊homo sapiens adiponectin;(4)点击go后显⽰序列接受号及序列名称;(5)点击序列接受号NP_004788 (adiponectin precursor;adipose most abundant gene transcript 1 [Homo sapiens])后显⽰序列详细信息;(6)将序列转为FASTA格式保存(参考上述步骤使⽤SRS信息查询系统检索⼈脂联素蛋⽩质序列);2、使⽤BioEdit软件对⼈脂联素蛋⽩质序列进⾏分⼦质量、氨基酸组成和疏⽔性等基本性质分析:打开BioEdit软件→将⼈脂联素蛋⽩质序列的FASTA格式序列输⼊分析框→点击左侧序列说明框中的序列说明→点击sequence 栏→选择protein→点击Amino Acid Composition→查看该蛋⽩质分⼦质量和氨基酸组成;或者选择protein后,点击Kyte & Doolittle Mean Hydrophobicity Profile→查看该蛋⽩质分⼦疏⽔性⽔平;3、⼈脂联素蛋⽩质序列的蛋⽩质同源性分析:(1)进⼊NCBI/Blast⽹页;(2)选择Protein-protein BLAST (blastp);(3)将FASTA格式序列贴⼊输⼊栏;(4)点击BLAST;(5)查看与之同源的蛋⽩质;4、⼈脂联素蛋⽩质序列的motif结构分析:(1)进⼊http://hits.isb-sib.ch/cgi-bin/PFSCAN⽹页;(2)将⼈脂联素蛋⽩质序列的FASTA格式序列贴⼊输⼊栏;(3)点击Scan;(4)查看分析结果(注意Prosite Profile中的motif information);5、⼈脂联素蛋⽩质序列的⼆级结构预测:(1)进⼊下列蛋⽩结构预测服务器⽹址http://www.embl-heidelberg.de/predictprotein//predictprotein.html(The PredictProtein Server);(2)在You can栏点击default;(3)填写email地址和序列名称;(4)将⼈脂联素蛋⽩质序列的FASTA格式序列贴⼊输⼊栏点击Submit;(5)从email信箱查看分析结果;6、⼈脂联素蛋⽩质序列的三维结构预测:(1)进⼊/doc/9364f7ae783e0912a3162a12.html /swissmod/SWISS-MODEL.html (SwissModel First Approach Mode)⽹页;(2)填写email地址、姓名和序列名称;(3)将⼈脂联素蛋⽩质序列的FASTA格式序列贴⼊输⼊栏;(4)点击Send Request;(5)从email信箱查看分析结果(注:需下载软件⼊rasmol查看三维图象)。

蛋白质数据库

蛋白质数据库

生物芯片北京国家工程研究中心湖南中药现代化药物筛选分中心暨湖南涵春生物有限公司常用数据库名录1、蛋白质数据库PPI - JCB 蛋白质与蛋白质相互作用网络•Swiss-Prot - 蛋白质序列注释数据库•Kabat - 免疫蛋白质序列数据库•PMD - 蛋白质突变数据库•InterPro - 蛋白质结构域和功能位点•PROSITE - 蛋白质位点和模型•BLOCKS - 生物序列分析数据库•Pfam - 蛋白质家族数据库 [镜像: St. Louis (USA), Sanger Institute, UK, Karolinska Institutet (Sweden)] •PRINTS - 蛋白质 Motif 数据库•ProDom - 蛋白质结构域数据库 (自动产生)•PROTOMAP - Swiss-Prot蛋白质自动分类系统•SBASE - SBASE 结构域预测数据库•SMART - 模式结构研究工具•STRING - 相互作用的蛋白质和基因的研究工具•TIGRFAMs - TIGR 蛋白质家族数据库•BIND - 生物分子相互作用数据库•DIP - 蛋白质相互作用数据库•MINT - 分子相互作用数据库•HPRD - 人类蛋白质查询数据库•IntAct - EBI 蛋白质相互作用数据库•GRID - 相互作用综合数据库•PPI - JCB 蛋白质与蛋白质相互作用网络2、蛋白质三级结构数据库•PDB - 蛋白质数据银行•BioMagResBank - 蛋白质、氨基酸和核苷酸的核磁共振数据库•SWISS-MODEL Repository - 自动产生蛋白质模型的数据库•ModBase - 蛋白质结构模型数据库•CATH - 蛋白质结构分类数据库•SCOP - 蛋白质结构分类 [镜像: USA | Israel | Singapore | Australia]•Molecules To Go - PDB数据库查询•BMM Domain Server - 生物分子模型数据库•ReLiBase - 受体/配体复合物数据库 [镜像: USA]•TOPS - 蛋白质拓扑图•CCDC - 剑桥晶体数据中心 (剑桥结构数据库 (CSD))•HSSP - 蛋白质二级结构数据库•MutaProt - PDB数据库中点突变的比较•SWISS-3DIMAGE - 蛋白质和其他生物分子的三维图像•BioImage - 生物图像数据库 (包含生物大分子图像) 3、蛋白质组数据库和链接•2-D胶数据库以及与2-D胶相关的数据库•蛋白质组链接4、与核酸相关的数据库•EMBL - EMBL核酸序列数据库 (EBI)•Genbank - GenBank核酸序列数据库 (NCBI)•DDBJ - 日本DNA数据库•dbEST - dbEST(表达序列标签)数据库 (NCBI)•dbSTS - dbSTS(序列标签位点)数据库 (NCBI)•AsDb - 异常剪切数据库•ACUTS - DNA非转录保守序列数据库•密码子数据库•EPD - 真核生物启动子数据库•HOVERGEN - 颈椎动物同源基因数据库•IMGT - 免疫遗传学数据库 [镜像: EBI]•ISIS - 内含子序列信息•RDP - 核糖体数据库•gRNAs db - gRNA数据库•PLACE - 植物DNA顺势调控元件数据库•PlantCARE - 植物中DNA顺势调控组件数据库•ssu rRNA - 欧洲核糖体RNA数据库-小核糖体•lsu rRNA - 欧洲核糖体RNA数据库-大核糖体•5S rRNA - 5S核糖体RNA数据库•tmRNA Website - tmRNA站点•tmRDB - tmRNA数据库•tRNA - tRNA剪切( Bayreuth大学)•uRNA db•RNA editing - RNA剪切位点•RNAmod db - RNA修饰数据库•TelDB - 多介质端粒数据库•MPDB - 分子探针数据库•VectorDB - 载体序列数据库5、糖类•FCCA - 糖类论坛•GlycoSuiteDB - 多聚糖数据库•Monosacharide browser - Space filling Fischer projection for monosaccharides•Thorkild's lectin page - 凝集素通道6、特殊物种数据库:人类:•OMIM - 孟德尔遗传在线--人类•GENATLAS - 人类基因图集•GeneClinics - 医学基因学库•GDB - 基因组数据库•GeneCards - 人类基因整合信息数据库•UDB - 人类基因图谱数据库•Ensembl人类基因组浏览器•UCSC人类基因组工作草图•TIGR HGI - TIGR人类基因组索引•Hs UniGene - GenBank中的人类转录本•STACK - 序列标签比对• - 人类基因预测•GenLink - 人类基因组资源数据库•GeneLynx - 人类基因组•HUGE - 人类未知基因-大型蛋白质反转录得到的cDNA (KIAA...)•HUNT - 人类异常转录本•CGAP - 癌症基因组解剖学•MGC - 哺乳动物基因•SCDb - 干细胞数据库•Homophila - 人类疾病基因与果蝇基因对比数据库•Human Protein Atlas - 人类正常组织蛋白质与癌细胞蛋白质表达与位点的比较•Chr at Rutgers - Rutgers的人类染色体信息•Chr at Sanger - Sanger Center的人类染色体信息•Chr Swiss-Prot list - Swiss-Prot的染色体信息脊椎动物:•OMIA - 孟德尔遗传在线--动物•MGI - 小鼠基因组学信息 [镜像: Australia]•Ensembl小鼠基因组浏览器•TIGR MGI - TIGR小鼠基因索引•Mm UniGene - GenBank 中的小鼠转录本(EST clusters) •MGC - 哺乳动物基因•Mouse gene knockouts db - 小鼠基因敲除数据库•RGD - 大鼠基因组数据库•RatMAP - 大鼠基因组数据库•TIGR RGI - TIGR大鼠基因组数据库•Rn Unigene - GenBank 中的大鼠转录本(EST clusters) •BOVMAP - 牛基因数据库 (法国)•DGP - 狗基因数据库•MIS - 孟德尔遗传--羊•Ark-Cat - 猫基因组数据库•Ark-Chicken - 鸡基因组数据库•Ark-Cow - 奶牛基因组数据库•Ark-Deer - 鹿基因组数据库•Ark-Horse - 马基因组数据库•Ark-Pig - 猪基因组数据库•Ark-Sheep - 绵羊基因组数据库•Ark-Turkey - 火鸡基因组数据库•FishBase -鱼类综合信息系统•Fugu genome project - 河豚基因组•Fugu - HGMP 河豚数据•- Ensembl 河豚基因组浏览器•Medakafish - Mekada fish (Oryzias latipes) server •Ark-Tilapia - 罗飞鱼基因组数据库•Ark-Salmon - 大马哈鱼基因组数据库•The fish net - 斑马鱼基因组数据库•Ensembl斑马鱼基因组浏览器线粒体和叶绿体:•GOBASE - 细胞器基因组数据库•MitoDat - 孟德尔遗传和线粒体数据库• C.caldarium - 蓝藻纲PK1菌株叶绿体基因组昆虫•Drosophila Swiss-Prot list - Swiss-Prot中的果蝇链接•FlyBase - 果蝇遗传数据库和分子数据库•BDGP - Berkeley果蝇基因组项目•FlyView - 果蝇图像数据库•Homophila - 人类疾病与果蝇基因对照数据库•蚊子基因组学•AnoDB - 疟蚊数据库•Ensembl蚊子基因组浏览器7、人类突变数据库•HGMD - 人类基因突变数据库•SVD - EBI序列变异数据库•GeneDis - 人类遗传病数据库8、特殊基因和蛋白质数据库•Allergens in Swiss-Prot - Swiss-Prot中过敏反应的命名与索引•Allergome - 过敏症反应分子数据库•Aminoacyl-tRNA synthetases in Swiss-Prot - Swiss-Prot 中氨基化tRNA合成酶列表9、转录后修饰数据库•DSDBASE - 二硫化物数据库 (数据来源于三级结构数据库) •GlycoSuiteDB - 多聚糖结构数据库•LIPID MAPS - 脂类代谢及路径10、系统发生学数据库•COG - 全基因组中编码的蛋白质的系统发生学分类方法•EGO - 真核生物基因分类方法•InParanoid - 真核生物分类11、芯片数据库•ArrayExpress - EBI中芯片数据•ExpressDB - 酵母菌和大肠杆菌表达数据库•GeneX - 基因表达工程12、专利数据库•DPD - DNA专利数据库•Ag Patents - USDA收录的农业工艺专利•Esp@cenet - 欧洲专利事务所专利信息数据库 (世界范围内)13、参考文献(目录数据库)•PubMed Medline server - PubMed查询•AGRICOLA - NAL农业查询数据库•Article@INIST - 科技信息数据库•Korean Journals Abstract db - 韩国杂志摘要数据库•SeqAnalRef - 序列分析文献14、字典, 读物, 课程 ,命名法•BioABACUS - 缩写词•BioTech's life science dictionary生物科技及生命科学字典•DCB - 细胞生物学字典(Julian Dow编写)15、生物软件数据库及目录•CLC Free Workbench - 可在Linux, MacOS X and Windows操作系统上运行的,对DNA、RNA和蛋白质进行算法分析的软件•CLC Protein Workbench - 可在Linux, MacOS X and Windows 操作系统上运行的,对DNA、RNA和蛋白质进行算法分析的软件•BioCatalog - EBI的生物目录16、生命科学资源•Biofind - 生物科技工业信息、评论及新闻•Bioinformatik.de - 生物信息学网页目录17、生物杂志和发行人•生物杂志主页:Swiss-Prot journals list - Swiss-Prot杂志列表• - 电子出版物目录• - 电子期刊目录18、发行人•Allen Press, Inc. - Allen出版社•AMA - 美国医学联合出版物•ACS - 美国化工协会出版物19、生物信息学杂志和通讯•BioInformer - EBI通讯•NCBI Newsletter -NCBI通讯•PDB Quaterly Newsletter - PDB通讯20、基因组通讯•Human Genome Project Information - 人类基因组计划•FGN - 真菌遗传学•Rice Genome Newsletter - 水稻基因组21、其他•IJC - 化学杂志•Plant Gene Register - 植物基因注册22、生物商业杂志•BioCentury - 生物世纪•BioWorld Online - 生物世界•Drug Discovery and Development - 药物发现和发展•GEN - 基因工程新闻23、综合性科学杂志•Nature•New Scientist•La Recherche•Science•Scientific American24、生物学研究机构•APS - 美国缩氨酸社区•ASCB - 美国细胞生物学社区•ASHG - 美国人类遗传学社区25、计算生物学服务器主页欧洲:•EBI - 欧洲生物信息学协会•EMBnet - 欧洲分子生物信息学网•EMBL - EMBL计算生物学机构美国和加拿大:•NCBI - 美国生物学信息中心•ABCC - NCI高级生物医学计算中心•ACGT - Oklahoma大学基因组技术中心亚洲•APBioNet - 亚太生物信息网•BIC-JNU - Jawaharlal Nehru大学生物信息学中心•DIC - Pune (印度)大学生物信息澳洲•APBioNet - 亚太生物信息网•ANGIS - 澳大利亚国家遗传信息服务中心•ANU - 澳大利亚国大学生物信息学研究组•APAF - 澳大利亚蛋白质组分析工具26、其他•HUJI - 耶路撒冷Hebrew大学基因组学和生物信息学服务中心•Weizmann Bioinfo/BCU - Weizmann计算生物学和生物信息学研究协会•SANBI - 南非生物信息学研究协会27、生物公司和制药公司•美国药物研究和制造商目录•Bioportfolio - 生物技术企业•Affymetrix, Inc. - Affymetrix公司28、生物信息公司•Aborygen•Accelrys, Inc•AlgoNomics NV t29、其他链接其他医学查询•HON - 基于网络的健康服务• - 药物网络指南•MedWeb - 医学链接其他科学查询•GPSDB - 基因和蛋白质同义词数据库•Chemcyclopedia Online - 商业化学试剂数据库。

蛋白质数据库使用说明

蛋白质数据库使用说明

引言:蛋白质数据是生物信息学领域中非常重要的资源之一,它提供了大量关于蛋白质序列、结构、功能以及相互作用等方面的信息。

本文旨在介绍如何使用蛋白质数据库,帮助用户更好地利用这一资源进行研究。

概述:蛋白质数据库是一个集成了许多蛋白质信息的在线资源,用户可以通过搜索、浏览、等方式获取所需的信息。

其中,常用的蛋白质数据库包括NCBI、UniProt、PDB等。

这些数据库提供了丰富的蛋白质数据,并且不断更新以满足用户需求。

正文内容:1.数据库搜索功能1.1.关键词搜索1.1.1.输入蛋白质名称1.1.2.输入序列片段1.1.3.输入关键词1.2.高级搜索选项1.2.1.提供更精确的搜索结果1.2.2.支持过滤和排序功能1.2.3.可以根据相关字段进行搜索2.数据库浏览功能2.1.蛋白质分类2.1.1.按物种分类2.1.2.按功能分类2.1.3.按家族分类2.2.数据表格浏览2.2.1.查看蛋白质基本信息2.2.2.查看蛋白质序列2.2.3.查看蛋白质结构2.3.数据图谱浏览2.3.1.查看蛋白质相互作用网络2.3.2.查看蛋白质结构域分布2.3.3.查看蛋白质功能注释3.数据库功能3.1.蛋白质序列数据3.1.1.全部序列3.1.2.特定物种的序列3.2.蛋白质结构数据3.2.1.已解析的蛋白质结构3.2.2.蛋白质结构预测结果3.3.蛋白质相互作用数据3.3.1.已验证的相互作用数据3.3.2.预测的相互作用数据4.数据库工具与资源4.1.序列比对工具4.1.1.BLAST4.1.2.PSIBLAST4.2.结构预测工具4.2.1.SWISSMODEL4.2.2.Phyre24.3.功能注释资源4.3.1.GeneOntology4.3.2.InterPro4.4.数据库交互接口4.4.1.提供API接口4.4.2.支持数据提交与5.数据库更新与维护5.1.数据更新频率5.2.数据质量保证5.3.用户反馈与支持5.4.数据库版本与历史记录总结:蛋白质数据库为研究人员提供了丰富的蛋白质信息资源,通过搜索、浏览、等功能,用户可以轻松地获取需要的数据。

蛋白质数据库

蛋白质数据库

蛋⽩质数据库
⼀、蛋⽩质数据库
》序列数据库:Uniprot (蛋⽩质序列和具有综合功能注释⽬录的中⼼资源库)
PIR (提供蛋⽩质序列数据和分析⼯具)
》结构数据库:PDB (实验测定的⽣物⼤分⼦三维结构)
MMDB
》模体及结构域数据库:PROSITE (蛋⽩质序列功能位点数据库)
Pfom (使⽤基于隐马模型的多序列⽐对对蛋⽩质进⾏家族分类) 》蛋⽩质分类数据库:SCOP (提供已知结构蛋⽩质间的结构和进化关系信息)
CAHT
HSSP
DSSP
⼆、蛋⽩质组数据库
》SWEISS PROT 2DE PAGE / neXtProt / PaxDb / PeptideAtlas / PRIDE
涉及不同⽣物、不同器官、组织、细胞的蛋⽩质图谱数据
三、蛋⽩质互作组数据库
》HPRD / DIP / INTERACT
四、综合型数据库
》ExPASy。

蛋白质组学研究中常用的网站和数据库

蛋白质组学研究中常用的网站和数据库

蛋白质组学研究中常用的网站和数据库蛋白质, 数据库, 研究本帖引用网址:/thread-35586-1-1.html一、蛋白质数据库1.UniProt (The Universal Protein Resource) 网址://uniprot/简介:由EBI(欧洲生物信息研究所)、PIR(蛋白信息资源)和SIB(瑞士生物信息研究所)合作建立而成,提供详细的蛋白质序列、功能信息,如蛋白质功能描述、结构域结构、转录后修饰、修饰位点、变异度、二级结构、三级结构等,同时提供其他数据库,包括序列数据库、三维结构数据库、2-D凝聚电泳数据库、蛋白质家族数据库的相应链接。

2.PIR(Protein Information Resource) 网址:/简介:致力于提供及时的、高质量、最广泛的注释,其下的数据库有iProClass、PIRSF、PIR-PSD、PIR-NREF、UniPort,与90多个生物数据库(蛋白家族、蛋白质功能、蛋白质网络、蛋白质互作、基因组等数据库)存在着交叉应用。

3.BRENDA(enzyme database) 网址:简介:酶数据库,提供酶的分类、命名法、生化反应、专一性、结构、细胞定位、提取方法、文献、应用与改造及相关疾病的数据。

4.CORUM(collection of experimentally verifiedmammalian protein complexes) 网址:http://mips.gsf.de/genre/proj/corum/index.html简介:哺乳动物蛋白复合物数据库,提供的数据包括蛋白复合物名称、亚基、功能、相关文献等5.CyBase(cyclic protein database) 网址:.au/cybase简介:环状蛋白数据库,提供环状蛋白的序列、结构等数据,提供环化蛋白预测服务。

6.DB-PABP 网址:/DB_PABP/简介:聚阴离子结合蛋白数据库。

UniProt:蛋白质的全信息数据库

UniProt:蛋白质的全信息数据库

Nucleic Acids Research, 2004, Vol. 32, Database issue D115-D119© 2004 Oxford University PressUniProt:蛋白质的全信息数据库摘要为了给科学界提供一个专门,集中,权威的蛋白质序列和功能的信息资源,瑞士-Prot,TrEMBL 和PIR蛋白质数据库已经合作组成了蛋白质的全信息数据库 (UniProt)。

我们的目的是用广泛的对照和询问接口来提供一个全面的,分类完全的,丰富并且准确的蛋白质序列信息。

中心数据库将有两个部分:符合熟悉的瑞士-Prot(完全手工操作入口)和TrEMBL(使用丰富的自动化的分类,注释和广泛的对照)。

为方便序列查寻,UniProt也提供几个无冗余的序列数据库。

UniProt NREF(UniRef)数据库为高效率的搜寻提供适当的蛋白质的全信息数据库的代表性的子集。

全面的UniProt 档案(UniParc)每天从很多公共来源数据库更新。

数据库那些UniProt接口可在线访问()或者以几个形式下载(ftp:///pub)。

我们鼓励科学界人士向UniProt 提供数据。

介绍近来,瑞士-Prot + TrEMBL和PIR-PSD如同蛋白质数据库不同的序列信息覆盖面和注释优势共存。

2002年,在生物信息科学(SIB)的瑞士研究所和欧洲生物信息科学研究所的瑞士-Prot + TrEMBL 组 (EBI)和蛋白质信息资源(PIR)组织在乔治敦大学医学中心和国家生物医学的研究基金会联合协作。

新联合的组织的主要任务是通过建立一个综合,详细分类,丰富并且准确注释蛋白质序列的优质的数据库和广泛序列对比和询问服务的到科学团体免费接口—knowledgebase来支持生物学的研究。

UniProt 将在组织成员多年合作的坚实基础上建立起来。

UniProt 数据库包括3 个数据库层:1、UniProt 档案(UniParc),通过储存全部可公开得到的蛋白质序列数据供一个稳定,综合,无冗余的序列收集。

实验四 蛋白质数据库uniprotkb的使用

实验四 蛋白质数据库uniprotkb的使用

生命科学学院生物技术091 罗信旭 0907040118实验四蛋白质数据库—uniprotkb/swiss-prot的使用一、实验目的:掌握蛋白质数据库uniprotkb/swiss-prot的蛋白质序列的查询方法,了解uniprotkb/swiss-prot数据库提供的有关蛋白质的信息资源。

二、实验原理:uniprotkb/swiss-prot蛋白质序列数据库是由SIB和EBI共同维护和管理,并随EMBL 数据库一起发行。

目前,该数据库是最为常用、注释最全、包含独立项最多的数据库,它包括其他蛋白质序列库中经过验证的全部序列、其注释及蛋白质的功能、结构域和活性位点、二级结构、四级结构、翻译后修饰、与其他蛋白质的相似性等内容。

三、实验器材:计算机,uniprotkb/swiss-prot蛋白质序列数据库。

四、实验内容:应用我们需要查找的物种的拉丁学名或蛋白质的名称,在uniprotkb/swiss-prot蛋白质序列数据库中进行查询,由此获得我们所需要查找的蛋白质序列。

五、实验步骤:1、输入域名/,打开EBI主界面,找到主界面下方的database一栏,点击下拉菜单,点击protein目录下uniprotkb/swiss-prot一栏,进入蛋白质序列数据库的Search界面。

2、找到uniprotkb/swiss-prot蛋白质序列数据库界面上端的Find一栏,在方框中输入需要查询的关键词,即物种的拉丁文学名或蛋白质的名称,然后开始搜索。

3、在进入查询结果界面后,选择界面下方的protein sequence/uniprotkb中的序列,点击in uniprot或in SRS,可以看到与查询要求相关的各种结果,根据实验要求将其拷贝下来即可。

六、实验要求:每个组每个同学至少查找四个蛋白质的序列。

将查询结果中的Sequence、Accession、similarity、Organism source等结果拷贝下来作为实验结果。

蛋白质数据库使用说明

蛋白质数据库使用说明

蛋白质数据库使用说明蛋白质数据库使用说明概述本文档提供了蛋白质数据库使用说明,包括数据库访问方式、数据搜索和分析方法等。

通过阅读本文档,用户将了解如何有效地利用蛋白质数据库进行蛋白质相关研究。

1. 数据库访问方式1.1 网站访问蛋白质数据库可以通过网站进行访问。

用户需要在浏览器中输入数据库的网址,并使用提供的用户名和密码进行登录。

一旦登录成功,用户将可以浏览数据库中的蛋白质信息。

1.2 API接口蛋白质数据库通常也提供了API接口,用户可以通过编程方式获取和操作数据库中的数据。

通过API接口,用户可以实现自动化的数据获取和分析。

2. 数据搜索2.1 关键词搜索用户可以通过关键词搜索来查找与特定蛋白质相关的信息。

在数据库的搜索框中输入关键词,数据库将返回与关键词相关的蛋白质条目。

2.2 高级搜索蛋白质数据库通常也提供了高级搜索功能,用户可以使用更复杂的搜索方式来满足特定需求。

高级搜索功能包括使用逻辑运算符、指定搜索范围等。

3. 数据分析3.1 蛋白质比对用户可以使用蛋白质数据库中的比对工具来进行蛋白质比对分析。

比对工具可以帮助用户找到在不同蛋白质序列之间的相似性和差异性。

3.2 功能注释蛋白质数据库还提供了功能注释工具,可以帮助用户预测蛋白质的功能。

用户可以根据数据库中的注释信息来了解蛋白质的功能和作用。

4. 数据蛋白质数据库通常也提供数据功能,用户可以将数据库中的数据到本地进行进一步的分析和处理。

功能可以提供多种格式的数据文件,如文本文件、Excel文件等。

附件本文档没有涉及附件。

法律名词及注释本文档没有涉及法律名词及注释。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

表1蛋白质相互作用分析相关数据库及网站
208
v/Entrez);
(2)在Search后的选择栏中选择protein;
(3)在输入栏输入homo sapiens adiponectin;
(4)点击go后显示序列接受号及序列名称;
(5)点击序列接受号NP_004788 (adiponectin precursor;adipose most abund ant gene transcript 1 [Homo sapiens])后显示序列详细信息;
(6)将序列转为FASTA格式保存(参考上述步骤使用SRS信息查询系统检索人脂联素蛋白质序列);
2、使用BioEdit软件对人脂联素蛋白质序列进行分子质量、氨基酸组成和疏水性等基本性质分析:
打开BioEdit软件→将人脂联素蛋白质序列的FASTA格式序列输入分析框→点击左侧序列说明框中的序列说明→点击sequence栏→选择protein→点击Amino Acid Composi tion→查看该蛋白质分子质量和氨基酸组成;或者选择protein后,点击Kyte & Doolittle Mean Hydrophobicity Profile→查看该蛋白质分子疏水性水平;
3、人脂联素蛋白质序列的蛋白质同源性分析:
(1)进入NCBI/Blast网页;
(2)选择Protein-protein BLAST (blastp);
(3)将FASTA格式序列贴入输入栏;
(4)点击BLAST;
(5)查看与之同源的蛋白质;
4、人脂联素蛋白质序列的motif结构分析:
(1)进入http://hits.isb-sib.ch/cgi-bin/PFSCAN网页;
(2)将人脂联素蛋白质序列的FASTA格式序列贴入输入栏;
(3)点击Scan;
(4)查看分析结果(注意Prosite Profile中的motif information);
5、人脂联素蛋白质序列的二级结构预测:
(1)进入下列蛋白结构预测服务器网址: http://www.embl-heidelberg.de/predictprot ein//predictprotein.html (The PredictProtein Server);
(2)在You can栏点击default;
(3)填写email地址和序列名称;
(4)将人脂联素蛋白质序列的FASTA格式序列贴入输入栏点击Submit;
(5)从email信箱查看分析结果;
6、人脂联素蛋白质序列的三维结构预测:
(1)进入/swissmod/SWISS-MODEL.html (SwissModel Fir st Approach Mode)网页;
(2)填写email地址、姓名和序列名称;
(3)将人脂联素蛋白质序列的FASTA格式序列贴入输入栏;
(4)点击Send Request;
(5)从email信箱查看分析结果(注:需下载软件入rasmol查看三维图象)。

【作业】
1、提交使用上述软件对人脂联素蛋白质序列进行基本性质分析、同源性分析、motif
结构分析以及二级结构和三维结构预测的结果;
2、相互对比结果,说明产生不同结果的原因,总结进行上述分析所需注意的关键事项。

蛋白质序列分析
蛋白质序列分析
pfam /蛋白质结构域预测
smart http://smart.embl-heidelberg.de/ 蛋白质结构域预测
BLOCKS / 蛋白质家族的序列保守区域
CluSTr /clustr/ 将SWISS-PROT+TrEMBL蛋白自动归类
InterPro /interpro/ 蛋白质家族、结构域和位点的集成信息资源
PIR-ALN /pirwww/dbinfo/piraln.html 蛋白质序列联配PRINTS /dbbrowser/PRINTS/ 分层的基因家族指纹PROSITE http://www.expasy.ch/prosite/ 具有生物学意义的蛋白模式和轮廓
ProtoMap / 对SWISS-PROT蛋白质进行自动分类
SBASE http://hydra.icgeb.trieste.it/~kristian/SBASE/ 注释了的蛋白质结构域序列SYSTERS http://systers.molgen.mpg.de/ 基于多种资源对蛋白质序列进行分类
Emotif /emotif 蛋白质序列模体查询
Iproclass /iproclass/ 注释了的蛋白质分类数据库
PFSCAN www.isrec.isb-sib.ch/software/PFSCAN_form.html 蛋白质序列的(profile)分析
Compute pI/Mw- http://www.expasy.ch/ch2d/pi_tool.html蛋白质序列的理论等电点、分子量的计算
CATH- /bsm/cath 通过自动、手动方式进行蛋白质结构相关性的系统分类,
CATH是以下四个单词的第一个字母的组合
Class(类) -源于二级结构的最高级别的分类
Architecture(构造) -独立于拓扑结构的二级结构排列描述。

Topology(拓扑结构)-参照已知的折叠及观测的结构进行拓扑分析
Homology(同源)-结构间相同的拓扑布局、不同的二级结构(与功能相似性相关)描述
CRASP http://wwwmgs.bionet.nsc.ru/Programs/CRASP/default.htm 蛋白质序列的相关分析
FPAT /fpat/-an 检索分子序列数据库模式的简易方法
Hydropathy Plot (GIF image) /nixon/webtools/hydro/default.htm 绘制亲疏水图
MOTIF http://www.genome.ad.jp/SIT/MOTIF.html- 蛋白质序列模式检索
RandSeq http://www.expasy.ch/sprot/randseq.html- 随机的蛋白质序列生长子
REPRO- http://www.embl-heidelberg.de/repro/repro_info.htmlA 蛋白质重复片断识别服务器
paralign / 蛋白质、核酸序列相似性检索
SignalP http://www.cbs.dtu.dk/services/SignalP/ 在不同的物种中预测信号肽及酶切位点SIM- http://expasy.hcuge.ch/sprot/sim-prot.html 由用户定义的最佳两序列对比
TMpred http://ulrec3.unil.ch/software/TMPRED_form.html - 蛋白质跨模区预测、定位,该方法基于统计学结果,通过权重矩阵打分进行预测分析
Coils http://ulrec3.unil.ch/software/COILS_for m.html 对比分析具有双股卷曲结构的序列同源性打分,进而计算适于采用该结构的序列的几率
GuessProt http://www.expasy.ch/www/guess-prot.html 选择SwissProt蛋白的等电点、分子量
MassSearch http://cbrg.inf.ethz.ch/subsection3_1_3.html- 蛋白质消化后的聚集检索Phospepsort http://genome.eerie.fr/gcg/phospepsort-query.html- 磷酸化位点分类
SAPS http://ulrec3.unil.ch/software/SAPS_form.html- 蛋白质序列统计分析
Sleuth /molebio/pro...du/pub/sleuth/data- 氨基酸构象及可及性分析
PEDANT-http://pedant.mips.biochem.mpg.de/frishman/pedant.html 蛋白质提炼
PROVE http://www.ucmb.ulb.ac.be/%7Ejoan/survol/form.html 蛋白质原子体积计算
Naccess (ASA for proteins)/research/themes/bioinformat ics/ 利用Lee & Richards方法描述分子表面性质的计算程序,能够计算蛋白质的表面
怎样能准确地将已知的蛋白质序列转化成DNA序列急!
根据物种在swiss-prot里面翻转
/index.php?id=tools/backtranslation&lang=eng /sms2/re_trans.html
用这两个其中的一个
sws里面好像默认大肠杆菌的密码子格式,换了物种之后密码子列表格式总是不对。

不知道怎么整。

你能给我说详细点吗?我想用酵母或鸟类的密码子。


谢啊!
可以,/sms2/re_trans.html
进去之后,点击Codon Usage Database,然后将你要的物种的拉丁文名输入QUERY Box for search with Latin name of organism ,点击submit,然后就可以看到各个物种的一个密码子列表。

然后替换那个大肠杆菌就可以了。

相关文档
最新文档