生物信息学第三次上机作业_电子科大

合集下载

生物信息学习题(2010-7)

生物信息学习题(2010-7)

生物信息学练习题(2009-2010学年第2学期)姓名:性别:班级:学号:说明:(1)此作业主要是让大家熟悉一下生物信息学的基本知识点,并真正练习一下生物信息软件的使用。

(2)此作业将作为我们的成绩,不交者将没有成绩,请认真对待;(3)作业统一用A4纸打印,并装订;(4)在7月10日前,各班学委收起后,交到新生化大楼C615房间;(5)如有问题可与我联系,一.问答题:1. 当今世界上主要的三大生物数据库是指哪些数据库?答:当今世界上主要的三大生物数据库是美国国家生物技术信息中心NCBI(National Center for Biotechnology Information),EBI(European Bioinformatics Institute)欧洲生物信息研究所,DDBJ(DNA Data Bank of Japan)日本核酸数据库2. 人类基因组计划的完成将绘制出“四张图“,请问这四张图是指哪些图?答:人类基因组计划的完成将绘制出“四张图“是指:1遗传图谱,又称连锁图谱(linkage map),它是以具有遗传多态性(在一个遗传位点上具有一个以上的等位基因,在群体中的出现频率皆高于1%)的遗传标记为“路标”,以遗传学距离(在减数分裂事件中两个位点之间进行交换、重组的百分率,1%的重组率称为1cM)为图距的基因组。

2物理图谱,是以一段已知核酸序列的片段STS序列为路标,以碱基对数目的多少为图距来表示两个遗传标记之间的物理距离[基本单位是Mb、kb、bp]的图谱。

3序列图谱,是分别将各染色体全部碱基序列绘制的图谱。

包括转录序列和非转录序列。

4转录图谱谱也叫基因表达图谱,以表达序列标签(expressed sequence tag , EST )为位标,反映基因在不同条件下的表达情况的图谱。

3. 生物信息学的定义有狭义与广义之分,请问狭义的生物信息学定义是什么?答:目前生物信息学可以狭义地定义为:将计算机科学和数学应用于生物大分子信息的获取、加工、存储、分类、检索与分析,以达到理解这些生物大分子信息的生物学意义的交叉学科。

《生物信息学》试卷(A)

《生物信息学》试卷(A)

武汉大学2007—2008学年度高校教师研修班《生物信息学》试卷(A)及答案一、翻译下列名词并解释。

(每题5分,共25分)1. EST2. ORF3. BLAST4. ANN5. HGP二、填空(每空2分,共20分)1、蛋白质空间结构测定常用的方法有和二维核磁共振技术。

2、BLAST对序列格式的要求是常见的格式。

3、系统发育树由一系列和组成,其中每个代表一个分类单元,而代表物种之间的进化关系。

、、等。

6. 目前已经是最广泛使用的系统发育程序。

三、解释说明: 请按要求对下列GenBank文件作解释说明。

(每小题4分,共20分)1、LOCUS行中的第3项mRNA linear表示,这里是。

2、DEFINITION行在GenBank记录中用以3 ACCESSION 是,是从数据库中检索一个记录的主要。

4. FEATURES后面部分是,直接表达了记录的生物背景知识,5 CDS 30…533 表示。

四、问答。

(共35分)1简述国际上有哪几个著名的核酸序列数据库?(10分)2何谓序列比对的相似性和同源性,它们之间有何联系和区别(10分)3试述发现基因的一般过程(15分)《生物信息学》试卷(A)答案一、翻译下列名词并解释。

(每题5分,共25分)1. EST expressed sequence tag 表达序列标签2. ORF Open Reading Frame, 开放阅读框3. BLAST Basic Local Alignment Search T ool 局部相似性基本查询工具4. ANN Artificial Neural Network, 人工神经网络5. HGP Human genome project 人类基因组计划二、填空(每空2分,共20分)1、蛋白质空间结构测定常用的方法有X射线晶体衍射法和二维核磁共振技术。

2、BLAST对序列格式的要求是常见的FASTA格式。

3、系统发育树由一系列节点和分支组成,其中每个节点代表一个分类单元,而节点之间的连线代表物种之间的进化关系。

生物信息学题库

生物信息学题库

■一、选择题:1.以下哪一个是mRNA条目序列号:A.J01536■.NM_15392C.NP_52280D.AAB1345062.确定某个基因在哪些组织中表达的最直接获取相关信息方式是:■.UnigeneB.EntrezC.LocusLinkD.PCR3.—个基因可能对应两个Unigene簇吗?■可能B.不可能4.下面哪种数据库源于mRNA信息:■dbESTB.PDBC.OMIMD.HTGS5.下面哪个数据库面向人类疾病构建:A.ESTB.PDB■.OMIMD.HTGS6.Refseq和GenBank有什么区别:A.Refseq包括了全世界各个实验室和测序项目提交的DNA序列B.GenBank提供的是非冗余序列■.Refseq源于GenBank,提供非冗余序列信息D.GenBank源于Refseq7.如果你需要查询文献信息,下列哪个数据库是你最佳选择:A.OMIMB.Entrez■PubMedD.PROSITE8.匕比较从Entrez和ExPASy中提取有关蛋白质序列信息的方法,下列哪附说法正确:A.因为GenBank的数据比EMBL更多,Entrez给出的搜索结果将更多B.搜索结果很可能一样,因为GenBank和EMBL的序列数据实际一样■搜索结果应该相当,但是ExPASy中的SwissProt记录的输出格式不同9.天冬酰胺、色氨酸和酪氨酸的单字母代码分别对应于:■N/W/YB.Q/W/YC.F/W/YD.Q/N/W10.直系同源定义为:■不同物种中具有共同祖先的同源序列B.具有较小的氨基酸一致性但是有较大的结构相似性的同源序列C.同一物种中由基因复制产生的同源序列D.同一物种中具有相似的并且通常是冗余的功能的同源序列11.下列那个氨基酸最不容易突变:A.丙氨酸B.谷氨酰胺C.甲硫氨酸■半胱氨酸12.PAM250矩阵定义的进化距离为两同源序列在给定的时间有多少百分比的氨基酸发生改变:A.1%B.20%■.80%D.250%13.下列哪个句子最好的描述了两个序列全局比蘇□局部匕比对的不同:A.全局匕比对通常用于比寸DNA序列,而局部匕比对通常用于比寸蛋白质序列B.全局比寸允许间隙,而局部比对不允许C.全局比对寻找全局最大化,而局部比对寻找局部最大化■全局比对比对整体序列,而局部比对寻找最佳匹配子序列14.假设你有两条远源相关蛋白质序列。

生物信息学上机指南3

生物信息学上机指南3

《生物信息学》上机指南(三)实验三、分子系统发育分析 2学时教学要求:1、了解系统发育分析原理、步骤、方法。

2、掌握phylip、Mega等软件的下载与使用。

3、学习进化树结果分析。

重点掌握phylip、Mega的使用。

实验步骤:1.基于细胞色素c氨基酸序列的真核生物系统发育分析细胞色素c(cytochrome c)是一种含血红素的电子转运蛋白,它存在于所有真核生物的线粒体中,参加呼吸作用。

细胞色素c的氨基酸顺序分析资料已经用来核对各个物种之间的分类学关系,以及绘制进化树。

本实验利用Mega软件,采用邻位相接法,构建43种真核生物细胞色素c系统进化树。

类群中文名称拉丁学名蛋白质登录号哺乳类人Homo sapiens P99999黑猩猩Pan troglodytes P99998恒河猴Macaca mulatta P00002大袋鼠Macropus giganteus P00014家兔Oryctolagus cuniculus P00008小家鼠Mus musculus CAA25899 马Equus caballus P00004绵羊Ovis aries P62896牛Bos taurus P62894野猪Sus scrofa P62895狗Canis familiaris P00011南象海豹Mirounga leonina P00012长翼蝠Miniopterus schreibersii P00013河马Hippopotamus amphibius P00007鸟类鸸鹋Dromaius novaehollandiae P00018 鸵鸟Struthio camelus P00019 原鸡Gallus gallus P67881 火鸡Meleagris gallopavo P67882企鹅Aptenodytes patagonicus P00017 家鸽Columba livia P00021绿头鸭Anas platyrhynchosP00020爬行类拟鳄龟Chelydra serpentina P00022 两栖类牛蛙Rana catesbeiana P00024硬骨鱼类长鳍金枪鱼Thunnus alalunga P81459 太平洋鲣鱼Katsuwonus pelamis P00025 斑马鱼Danio rerio Q6IQM2软骨鱼类角鲨Squalus sucklii P00027 圆口类七鳃鳗Entosphenus tridentatus P00028 棘皮动物红海星Asterias rubens P00029 环节动物赤子爱胜蚓Eisenia fetida P00030昆虫沙漠蝗Schistocerca gregaria P00040 烟草天蛾Manduca sexta P00039 眉纹天蚕蛾Samia cynthia P00037 铜绿蝇Lucilia cuppina P00036植物小麦Triticum aestivum P00068水稻Oryza sativa BAA02159 向日葵Helianthus annuus P00070菠菜Spinacia oleracea P00073银杏Ginkgo biloba P00074芝麻Sesamum indicum P00054真菌毕赤酵母Pichia anomala P00042 白色念珠菌Candida albicans P53698 粗糙脉胞菌Neurospora crassa P000481.1.序列获取(1) 用记事本将蛋白质登录号粘进去,每个登录号占一行,存为Sequence_ID.txt。

生物信息上机作业

生物信息上机作业

生物信息学上机作业上机一生物信息数据库信息检索上机内容:1、了解NCBI、DDBJ、EMBL上网的方法自学各网站相关介绍。

2、了解北大生物信息学中心等几大中文生物信息学网站。

3、了解一些生物论坛中有关生物信息学的部分。

如:Biooo和Bioon。

4、利用NCBI的Entrenz查询系统和EBI的SRS检索文献和核酸或蛋白质序列。

(phyA)并对照所学复习各字段的含义。

5、将所得记录的ID或Accession记录下来备用。

作业:1、记录相关网站及论坛网址(或如何查询到该网址的方法)。

(1)NCBI :/(2)DDBJ :http://www.ddbj.nig.ac.jp/(3)EMBL :/(4)北大生物信息学中心 /chinese/(5)中科院计算所智能信息处理重点上机室生物信息学:/index.php(6)北大生物信息中心:/chinese/documents/bioinfor/overview/web1/1.html (7)生物谷生物信息学:/bioinfo.htm(8)中国生物论坛:/(9)中国生物谷论坛:/(10)生物谷:/2、找到编码拟南芥(arabidopsis)phyA(光敏色素A)基因的核酸序列编号。

并记录查找过程。

上机二核酸及蛋白质序列的比对一、上机内容利用检索出的蛋白质和核酸序列进行序列比对并进行分子进化树分析。

二、作业1、绘制分子进化树,并标明各个物种phyA蛋白之间的序列相似性。

2、根据你所学生物分类的知识,试解释该分子进化树的合理性。

3、找出一条可能的保守序列(多条蛋白共同的氨基酸序列)。

上机三核酸序列分析(一)一、上机内容1、使用DNAstar进行核酸基本信息分析2、ORF分析二、作业1、记录拟南芥phyA NM_100828序列的序列组成2、记录拟南芥phyA NM_100828序列最长的ORF的起止区间。

上机四核酸序列分析(二)一、上机内容1、PCR引物设计2、核酸序列的电子基因定位二、作业1、记录拟南芥phyA NM_100828序列最长的ORF的起止区间。

生物信息学上机实验4 用DNAMAN软件进行引物设计

生物信息学上机实验4 用DNAMAN软件进行引物设计

生物信息学上机实验四用DNAMAN软件设计PCR引物一、目的要求DNAMAN 是一种常用的核酸序列分析软件。

由于它功能强大,使用方便,已成为一种普遍使用的DNA序列分析工具。

通过本实验,使学生掌握PCR引物的设计方法。

二、实验准备DNAMAN的使用说明书(word文档)一份、DNAMAN软件5.2.2版本、实验分析所用的4个序列见下面。

三、实验内容1、将待分析4个序列装入4个Channel,熟悉Channel的使用方法2、显示“序列(2)”的反向互补序列、互补序列、反向序列3、分析“序列(3)”的限制性酶切位点4、设计一对引物扩增“序列(1)”中的微卫星重复区域四、作业将上述前5项操作所得结果保存到电脑桌面,发到xiaopingjia@(1)CCAGA TGAGCGTGCGTTCGTTCCACGTACGTGTGCTGTGTGAGACGACACA TCT GCACCTGCACGTCAGCACGTACGTGCACCCGGTA TGTGTGCGCGTGTACTTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTCTGAGA TGAGGCCGGA TTCAGGA GCTGCGAGCTCA TAGGCCACAGTCACAGAA TTGCAACGGTACTTCAGTTCAGTCA TCTCCTAGTCCTTGAGAG(2)GGAAAAAAGA TACGTA TGTACA TA TACGTGTACGTGTGTGTGTGTGTGTGTGTGT GTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGAAGCAAAGACA TTGA TA TTGTTGCTGGTGGCGAGGTTGA TGCGCACAGCTCACTCCCGCGCTGACTGACACG(3)GGTCAGCAGAAAGCA TGCCGTAGTCAAACGA TCGACCTAGCTAGTAGCAGTGTG TGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTTTTGCAAAAACCTAGACCTTAGCAGCCTAG(4)CCTGA TTTGGA TCCAACAAAA TGCA TTTGACCA TA TAGTGTGTGTGTGTGTGTGTG TGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTTCACAGTCACAGAA TTGCAACGGTACTTCAGTTCAGTCA TCTCCTAGTCCTTGAGAG(2)题 SEQ DNAMAN2: 172 bp;Composition 57 A; 62 C; 22 G; 31 T; 0 OTHERPercentage: 33.1% A; 36.0% C; 12.8% G; 18.0% T; 0.0%OTHERMolecular Weight (kDa): ssDNA: 52.42 dsDNA: 106.04COLOURSsequence = 1features = 0ORIGIN1 CGTGTCAGTC AGCGCGGGAG TGAGCTGTGC GCATCAACCT CGCCACCAGC AACAATATCA 61 ATGTCTTTGC TTCACACACA CACACACACA CACACACACA CACACACACA CACACACACA 121 CACACACACA CACACACACG TACACGTATA TGTACATACG TATCTTTTTT CCSEQ DNAMAN2: 172 bp;Composition 57 A; 62 C; 22 G; 31 T; 0 OTHERPercentage: 33.1% A; 36.0% C; 12.8% G; 18.0% T; 0.0%OTHERMolecular Weight (kDa): ssDNA: 52.42 dsDNA: 106.04COLOURSsequence = 1features = 0ORIGIN1 CCTTTTTTCT ATGCATACAT GTATATGCAC ATGCACACAC ACACACACAC ACACACACAC 61 ACACACACAC ACACACACAC ACACACACAC ACACACACAC TTCGTTTCTG TAACTATAAC 121 AACGACCACC GCTCCAACTA CGCGTGTCGA GTGAGGGCGC GACTGACTGT GCSEQ DNAMAN2: 172 bp;Composition 31 A; 22 C; 62 G; 57 T; 0 OTHERPercentage: 18.0% A; 12.8% C; 36.0% G; 33.1% T; 0.0%OTHERMolecular Weight (kDa): ssDNA: 53.79 dsDNA: 106.04COLOURSsequence = 1features = 0ORIGIN1 GCACAGTCAG TCGCGCCCTC ACTCGACACG CGTAGTTGGA GCGGTGGTCG TTGTTATAG T 61 TACAGAAACG AAGTGTGTGT GTGTGTGTGT GTGTGTGTGT GTGTGTGTGT GTGTGTGTGT 121 GTGTGTGTGT GTGTGTGTGC ATGTGCATAT ACATGTATGC ATAGAAAAAA GG(3)题 Restriction analysis on DNAMAN3Methylation: dam-No dcm-NoScreened with 180 enzymes, 19 sites foundAluI AG/CT 1: 40BbvI GCAGCNNNNNNNN/ 1: 151BsaOI CGRY/CG 1: 32Bst71I GCAGCNNNNNNNN/ 1: 151DdeI C/TNAG 1: 135DpnI GA/TC 1: 31Fnu4HI GC/NGC 1: 140MaeI C/TAG 4: 37, 41, 129, 144MboI /GATC 1: 29NlaIII CATG/ 1: 17NspI RCATG/Y 1: 17PvuI CGAT/CG 1: 32Sau3AI /GATC 1: 29SphI GCATG/C 1: 17TaqI T/CGA 1: 32XorII CGAT/CG 1: 32List by Site Order17 NlaIII 31 DpnI 37 MaeI 140 Fnu4HI17 SphI 32 TaqI 40 AluI 144 MaeI17 NspI 32 PvuI 41 MaeI 151 BbvI29 Sau3AI 32 BsaOI 129 MaeI 151 Bst71I 29 MboI 32 XorII 135 DdeINon Cut EnzymesAatII Acc65I AccI AccII AccIII AclIAcyI AflII AflIII AgeI AhaIII Alw26IAlw44I AlwNI ApaBI ApaI ApaLI AscIAsp718I AsuI AsuII AvaI AvaII AvrIIBalI BamHI BanI BanII BbeI BbvIIBclI BglI BglII Bpu1102I BsaHI Bsc91IBsiI BsmI Bsp1286I Bsp1407I BspHI BspMIBspMII BssHII BstD102I BstEII BstNI BstXIBsu36I Cfr10I CfrI ClaI Csp45I CspICvnI DraI DraII DraIII DrdI EagIEam1105I Ecl136II Eco31I Eco47III Eco52I Eco56IEco57I Eco72I EcoHI EcoICRI EcoNI EcoRIEcoRII EcoRV EheI EspI FnuDII FokIFseI HaeII HaeIII HgaI HgiAI HhaIHindII HindIII HinfI HinP1I HpaI HpaIIHphI I-PpoI KpnI MaeII MaeIII MboIIMfeI Mlu113I MluI MnlI MscI MseIMspA1I MspI MstI MstII NaeI NarINcoI NdeI NheI NlaIV NotI NruINsiI NspBII PacI PflMI PinAI PleIPmaCI PmeI PpuMI PssI PstI PvuIIRleAI RsaI SacI SacII SalI SapISauI ScaI SciI ScrFI SduI SfaNISfiI SgrAI SmaI SnaBI SpeI SplISpoI SrfI SspI SstI SstII StuIStyI SunI SwaI ThaI Tth111I Tth111IIVspI XbaI XcmI XhoI XhoII XmaIXmaIII XmnIRestriction sites on DNAMAN3MaeIAluIMaeIXorIIBsaOIPvuITaqINspI DpnISphI MboINlaIII Sau3AI1 GGTCAGCAGAAAGCATGCCGTAGTCAAACGATCGACCTAGCTAGTAGCAGTGTGTGTGTGCCAGTCGTCTTTCGTACGGCATCAGTTTGCTAGCTGGATCGATCATCGTCACACACACAC61 TGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTTTTACACACACACACACACACACACACACACACACACACACACACACACACACACACACAAAAMaeIMaeI DdeI Fnu4HI121 GCAAAAACCTAGACCTTAGCAGCCTAGCGTTTTTGGATCTGGAATCGTCGGATC(4)题Primer List29 CGTGTGCTGTGTGAGAC 51.9癈 and 224 GGAGATGACTGAACTGAAG 50.1癈30 GTGTGCTGTGTGAGACG 51.9癈 and 224 GGAGATGACTGAACTGAAG 50.1癈32 GTGCTGTGTGAGACGAC 50.7癈 and 224 GGAGATGACTGAACTGAAG 50.1癈。

《生物信息学》大作业参考模板-2016

《生物信息学》大作业参考模板-2016

《生物信息学》大作业 参考答案
芍药 ACS 基因的生物信息学分析
姓名: 班级: 学号: 2016 年 4 月 11 日
一、芍药 ACS 基因序列及其编码的蛋白的功能 乙烯是存在于植物体内的唯一的一种气态植物激素,调控植物花、果和叶片的衰老进程。乙烯的合成 主要在转录水平上受到 ACS(ACC synthase,ACC 合酶)和 ACC 氧化酶的调控,ACS 将 SAM(S-adenosyl
a r t i c l e i n f o
Article history: Received 17 November 2015 Accepted 23 November 2015 Available online 26 November 2015 Keywords: ACC synthase Ethylene biosynthesis Flower senescence Oncidium Gower Ramsey Gene cloning Expression analysis
Biochemical and Biophysical Research Communications 469 (2016) 20vailable at ScienceDirect
Biochemical and Biophysical Research Communications
图 1 芍药 ACS 基因的核苷酸序列及其编码的氨基酸序列 下载的论文“Molecular cloning and expression analysis of an 1-aminocyclopropane-1-carboxylate synthase gene from Oncidium Gower Ramsey” 为 2016 年发表于 Biochemical and Biophysical Research Communications 的最新英文文章(见下页) 。 (2 分)

生物信息学

生物信息学

多序列比对
• 多序列比对完成
• Dateexport alignment, 导出MEGE format和 Fasta format两份结果, 得到一个*.meg文件 和一个*.fas文件
进化树构建
• 关闭Alignment窗口,回到MEGA软件主窗口, File -> Open A File/Session,打开之前 保存的*.meg文件
• 选择Protein
MEGA 5软件使用
• 在新弹出的窗口中,选择Data->Open>Retrieve Sequences from File,然后导 入刚才保存的fasta文件
多序列比对
• Ctrl+A选择全部序列,Aligment->Align by ClustalW
多序列比对
• 可以修改各补偿值等参数,点OK
• 每个序列的Title仅保留蛋白/基因名称+种 属来源,如:CY1_YEAST
• 序列名称中不含有 ‘=’ 字符
• 氨基酸序列可以分成多行,但内部不要有 空格
MEGA 5软件使用
• 打开MEGA 5,拉开Align菜单,选择 Edit/Build Alignment
MEGA 5软件使用
• Creat a new Alignment
创建Fasta
可直接下载或复制粘贴创建Fasta文件: 以>为开头,后接序列名称,重启一行,输入序列
>CY1_BOVIN MAAAAATLRGAMVGPRG… >CY1_YEAST MFSNLSKRWAQRTLSKS… >CY1_HUMAN MAAAAASLRGVVLGPRG… >…
Fasta文件要求
问题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2011092010017生物信息学第三次上机作业
小鼠基因序列:
AA TTTGCTGAGTACAACAGCGACCGTCATCAGTTTTTTGAGTTTCTGTACAACCAGGG AA TTGGAACCAAGTCA TCA TA TATA TACATGTCCTGGGCAGGGCATCTGGAAGCCCAGG GAGAGCTGCAGCA TGCCAGTGCT
.1. 这个基因在小鼠中是哪个基因?budding uninhibited by benzimidazoles 1 homolog (S. cerevisiae).
基因的标识符是什么?Locus tag:RP23-189N15.7
这个基因的在基因组上的定位是怎样的?Chromosome 2
这个基因标码的蛋白质是什么?protein_id="BAE25776.1"
2. 3.
4.
具有什么样的功能?
ATP选择性和非共价相互作用,5’-腺苷三磷酸的一个重要的辅酶和酶活性的调节。

反应的催化A TP +蛋白丝氨酸= ADP +蛋白磷酸丝氨酸,苏氨酸蛋白和A TP + ADP + =蛋白苏氨酸磷酸。

细胞亚定位在何处?
这个基因是一个酶吗,什么酶?
ATP选择性和非共价相互作用,5’-腺苷三磷酸的一个重要的辅酶和酶活性的调节。

具有什么样的功能结构域?
3.编码的蛋白质有3级结构的信息吗?如果有,给出在PDB中的标识符。

检索序列:
搜索蛋白质数据库。

相关文档
最新文档