生物信息学作业题目汇总
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一次作业
1. 生物信息学定义(NIH版)
2. 生物信息学研究意义及主要研究内容
3. 人类基因组计划开始及结束日期,我国参与的内容,有什么意义;
4. 什么是功能基因组学,其研究内容有哪些?
5. 检索至少两个在线翻译工具,将
/berry.phtml?topic=index&group=programs& subgroup=gfind网页内容翻译后,贴到word中。
6. 搜索生物信息学国内外教学相关网站(至少5个),将其网址拷贝到作业中。
7. 搜索生物信息学应用网站,(至少5个),将其网址拷贝到作业中。
第二次作业
登陆NCBI(学号为单数)EMBL(学号为双数)网站熟悉网站结构分别查找抗冻蛋白核酸序列、氨基酸序列、结构信息和五篇最新文献。
第三次作业
1.UniProt蛋白质序列数据库由哪几部分组成?各有什么特点?
2.登陆UniProt蛋白质序列数据库
2.1.查找人体血红蛋白α亚基(学号单数)或β亚基(学号偶数)的蛋白质序列。
2.2.通过交叉链接到GenBank检索人体血红蛋白相关亚基的mRNA编码序列。
2.3.通过交叉链接查找人体血红蛋白晶体结构的相关文献。
2.4.找出结合血红素的两个组氨酸。
2.5.通过交叉链接查找人体血红蛋白晶体结构
2.6.以2.1中序列为检测序列,检索uniprot数据库中所有哺乳动物的血红蛋白,
找出前10个高分匹配序列;
2.7以2.2中序列为检测序列,检索核酸数据库所有序列,找出前10个高分匹配
序列;其于6中结果有什么不同?
第四次作业
请下载Human Papillomavirus type XX(学号后两位)L1核苷酸序列
1.给出序列检索号,发布时间;
2.给出该序列的反向互补序列;
3.该序列中有哪些识别位点≧6,酶切后末端是平末段(Blunt)的核酸限制性内切酶的位点;
4.通过blast软件检索该序列,给出最相似的5个序列的检索号;
5.下载学号附近的5个L1序列(学号后两位-2,学号后两位-1,学号后两位,学号后两位+1,学号后两位+2),通过多重序列比较后,输出(output)homology tree。
第五次作业
1.DDBJ或NCBI数据库下载Human Papillomavirus type (学号后两位)L2核酸序列,记录该序列检索号
2.设计能扩增长度最接近350bp的一对引物;
3.画一个分子量大小为5110的pM-L2质粒示意图,要求:包含a.RepA序列(50-->950);b.Emr序列(2300-->1450);c.P32序列(2400—>2450);d.EcoRI 位点(2462),L序列(2462-->3962);XbaI位点(3962);e.T序列(4400-4450)。
4.将上述序列翻译成氨基酸,并分析其等电点,分子量;
5.试分子该序列被CNBr作用后的片段大小与分子量;
6.预测该蛋白序列可能的抗原肽
7.在http://www.jcat.de/网站(学号单数)或
http://genomes.urv.cat/OPTIMIZER/网站(学号偶数)上分别将下载的L2基因的碱基序列按照宿主细胞(Escherichia coli K12)最适密码子进行优化,上交相应的优化序列;序列中避免出现因子依赖性的终止子、原核生物核糖体结合位点和EcoRI位点。
8.用DNAMAN软件比较优化后核酸序列的区别。
第六次作业
请到教学材料上机实验中调取AC_000160.1序列
请分析
该序列中可能包含的开放阅读框;
将预测的开放阅读框序列在Genbank中比对,推测该开放阅读框编码什么基因,可能具有什么功能;
试预测该基因的上游调控序列、CpG岛与polyA的结合位点的位置;
查找该基因最相似的另外两个物种的mRNA序列,多重比对后输出可能的系统进化树;
试分析该序列中基因编码的蛋白质的基本理化性质;
试预测该序列中基因编码的蛋白质的跨膜区;
试预测该序列中基因编码的蛋白质的二级结构及可能的motif位点;
试分析该序列中基因编码的蛋白质的结构域;
试预测该序列中基因编码的蛋白质的三维结构。