生物信息学作业题目汇总

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一次作业

1. 生物信息学定义(NIH版)

2. 生物信息学研究意义及主要研究内容

3. 人类基因组计划开始及结束日期,我国参与的内容,有什么意义;

4. 什么是功能基因组学,其研究内容有哪些?

5. 检索至少两个在线翻译工具,将

/berry.phtml?topic=index&group=programs& subgroup=gfind网页内容翻译后,贴到word中。

6. 搜索生物信息学国内外教学相关网站(至少5个),将其网址拷贝到作业中。

7. 搜索生物信息学应用网站,(至少5个),将其网址拷贝到作业中。

第二次作业

登陆NCBI(学号为单数)EMBL(学号为双数)网站熟悉网站结构分别查找抗冻蛋白核酸序列、氨基酸序列、结构信息和五篇最新文献。

第三次作业

1.UniProt蛋白质序列数据库由哪几部分组成?各有什么特点?

2.登陆UniProt蛋白质序列数据库

2.1.查找人体血红蛋白α亚基(学号单数)或β亚基(学号偶数)的蛋白质序列。

2.2.通过交叉链接到GenBank检索人体血红蛋白相关亚基的mRNA编码序列。

2.3.通过交叉链接查找人体血红蛋白晶体结构的相关文献。

2.4.找出结合血红素的两个组氨酸。

2.5.通过交叉链接查找人体血红蛋白晶体结构

2.6.以2.1中序列为检测序列,检索uniprot数据库中所有哺乳动物的血红蛋白,

找出前10个高分匹配序列;

2.7以2.2中序列为检测序列,检索核酸数据库所有序列,找出前10个高分匹配

序列;其于6中结果有什么不同?

第四次作业

请下载Human Papillomavirus type XX(学号后两位)L1核苷酸序列

1.给出序列检索号,发布时间;

2.给出该序列的反向互补序列;

3.该序列中有哪些识别位点≧6,酶切后末端是平末段(Blunt)的核酸限制性内切酶的位点;

4.通过blast软件检索该序列,给出最相似的5个序列的检索号;

5.下载学号附近的5个L1序列(学号后两位-2,学号后两位-1,学号后两位,学号后两位+1,学号后两位+2),通过多重序列比较后,输出(output)homology tree。

第五次作业

1.DDBJ或NCBI数据库下载Human Papillomavirus type (学号后两位)L2核酸序列,记录该序列检索号

2.设计能扩增长度最接近350bp的一对引物;

3.画一个分子量大小为5110的pM-L2质粒示意图,要求:包含a.RepA序列(50-->950);b.Emr序列(2300-->1450);c.P32序列(2400—>2450);d.EcoRI 位点(2462),L序列(2462-->3962);XbaI位点(3962);e.T序列(4400-4450)。

4.将上述序列翻译成氨基酸,并分析其等电点,分子量;

5.试分子该序列被CNBr作用后的片段大小与分子量;

6.预测该蛋白序列可能的抗原肽

7.在http://www.jcat.de/网站(学号单数)或

http://genomes.urv.cat/OPTIMIZER/网站(学号偶数)上分别将下载的L2基因的碱基序列按照宿主细胞(Escherichia coli K12)最适密码子进行优化,上交相应的优化序列;序列中避免出现因子依赖性的终止子、原核生物核糖体结合位点和EcoRI位点。

8.用DNAMAN软件比较优化后核酸序列的区别。

第六次作业

请到教学材料上机实验中调取AC_000160.1序列

请分析

该序列中可能包含的开放阅读框;

将预测的开放阅读框序列在Genbank中比对,推测该开放阅读框编码什么基因,可能具有什么功能;

试预测该基因的上游调控序列、CpG岛与polyA的结合位点的位置;

查找该基因最相似的另外两个物种的mRNA序列,多重比对后输出可能的系统进化树;

试分析该序列中基因编码的蛋白质的基本理化性质;

试预测该序列中基因编码的蛋白质的跨膜区;

试预测该序列中基因编码的蛋白质的二级结构及可能的motif位点;

试分析该序列中基因编码的蛋白质的结构域;

试预测该序列中基因编码的蛋白质的三维结构。

相关文档
最新文档