生物信息学作业题目汇总

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第一次作业

1. 生物信息学定义（NIH版）

2. 生物信息学研究意义及主要研究内容

3. 人类基因组计划开始及结束日期，我国参与的内容，有什么意义；

4. 什么是功能基因组学，其研究内容有哪些？

5. 检索至少两个在线翻译工具，将

/berry.phtml?topic=index&group=programs& subgroup=gfind网页内容翻译后，贴到word中。

6. 搜索生物信息学国内外教学相关网站（至少5个），将其网址拷贝到作业中。

7. 搜索生物信息学应用网站，（至少5个），将其网址拷贝到作业中。

第二次作业

登陆NCBI(学号为单数)EMBL(学号为双数）网站熟悉网站结构分别查找抗冻蛋白核酸序列、氨基酸序列、结构信息和五篇最新文献。

第三次作业

1.UniProt蛋白质序列数据库由哪几部分组成？各有什么特点？

2.登陆UniProt蛋白质序列数据库

2.1.查找人体血红蛋白α亚基（学号单数）或β亚基（学号偶数）的蛋白质序列。

2.2.通过交叉链接到GenBank检索人体血红蛋白相关亚基的mRNA编码序列。

2.3.通过交叉链接查找人体血红蛋白晶体结构的相关文献。

2.4.找出结合血红素的两个组氨酸。

2.5.通过交叉链接查找人体血红蛋白晶体结构

2.6.以2.1中序列为检测序列，检索uniprot数据库中所有哺乳动物的血红蛋白，

找出前10个高分匹配序列；

2.7以2.2中序列为检测序列，检索核酸数据库所有序列，找出前10个高分匹配

序列；其于6中结果有什么不同？

第四次作业

请下载Human Papillomavirus type XX（学号后两位）L1核苷酸序列

1.给出序列检索号，发布时间；

2.给出该序列的反向互补序列；

3.该序列中有哪些识别位点≧6，酶切后末端是平末段（Blunt）的核酸限制性内切酶的位点；

4.通过blast软件检索该序列，给出最相似的5个序列的检索号；

5.下载学号附近的5个L1序列（学号后两位-2，学号后两位-1，学号后两位，学号后两位+1，学号后两位+2），通过多重序列比较后，输出（output）homology tree。

第五次作业

1.DDBJ或NCBI数据库下载Human Papillomavirus type （学号后两位）L2核酸序列，记录该序列检索号

2.设计能扩增长度最接近350bp的一对引物；

3.画一个分子量大小为5110的pM-L2质粒示意图，要求：包含a.RepA序列（50-->950）;b.Emr序列（2300-->1450）;c.P32序列（2400—>2450）;d.EcoRI 位点（2462），L序列（2462-->3962）；XbaI位点（3962）；e.T序列（4400-4450）。

4.将上述序列翻译成氨基酸，并分析其等电点，分子量；

5.试分子该序列被CNBr作用后的片段大小与分子量；

6.预测该蛋白序列可能的抗原肽

7.在http://www.jcat.de/网站(学号单数)或

http://genomes.urv.cat/OPTIMIZER/网站（学号偶数）上分别将下载的L2基因的碱基序列按照宿主细胞（Escherichia coli K12）最适密码子进行优化，上交相应的优化序列；序列中避免出现因子依赖性的终止子、原核生物核糖体结合位点和EcoRI位点。

8.用DNAMAN软件比较优化后核酸序列的区别。

第六次作业

请到教学材料上机实验中调取AC_000160.1序列

请分析

该序列中可能包含的开放阅读框；

将预测的开放阅读框序列在Genbank中比对，推测该开放阅读框编码什么基因，可能具有什么功能；

试预测该基因的上游调控序列、CpG岛与polyA的结合位点的位置；

查找该基因最相似的另外两个物种的mRNA序列，多重比对后输出可能的系统进化树；

试分析该序列中基因编码的蛋白质的基本理化性质；

试预测该序列中基因编码的蛋白质的跨膜区；

试预测该序列中基因编码的蛋白质的二级结构及可能的motif位点；

试分析该序列中基因编码的蛋白质的结构域；

试预测该序列中基因编码的蛋白质的三维结构。