生物信息学完结版说课材料

生物信息学完结版说课材料
生物信息学完结版说课材料

生物信息学论文完结

生物信息学论文

学院:生命科学技术学院

专业:生物科学

班级:2013级

老师:高亚梅

学生:蔡欣月

学号:20134083003

链孢霉GH5-1及GH6-3基因生物信息学分析

蔡欣月(黑龙江八一农垦大学,生命科学技术学院,2013级生物科学专业,黑龙江省,大

庆市)

【摘要】目的:分析和预测链孢霉菌GH5-1和GH6-3基因及其编码蛋白质的结构和特征。方法:利用NCBI、CBS和ExPASy网站中的各种信息分析工具,并结合VectorNTIsuite8.0生物信息分析软件包,分析预测链孢霉菌GH5-1和GH6-3基因并预测该基因编码蛋白结构的特征和功能。结果:GH5-1基因全长2006bp,编码区具有390个氨基酸,在GenBank同源序列中,其与endoglucanase 3 [Neurospora crassa OR74A]基因氨基酸序列一致性达到100%,且有GH5-1保守域。GH5-1蛋白相对分子量预测为41907.4,理论等电点为5.14。预测GH5-1编码蛋白α螺旋(H ) 、β折叠(E )、无规则卷(L )的比例分别是16.92%、

33.85%、49.23%,2个GTPase结构域。GH5-1蛋白为亲水蛋白,无跨膜区,有信号肽。GH6-3基因全长1914bp,编码区具有419个氨基酸,在GenBank同源序列中,其与exoglucanase 3 [Neurospora crassa OR74A]基因氨基酸序列一致性达到100%,且有GH6-3保守域。GH6-3蛋白相对分子量预测为44839.3,理论等电点为6.51。预测GH6-3编码蛋白α螺旋(H ) 、β折叠(E )、无规则卷(L )的比例分别是29.59%、16.71%、53.75%,1个GTPase 结构域。GH6-3蛋白为亲水蛋白,有跨膜区,无信号肽。结论:成功预测GH5-1和GH6-3基因及其编码蛋白生化及其结构特征,为下一步对其进行克隆和表达奠定基础。

【关键词】链孢霉菌;糖基水解酶家族5(GH5-1);糖基水解酶家族6(GH6-3)生物信息学链孢霉菌又称脉孢菌、串珠菌、红色面包菌,俗称红霉菌,是食用菌生产中重要的竞争性杂菌之一。其广泛分布在自然界土壤中和和禾本科植物上,尤其在玉米芯上极易发生[1]。通过空气、土壤、腐烂植物、谷物等进行传播、在食用菌生产中,链孢菌和绿菌是生产中最常见的病原菌。链孢霉在高温高湿条件下最易发生,是夏季食用菌生产中危害严重的

病原菌,该病原菌生活力强、生长迅速、繁殖快、分生孢子多、易传播,几乎会感染所有熟料栽培的食用菌,并且一旦感染很难彻底消灭,给生产造成较大的经济损失,严重危害所有食用菌的母种、原种、栽培种,以及香菇、木耳、银耳、银耳、灵芝等熟料菌简[2]。目前链孢霉菌的全基因组序列已经获得,但有关其蛋白和基因的各类研究仍为数较少,本文通过对链孢霉GH5-1和GH6-3基因及编码蛋白质进行生物信息学分析,分析其基本生化及结构特征,为下一步对其进行克隆表达和应用奠定基础。

一、材料与方法

1.1材料

通过ExPASy 数据库的UniProtKB(https://www.360docs.net/doc/2513166532.html,或https://www.360docs.net/doc/2513166532.html,/uniprot)获得链孢霉菌的GH5-1与GH6-3基因序列。GH5-1基因编号为NCU00762,NCBI的登录号为XM_959066.2,其他物种的GH5-1的氨基酸序列均来自Genbank,登录号见表1。GH6-3基因编号为NCU09680,NCBI的登录号为XM_952322.2,其他物种的GH6-3的氨基酸序列均来自Genbank,登录号见表2。

1.2方法

利用美国国家生物技术信息中心(NCBI,https://www.360docs.net/doc/2513166532.html,)的基本局部比对搜索工具(BLAST,https://www.360docs.net/doc/2513166532.html,/blast/),运用Blastx完成基因同源性分析。

应用ORF finder(https://www.360docs.net/doc/2513166532.html,/gorf/orfig.cgi)寻找其开放读码框,并推导出可编码蛋白序列。

利用保守结构域(https://www.360docs.net/doc/2513166532.html,/Structure/cdd/wrpsb.cgi)分析预测其保守域。

通过瑞士生物信息学研究所的蛋白分析专家系统(ExPASy,https://www.360docs.net/doc/2513166532.html,)所提供的蛋白组学和分析工具:Protparam、Proscale程序分析GH5-1及GH6-3蛋白氨基酸组成、相对分子质量、等电点等基本理化性质;TMHMM程序预测GH5-1及GH6-3的跨膜区;

SignalP程序预测GH5-1及GH6-3蛋白的信号肽,GOR超链接分析GH5-1及GH6-3的二级结构,SWISS-MODEL通过二级结构比对和折叠,模拟蛋白质的空间构象。

利用SMART(http://smart.embl-heidelberg.de/)分析预测其结构域。

二、结果

2.1GH5-1及GH6-3基因序列的分析

BLASTx分析结果表明,GH5-1与多个物种的GH5基因同源,其中与endoglucanase 3 [Neurospora crassa OR74A]的同源性最高,一致性达100%,相似度达58%(图1)。ORF Finder获得其开放阅读框编码氨基酸序列,该基因全长2006bp,编码区为678?—1850bp,编码390个氨基酸,起始密码子ATG,终止密码子TAA(图2)。CCD分析发现有GH5-1保守域。

图1 GH5-1基因BLASTx同源性分析

图2 GH5-1基因开放阅读框分析

BLASTx分析结果表明,GH6-3与多个物种的GH6基因同源,其中与exoglucanase 3 [Neurospora crassa OR74A]的同源性最高,一致性达100%,相似性达65%(图3)。ORF Finder获得其开放阅读框编码氨基酸序列,该基因全长1914bp,编码区为22—1281bp,编码419个氨基酸,起始密码子ATG,终止密码子TAA(图4)。CCD分析发现有GH6-3保守域。

图3 GH6-3基因BLASTx同源性分析

图4 GH6-3基因开放阅读框分析

2.2GH5-1及GH6-3编码蛋白的特征分析

2.2.1蛋白质的基本参数

GH5-1蛋白相对分子量预测为41907.4,理论等电点为5.14,脂肪系数为65.90。在溶液中的不稳定系数是19.02,为稳定蛋白。当蛋氨酸在N端时,可预测其在哺乳动物网织红细胞(体外)中,半衰期均30小时,在酵母(体内)中,半衰期大于20小时,在大肠杆菌

(体内)中,大于10小时。氨基酸的组合物(图5),原子

组成(图6)。带负电荷的残基总数28,带正电荷的残基总

数22。当蛋白浓度为1g/L,所有的半胱氨酸残基形成半胱氨

酸时,吸光指数(ABS)为2.653,在水中280nm摩尔消光指

数为111185;所有的半胱氨酸残基不形成半胱氨酸时,吸光

指数(ABS)则为2.644,在水溶液中280nm摩尔消光指数为

110810。总的亲水性平均疏水性指数(grand average of

hydropathieity)为-0.192,预测为亲水蛋白。

GH6-3蛋白相对分子量预测为44839.3,理论等电点为6.51,脂肪系数为80.19。在溶液中的不稳定系数是34.75,为稳定蛋白。当蛋氨酸在N端时,可预测其在哺乳动物网织红细胞(体外)中,半衰期均30小时,在酵母(体内)中,半衰期大于20小时,在大肠杆菌(体内)中,大于10小时。氨基酸的组合物(图7),原子组成(图8)。带负电荷的残

的氨基酸

图6 GH5-1基因原子

生物信息学题库

■一、选择题: 1.以下哪一个是mRNA条目序列号: A. J01536■. NM_15392 C. NP_52280 D. AAB134506 2.确定某个基因在哪些组织中表达的最直接获取相关信息方式是:■. Unigene B. Entrez C. LocusLink D. PCR 3.一个基因可能对应两个Unigene簇吗?■可能 B. 不可能 4.下面哪种数据库源于mRNA信息:■dbEST B. PDB C. OMIM D. HTGS 5.下面哪个数据库面向人类疾病构建: A. EST B. PDB ■. OMIM D. HTGS 6.Refseq和GenBank有什么区别: A. Refseq包括了全世界各个实验室和测序项目提交的DNA序列B. GenBank提供的是非冗余序列 ■. Refseq源于GenBank,提供非冗余序列信息D. GenBank源于Refseq 7.如果你需要查询文献信息,下列哪个数据库是你最佳选择: A. OMIM B. Entrez ■PubMed D. PROSITE 8.比较从Entrez和ExPASy中提取有关蛋白质序列信息的方法,下列哪种说法正确:A. 因为GenBank的数据比EMBL更多,Entrez给出的搜索结果将更多B. 搜索结果很可能 一样,因为GenBank和EMBL的序列数据实际一样■搜索结果应该相当,但是ExPASy中的SwissProt记录的输出格式不同 9.天冬酰胺、色氨酸和酪氨酸的单字母代码分别对应于:■N/W/Y B. Q/W/Y C. F/W/Y D. Q/N/W 10.直系同源定义为:■不同物种中具有共同祖先的同源序列B. 具有较小的氨基酸一致性但是有较大的结构相似性的同源序列 C. 同一物种中由基因复制产生的同源序列 D. 同一物种中具有相似的并且通常是冗余的功能的同源序列 11.下列那个氨基酸最不容易突变: A. 丙氨酸B. 谷氨酰胺 C. 甲硫氨酸■半胱氨酸 12.PAM250矩阵定义的进化距离为两同源序列在给定的时间有多少百分比的氨基酸发生改变: A. 1% B. 20%■. 80% D. 250% 13.下列哪个句子最好的描述了两个序列全局比对和局部比对的不同:A. 全局比对通常用于比对DNA序列,而局部比对通常用于比对蛋白质序列B. 全局比对允许间隙,而局 部比对不允许C. 全局比对寻找全局最大化,而局部比对寻找局部最大化■全局比对比对整体序列,而局部比对寻找最佳匹配子序列 14.假设你有两条远源相关蛋白质序列。为了比较它们,最好使用下列哪个BLOSUM和PAM矩阵:■BLOSUM45和PAM250 B. BLOSUM45和PAM 1 C. BLOSUM80和PAM250 D. BLOSUM10和PAM1 15.与PAM打分矩阵比较,BLOSUM打分矩阵的最大区别是:A. 最好用于比对相关性高的蛋白B. 它是基于近相关蛋白的全局多序列比对 ■它是基于远相关蛋白的局部多序列比对D. 它结合了全局比对和局部比对 16.如果有一段DNA序列,它可能编码多少种蛋白质序列: A. 1 B. 2 C. 3 ■. 6 17.要在数据库查询一段与某DNA序列编码蛋白质最相似的序列,应选择: A. blastn B. blastp C. tblastn D. tblastp■blastx 18.为什么ClustalW(一个采用了Feng-Doolittle渐进比对算法的程序)不报告E值:A. ClustalW报告E值■使用了全局比对 C. 使用了局部比对 D. 因为是多序列比对 19.Feng-Doolittle方法提出“一旦是空隙,永远是空隙”规则的依据是:A. 保证空隙不会引物序列加入而填充B. 假定进化早期分歧的序列有较高优先级别■假定最近序列空隙应 该保留 D. 假定最远序列空隙应该保留 20.根据分子钟假说:A. 所有蛋白质都保持一个相同的恒定进化速率 B. 所有蛋白质的进化速率都与化石记录相符合C. 对于每一个给定的蛋白质,分子进化的速率是逐 渐减慢的,就如同不准时的钟■对于每一个给定的蛋白质,其分子进化的速率在所有的进化分支上大致是恒定 21.系统发生树的两个特征是: A. 进化分支和进化节点■树的拓扑结构和分支长度C. 进化分支和树根D. 序列比对和引导检测方法 22.下列哪一个是基于字母特征的系统发生分析的算法:A. 邻位连接法(NJ法)B. Kimura算法■最大似然法(ML)D. 非加权平均法(UPGMA) 23.基于字母特征和基于距离的系统发生分析的算法的基本差异是:■基于字母特征的算法没有定义分支序列的中间数据矩阵 B. 基于字母特征的算法可应用于DNA或者蛋白质序列,而基于距离仅能用于DNA C. 基于字母特征的算法无法运用简约算法 D. 基于字母特征的算法的进化分支与进化时间无关 24.一个操作分类单元(OTU)可指:A. 多序列比对■蛋白质序列C. 进化分支D. 进化节点 25.构建进化树最直接的错误来源是:■多序列比对错误B. 采样的算法差异C. 假设进化分支是单一起源D. 尝试推测基因的进化关系 26.第一个被完整测定的基因组序列是:A. 啤酒酵母的3号染色体B. 流感病毒■ФX174 D. 人类基因组 27.普通的真核生物线粒体基因组编码大约多少个蛋白质:■10 B. 100 C. 1000 D. 10000 28.根据基因组序列预测蛋白质编码基因的算法的最大问题是:A. 软件太难使用■. 假阳性率太高,许多不是外显子的序列部分被错误指定C. 假阳性率太高,许 多不是外显子功能未知 D. 假阴性率太高,丢失太多外显子位点 29.HIV病毒亚型的系统演化研究可以:A. 证实HIV病毒是由牛病毒演化而来■. 用于指导开发针对保守蛋白的疫苗C. 证实哪些人类组织最容易遭受病毒侵染 30.一个典型的细菌基因组大小约为多少bp:A. 20000■. 200000 C. 2000000 D. 20000000

生物信息学填空题(个人整理)

1、BLAST教案所程序中,哪个方法是不存在的?(D) A:BLASTP B:BLASTN C:BLASTX D:BLASTQ 2、下列哪个软件不是常用来观察蛋白质结构视图的?(D) A:AVS B:Chimera C:MICE D:HMM 3、下列哪个不是点突变的类型?(A) A:染色体畸变 B:错义突变 C:无义突变 D:移码突变 4、基因突变的效应不包括:(C) A:有利突变 B:中性突变 C:移码突变D:遗传多态现象 5、人类基因组的结构特点不包括:(A) A:基因进化 B:基因数目 C:基因重复序列 D:基因组复制 6、世界上三大数据库不包括:(B) A:NCBI B:BLAST C:UCSC D:Ensembl 7、常用序列比对方法错误的是:(C) A:编辑距离 B:点阵描图 C:局部比对 D:记分模式 8、下列哪个不是蛋白质结构模型?(D) A:同源性模型 B:折叠识别 C:ab initio折叠 D: MoLScript结构9、下列哪个选项不是微阵列实验设计的内容?(A) A:贝叶斯网络法 B:对照组的选择 C:重复样本的使用 D:随机化原则10、构建序列进化树的一般步骤不包括:(A) A:建立DNA文库 B:建立数据模型 C:建立取代模型 D:建立进化树 11、下列中属于一级蛋白质结构数据库的是:(C) A. EMBL B. DDBJ C. PDB D.SWISS-PROT 12.蛋白质结构预测分为:(B) A.一级和三级结构预测 B. 二级和空间结构预测 C. 三级和空间结构预测 D. 二级和三级结构预测 13.数据挖掘的四个步骤不包括下列哪个:(C) A. 数据选择 B. 数据转换 C. 数据记录 D. 结果分析 14.下列哪项不是生物学研究必备的工具:(A) A.数据分析B.数据统计C.因素分析D.多元回归分析 15.Linux中rmdir 命令的功能是:(D) A.改变工作目录 B.删除工作目录 C. 创建目录 D.删除空目录 16.BLAST教案所程序中,哪个方法是不存在的?(D) A:BLASTP B:BLASTN C:BLASTX D:BLASTQ 17.下列哪个不是蛋白质结构模型?(D) A:同源性模型 B:折叠识别 C:ab initio折叠 D: MoLScript结构18.人类基因组的结构特点不包括:(A) A:基因进化 B:基因数目 C:基因重复序列 D:基因组复制 19、下列哪个选项不是微阵列实验设计的内容?(A) A:贝叶斯网络法 B:对照组的选择 C:重复样本的使用 D:随机化原则20、构建序列进化树的一般步骤不包括:(A) A:建立DNA文库 B:建立数据模型 C:建立取代模型 D:建立进化树三、填空题

最新生物信息学考试复习

——古A.名词解释 1. 生物信息学:广义是指从事对基因组研究相关的生物信息的获取,加工,储存,分配,分析和解释。狭义是指综合应用信息科学,数学理论,方法和技术,管理、分析和利用生物分子数据的科学。 2. 基因芯片:将大量已知或未知序列的DNA片段点在固相载体上,通过物理吸附达到固定化(cDNA芯片),也可以在固相表面直接化学合成,得到寡聚核苷酸芯片。再将待研究的样品与芯片杂交,经过计算机扫描和数据处理,进行定性定量的分析。可以反映大量基因在不同组织或同一组织不同发育时期或不同生理条件下的表达调控情况。 3. NCBI:National Center for Biotechnology Information.是隶属于美国国立医学图书馆(NLM)的综合性数据库,提供生物信息学方面的研究和服务。 4. EMBL:European Molecular Biology Laboratory.EBI为其一部分,是综合性数据库,提供生物信息学方面的研究和服务。 5. 简并引物:PCR引物的某一碱基位置有多种可能的多种引物的混合体。 6. 序列比对:为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。

7. BLAST:Basic Local Alignment Search Tool.是通过比对(alignment)在数据库中寻找和查询序列(query)相似度很高的序列的工具。 8. ORF:Open Reading Frame.由起始密码子开始,到终止密码子结束可以翻译成蛋白质的核酸序列,一个未知的基因,理论上具有6个ORF。 9. 启动子:是RNA聚合酶识别、结合并开始转录所必须的一段DNA序列。原核生物启动子由上游调控元件和核心启动子组成,核心启动子包括-35区(Sextama box)TTGACA,-10区(Pribnow Box)TATAAT,以及+1区。真核生物启动子包括远上游序列和启动子基本元件构成,启动子基本元件包括启动子上游元件(GC岛,CAAT盒),核心启动子(TATA Box,+1区帽子位点)组成。 10. motif:模体,基序,是序列中局部的保守区域,或者是一组序列中共有的一小段序列模式。 11. 分子进化树:通过比较生物大分子序列的差异的数值重建的进化树。 12. 相似性:序列比对过程中用来描述检测序列和目标序列之间相似DNA碱基或氨基酸残基序列所占的比例。 13. 同源性:两个基因或蛋白质序列具有共同祖先的结论。

体育管理学教案

邯郸职业技术学院课程教案 2011年一2012 年第一学期 课程名称:《体育管理学》开课院系:体育系 授课教师:苗晓亮 授课班级:10级社体 学生人数:73人 河北体育学院课时计划

第周课次年级级班教师 第一章体育管理学与体育管理主体 管理与体育管理学体育管理系统体育管理人员 体育管理体制与体育法规通过教学使学生掌握体育管理概念,了解体育管理系统、体育管理人员、体育管理体制与体育法规。 体育管理基础 第一章体育管理学与体育管理主体 教教学重点:体育管理学基础观念与特征 附页

(三)体育管理学的知识体系 1、指导科学 2、基础科学

3、体育管理科学 作业:经营 管理 课后小结: 体育管理客体:是指体育管理的对象(主要指各种资源要素)与环境。 体育管理的媒介:是指管理主体作用管理客体的机制与方法。体育管理 的过程:就是管理主体,借助管理媒介,作用客体的过程。

学体育管理的过程:就是管理主体,借助管理媒介,作用客体的过程。 第一节体育管理基本对象的管理 体育管理对象主要指体育组织的各种资源,包括体育人员、资金、物资设备、时间与信息。

过一、体育人员管理 (一)体育人员分类 按照各类人员的工作性质与职能进行划分:运动技术人员、管理人员、 服务人员、产业经营人员四大类。 1、体育技术人员主要包括:各类运动项目的运动员,这是主体。教练 员、裁判员、体育教师等。 程2、体育管理人员:各级各类的体育管理机构的领导者与一般工作人员。 3、体育服务人员:为体育运动训练、竞赛及其他活动提供服务的各类人 员。 4、体育产业经营人员:体育产业的广大从业人员。 (二)体育人员管理的内容与目标 1、体育人员管理的内容:组织、激励、培训、使用、考核一系列内容。 2、体育人员管理的目标:不断提高体育工作者的素质;调动积极性和创造 性;促进工作效率。以调动人的积极性发挥人的潜力是核心内容。 (三)体育人员的素质 体育被管理者所涉及范围包括:体育教育管理、竞技体育管理、社会体育 管理。 运动员应具备的基本素质: 1、高度负责的事业心和强烈的进取精神。 2、坚忍不拔的顽强意志。 3、强烈的学习追求与准备的独立分析、判断和理解能力。 4、高度的自控能力和抵御不良思想、落后意识的能力。 二、体育资金管理 资金筹备、分配使用、核算监督 (三)体育资金的筹备 3、体育资金来源的基本类型 拨款型、筹款型、结合性 2、筹备资金的途径 国家财政拨款、社会团体投资、社会投资、负债资金、体育产业开发。 (四)体育资金的分配与使用 体育资金预算、体育资金的支出与收入管理 (三)体育资金的核算体育产业、财务核算监督 三、体育场馆管理 (四)体育场馆的分类 (五 ) 体育场馆里的功能

生物信息学名词解释资料

1.生物信息学:研究大量生物数据复杂关系的学科,其特征是多学科交叉,以互联网为媒介,数据库为载体。利用数学知识建立各种数学模型; 利用计算机为工具对实验所得大量生物学数据进行储存、检索、处理及分析,并以生物学知识对结果进行解释。 2.二级数据库:在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来,是对生物学知识和信息的进一步的整理。 3.FASTA序列格式:是将DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨基酸字符串,大于号(>)表示一个新文件的开始,其他无特殊要求。 4.genbank序列格式:是GenBank 数据库的基本信息单位,是最为广泛的生物信息学序列格式之一。该文件格式按域划分为4个部分:第一部分包含整个记录的信息(描述符);第二部分包含注释;第三部分是引文区,提供了这个记录的科学依据;第四部分是核苷酸序列本身,以“//”结尾。 5.Entrez检索系统:是NCBI开发的核心检索系统,集成了NCBI 的各种数据库,具有链接的数据库多,使用方便,能够进行交叉索引等特点。 6.BLAST:基本局部比对搜索工具,用于相似性搜索的工具,对需要进行检索的序列与数据库中的每个序列做相似性比较。P94 7.查询序列(query sequence):也称被检索序列,用来在数据库中检索并进行相似性比较的序列。P98 8.打分矩阵(scoring matrix):在相似性检索中对序列两两比对的质量评估方法。包括基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如PAM)两类方法。P29 9.空位(gap):在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最佳比对结果,这样在其中一序列上产生中断现象,这些中断的位点称为空位。P29 10.空位罚分:空位罚分是为了补偿插入和缺失对序列相似性的影 响,序列中的空位的引入不代表真正的进化事件,所以要对其进行 罚分,空位罚分的多少直接影响对比的结果。P37 11.E值:衡量序列之间相似性是否显著的期望值。E值大小说明了 可以找到与查询序列(query)相匹配的随机或无关序列的概率,E 值越接近零,越不可能找到其他匹配序列,E值越小意味着序列的 相似性偶然发生的机会越小,也即相似性越能反映真实的生物学意 义。P95 12.低复杂度区域:BLAST搜索的过滤选项。指序列中包含的重复 度高的区域,如poly(A)。 13.点矩阵(dot matrix):构建一个二维矩阵,其X轴是一条序列, Y轴是另一个序列,然后在2个序列相同碱基的对应位置(x,y) 加点,如果两条序列完全相同则会形成一条主对角线,如果两条序 列相似则会出现一条或者几条直线;如果完全没有相似性则不能连 成直线。 14.多序列比对:通过序列的相似性检索得到许多相似性序列,将这 些序列做一个总体的比对,以观察它们在结构上的异同,来回答大 量的生物学问题。 15.分子钟:认为分子进化速率是恒定的或者几乎恒定的假说,从而 可以通过分子进化推断出物种起源的时间。 16.系统发育分析:通过一组相关的基因或者蛋白质的多序列比对或 其他性状,可以研究推断不同物种或基因之间的进化关系。 17.进化树的二歧分叉结构:指在进化树上任何一个分支节点,一个 父分支都只能被分成两个子分支。 系统发育图:用枝长表示进化时间的系统树称为系统发育图,是 引入时间概念的支序图。 18.直系同源:指由于物种形成事件来自一个共同祖先的不同物种中 的同源序列,具有相似或不同的功能。(书:在缺乏任何基因复制 证据的情况下,具有共同祖先和相同功能的同源基因。) 19.旁系(并系)同源:指同一个物种中具有共同祖先,通过基因重 复产生的一组基因,这些基因在功能上可能发生了改变。(书:由于 基因重复事件产生的相似序列。) 20.外类群:是进化树中处于一组被分析物种之外的,具有相近亲缘 关系的物种。 21.有根树:能够确定所有分析物种的共同祖先的进化树。 22.除权配对算法(UPGMA):最初,每个序列归为一类,然后找 到距离最近的两类将其归为一类,定义为一个节点,重复这个过程, 直到所有的聚类被加入,最终产生树根。 23.邻接法(neighbor-joining method):是一种不仅仅计算两两比 对距离,还对整个树的长度进行最小化,从而对树的拓扑结构进行 限制,能够克服UPGMA算法要求进化速率保持恒定的缺陷。 24.最大简约法(MP):在一系列能够解释序列差异的的进化树中 找到具有最少核酸或氨基酸替换的进化树。 25.最大似然法(ML):它对每个可能的进化位点分配一个概率, 然后综合所有位点,找到概率最大的进化树。最大似然法允许采用 不同的进化模型对变异进行分析评估,并在此基础上构建系统发育 树。 26.一致树(consensus tree):在同一算法中产生多个最优树,合并 这些最优树得到的树即一致树。 27.自举法检验(Bootstrap):放回式抽样统计法。通过对数据集多 次重复取样,构建多个进化树,用来检查给定树的分枝可信度。 精品文档

基因组学与生物信息学教案

《基因组学与生物信息学》教案 授课专业:生物学大类各专业 课程名称:基因组学与生物信息学 主讲教师:夏庆友程道军赵萍徐汉福

课程说明 一、课程名称:基因组学与生物信息学 二、总课时数:36学时(理论27学时实验9学时) 三、先修课程:遗传学、分子生物学、基因工程 四、使用教材: 杨金水. 基因组学. 北京:高等教育出版社,2002. 张成岗. 贺福初, 生物信息学方法与实践. 北京:科学出版社,2002. 五、教学参考书: T.A.布朗著,袁建刚译著,基因组(2rd版),北京:科学出版社,2006. 沈桂芳,丁仁瑞,走向后基因组时代的分子生物学,杭州:浙江教育出版社,2005. 罗静初译,生物信息学概论,北京:北京大学出版社,2002. 六、考核方式:考查 七、教案编写说明: 教案又称课时授课计划,是任课教师的教学实施方案。任课教师应遵循专业教学计划制订的培养目标,以教学大纲为依据,在熟悉教材、了解学生的基础上,结合教学实践经验,提前编写设计好每门课程每个章、节或主题的全部教学活动。教案可以按每堂课(指同一主题连续1~2节课)设计编写。教案编写说明如下: 1、编号:按施教的顺序标明序号。 2、教学课型表示所授课程的类型,请在相应课型栏内选择打“√”。 3、题目:标明章、节或主题。 4、教学内容:是授课的核心。将授课的内容按逻辑层次,有序设计编排,必要时标以“*”、“#”“?” 符号分别表示重点、难点或疑点。 5、教学方式既教学方法,如讲授、讨论、示教、指导等。教学手段指教科书、板书、多媒体、模型、 标本、挂图、音像等教学工具。 6、讨论、思考题和作业:提出若干问题以供讨论,或作为课后复习时思考,亦可要求学生作为作业 来完成,以供考核之用。 7、参考书目:列出参考书籍、有关资料。 8、日期的填写系指本堂课授课的时间。

生物信息学论文

生物信息学的进展综述 韩雪晴 (生物工程1201班,学号:201224340124) 摘要:生物信息学是一门研究生物和生物相关系统中信息内容和信息流向的综合性系统科学。80年代以来新兴的一门边缘学科,信息在其中具有广阔的前景。伴随着人类基因组计划的胜利完成与生物信息学的发展有着密不可分的联系,生物信息学的发展为生命科学的发展为生命科学的研究带来了诸多的便利,对此作了简单的分析。 关键词:生物信息学;进展;序列比对;生物芯片 A review of the advances in Bioinformatics Han Xueqing (Bioengineering, Class1201,Student ID:201224340124) Abstract: Bioinformatics is the science of comprehensive system of information content and information flows to a study on the biological and bio related in the system. The edge of an emerging discipline since 80, has broad prospects in which information. With the human genome project was completed and the development of bioinformatics are inextricably linked, for the life science research development of bioinformatics for the development of life science has also brought a lot of convenience, has made the simple analysis. Keywords: bioinformatics;progress;Sequence alignment;biochip 1、生物信息学的产生背景 生物信息学是20世纪80年代末开始,随着基因组测序数据迅猛增加而逐渐兴起的一门学科[1]。应用系统生物学的方法认识生物体代谢、发育、分化、进化以及疾患发生规律的不可或缺的工具[2]。及时、充分、有效地利用网络上不断增长的生物信息数据库资源,已经成为生命科学和生物技术研究开发的必要手段,从而诞生了生物信息学。 2、生物信息学研究内容 主要是利用计算机存储核酸和蛋白质序列,通过研究科学的算法,编制相应的软件对序列进行分析、比较与预测,从中发现规律。白细胞介素-6(IL-6)是机体重要的免疫因子,但在两栖类中未见报道。采用生物信息学方法对两栖类模式动物非洲爪蟾IL-6进行分析[3]。以人IL-6基因对非洲爪蟾数据库进行搜索、分析,并采用RT-PCR方法对所得序列进行验证。结果表明,非洲爪蟾IL-6基因位于scaffold_52基因架上,具有保守的IL-6家族基序[4]。采用生物信息新方法进行不同物种的免疫基因挖掘、克隆,是一种有效的方法[5]。 2.1序列比对 比较两个或两个以上符号序列的相似性或不相似性。序列比对是生物信息学的基础。两个序列的比对现在已有较成熟的动态规划算法,以及在此基础上编写的比对软件包BLAST和FASTA[6]。序列数据库搜索最著名且最常用的工具之一便是BLAST算法。FASTA算法是另一族常用的序列比对及搜索工具[7]。 2.2结构比对 比较两个或两个以上蛋白质分子空间结构的相似性或不相似性。 2.3蛋白质结构预测 从方法上来看有演绎法和归纳法两种途径。前者主要是从一些基本原理或假设出发来预测和研究蛋白质的结构和折叠过程。分子力学和分子动力学属这一范畴。后者主要是从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构[8]。 3、生物信息学的新技术

最新生物信息学复习题及答案(陶士珩)

生物信息学复习题 一、名词解释 生物信息学, 二级数据库, FASTA序列格式, genbank序列格式, Entrez,BLAST,查询序列(query),打分矩阵(scoring matrix),空位(gap),空位罚分,E 值, 低复杂度区域,点矩阵(dot matrix),多序列比对,分子钟,系统发育(phylogeny),进化树的二歧分叉结构,直系同源,旁系同源,外类群,有根树,除权配对算法(UPGMA),邻接法构树,最大简约法构树,最大似然法构树,一致 树(consensus tree),bootstrap,开放阅读框(ORF),密码子偏性(codon bias),基因预测的从头分析法,结构域(domain),超家族,模体(motif),序列表谱(profile),PAM矩阵,BLOSUM,PSI-BLAST,RefSeq,PDB数据库,GenPept, 折叠子,TrEMBL,MMDB,SCOP,PROSITE,Gene Ontology Consortium,表谱(profile)。 二、问答题 1)生物信息学与计算生物学有什么区别与联系? 2)试述生物信息学研究的基本方法。 3)试述生物学与生物信息学的相互关系。 4)美国国家生物技术信息中心(NCBI)的主要工作是什么?请列举3个以上NCBI 维护的数据库。 5)序列的相似性与同源性有什么区别与联系? 6)BLAST套件的blastn、blastp、blastx、tblastn和tblastx子工具的用途 什么? 7)简述BLAST搜索的算法。 8)什么是物种的标记序列? 9)什么是多序列比对过程的三个步骤? 10)简述构建进化树的步骤。 11)简述除权配对法(UPGMA)的算法思想。 12)简述邻接法(NJ)的算法思想。 13)简述最大简约法(MP)的算法思想。 14)简述最大似然法(ML)的算法思想。 15)UPGMA构树法不精确的原因是什么? 16)在MEGA2软件中,提供了多种碱基替换距离模型,试列举其中2种,解释其 含义。 17)试述DNA序列分析的流程及代表性分析工具。 18)如何用BLAST发现新基因? 19)试述SCOP蛋白质分类方案。 20)试述SWISS-PROT中的数据来源。 21)TrEMBL哪两个部分? 22)试述PSI-BLAST 搜索的5个步骤。 三、操作与计算题 1)如何获取访问号为U49845的genbank文件?解释如下genbank文件的LOCUS行提供的信息: LOCUS SCU49845 5028 bp DNA linear PLN 21-JUN-1999 2)利用Entrez检索系统,对核酸数据搜索,输入如下信息,将获得什

小学五年级体育健康课教案doc资料

小学五年级体育健康 课教案

第一课行路安全 教学目标:通过学习,使学生知道上学、放学的路上要多注意安全。 教学用具:相关课件 教学过程: 一、导入新课 小朋友,你们知道上学、放学时是高峰时期,所以大家要注意交通安全。 板书课题:行路安全 二、教授新课 1、出示图片提问:小朋友你们认识这些标志吗? 小结:马路上,车多、人多。行人要靠右走,不追逐,不打闹。过马路时,先看左,后看右,要走人行道。 2、出示图片提问:图上的小朋友做得对吗? 小结:他做得不对,不能翻越栏杆。 3、出示图片提问:图上的小朋友做得对吗?

小结:他做得对,要和妈妈一起过马路。 4、出示图片提问:图上的小朋友做得对吗? 小结:他做得不对,骑车时不能打伞。 5、出示图片提问:图上的小朋友做得对吗? 小结:他做得不对,不能在马路上踢球。 二、总结全文 五课后反思: 第二课吃好早饭 教学目标:通过本课学习,让学生知道吃好早饭在一天当中的重要性。教学用具:相关课件 教学过程: 一、导入新课

小朋友,我们上节课学习了怎样养成爱清洁、讲卫生的好习惯。做好它可以保护我们的身体不受病菌的侵害,可是想要有一个健康的身体还需要小朋友们注意饮食,尤其是吃好我们的早饭。 二、教授新课 1、出示图片 提问:你知道图上这些小朋友为什么会不舒服吗? 小结:早饭对一天来说非常的重要。如果不吃早饭,会影响同学们的身体正常发展。 2、教儿歌 同学每天要早起, 吃好早饭再学习, 干稀搭配质量好, 身体学习大提高。 3、出示图 提问:知道图上这些叫什么吗? 你每天吃早饭吗?经常吃哪几种?

四、总结全文 五、作业 你今天吃早饭了吗?吃好了就用彩笔画一朵花。 五课后反思: 第三课讲卫生勤洗手 教学目标:通过本课学习,让学生知道要爱清洁、讲卫生。 教学过程: 一、导入新课 同学们,我们上节课学习了怎样养成爱清洁、讲卫生的好习惯,但讲卫生不仅只是带手绢和水碗还需要勤洗手。 二、教授新课 1、出示图片 提问:你知道手是怎样受污染的吗? 小结:我们的小手用途可真大。它可以拍皮球、择菜、开门、浇花、打扫卫生等等。可是在它做这些事情的同时,自己也受到了污染。

生物信息学论文

生物信息学论文 论文题目 PBL教学法在生物信息学课程教学中的应用与实践 指导老师:谷峻 学生姓名:吕晓莹 学号: 20112501092 院系:生命科学学院 专业:生物科学 撰写时间:2014年4月

摘要:PBL Problem-Based Leaming),即基于问题学习,是由美国神经病学教授Barrows首创并于1969年在加拿大的麦克马斯特大学医学院试行的一种新的教学方法。PBL 的基本特点是以教师为引导,以学生为中心,通过解决问题来学习,与传统的以学科为基础,以教师为中心的教学方法相比有很大的不同。本论文通过对照PBL 教学理念和生物信息学课程理论,来探究PBL 教学法在生物信息学课程教学中应用与实践,为提高生物信息学课程教学质量提供一种可行方法。 关键词:PBL 教学法,生物信息学,应用与实践 1 前言 生物信息学是20世纪90年代由多种学科知识相互渗透、融合而兴起的一门用数理和信息科学的观点、理论以及方法去研究生命现象、组织和分析呈现指数增长的生物医学数据的一门学科,具有开放性、发展性、交叉性、综合性、应用性等特点。鉴于此,尽管国内的生物信息学科学研究开展得如火如荼,但由于受到师资、教材、授课对象、教学条件、教学法等因素限制,开设该课程的高校尚未真正形成一套成熟的、科学的教学体系。 目前, 国内的生物信息学教学基本沿用以“教师讲授为主”的传统教学模式。以课堂为中心、以理论教学为主, 进行“满堂灌”式教育, “照本宣读”的方式也比较常见。缺乏与生物信息学交叉前沿性特点相适应的型教学模式。同时,实验教学比较单一, 常以验证性为目的, 有些甚至成为了“文献检索”课程, 缺乏和专相适应的综合性、设计性实验。现代教学改革与实践证明,在教学过程中必须要突出“学生是教学活动的主体”,既要注意张扬学生“个性”,更要强化学生团队合作意识及创新、创业能力培养,以保证人才培养质量。在这种情况下,传统的教学模式已与当前社会快速发展的局面格格不入,迫切需要变革。因此,为激发学生的学习积极性和教学参与热情,探索先进的教学法以革新生物信息学的教学内容及考核方式等显得尤为重要。其中,以PBL 为例的教学法在生物信息学课程教学应用与实践中取得了良好的课程教学效果。 2 PBL 教学法的优势 2.1 PBL 教学顺应时代的发展 当今社会是信息时代, 生物学不断发展, 知识不断更新, 老师要讲的内容越来越多, 学生要读的书越来越厚, 授课内容与课时不相适应的矛盾非常突出, 且教学双方负担过重, 教学效果难以保证, 这种填鸭式的传统教学越来越无法适应信息社会的要求, 这就要求学生在接受人类已有的科学知识基础上, 着重培养创造能力, 学会自己寻找知识和创造知识的本领。而PBL 教学模式能明显减少说教式教学和学习负担, 既能加强学生独立学习,又能减轻教师的教学负担,顺应了时代的发展。 2.2 有利于培养学生主动学习的能力和形成双向交流 传统的教学模式是以学科为基础, 教师课堂讲解为主, 教学内容进度和方法均由老师决定,其 对象是学生整体, 容易忽视单一个体的学习兴趣、能力及个性特征, 学生始终处于被动地接受知识的地位, 不利于主动学习能力的培养。而PBL 教学法打破传统的界限, 采取以“学生为中心、问题为核心”的教育方式。在教师的整体把握和指导下, 学生充分运用现代化科技手段如教材、图书馆、录像、模型、文献检索系统、电脑学习软件、网络以及多媒体等多种形式进行自学。课堂上,PBL模式强调学生主动参与学习, 从而大大提高学习效果和长期记忆的形成。从教学的角度来看, 指导老师长期与同一小组学生

生物信息学课程论文 作业题目 分配表

生物技术12-1 生物技术12-1 学号姓名性 别 签名学号姓名性别签名学号姓名性 别 签名 12114350101陈丽娜女大肠杆菌连接 酶 12114350104黄少敏女人的胰蛋白 酶 12114350105黄晓静女T4噬菌体 DNA聚合酶12114350106纪秀玲女人的肌红蛋白12114350107列泳婵女蛋白酶K序 列 12114350108石彩虹女小鼠P53基 因12114350110周海琪女拟南芥端粒酶 序列 12114350111曹杰濠男淀粉酶12114350113陈永成男G-谷氨酰转 肽酶12114350115方壮杰男乳酸脱氢酶12114350116冯健锋男肝癌铁蛋白12114350118黄静云男牛血清白蛋 白12114350119李树森男18S rDNA 12114350120李涛男ATP合成酶12114350121林秀尧男谷氨酸脱羧 酶12114350123刘国标男CDK4 12114350124罗皓炽男胃蛋白酶12114350125阮永刚男鲨烯合酶基 因12114350126石晓洲男肌动蛋白12114350129王佐正男肥胖基因相 关蛋白 12114350130吴文祯男柑橘果胶酯 酶12114350131吴永鹏男凝血酶原12114350132徐国相男维生素C合 成基因 12114350133叶业林男葡萄糖脱氢 酶

12114350134张维彬男大肠杆菌Β-半 乳糖苷酶 12114350135张伟龙男抗干旱基因12114350136郑晓坤男人血红蛋白 12114350142郑桂捷男磷酸酶的蛋白 质12114350138黄忠海男牛凝乳酶原 基因 12114350139徐少东男岩藻糖苷酶 12114350141王晓敏女木瓜蛋白酶 本班总人数:31 生物技术12-2 生物技术12-2 学号姓名性别签名学号姓名性别签名学号姓名性别签名12114350201黄雪梅女人的胰岛素12114350202李晨晨女热震惊蛋白/ 热击蛋白 1211435020 3 廖垭娣女乙肝病毒 CABYR- binding prot ein 12114350204冉梦梦女腺苷酸环化酶12114350205魏丹璇女DNA ase I 1211435020 6 吴彩凤女纤维素酶 12114350207武亦婷女18 rDNA 12114350208叶国玲女谷胱甘肽1211435020 9 叶锦玉女线粒体基因

最新生物信息学名词解释(个人整理)

一、名词解释: 1.生物信息学:研究大量生物数据复杂关系的学科,其特征是多学科交叉,以互联网为媒介,数据库为载体。利用数学知识建立各种数学模型; 利用计算机为工具对实验所得大量生物学数据进行储存、检索、处理及分析,并以生物学知识对结果进行解释。 2.二级数据库:在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来,是对生物学知识和信息的进一步的整理。 3.FASTA序列格式:是将DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨基酸字符串,大于号(>)表示一个新文件的开始,其他无特殊要求。 4.genbank序列格式:是GenBank 数据库的基本信息单位,是最为广泛的生物信息学序列格式之一。该文件格式按域划分为4个部分:第一部分包含整个记录的信息(描述符);第二部分包含注释;第三部分是引文区,提供了这个记录的科学依据;第四部分是核苷酸序列本身,以“//”结尾。 5.Entrez检索系统:是NCBI开发的核心检索系统,集成了NCBI的各种数据库,具有链接的数据库多,使用方便,能够进行交叉索引等特点。 6.BLAST:基本局部比对搜索工具,用于相似性搜索的工具,对需要进行检索的序列与数据库中的每个序列做相似性比较。P94 7.查询序列(query sequence):也称被检索序列,用来在数据库中检索并进行相似性比较的序列。P98 8.打分矩阵(scoring matrix):在相似性检索中对序列两两比对的质量评估方法。包括基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如PAM)两类方法。P29 9.空位(gap):在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最佳比对结果,这样在其中一序列上产生中断现象,这些中断的位点称为空位。P29 10.空位罚分:空位罚分是为了补偿插入和缺失对序列相似性的影响,序列中的空位的引入不代表真正的进化事件,所以要对其进行罚分,空位罚分的多少直接影响对比的结果。P37 11.E值:衡量序列之间相似性是否显著的期望值。E值大小说明了可以找到与查询序列(query)相匹配的随机或无关序列的概率,E值越接近零,越不可能找到其他匹配序列,E 值越小意味着序列的相似性偶然发生的机会越小,也即相似性越能反映真实的生物学意义。P95 12.低复杂度区域:BLAST搜索的过滤选项。指序列中包含的重复度高的区域,如poly(A)。 13.点矩阵(dot matrix):构建一个二维矩阵,其X轴是一条序列,Y轴是另一个序列,然后在2个序列相同碱基的对应位置(x,y)加点,如果两条序列完全相同则会形成一条主对角线,如果两条序列相似则会出现一条或者几条直线;如果完全没有相似性则不能连成直线。 14.多序列比对:通过序列的相似性检索得到许多相似性序列,将这些序列做一个总体的比对,以观察它们在结构上的异同,来回答大量的生物学问题。 15.分子钟:认为分子进化速率是恒定的或者几乎恒定的假说,从而可以通过分子进化推断出物种起源的时间。 16.系统发育分析:通过一组相关的基因或者蛋白质的多序列比对或其他性状,可以研究推断不同物种或基因之间的进化关系。 17.进化树的二歧分叉结构:指在进化树上任何一个分支节点,一个父分支都只能被分成两个子分支。 系统发育图:用枝长表示进化时间的系统树称为系统发育图,是引入时间概念的支序图。 18.直系同源:指由于物种形成事件来自一个共同祖先的不同物种中的同源序列,具有相似或不同的功能。(书:在缺乏任何基因复制证据的情况下,具有共同祖先和相同功能的同源基因。)

生物信息学复习资料全

一、名词解释(31个) 1.生物信息学:广义:应用信息科学的方法和技术,研究生物体系和生物过程 息的存贮、信息的涵和信息的传递,研究和分析生物体细胞、组织、器官的生理、病理、药理过程中的各种生物信息,或者也可以说成是生命科学中的信息科学。狭义:应用信息科学的理论、方法和技术,管理、分析和利用生物分子数据。 2.二级数据库:对原始生物分子数据进行整理、分类的结果,是在一级数据库、 实验数据和理论分析的基础上针对特定的应用目标而建立的。 3.多序列比对:研究的是多个序列的共性。序列的多重比对可用来搜索基因组 序列的功能区域,也可用于研究一组蛋白质之间的进化关系。 4.系统发育分析:是研究物种进化和系统分类的一种方法,其常用一种类似树 状分支的图形来概括各种(类)生物之间的亲缘关系,这种树状分支的图形称为系统发育树。 5.直系同源:如果由于进化压力来维持特定模体的话,模体中的组成蛋白应该 是进化保守的并且在其他物种中具有直系同源性。 指的是不同物种之间的同源性,例如蛋白质的同源性,DNA序列的同源性。(来自百度) 6.旁系(并系)同源:是那些在一定物种中的来源于基因复制的蛋白,可能会 进化出新的与原来有关的功能。用来描述在同一物种由于基因复制而分离的同源基因。(来自百度) 7.FASTA序列格式:将一个DNA或者蛋白质序列表示为一个带有一些标记的 核苷酸或氨基酸字符串。 8.开放阅读框(ORF):是结构基因的正常核苷酸序列,从起始密码子到终止 密码子的阅读框可编码完整的多肽链,其间不存在使翻译中断的终止密码子。(来自百度) 9.结构域:大分子蛋白质的三级结构常可分割成一个或数个球状或纤维状的区 域,折叠得较为紧密,各行其功能,称为结构域。 10.空位罚分:序列比对分析时为了反映核酸或氨基酸的插入或缺失等而插入空 位并进行罚分,以控制空位插入的合理性。(来自百度) 11.表达序列标签:通过从cDNA文库中随机挑选的克隆进行测序所获得的部分 cDNA的3’或5’端序列。(来自文献) 12.Gene Ontology 协会: 13.HMM 隐马尔可夫模型:将核苷酸序列看成一个随机序列,DNA序列的编 码部分与非编码部分在核苷酸的选用频率上对应着不同的Markov模型。14.一级数据库:数据库中的数据直接来源于实验获得的原始数据,只经过简单 的归类整理和注释 15.序列一致性:指同源DNA顺序的同一碱基位置的相同的碱基成员, 或者蛋 白质的同一氨基酸位置的相同的氨基酸成员, 可用百分比表示。 16.序列相似性:指同源蛋白质的氨基酸序列中一致性氨基酸和可取代氨基酸所 占的比例。 17.Blastn:是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将 同所查序列作一对一地核酸序列比对。(来自百度) 18.Blastp:是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐 一地同每条所查序列作一对一的序列比对。(来自百度)

生物信息学理论大纲

《生物信息学》课程教学大纲 课程编号:E082042 课程类型: 专业选修课 课程名称:生物信息学英文名称:Bioinformatics 学分:2 适用专业:生物工程 第一部分大纲说明 一、课程的性质、目的和任务 生物信息学是应用信息科学研究生物体系和生物过程中信息的存贮、信息的内涵和信息的传递,研究和分析生物体细胞、组织、器官的生理、病理、药理过程的中各种生物信息,或者说是生命科学中的信息科学。生物信息学是数学、统计、计算机与生物命科学的交叉新兴学科,它广泛地渗透到生物学的各个研究领域中,更是生物工程研究中不可缺少的重要工具。随着人类基因组计划的快速发展,生物信息学技术在功能性基因的发现与识别、基因与蛋白质的表达与功能研究方面都发挥着关键的作用。本课程从生物信息学的基本理论和技术出发,结合该学科应用研究的教授,使学生能扎实掌握生物信息学的基本理论、国内外研究的前沿进展以及如何为经济建设和社会发展服务等内容。 二、课程的基本要求 本课程使学生了解生物信息学的基础知识,生物信息数据库的使用,生物信息工具的应用,熟悉生物信息学学科的发展和现状,熟悉几种主要数据库的内容、注释、检索,掌握常用数据库搜索工具的使用方法,了解上述方法在实际研究中的应用(包括基因序列信息分析、基因预测、分子进化及系统发育树和蛋白质结构预测等重要问题)。 三、本课程与相关课程的联系 本课程是以普通生物学、分子生物学、信息科学、数理统计、工程学为基础的交叉

学科。 先修课程:普通生物学、生物化学、微生物学。 四、学时分配 五、教材与参考书 教材:《生物信息学》(普通高等教育“十一五”规划教材),许忠能主编,清华大学出版社,2008。 参考书:1.Bioinformatics(英文原版),Westhead et al.,科学出版社,2003;2.Computational Molecular Biology,Pevzner,MIT Press,2000; 3.Biological Sequence Analysis(英文原版), Durbin等,清华大学出版社,2002;

相关文档
最新文档