2017年中科院岩石学考研参考书

2017年中科院岩石学考研参考书
2017年中科院岩石学考研参考书

中国科学院大学硕士研究生入学考试

《岩石学》考试大纲

本《岩石学》考试大纲适用于中国科学院大学地质学各专业的硕士研究生入学考试。岩石学是地质学的三大支柱学科之一,也是地质学各专业必备的基础理论课程。岩石学包括岩浆岩、沉积岩、变质岩三部分,本大纲也涵盖这三部分内容。地球上几乎所有的元素都来源于岩石。岩石是地球演化的最直接记录,各种岩石中都蕴涵着地球岩石圈演化的丰富信息。尽管岩石学是个相对古老的学科,但越来越深入的岩石学研究一直是地质学研究必不可少的重点工作内容。近年来,随着分析实验手段的进步,无论是岩石学理论还是天然岩石的研究都正在向纵深发展。硕士研究生入学的岩石学考试,主要考察学生对岩石学课程最基本知识的掌握程度,要求考生准确掌握三大类岩石最基本特征、研究方法、特定岩石的地质学意义,并具有从岩石学角度解决地质科学问题的基本能力。

一、考试范围

(一)岩浆岩部分

1.岩浆与岩浆作用

2.岩浆岩的结构和构造

3.岩浆岩化学成分及其分类

4.超镁铁质岩类与镁铁质岩类

5.玄武岩类及其相关岩石

6.花岗岩类及其相关岩类

7.中酸性熔岩与火山碎屑岩类

8.硅不饱和岩浆岩

9.岩浆的演化

(二)沉积岩部分

1.沉积岩的形成过程、一般特征、分类方法

2.风化和风化带中矿物的稳定性

3.沉积作用和沉积物

4.成岩作用及其特点

5.他生沉积岩类

6.自生沉积岩类

(三)变质岩部分

1.变质作用基本概念、变质作用基本分类

2.变质岩的结构构造、分类和命名

3.变质反应和变质带

4.相律及变质矿物共生分析

5.几大类变质岩基本特征

(四)特定大地构造区域的岩石组合

1.洋中脊的岩石组合

2.会聚板块边界的岩石组合

3.陆–陆碰撞带的岩石组合

4.板块内部的岩石组合

二、考试要求

(一)岩浆岩部分

1、掌握岩浆的概念及岩浆的形成与运移、岩浆的性质、岩浆的分异、混合作用和同化作用等特征。

2、对岩浆岩的结构和构造有较准确的把握,掌握岩浆岩结构、岩浆岩特征构造的一般特征。

3、较准确掌握岩浆岩的化学成分、岩浆岩的矿物成分、深成岩的QAPF分类三角形、火山岩的TAS化学分类。

4、掌握各种镁铁质岩类(玄武岩、辉长岩、辉绿岩等)、常见的岩石共生组合及其成因、超镁铁岩的岩浆成因与非岩浆成因等特征。

5、掌握玄武岩系列的划分,基本了解常见的玄武质岩石种类。对于玄武岩浆的形成有初步了解。

6.掌握花岗岩及其相关岩类特征,包括花岗岩类、花岗闪长岩类、细晶岩和伟晶岩。了解花岗岩类的岩浆成因与交代成因(结晶分异、混合岩化、深熔作用)、花岗岩的成因类型(I型、S型、A型及M形花岗岩)划分及其地质意义。

7掌握中酸性熔岩与火山碎屑岩类基本特征,包括安山岩、流纹岩、英安岩、火山碎屑岩,及火山碎屑的搬运、堆积方式和火山碎屑岩相(喷发柱、湍流、涌流等)。

8、对硅不饱和岩浆岩有基本了解,了解金伯利岩、煌斑岩、碳酸岩类、碱性岩浆岩的一般特征。

9、了解岩浆的流变学性质、岩浆的分异作用、岩浆的混合作用、岩浆的同化混染作用。

(二)沉积岩部分

1、对沉积岩的形成过程和一般特征有准确的把握,掌握沉积岩的形成过程、沉积岩的矿物成分和化学成分、沉积岩颜色的成因类型、沉积岩的层理构造、冲刷构造、生物成因的生物扰动构造和叠层构造、化学成因的构造。掌握沉积岩分类方法。

2、对风化和风化带中矿物的稳定性有初步了解,包括风化、风化带中不稳定、准稳定和稳定矿物。

3、准确把握沉积作用,包括物理沉积作用和碎屑沉积物、化学沉积作用和化学沉积物、生物沉积作用和生物沉积物、复合沉积作用及其沉积物。

4、准确掌握成岩作用及其特点,包括压实和压溶作用、胶结作用及胶结类型(基底式、空隙式、接触史、悬挂式、镶嵌式)、胶结物的结构(非晶质和隐晶质,微晶结构、镶嵌粒状结构、介壳状结构、加大边结构)、胶结物的世代、重结晶作用。

5、了解他生沉积岩类,包括砾岩、角砾岩和沉积混杂岩、砂岩与粉砂岩、泥质岩的基本特征。

6、了解自生沉积岩类,包括碳酸盐岩、硅质岩、蒸发岩、磷质岩、铁质岩

的基本特征。

(三)变质岩部分

1.对变质作用基本概念有较好的把握,包括变质作用的定义、变质作用与岩浆作用及成岩作用的区别、地温梯度、前进变质作用、退变质作用、变质相、变质相系、变质程度。

2.对变质岩的结构构造、分类和命名有较好的把握,例如常见的变质岩结构构造、变质岩命名准则、特殊岩石的命名。掌握根据结构构造恢复原岩的原理。

3.掌握变质反应和变质带相关概念,包括不连续反应、连续反应、特征变质矿物、等变线、等变带、巴罗型递增变质带、双变质带及其意义。

4.掌握相律及变质矿物共生分析方法,包括平衡与非平衡矿物共生组合的鉴别标志、吉布斯相律、戈德史密特矿物相律、AFM共生图解及其应用。

5.对几大类变质岩基本特征有较好的把握,尤其是区域变质岩(泥质、基性)、接触变质岩、动力变质岩。

(四)特定大地构造区域的岩石组合

1、了解洋中脊的岩石组合总的特征、岩浆岩组合、蛇绿岩套。

2、了解会聚板块边界的岩石组合,主要是岛弧、大陆边缘弧的岩浆岩组合。

3、了解陆–陆碰撞带的岩石组合,注重榴辉岩、蓝片岩等高压变质岩组合。

4、了解板块内部的岩石组合,包括洋岛火山岩、大陆溢流型玄武岩、大陆裂谷区的岩浆岩组合、斜长岩岩体、其它的大陆岩浆岩组合。

三参考书

陆凤香、桑隆康(2002)岩石学,第一版,地质出版社,北京

生物信息学考研报考院校

学科门类:07 理学 一级学科:0710 生物学 以下表格数据来自:中国研究生信息网北京: (10001)北京大学 071020 生物学(生物信息学)071021 生物学(生物技术) (90106)中国人民解放军军事医学科学院071020 生物信息学

(10019)中国农业大学 071021 生物信息学 (80167)中国科学院北京基因组研究所071021 生物信息学 071022 基因组学 (80112)中国科学院生物物理研究所 071021 生物信息学 (80156)中国科学院北京遗传与发育生物研究所071021 生物信息学 (90106)中国人民解放军军事医学科学院071020 生物信息学 071021 生物安全

上海: (10246)复旦大学071020 生物信息学071021 人类生物学

(10248)上海交通大学

吉林: (10200)东北师范大学 071020 基因组学 071021 生物医学 071023 化学生物学 (80100)中国科学院上海生命科学研究院 071020 生物技术与医药 071021 生物信息学 071023 计算生物学 071024 生物情报学 具体考试的要求很详细具体由于表格很大就不一一列举 了:https://www.360docs.net/doc/f29657186.html,/zsml/querySchAction.do?dwdm=80100&mldm=07&yjxkdm=0710&zymc=&pageno=8 江苏: (10319)南京师范大学 071020 生物技术 071021 生物物理化学 浙江: (10335)浙江大学 071020 生物信息学

生物信息学就业前景分析

专业介绍 生物信息学不在注重分析完成而是注重生物学或者临床医学解读,诸如,当我们发现一个信号通路pi3k,其中akt3这个基因表达他会激活什么因子,产生何种生物学表型影响什么细胞,下一步该如何实验。因为分析出结果越来越简单,在线平台,在线工具,自己看个教程就可以轻易完成,毕竟现阶段生物信息学的代码人员的素养越来越高,包括dockerhub的高手开发了很多镜像,版本控制问题也不难。所以在这个时代,实际上是谁知道数据如何使用谁强。毕竟生物学医学都是实验科学。 生物信息学在国内一直是一个比较前沿的学科。生物信息学是最近几年比较热门的专业之一。生物信息学(Bioinformatics)是一门交叉科学,它包含了生物信息的获取、加工、存储、分配、分析、解释等在内的所有方面,它综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量生物数据所包含的生物学意义。 它随1990年人类基因组计划(HGP)的实施和信息技术的发展而诞生,现已迅速发展成为当今生命科学最具吸引力和重大的前沿领域,为生物学、计算机科学、数学、信息科学等专业的高素质人才提供了更广阔的发展天地。 生物信息学专业培养德、智、体、美全面发展,具有较好的分子生物学、计算机科学与技术、数学和统计学素养,掌握生物信息学基本理论和方法,具备生物信息收集、分析、挖掘、利用等方面的基本能力,能在科研机构、高等学校、医疗医药、环境保护等相关部门与行业从事教学、科研、管理、疾病分子诊断、药物设计、生物软件开发、环境微生物监测等工作的高级科学技术人才。 学生主要学习生物信息学的基本理论和方法,受到相关科学实验和科学思维

的基本训练,具有较好的分子生物学、计算机科学与技术、数学和统计学素养,具备生物信息的收集、分析、挖掘、利用等方面的基本能力,具有较好的业务素质。 就业前景 发展前景 生物信息(Bioinformatics)是典型的新兴交叉学科。从这个词的字面上便可以对其涵盖的领域略知一二:那就是生物学加上信息学。 布朗大学计算机科学系教授索林·伊斯特雷尔(Prof. Sorin Istrail)是这所“常青藤”名校计算分子生物学中心(Center for Computational Molecular Biology)的主任。他说,这个学科涉及范围广泛,该中心便整合了布朗大学两个生物科系、数学系和计算机科学系的资源。伊斯特雷尔教授这样描述生物信息工程师的工作。 “生物信息工程师需要有计算机、生物、生化、物理、数学等各方面的技能。所以说,它是个跨学科领域。它还涉及所谓的‘干实验室’(dry labs),例如思维方式实验室、网络实验室等。因此这个工作要求对生物和计算机都有基本了解。” 几乎所有的生物信息工程师职位都需要有高等教育背景。很多时候,仅有本科学历已经不够用了,入门学位都得是硕士。 不过,鉴于这个领域相当不错的就业前景和不俗的薪资水平,在这方面的教育投入还是值得的。 由于生物信息工程师侧重领域不同,薪水也略有差别:例如,搞科研的微生物学家薪水在每年4万到10万美元间;生物统计方面的年薪为7万到11万美元;分子建模师和生物信息软件开发师每年可以赚到6万到10万美元。

生物信息学现状与展望

研究生课程考试卷 学号、姓名: j20112001 苗天锦 年级、专业:2011生物化学与分子生物学 培养层次:硕士 课程名称:生物信息学 授课学时学分: 32学时 2学分 考试成绩: 授课或主讲教师签字:

生物信息学现状与展望 摘要:生物信息学是一门新兴学科,起步于20世纪90年代,至今已进入"后基因组时代",本文对生物信息学的产生背景及其研究现状等方面进行了综述,并展望生物信息学的发展前景。生物信息学的发展在国内、外基本上都处在起步阶段。 关键词:生物信息学;生物信息学背景;发展前景 一、生物信息学概述 1.生物信息学发展历史 随着生物科学技术的迅猛发展,生物信息数据资源的增长呈现爆炸之势,同时计算机运算能力的提高和国际互联网络的发展使得对大规模数据的贮存、处理和传输成为可能,为了快捷方便地对已知生物学信息进行科学的组织、有效的管理和进一步分析利用,一门由生命科学和信息科学等多学科相结合特别是由分子生物学与计算机信息处理技术紧密结合而形成的交叉学科——生物信息学(Bioinformatics)应运而生,并大大推动了相关研究的开展, 被誉为“解读生命天书的慧眼”【1】。 研究生物细胞的生物大分子的结构与功能很早就已经开始,1866年孟德尔从实验上提出了假设:基因是以生物成分存在。1944年Chargaff发现了著名的Chargaff规律,即DNA中鸟嘌呤的量与胞嘧定的量总是相等,腺嘌呤与胸腺嘧啶的量相等。与此同时,Wilkins与Franklin用X射线衍射技术测定了DNA纤维的结构。1953年James Watson 和FrancisCrick在Nature杂志上推测出DNA 的三维结构(双螺旋)。Kornberg于1956年从大肠杆菌(E.coli)中分离出DNA 聚合酶I(DNA polymerase I),能使4种dNTP连接成DNA。Meselson与Stahl (1958)用实验方法证明了DNA复制是一种半保留复制。Crick于1954年提出了遗传信息传递的规律,DNA是合成RNA的模板,RNA又是合成蛋白质的模板,称之为中心法则(Central dogma),这一中心法则对以后分子生物学和生物信息学的发展都起到了极其重要的指导作用。经过Nirenberg和Matthai(1963)的努力研究,编码20氨基酸的遗传密码得到了破译。限制性内切酶的发现和重组DNA的克隆(clone)奠定了基因工程的技术基础【2】。自1990年美国启动人类基因组计划以来,人与模式生物基因组的测序工作进展极为迅速。迄今已完成了约40多种生物的全基因组测序工作,人基因组约3x109碱基对的测序工作也接近完成。至2000年6月26日,被誉为生命“阿波罗计划”的人类基因组计划终于完成了工作草图,预示着完成人类基因组计划已经指日可待。生物信息学已成为整个生命科学发展的重要组成部分,成为生命科学研究的前沿。 2.生物信息学研究方向 2.1 序列比对

最新生物信息学考试复习

——古A.名词解释 1. 生物信息学:广义是指从事对基因组研究相关的生物信息的获取,加工,储存,分配,分析和解释。狭义是指综合应用信息科学,数学理论,方法和技术,管理、分析和利用生物分子数据的科学。 2. 基因芯片:将大量已知或未知序列的DNA片段点在固相载体上,通过物理吸附达到固定化(cDNA芯片),也可以在固相表面直接化学合成,得到寡聚核苷酸芯片。再将待研究的样品与芯片杂交,经过计算机扫描和数据处理,进行定性定量的分析。可以反映大量基因在不同组织或同一组织不同发育时期或不同生理条件下的表达调控情况。 3. NCBI:National Center for Biotechnology Information.是隶属于美国国立医学图书馆(NLM)的综合性数据库,提供生物信息学方面的研究和服务。 4. EMBL:European Molecular Biology Laboratory.EBI为其一部分,是综合性数据库,提供生物信息学方面的研究和服务。 5. 简并引物:PCR引物的某一碱基位置有多种可能的多种引物的混合体。 6. 序列比对:为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。

7. BLAST:Basic Local Alignment Search Tool.是通过比对(alignment)在数据库中寻找和查询序列(query)相似度很高的序列的工具。 8. ORF:Open Reading Frame.由起始密码子开始,到终止密码子结束可以翻译成蛋白质的核酸序列,一个未知的基因,理论上具有6个ORF。 9. 启动子:是RNA聚合酶识别、结合并开始转录所必须的一段DNA序列。原核生物启动子由上游调控元件和核心启动子组成,核心启动子包括-35区(Sextama box)TTGACA,-10区(Pribnow Box)TATAAT,以及+1区。真核生物启动子包括远上游序列和启动子基本元件构成,启动子基本元件包括启动子上游元件(GC岛,CAAT盒),核心启动子(TATA Box,+1区帽子位点)组成。 10. motif:模体,基序,是序列中局部的保守区域,或者是一组序列中共有的一小段序列模式。 11. 分子进化树:通过比较生物大分子序列的差异的数值重建的进化树。 12. 相似性:序列比对过程中用来描述检测序列和目标序列之间相似DNA碱基或氨基酸残基序列所占的比例。 13. 同源性:两个基因或蛋白质序列具有共同祖先的结论。

2019版国科大生物信息学期末考试复习题

中科院生物信息学期末考试复习题 陈润生老师部分: 1.什么是生物信息学,如何理解其含义?为什么在大规模测序研究中,生物信息学至关重要? 答:生物信息学有三个方面的含义: 1)生物信息学是一个学科领域,包含着基因组信息的获取、处理、存储、分配、分析和 解释的所有方面,是基因组研究不可分割的部分。 2)生物信息学是把基因组DNA序列信息分析作为源头,破译隐藏在DNA序列中的遗传语 言,特别是非编码区的实质;同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测;其本质是识别基因信号。 3)生物信息学的研究目标是揭示“基因组信息结构的复杂性及遗传语言的根本规律”。它 是当今自然科学和技术科学领域中“基因组、“信息结构”和“复杂性”这三个重大科学问题的有机结合。 2.如何利用数据库信息发现新基因,其算法本质是什么? 答:利用数据库资源发现新基因,根据数据源不同,可分2种不同的查找方式: 1)从大规模基因组测序得到的数据出发,经过基因识别发现新基因: (利用统计,神经网络,分维,复杂度,密码学,HMM,多序列比对等方法识别特殊序列,预测新ORF。但因为基因组中编码区少,所以关键是“数据识别”问题。)利用大规模拼接好的基因组,使用不同数据方法,进行标识查找,并将找到的可能的新基因同数据库中已有的基因对比,从而确定是否为新基因。可分为:①基于信号,如剪切位点、序列中的启动子与终止子等。②基于组分,即基因家族、特殊序列间比较,Complexity analysis,Neural Network 2)利用EST数据库发现新基因和新SNPs: (归属于同一基因的EST片断一定有overlapping,通过alignment可组装成一完整的基因,但EST片断太小,不存在数据来源,主要是拼接问题) 数据来源于大量的序列小片段,EST较短,故关键在正确拼接。方法有基因组序列比对、拼接、组装法等。经常采用SiClone策略。其主要步骤有:构建数据库;将序列纯化格式标准化;从种子库中取序列和大库序列比对;延长种子序列,至不能再延长;放入contig库①构建若干数据库:总的纯化的EST数据库,种子数据库,载体数据库,杂质、引物数据库,蛋白数据库,cDNA数据库; ②用所用种子数据库和杂质、引物数据库及载体数据库比对,去除杂质; ③用种子和纯化的EST数据库比对 ④用经过一次比对得到的长的片段和蛋白数据库、cDNA数据库比较,判断是否为已有序列,再利用该大片段与纯化的EST数据库比对,重复以上步骤,直到序列不能再延伸; ⑤判断是否为全长cDNA序列。 (利用EST数据库:原理:当测序获得一条EST序列时,它来自哪一个基因的哪个区域是未知的(随机的),所以属于同一个基因的不同EST序列之间常有交叠的区域。根据这种“交叠”现象,就能找出属于同一个基因的所有EST序列,进而将它们拼接成和完整基因相对应的全长cDNA序列。而到目前为止,公共EST数据库(dbEST)中已经收集到约800万条的人的EST序列。估计这些序列已覆盖了人类全部基因的95%以上,平均起来每个基因有10倍以上的覆盖率。)

最新生物信息学学习心得

生物信息学学习心得 第一篇:生物信息学 生物信息学是上世纪90年代初人类基因组计划(hgp)依赖,随着基因组学、蛋白组学等新兴学科的建立,逐渐发展起来的生物学、数学和计算机信息科学的一门交叉应用学科。目前生物信息学的研究领域主要包括基于生物序列数据的整理和注释、生物信息挖掘工具开发及利用这些工具揭示生物学基础理论知识等领域。生物信息学作为新型交叉应用学科,可以依托本校已有的计算机科学、信息学、生物学和数学等学科优势,充分展现投入少、见效快、起点高的特色,推动学校学科建设和本科教学水平。 本实验指导书中的8个实验均设计为综合性开发实验,面向生物信息学院全体本科学生和研究生,以及全校对生物信息学感兴趣的其他专业学生开放。生物信息学实验室将提供系统的保障,包括采用mail服务器和linux帐号管理等进行实验过程管理和支持。限选《生物信息学及实验》的生物技术专业本科生至少选择其中5个实验,并不少于8个学时,即为课程要求的0.5个学分。其他选修者按照课时和学校相关规定计算创新学分。实验一熟悉生物信息学网站及其数据的生物学意义 实验目的:

培养学生利用互联网资源获取生物信息学研究前沿和相关数据的能力,熟悉生物信息学相关的一些重要国内外网站,及其核酸序列、蛋白质序列及代谢途径等功能相关数据库,学会下载生物相关的信息数据,了解不同的数据文件格式和其中重要的生物学意义。 实验原理: 利用互联网资源检索相关的国内外生物信息学相关网站,如:ncbi、sanger、tigr、kegg、sble、中科院北京基因组研究所、北大生物信息 学中心等,下载其中相关的数据,如fasta、genbank格式的核算和蛋白质序列、pathatdb格式化库文件,并输入blast命令进行计算,获得结果文件。 实验内容: 1. 向网上blast服务器提交序列,得到匹配结果; 2. 本地使用blast,格式化库文件,输入命令行得到匹配结果;

新版南开大学生物信息学考研经验考研参考书考研真题

考研真的是一件考研耐力和意志力的事情,需要你不断坚持和努力才能获得成功,所以你必须要想清楚自己为什么要考研,这一点非常重要,因为只有确认好坚定的动机,才能让你在最后冲刺阶段时能够坚持下来。 如果你只是看到自己周围的人都在考研而决定的考研,自己只是随波逐流没有坚定的信心,那么非常容易在中途就放弃掉了,而且现在考研非常火热,这就意味着竞争也会非常激烈,而且调剂的机会都会非常难得,所以备考时的压力也会比较大,所以大家一定要调整好心态,既不能压力太大,也不能懈怠。 虽关于择校问题是非常重要的,个人建议一定要趁早,因为即使同一专业,不同学校的考试科目也未必完全一致。 如果同学们一时之间不知道选择那所学校,千万不要把过度的精力浪费在这上面,因为,备考复习工作是一天都不能丢的,所以在未定学校之前千万要保持学习进度。因为考试内容都是一样的,大家可以筛选一些目标院校,有了一个大致方向,现阶段自己的不会过于慌乱,不会整天胡思乱想。 介于考研方面有太多的问题要讲,所以这篇文章便是我的种种干货和经验的整理,篇幅会比较长,希望大家耐心看完后会有所帮助,结尾处附赠我的学习资料。 南开大学生物信息学的初试科目为: (101)思想政治理论和(201)英语一 (712)数学分析和(837)高等代数 参考书目为: 1.《数学分析》(陈传璋等编)高等教育出版社第三版

2.《高等代数》北大王萼芳第四版 先聊聊英语 单词部分:我个人认为不背的单词再怎么看视频也没用,背单词没捷径。你想又懒又快捷的提升单词量,没门。(仅供个人选择)我建议用木糖英语单词闪电版,一天200个,用艾宾浩斯曲线一个月能记完,每天记单词需要1小时(还是蛮痛苦的,但总比看真题时啥也看不懂要舒服多)。好处在于是剔除了初高中的简单词,只剩下考研的必考词,能迅速让你上手真题。背单词要一直从3-4月份持续到考研前几天,第一遍记完必须要在暑假前。 阅读完形部分:木糖英语真题手译就挺好用的,不需要做真题以外的任何阅读题。因为真题就是最贴近实战的练习题了,还记得近十年的真题我是刷了大概有四五遍。 不过,我建议从05年的开始抠真题,需要一个单词都不放过,因为考研英语的试卷有80%的单词,去年的卷子重复过。抠真题需要每句都看懂,每个单词都会。尽量在暑假前结束抠题的过程这决定你英语能否考70+,最迟到暑假结束(尽量别这么干,这会拖其他科目的节奏),因为需要大量时间,前期抠真题,一套得一整天。这是为了不让看不懂卡你的阅读,但阅读拿分重要的是逻辑结构,就算看懂了也不一定能做对。在抠完第一遍后,必看木糖的课和木糖的课或者方法。今年的找不到就去找去年的。里面有超级多做题的逻辑,教你提高正确率。然后再做真题,用木糖英语教的方法。最迟10月份搞定。 若你这个时候已经完成这些项目就完全可以三刷了,重点看你为什么会做错,同时要严格用考试要求对待自己。新题型:还是木糖的课,只要阅读好,新题型一般没问题,主要还是,做题方法和套路,找好逻辑关系。

国内外生物信息学发展状况

国内外生物信息学发展状况 1.国外生物信息发展状况 国外非常重视生物信息学的发展各种专业研究机构和公司如雨后春笋般涌现出来,生物科技公司和制药工业内部的生物 信息学部门的数量也与日俱增。美国早在1988年在国会的支持 下就成立了国家生物技术信息中心(NCBI),其目的是进行计 算分子生物学的基础研究,构建和散布分子生物学数据库;欧 洲于1993年3月就着手建立欧洲生物信息学研究所(EBI), 日本也于1995年4月组建了信息生物学中心(CIB)。目前, 绝大部分的核酸和蛋白质数据库由美国、欧洲和日本的3家数 据库系统产生,他们共同组成了 DDBJ/EMBL/Gen Bank国际核 酸序列数据库,每天交换数据,同步更新。以西欧各国为主的 欧洲分子生物学网络组织(EuropeanMolecular Biology Network, EMB Net)是目前国际最大的分子生物信息研究、开 发和服务机构,通过计算机网络使英、德法、瑞士等国生物信 息资源实现共享。在共享网络资源的同时,他们又分别建有自 己的生物信息学机构、二级或更高级的具有各自特色的专业数 据库以及自己的分析技术,服务于本国生物(医学)研究和开 发,有些服务也开放于全世界。 从专业出版业来看,1970年,出现了《Computer Methods and Programs in Biomedicine》这本期刊;到1985年4月, 就有了第一种生物信息学专业期刊《Computer Application

in the Biosciences》。现在,我们可以看到的专业期刊已经很多了。 2 国内生物信息学发展状况 我国生物信息学研究近年来发展较快,相继成立了北京大学生物信息学中心、华大基因组信息学研究中心、中国科学院上海生命科学院生物信息中心,部分高校已经或准备开设生物信息学专业。2002年国家自然科学基金委在生物化学、生物物理学与生物医学工程学学科设立了生物信息学项目,并列入生命科学部优先资助的研究项目。国家 863计划特别设立了生物信息技术主题,从国家需求的层面上推动我国生物信息技术的大力发展[3]。 但是由于起步较晚及诸多原因,我国的生物信息学发展水平远远落后于国外。在PubMed收录的以关键词“Bioinformatics”检索到的历年发表的文章数,可以看出大量的研究文献出现在21世纪以后。其中我国共有138篇占全部5548篇的2.5%,而美国则发表2160篇占全部的39%之多(统计数据截至2004年2月15日)。我国学者在生物信息学领域发表的有高影响力的论文只有不到美国学者发表数量的6%,差距相当大[4]。在生物信息学领域,一些著名院士和教授在各自领域取得了一定成绩,显露出蓬勃发展的势头,有的在国际上还占有一席之地。如北京大学的罗静初和顾孝诚教授在生物信息学网站建设方面、中科院生物物理所的陈润生研究员在EST

生物信息学专业硕士学位培养方案

北京大学生物信息学跨学科硕士研究生培养方案 (试行) 一、培养目标 1. 较好地掌握马克思主义、毛泽东思想和邓小平理论,拥护党的基本路线,热爱祖国,遵纪守法,学风严谨,品行端正,有较强的事业心和献身科学的精神,积极为国家现代化建设服务; 2. 掌握一门外国语,具有坚实宽广的与生物信息学跨学科研究相关的生物学以及计算机与信息科学方面的理论基础; 3. 在生物信息学跨学科研究的某一领域掌握较系统的专门知识、技术与方法,能够运用所掌握的基础理论与专门知识解决科学研究或实际工作中的问题,具有从事教学与科学研究工作和其他实际工作的能力。 二、研究方向与指导教师(暂略) 三、招生、入学考试和学习年限 1. 招生对象 生物学、数学、化学、物理学、计算机与信息工程科学类大学本科毕业生或同等学力者,以及具备较好相关知识背景的其它学科的大学本科毕业生。 2. 入学考试 参加全国研究生招生统一考试。考试科目为政治理论课(理)、外语、专业基础课和专业课(专业基础课和专业课考试科目,包括生物学、数学、计算机科学与技术、物理学、化学等相关学科的课程,可根据报考者的学历背景及其报考导师的专业领域等情况进行选择)。 3.学习年限 三年 四、课程设置 生物信息学跨学科研究方向硕士研究生课程设置包括以下四个部分: (一)公共必修课 (1)科学技术哲学与政治理论课 (2)第一外国语 (二)专业必修课(核心课程) 概率论与数理统计 数据库概论 普通生物学 生物信息学概论 生物化学与分子生物学 遗传学与细胞生物学 生物信息学研究中的数学方法 (三)讨论班与前沿讲座课(必修课) 生物信息学跨学科研究方向硕士研究生须参加讨论班与前沿讲座课程的学

中国科学院大学生物信息学期末考试资料,陈润生老师

生物信息学期末考试复习 1.生物学中的7个数学故事 (1) 孟德尔遗传定律(分离和自由组合定律)运用了组、合原理中的加法原理和乘法原理。 (2) Hardy-Weinberg遗传平衡定律通过构造数学关系式来证明。 (3)基因在染色体上的线性排列采用概率分布优化距离的计算距离,使其更接近真实情况。 (4)关联分析通过假设检验看两个特征的关联有无统计显著性。 (5) 序列比对设计合适的算法可以有效降低计算复杂度。 (6)基因组学和其他的组学组学时代产生的大量数据需要依赖数据库技术来寻找生物分子之间的关联。 (7)微阵列芯片大规模芯片数据需要数据挖掘:聚类、关联、预测建模、异常检测。 2. DNA、protein、RNA序列比对及其算法 序列比对:为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。常用的方法有:点阵法,动态规划算法,k-tup 算法等。 (1)dotplot算法:通过点阵作图的方法表示,能很直观地氨基酸序列或核苷酸序列上的插入、删除、重复和反相重复。 算法步骤:将两条序列的碱基(或残基)分别沿x轴和y轴排列,依次比较两条序列的每个碱基(或残基),如果两个碱基(或残基)相同则在矩阵中填充点,这样就形成一个点矩阵。在点矩阵中,将对角线上的点连接起来,这些直线所对应的矩形区域就是这两条序列的相似性片段。 算法特点:该算法相似性片段实际上是相同的片段;而且不能提供相似性片段在统计学意义上的相似性。 (2)动态规划算法:分为全局动态规划算法和局部动态规划算法。保证了指定打分模型的情况下,两条序列能获得尽可能的最高分 算法步骤:①初始化序列矩阵;②将序列输入矩阵,计算分数并绘制箭头;③用箭头回溯找到最优得分路径;④连接最优路径,产生序列比对。 动态规划算法优缺点: 优点:对于一个给定的计分函数集合,能找到最优的比对 缺点:时间复杂度为O(n 2),运行慢,计算所需的内存与序列长度的平方成正比,因此不适用于非常长序列的比对。 序列比对的定义,存在哪几种算法,打分矩阵是什么意思 序列比对:为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列; 算法种类:动态规划算法、Smith-Waterman Alterations算法、FASTA - Hi Level Algorithm 算法、BLAST – Heuristic算法; 打分矩阵:通过点矩阵对序列比对进行积分,根据不同物质情况可分为DNA序列打分矩阵:等价矩阵、转换-颠换矩阵、blast矩阵;蛋白质打分矩阵:等价矩阵、遗传密码矩阵、疏水性矩阵、PAM矩阵、BLOSUM矩阵。 1.动态规划算法,给个表格可以把数字填出:

中科院生物信息学题目整理

生物信息学题目整理: 陈润生: 一、什么是生物信息学?你怎么理解它的含义? Genome informatics is a scientific discipline that encompasses all aspects of genome information acquisition, processing, storage, distribution, analysis, and interpretation. 1、生物信息学是一个学科领域,包含着基因组信息的获取、处理、存储、分配、分析和解释的所有方面。 2、生物信息学是把基因组DNA序列信息分析作为源头,破译隐藏在DNA序列中的遗传语言,特别是非编码区的实质;同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测;其本质是识别基因信号。 3、生物信息学的研究目标是揭示“基因组信息结构的复杂性及遗传语言的根本规律”。它是当今自然科学和技术科学领域中“基因组、“信息结构”和“复杂性”这三个重大科学问题的有机结合。 对生物信息学理解的实例:怎样从新测得的DNA序列中找到编码区?非编码区与编码区的差别是什么?非编码区有什么具体功能?RNAi现象对于细胞来说有着很重要的意义,包括基因表达的调控等等,那么都有哪些具体机制可以诱导正常细胞产生RNAi现象?SARS病毒的比较基因组研究;治疗SARS的RNAi设计;SARS蛋白的结构预测和模拟。 怎么理解: 生物信息学是把基因组DNA序列信息分析作为源头,找到基因组序列中代表蛋白质和RNA 基因的编码区;同时,阐明基因组中大量存在的非编码区的信息实质,破译隐藏在DNA序列中的遗传语言规律;在此基础上,归纳、整理与基因组遗传信息释放及其调控相关的转录谱和蛋白谱数据,从而认识代谢、发育、分化、进化的规律。 其还利用基因组中编码区信息进行蛋白空间结构模拟和蛋白功能预测,并将此类信息与生物体和生命过程的生理生化信息结合,阐明其分子机理,最终进行蛋白、核酸分子设计、药物设计、个体化医疗保健设计。 二、发现新基因的两种方法是什么?算法的本质是? 大部分新基因是靠理论方法预测出来的。 1、利用NCBI中EST( Expression Sequence Tag) 数据库(dbEST) 发现新基因和新SNPs。 国际上现已出现了几个基于EST的基因索引如UniGene, Merck-Gene, GenExpress-index 数据来源于大量的序列小片段,EST较短,故关键在正确拼接。方法有基因组序列比对、拼接、组装法等。经常采用SiClone策略 主要步骤:构建数据库;将序列纯化格式标准化;从种子库中取序列和大库序列比对;延长种子序列,至不能再延长;放入contig库 (1)构建若干数据库:总的纯化的EST数据库、种子数据库、载体数据库、杂质、引物数据库、蛋白数据库、cDNA数据库; (2)用所用种子数据库和杂质、引物数据库及载体数据库比对,去除杂质; (3)用种子和纯化的EST数据库比对; (4)用经过一次比对得到的长的片段和蛋白数据库、cDNA数据库比较,判断是否为已有序列,再利用该大片段与纯化的EST数据库比对。重复以上步骤,直到序列不能再延伸;(5)判断是否为全长cDNA序列。 2、从大规模基因组测序得到的数据出发,经过基因识别发现新基因:利用大规模拼接好的基因组,使用不同数据方法,进行标识查找,并将找到的可能的新基因同数据库中已有的基因比对,从而确定是否为新基因。

中科院生物信息学期末考试复习题

中科院生物信息学期末考试复习题 润生老师部分: 1.什么是生物信息学,如何理解其含义?为什么在大规模测序研究中,生物信息学至关重要? 答:生物信息学有三个方面的含义: 1)生物信息学是一个学科领域,包含着基因组信息的获取、处理、存储、分配、分析和 解释的所有方面,是基因组研究不可分割的部分。 2)生物信息学是把基因组DNA序列信息分析作为源头,破译隐藏在DNA序列中的遗传语言, 特别是非编码区的实质;同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测;其本质是识别基因信号。 3)生物信息学的研究目标是揭示“基因组信息结构的复杂性及遗传语言的根本规律”。它 是当今自然科学和技术科学领域中“基因组、“信息结构”和“复杂性”这三个重大科学问题的有机结合。 生物信息学是把基因组DNA序列信息分析作为源头,找到基因组序列中代表蛋白质和RNA 基因的编码区;同时阐明基因组量存在的非编码区的信息实质,破译隐藏在DNA序列中的遗传语言规律:在此基础上,归纳、整理与基因组遗传信息释放及其调控相关的转录谱和蛋白谱数据,从而认识代、发育、分化、进化的规律。同时在发现了新基因信息之后,其还利用基因组中编码区信息进行蛋白空间结构模拟和蛋白功能预测,并将此类信息与生物体和生命过程中的生理生化信息结合,阐明其分子机制,最终进行蛋白、核酸分子设计、药物设计、个体化医疗保健设计。 2.如何利用数据库信息发现新基因,基本原理? 答:利用数据库资源发现新基因,根据数据源不同,可分2种不同的查找方式: 1)从大规模基因组测序得到的数据出发,经过基因识别发现新基因: (利用统计,神经网络,分维,复杂度,密码学,HMM,多序列比对等方法识别特殊序列,预测新ORF。但因为基因组中编码区少,所以关键是“数据识别”问题。)利用大规模拼接好的基因组,使用不同数据方法,进行标识查找,并将找到的可能的新基因同数据库中已有的基因对比,从而确定是否为新基因。可分为:①基于信号,如剪切位点、序列中的启动子与终止子等。②基于组分,即基因家族、特殊序列间比较,Complexity analysis,Neural Network 2)利用EST数据库发现新基因和新SNPs: (归属于同一基因的EST片断一定有overlapping,通过alignment可组装成一完整的基因,但EST片断太小,不存在数据来源,主要是拼接问题) 数据来源于大量的序列小片段,EST较短,故关键在正确拼接。方法有基因组序列比对、拼接、组装法等。经常采用SiClone策略。其主要步骤有:构建数据库;将序列纯化格式标准化;从种子库中取序列和大库序列比对;延长种子序列,至不能再延长;放入contig库①构建若干数据库:总的纯化的EST数据库,种子数据库,载体数据库,杂质、引物数据库,蛋白数据库,cDNA数据库; ②用所用种子数据库和杂质、引物数据库及载体数据库比对,去除杂质; ③用种子和纯化的EST数据库比对 ④用经过一次比对得到的长的片段和蛋白数据库、cDNA数据库比较,判断是否为已有序列,再利用该大片段与纯化的EST数据库比对,重复以上步骤,直到序列不能再延伸; ⑤判断是否为全长cDNA序列。

《生物信息学》试卷(B)

武汉大学2007—2008学年度 高校教师研修班 《生物信息学》试卷(B)及答案 一、翻译下列名词并解释。 (每题5分,共25分) 1. HGP 2. SRS 3. Markov Chain 4. ANN 5. CDS 二、填空(每空2分,共20分) 1、生物信息学主要研究的两种信息载体是和。 2、目前国际上主要的核酸数据库是由建立和维护的、由维护的,和日本遗传研究所建立和维护的。每个机构负责收集来自不同地理分布的数据, 3 个数据库所有信息并向世界开放, 3、在进行序列两两比对时,有两方面问题直接影响相似性分值:和。 三、解释说明:请按要求对下列GenBank文件作解释说明。(每小题4分,共20分) 1、LOCUS行中的第3项mRNA linear表示,这里是。 2、DEFINITION行在GenBank记录中用以 3 ACCESSION 是,是从数据库中检索一个记录的主要。 4. FEATURES后面部分是,直接表达了记录的生物背景知识, 5 CDS 30…533 表示。 四、问答。(共35分) 1、DNA测序有哪些方法?其基本原理是什么?(10分) 2、简述蛋白质结构预测的基本思想和方法。(10分) 3、试述人类基因组计划与生物信息学的关系。(15分)

《生物信息学》试卷(B)答案 一、翻译下列名词并解释。 (每题5分,共25分) 1. HGP Human genome project人类基因组计划 2. SRS Sequence Retrieval System 序列检索系统 3. 马尔科夫链(Markov Chain),对于生物分子序列分析,马尔科夫链是一个很好的数学统计模型,因为马尔科夫链本身就是相继发生事件的序列,其特征是对于事件序列中的任何一个事件都有一个发生概率,而这个概率依赖于该事件之前的若干个事件。 4. ANN Artificial Neural Network, 人工神经网络 5. CDS指的是编码序列,从起始密码子到终止密码子 二、填空(每空2分,共20分) 1、生物信息学主要研究的两种信息载体是DNA分子和蛋白质分子 2、目前国际上主要的核酸数据库是由美国国立生物技术信息中心建立和维护的Genbank库、由欧洲生物信息学研究所(EBI)维护的EMBL-Bank,和日本遗传研究所建立和维护的日本DNA 数据仓库(DDBJ)。每个机构负责收集来自不同地理分布的数据, 3 个数据库共同享有所有信息并向世界开放, 3、在进行序列两两比对时,有两方面问题直接影响相似性分值:取代矩阵和空位罚分。 三、解释说明:请按要求对下列GenBank文件作解释说明。(每小题4分,共20分) 1、LOCUS行中的第3项mRNA linear表示生物分子的类型,这里是单链的mRNA。 2、DEFINITION行在GenBank记录中用以总结记录的生物意义 3 ACCESSION 是检索号,是从数据库中检索一个记录的主要关键词。 4. FEATURES后面部分是特性表,直接表达了记录的生物背景知识, 5 CDS 30…533 表示编码序列是从序列的第30个核苷酸到第533个核苷酸的连续序列 四、问答。(共35分) 1.DNA测序有哪些方法?其基本原理是什么?(10分) 答:①链终止法测序.基本原理: 通过合成与单链DNA互补的多核苷酸链,由于合成的互补链可在不同位置随机终止反应,产生只差一个核苷酸的DNA分子,从而来读取待测DNA分子的顺序. ②Maxam Gilbert DNA化学降解法,基本原理:在选定的核苷酸碱基中引入化学集团,再用化合物处理,使DNA分子在被修饰的位置降解.

生物信息学考试

2010级硕士研究生生物信息学考试试题 专业:生物化学与分子生学学号:姓名: 1、经实验从某生物个体中获得一段cDNA序列,测序结果如下: TCACGCGTCGAATCGCGCGGCGACTCGATGAAATGGCCCGCGACGACGTCCCAATCCGCTTCCGCGCG CAGATCGGTGGTCTGCGCGGGCCAATGCTCGCGCGCTCGCGCGACGAACGCGGTGCGATAGGCCCAGC GCCGCGCGGGCAGGAGGTCGCCGTTGTGCGCGGCGACGAGGACACCCTCA TCCGGACGCAGCGCGAG GA TA TCGGCCGTGCGCAGGTACGCTTCGGGCGTCGGCTTGTACGCCTGCGCCACCGTCGCGCCGAGGAT CGCGTCCCACGGCAGCCAACGGCGCTTGGCCA TGTCGA TCA TCAGGATCACGTTGCCGTTCGACAGCG GCGCGA TGA TGTAATGCGCCTTCAGCCGCGTGAGCCCCGCGACCGAATCGGGCCACGGATCGAGCCGG TGCCATGCGGGTATCAGCGCGTCGAGA TCGGCGTCGGCCACGCTCGTGCGA TCGATGCCGAACGCGGG CAGCAGCGCGTCGAGA TTCTCCCGATGCAGAAGGTCGAGCCGCGTGAACGGCCGGCGGCCGCTGATGC CCTCCTCCA TCGCGGGCGAA TAGCCCGCGCGCCACGCATCCGCGAACGCGGCCGGATCGGCTCCCGCG CCGCCGTACTTCGCGAGGAACGGCGTCGCGTCGCGAATGACGCCGGAACGCCAGTCGACCACGGTGC CGAACACGTCGAATACCAA TGCCTTCACGCCAAGCGTCTGCA T 请应用生物信息学的原理和方法解析以下几个问题: (1)对该基因序列的特征进行分析,如碱基组成、限制性内切酶EcoRV和PleI酶切位点等; 利用BioEdit软件,打开题目所给的RNA序列,选中序列后依次点击Sequence→Nuclei Acid→Nucleotide Composition 碱基组成: DNA molecule: 序列1 Length = 722 base pairs Molecular Weight = 221052.00 Daltons, single stranded Molecular Weight = 441319.00 Daltons, double stranded G+C content = 69.39% A+T content = 30.61% Nucleotide Number Mol% A 119 16.48 C 255 35.32 G 246 34.07 T 102 14.13

生物信息学考试复习

——古 A.名词解释 1. 生物信息学:广义是指从事对基因组研究相关的生物信息的获取,加工,储存,分配,分析和解释。狭义是指综合应用信息科学,数学理论,方法和技术,管理、分析和利用生物分子数据的科学。 2. 基因芯片:将大量已知或未知序列的DNA片段点在固相载体上,通过物理吸附达到固定化(cDNA芯片),也可以在固相表面直接化学合成,得到寡聚核苷酸芯片。再将待研究的样品与芯片杂交,经过计算机扫描和数据处理,进行定性定量的分析。可以反映大量基因在不同组织或同一组织不同发育时期或不同生理条件下的表达调控情况。 3. NCBI:National Center for Biotechnology Information.是隶属于美国国立医学图书馆(NLM)的综合性数据库,提供生物信息学方面的研究和服务。 4. EMBL:European Molecular Biology Laboratory.EBI为其一部分,是综合性数据库,提供生物信息学方面的研究和服务。 5. 简并引物:PCR引物的某一碱基位置有多种可能的多种引物的混合体。 6. 序列比对:为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。

7. BLAST:Basic Local Alignment Search Tool.是通过比对(alignment)在数据库中寻找和查询序列(query)相似度很高的序列的工具。 8. ORF:Open Reading Frame.由起始密码子开始,到终止密码子结束可以翻译成蛋白质的核酸序列,一个未知的基因,理论上具有6个ORF。 9. 启动子:是RNA聚合酶识别、结合并开始转录所必须的一段DNA序列。原核生物启动子由上游调控元件和核心启动子组成,核心启动子包括-35区(Sextama box)TTGACA,-10区(Pribnow Box)TATAAT,以及+1区。真核生物启动子包括远上游序列和启动子基本元件构成,启动子基本元件包括启动子上游元件(GC岛,CAAT盒),核心启动子(TATA Box,+1区帽子位点)组成。 10. motif:模体,基序,是序列中局部的保守区域,或者是一组序列中共有的一小段序列模式。 11. 分子进化树:通过比较生物大分子序列的差异的数值重建的进化树。 12. 相似性:序列比对过程中用来描述检测序列和目标序列之间相似DNA碱基或氨基酸残基序列所占的比例。 同源性:两个基因或蛋白质序列具有共同祖先的结论。13.

生物信息学简答题讲解学习

生物信息学简答题

1. 生物分子至少携带着三种信息 遗传信息功能相关的结构信息进化信息 2. 生物信息学的目标和任务 收集和管理生物分子数据 数据分析和挖掘 开发分析工具和实用软件 3. 生物信息学研究意义 认识生物本质 改变生物学的研究方式 在医学上的重要意义 4. 生物信息学与实验生物学的关系 实验生物学(传统生物学or现代生物学):是实验性的;为生物信息学提供相应的数据生物信息学:生物信息的搜集、整理、注释、管理;建立并利用生物信息学数据库;开发生物信息学软件;研究生物信息学算法 生物信息学对实验数据分析与利用的结果,为进一步合理、有效地设计实验方案,研究方向等提供有力的指导和合理的建议。使得新的生物学研究的出发点是理论的 生物信息学分析的结果必须通过生物实验科学来进一步验证 5. 生物信息学主要研究内容 1、生物分子数据的收集与管理 2、数据库搜索及序列比较 3、基因组序列分析

4、基因表达数据的分析与处理 5、蛋白质结构与功能预测 6、代谢途径分析与解析 6. 生物分子数据库应满足: (1)时间性(2)注释(3)支撑数据(4)数据质量(5)集成性(6)非冗余性 7. 一个数据库记录(entry)一般由两部分组成: 1. 原始序列数据 2. 描述这些数据生物学信息的注释 8. FASTA格式 序列分析软件最常用的格式,包括三部分: 在注释行的第一列用字符“>”标识,后面是序列的名字和来源; 标准的单字符标记的序列;序列中没有数字或其他非字符。 可选的“*”表示序列的结束,它可能出现也可能不出现,但它是许多序列分析程序正确读取序列所必须的。 9. SWISS-PROT的三个特点:注释、非冗余、交叉索引 (1)注释 SWISS-PROT数据分为核心数据和注释两大类。 (2)最小冗余尽量将相关的数据归并,降低数据库的冗余程度。如果不同来源的原始数据有矛盾,则在相应序列特征表中加以注释。 (3)与其它数据库的连接:对于每一个登录项,有指向其它数据库的指针10. SWISS-PROT数据的来源: (1)从核酸数据库经过翻译推导而来;(2)从蛋白质数据库PIR挑选出合适的数据;

相关文档
最新文档