2019版国科大生物信息学期末考试复习题
生物信息考试题及答案

生物信息考试题及答案生物信息学是一门结合生物学、计算机科学、信息技术和数学的交叉学科,它利用计算机技术来分析和解释生物数据。
以下是一份生物信息学考试题及答案的示例。
生物信息学考试题一、选择题(每题2分,共20分)1. 生物信息学中,用于存储DNA序列的文件格式是:A. FASTAB. JPEGC. MP3D. DOCX2. 以下哪项不是生物信息学分析的基本步骤?A. 数据收集B. 数据预处理C. 数据解释D. 数据存储3. 在蛋白质序列分析中,BLAST工具用于:A. 序列比对B. 序列组装C. 序列克隆D. 序列合成4. 以下哪个数据库不是用于存储基因表达数据的?A. NCBIB. GEOC. PDBD. ArrayExpress5. 以下哪个算法不是用于基因预测的?A. GeneMarkB. BLASTC. GlimmerD. Fgenesh二、简答题(每题10分,共30分)6. 简述生物信息学在现代生物学研究中的重要性。
7. 解释什么是基因组学,并说明其在医学研究中的应用。
8. 描述序列比对的基本原理及其在生物信息学中的作用。
三、计算题(每题15分,共30分)9. 假设你有一个DNA序列,其组成为:ATCGTA。
请计算其互补序列。
10. 给定两个蛋白质序列,序列A:A-B-C-D-E,序列B:A-C-E-B-D。
请使用Needleman-Wunsch算法计算它们的全局比对得分。
四、论述题(每题20分,共20分)11. 论述生物信息学在新药开发中的作用及其面临的挑战。
答案一、选择题1. A2. C3. A4. C5. B二、简答题6. 生物信息学在现代生物学研究中的重要性体现在它能够处理和分析大量的生物数据,如基因组序列、蛋白质结构等,帮助科学家快速发现生物现象的规律,推动生物学的发展。
7. 基因组学是研究生物基因组的结构、功能和演化的科学。
在医学研究中,基因组学可以帮助我们了解疾病的遗传基础,为个性化医疗提供理论基础。
生物信息学考试试题

生物信息学考试试题生物信息学考试试题:一、选择题1. 以下哪种是常见的生物信息学数据库?A. NCBIB. AmazonC. GoogleD. Instagram2. 下列哪一个不是生物信息学中常见的序列比对软件?A. BLASTB. ClustalWC. PhotoshopD. MUSCLE3. 生物信息学中常用的数据分析工具是?A. Microsoft ExcelB. SPSSC. RD. Adobe Photoshop4. BLAST是用来做什么的?A. 序列比对B. 图像处理C. 文本编辑D. 网页设计5. NCBI是什么机构的缩写?A. National Center for Biotechnology InformationB. National Center for Business IntelligenceC. New York City Bureau of InvestigationD. North Carolina Biological Institute二、填空题1. 生物信息学的研究对象是________。
2. 为了识别蛋白质功能和结构,可以使用________软件进行序列比对。
3. 研究生物信息学常用的数据库之一是________。
4. 生物信息学中的图形工具有助于可视化________。
5. 生物信息学可以帮助人们理解________的基本原理。
三、简答题1. 请解释生物信息学在生物学研究中的重要性。
2. 什么是序列比对?它在生物信息学中有什么作用?3. 请举例说明生物信息学数据库的用途。
四、综合题根据以下序列,请使用BLAST软件进行在线比对,并分析结果:序列1:ATGGCCATAG序列2:ATGCCGATAG序列3:ATGGCTATAG序列4:ATGGTCATAG请写出每个序列与其他序列的比对结果,并解释相似性及差异性。
以上为生物信息学考试试题,希望您认真作答,祝您考试顺利!。
生物信息学复习题已附答案

本卷的答案仅做参考,如有疑问欢迎提出。
后面的补充复习题要靠你们自己整理答案了。
生物信息学复习题一、填空题1、识别基因主要有两个途径即基因组DNA外显子识别和基于EST策略的基因鉴定。
2、表达序列标签是从mRNA 中生成的一些很短的序列(300-500bp),它们代表在特定组织或发育阶段表达的基因。
3、序列比对的基本思想,是找出检测基因和目标序列的相似性,就是通过在序列中插入空位的方法使所比较的序列长度达到一致。
比对的数学模型大体分为两类,分别是整体比对和局部比对。
4、2-DE的基本原理是根据蛋白质等电点和分子量不同,进行两次电泳将之分离。
第一向是等电聚焦分离,第二向是SDS-PAGE分离。
5、蛋白质组研究的三大关键核心技术是双向凝胶电泳技术、质谱鉴定技术、计算机图像数据处理与蛋白质数据库。
二、判断题1、生物体的结构和功能越复杂的种类就越多,所需要的基因也越多,C值越大,这是真核生物基因组的特点之一。
(对)2、CDS一定就是ORF。
(对)3、两者之间有没有共同的祖先,可以通过序列的同源性来确定,如果两个基因或蛋白质有着几乎一样的序列,那么它们高度同源,就具有共同的祖先。
(错)4、STS,是一段200-300bp的特定DNA序列,它的序列已知,并且在基因组中属于单拷贝。
(对)5、非编码DNA是“垃圾DNA”,不具有任何的分析价值,对于细胞没有多大的作用。
(错)6、基因树和物种树同属于系统树,它们之间可以等同。
(错)7、基因的编码序列在DNA分子上是被不编码的序列隔开而不连续排列的。
( 对)8、对任意一个DNA序列,在不知道哪一个碱基代表CDS的起始时,可用6框翻译法,获得6个潜在的蛋白质序列。
(对)9、一个机体只有一个确定的基因组,但基因组内各个基因表达的条件和表达的程度随时间、空间和环境条件而不同。
(对)10、外显子和内含子之间没有绝对的区分,一个基因的内含子可以是另一个基因的外显子,同一个基因在不同的生理状况或生长发育的不同阶段,外显子组成也可以不同。
生物信息学考试复习

——古A.名词解释1. 生物信息学:广义是指从事对基因组研究相关的生物信息的获取,加工,储存,分配,分析和解释。
狭义是指综合应用信息科学,数学理论,方法和技术,管理、分析和利用生物分子数据的科学。
2. 基因芯片:将大量已知或未知序列的DNA 片段点在固相载体上,通过物理吸附达到固定化(cDNA 芯片),也可以在固相表面直接化学合成,得到寡聚核苷酸芯片。
再将待研究的样品与芯片杂交,经过计算机扫描和数据处理,进行定性定量的分析。
可以反映大量基因在不同组织或同一组织不同发育时期或不同生理条件下的表达调控情况。
3. NCBI :National Center for Biotechnology Information. 是隶属于美国国立医学图书馆(NLM )的综合性数据库,提供生物信息学方面的研究和服务。
4. EMBL :European Molecular Biology Laboratory.EBI 为其一部分,是综合性数据库,提供生物信息学方面的研究和服务。
5. 简并引物:PCR 引物的某一碱基位置有多种可能的多种引物的混合体。
6. 序列比对:为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。
7. BLAST :Basic Local Alignment Search Tool. 是通过比对(alignment) 在数据库中寻找和查询序列(query) 相似度很高的序列的工具。
8. ORF :Open Reading Frame. 由起始密码子开始,到终止密码子结束可以翻译成蛋白质的核酸序列,一个未知的基因,理论上具有6 个ORF 。
9. 启动子:是RNA 聚合酶识别、结合并开始转录所必须的一段DNA 序列。
原核生物启动子由上游调控元件和核心启动子组成,核心启动子包括-35 区( Sextama box ) TTGACA ,-10 区 (Pribnow Box ) TATAAT ,以及+1 区。
生物信息学复习题

生物信息学复习题### 生物信息学复习题#### 一、选择题1. 生物信息学主要研究的是什么?A. 生物学数据的收集和存储B. 生物学数据的分析和解释C. 生物学实验的设计和执行D. 生物学仪器的操作和维护2. 下列哪一项不是生物信息学中常用的数据库?A. GenBankB. PDBC. PubMedD. Google Scholar3. 序列比对的目的是什么?A. 确定序列间的同源性B. 预测蛋白质的三维结构C. 鉴定基因的功能D. 计算基因的表达量#### 二、填空题1. 生物信息学中的BLAST工具主要用于__________。
2. 基因表达分析中常用的芯片技术包括__________和__________。
3. 在蛋白质结构预测中,同源建模依赖于__________数据库中的已知结构。
4. 转录组测序(RNA-Seq)可以用于研究__________和__________。
#### 三、简答题1. 描述基因组注释的一般流程。
2. 阐述生物信息学在药物设计中的应用。
3. 解释什么是系统发育树,并说明其在进化研究中的意义。
#### 四、计算题1. 给定一段DNA序列,计算其GC含量。
(示例序列:ATCGTACGTAGCTAGCTAG)2. 如果一个蛋白质序列的分子量为12345 Da,其氨基酸的平均分子量为110 Da,计算该蛋白质序列中氨基酸的数量。
#### 五、论述题1. 讨论生物信息学在个性化医疗中的作用和挑战。
2. 分析高通量测序技术对生物信息学领域的影响。
通过以上题目的复习,可以帮助学生掌握生物信息学的基础知识和技能,包括对生物数据的分析、解释和应用。
这些知识点不仅涵盖了生物信息学的基础理论,还涉及到实际应用,如药物设计、个性化医疗等,为学生提供了一个全面的复习框架。
生物信息技术考试试题

生物信息技术考试试题一、选择题(每题 3 分,共 30 分)1、以下哪个不是生物信息学的主要研究内容?()A 基因组学B 蛋白质组学C 细胞学D 代谢组学2、生物信息学中用于序列比对的常用算法是()A 动态规划算法B 贪心算法C 分治算法D 回溯算法3、在基因表达数据分析中,常用的标准化方法是()A RPKMB TPMC FPKMD 以上都是4、以下哪种数据库主要用于存储蛋白质结构信息?()A GenBankB PDBC UniProtD Ensembl5、进行系统发育分析时,常用的构建进化树的方法是()A 邻接法B 最大简约法C 最大似然法D 以上都是6、以下哪个软件不是用于基因序列分析的?()A Primer PremierB SPSSC DNAStarD Vector NTI7、生物信息学中,预测蛋白质二级结构的方法不包括()A 基于同源建模B 基于机器学习C 基于物理化学原理D 基于经验规则8、在生物信息学中,BLAST 程序主要用于()A 序列比对B 进化分析C 基因预测D 蛋白质结构预测9、以下哪种编程语言在生物信息学中应用较为广泛?()A JavaB PythonC C++D Fortran10、用于分析基因芯片数据的软件包是()A R 语言中的 BioconductorB MATLABC StataD SAS二、填空题(每题 3 分,共 30 分)1、生物信息学中的三大核心数据库是_____、_____、_____。
2、基因序列的相似性搜索常用的工具是_____。
3、蛋白质的一级结构是指_____。
4、常见的基因注释数据库有_____、_____等。
5、系统发育树的构建基于_____的原理。
6、生物信息学中常用的数据格式有_____、_____等。
7、预测蛋白质三级结构的方法主要有_____、_____。
8、基因表达数据的差异分析常用的方法有_____、_____。
9、用于分析高通量测序数据的软件有_____、_____。
生物信息学期末考试重点

1、生物信息学(Bioinformatics)是研究生物信息的采集、处理、存储、传播,分析和解释等各方面的学科,也是随着生命科学和计算机科学的迅猛发展,生命科学和计算机科学相结合形成的一门新学科.它通过综合利用生物学,计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。
2、数据库(Database)是按照数据结构来组织、存储和管理数据的仓库,它产生于距今六十多年前,随着信息技术和市场的发展,特别是二十世纪九十年代以后,数据管理不再仅仅是存储和管理数据,而转变成用户所需要的各种数据管理的方式。
数据库有很多种类型,从最简单的存储有各种数据的表格到能够进行海量数据存储的大型数据库系统都在各个方面得到了广泛的应用。
3、表达序列标签从一个随机选择的cDNA 克隆进行5'端和3’端单一次测序获得的短的cDNA 部分序列,代表一个完整基因的一小部分,在数据库中其长度一般从20 到7000bp 不等,平均长度为360 ±120bp。
EST 来源于一定环境下一个组织总mRNA 所构建的cDNA 文库,因此EST也能说明该组织中各基因的表达水平。
4、开放阅读框是基因序列中的一段无终止序列打断的碱基序列,可编码相应的蛋白.ORF识别包括检测六个阅读框架并决定哪一个包含以启动子和终止子为界限的DNA序列而其内部不包含启动子或终止子,符合这些条件的序列有可能对应一个真正的单一的基因产物。
ORF的识别是证明一个新的DNA序列为特定的蛋白质编码基因的部分或全部的先决条件。
5、蛋白质的一级结构在每种蛋白质中氨基酸按照一定的数目和组成进行排列,并进一步折叠成特定的空间结构前者我们称为蛋白质的一级结构,也叫初级结构或基本结构。
蛋白质一级结构是理解蛋白质结构、作用机制以及与其同源蛋白质生理功能的必要基础.6、基因识别是生物信息学的一个重要分支,使用生物学实验或计算机等手段识别DNA序列上的具有生物学特征的片段。
生物信息学期末期末复习

■一、选择题:1.以下哪一个是mRNA条目序列号:A.J01536■.NM_15392C.NP_52280D.AAB1345062.确定某个基因在哪些组织中表达的最直接获取相关信息方式是:■.UnigeneB.EntrezC.LocusLinkD.PCR3.一个基因可能对应两个Unigene簇吗?■可能B.不可能4.下面哪种数据库源于mRNA信息:■dbESTB.PDBC.OMIMD.HTGS5.下面哪个数据库面向人类疾病构建:A.ESTB.PDB■.OMIMD.HTGS6.Refseq和GenBank有什么区另1J:A.Refseq包括了全世界各个实验室和测序项目提交的DNA序列B.GenBank提供的是非冗余序列■.Refseq源于GenBank,提供非冗余序列信息D.GenBank源于Refseq7.如果你需要查询文献信息,下列哪个数据库是你最佳选择:A.OMIMB.Entrez■PubMedD.PROSITE8.比较从Entrez和ExPASy中提取有关蛋白质序列信息的方法,下列哪种说法正确:A.因为GenBank的数据比EMBL更多,Entrez给出的搜索结果将更多B.搜索结果很可能一样,因为GenBank和EMBL的序列数据实际一样■搜索结果应该相当,但是ExPASy中的SwissProt记录的输出格式不同9.天冬酰胺、色氨酸和酪氨酸的单字母代码分别对应于:■N/W/YB.Q/W/YC.F/W/YD.Q/N/W10.直系同源定义为:■不同物种中具有共同祖先的同源序列B.具有较小的氨基酸一致性但是有较大的结构相似性的同源序列C.同一物种中由基因复制产生的同源序列D.同一物种中具有相似的并且通常是冗余的功能的同源序列11.下列那个氨基酸最不容易突变:A.丙氨酸B.谷氨酰胺C.甲硫氨酸■半胱氨酸12.PAM250矩阵定义的进化距离为两同源序列在给定的时间有多少百分比的氨基酸发生改变:A.1%B.20%■.80%D.250%13.下列哪个句子最好的描述了两个序列全局比对和局部比对的不同:A.全局比对通常用于比对DNA序列,而局部比对通常用于比对蛋白质序列B.全局比对允许间隙,而局部比对不允许C.全局比对寻找全局最大化,而局部比对寻找局部最大化■全局比对比对整体序列,而局部比对寻找最佳匹配子序列14.假设你有两条远源相关蛋白质序列。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中科院生物信息学期末考试复习题陈润生老师部分:1.什么是生物信息学,如何理解其含义?为什么在大规模测序研究中,生物信息学至关重要?答:生物信息学有三个方面的含义:1)生物信息学是一个学科领域,包含着基因组信息的获取、处理、存储、分配、分析和解释的所有方面,是基因组研究不可分割的部分。
2)生物信息学是把基因组DNA序列信息分析作为源头,破译隐藏在DNA序列中的遗传语言,特别是非编码区的实质;同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测;其本质是识别基因信号。
3)生物信息学的研究目标是揭示“基因组信息结构的复杂性及遗传语言的根本规律”。
它是当今自然科学和技术科学领域中“基因组、“信息结构”和“复杂性”这三个重大科学问题的有机结合。
2.如何利用数据库信息发现新基因,其算法本质是什么?答:利用数据库资源发现新基因,根据数据源不同,可分2种不同的查找方式:1)从大规模基因组测序得到的数据出发,经过基因识别发现新基因:(利用统计,神经网络,分维,复杂度,密码学,HMM,多序列比对等方法识别特殊序列,预测新ORF。
但因为基因组中编码区少,所以关键是“数据识别”问题。
)利用大规模拼接好的基因组,使用不同数据方法,进行标识查找,并将找到的可能的新基因同数据库中已有的基因对比,从而确定是否为新基因。
可分为:①基于信号,如剪切位点、序列中的启动子与终止子等。
②基于组分,即基因家族、特殊序列间比较,Complexity analysis,Neural Network2)利用EST数据库发现新基因和新SNPs:(归属于同一基因的EST片断一定有overlapping,通过alignment可组装成一完整的基因,但EST片断太小,不存在数据来源,主要是拼接问题)数据来源于大量的序列小片段,EST较短,故关键在正确拼接。
方法有基因组序列比对、拼接、组装法等。
经常采用SiClone策略。
其主要步骤有:构建数据库;将序列纯化格式标准化;从种子库中取序列和大库序列比对;延长种子序列,至不能再延长;放入contig库①构建若干数据库:总的纯化的EST数据库,种子数据库,载体数据库,杂质、引物数据库,蛋白数据库,cDNA数据库;②用所用种子数据库和杂质、引物数据库及载体数据库比对,去除杂质;③用种子和纯化的EST数据库比对④用经过一次比对得到的长的片段和蛋白数据库、cDNA数据库比较,判断是否为已有序列,再利用该大片段与纯化的EST数据库比对,重复以上步骤,直到序列不能再延伸;⑤判断是否为全长cDNA序列。
(利用EST数据库:原理:当测序获得一条EST序列时,它来自哪一个基因的哪个区域是未知的(随机的),所以属于同一个基因的不同EST序列之间常有交叠的区域。
根据这种“交叠”现象,就能找出属于同一个基因的所有EST序列,进而将它们拼接成和完整基因相对应的全长cDNA序列。
而到目前为止,公共EST数据库(dbEST)中已经收集到约800万条的人的EST序列。
估计这些序列已覆盖了人类全部基因的95%以上,平均起来每个基因有10倍以上的覆盖率。
)3.用蛋白或核酸序列数据库研究生物演化的主要步骤是什么?当前的困难是什么,如何克服?答:计算步骤,构建系统进化树,其主要步骤如下:(1.序列相似性比较: 就是将待研究序列与DNA或蛋白质序列库进行比较,用于确定该序列的生物属性,也就是找出与此序列相似的已知序列是什么,完成这一工作只需要使用两两序列比较算法。
常用的序列包有BBLAST、FASTA等;(2.序列同源性分析:将待研究序列加入到一组与之同源,但来自不同物种的序列中进行多序列同时比较,以确定该序列与其他序列间的同源性大小,这是理论分析方法中最关键的一步,完成这一工作必须使用多序列比较算法,常用的程序包有CLUSTAL等;(3.构建系统进化树:根据序列同源性分析的结果,重建反应物种间进化关系的进化树,为完成这一工作,已发展了多种软件包,如PYLIP、MEGA等(4.稳定性检验:为了检验构建好的进化树的可靠性,需要进行统计可靠性检验,通常构建过程要随机地进行成百上千次,只有以大概率(70%以上)出现的分支点才是可靠的。
通用的方法使用Bootstrap算法,相应的软件已包括在构建系统进化树所用的软件包当中。
当前的主要困难:是发现了基因的横向迁移(LGT)现象,即进化程度不同的物种间存在着遗传信息基因的传递,如果拿迁移的基因做进化分析就会出错。
克服LGT的方法(可能的解决途径):1)纵向思路:选择垂直进化而来的序列进行研究,即去除横向迁移的数据库,如COG数据库;2)横向思路:发展基于完整基因组构建进化树,即使用全基因组数据库进行基因组水平上的对比;4.什么是SNP?为什么SNP的研究是重要的?SNP研究有哪些优点?举出2~3个SNP相关的网站。
答:SNP是指单核苷酸多态性,主要是指在基因组水平上由单个核苷酸的变异所引起的DNA 序列多态性,代表了基因组水平上遗传密码的变异,由于这种变异很多以单碱基突变的形式出现,因此称为单核苷酸多态性;它反映了不同个体间、正常与异常个体之间基因组上的差别,现在这个概念有所扩大,不限于一个核苷酸的差异。
重要性:因为SNP研究是基因组领域理论成果走向应用的关键步骤,是联系基因型和表现型之间关系的桥梁,是研究人类基因组计划走向应用的重要步骤。
优点:(1)SNP在基因组中分布相当广泛,使人们有机会发现与各种疾病相关的基因组突变;(2)不直接导致疾病基因表达的SNP,与某些疾病基因相邻,成为重要标记,有助于发现疾病基因(3)从实验操作来看,通过SNP发现疾病相关基因突变,比通过家系发现更加容易。
(4)基础研究中非常重要,如对Y染色体SNP分析有重要成果。
SNP相关的一些网站:1)SNP Consortium's database(/index.html)2)NCBI SNP database将这些数据进行整理,去掉冗余,使每个SNP都是唯一的。
此时的SNP被称为reference SNP或refSNP。
((/SNP/overview.html) 3)The Human Genic Bi-Allelic Sequences Database(HGBASE) 这一数据库收录了人基因组中所有已知的序列变化,包括:SNPs、序列的插入和缺失(Indels)、简单重复序列等。
(http://hgbase.cgr.ki.se/)4)The Human Gene Mutation Database(HGMD)(/)5. 什么是系统生物学?系统生物学对生命科学概念上的发展?系统生物学对生物功能实现的理解有何本质变化?系统生物学的研究思路是什么?答:系统生物学是指在系统的层面上研究生命活动,包含三个相互衔接的组成:整合数据,即整合所有各个层次(DNA水平,RNA水平,蛋白质水平,蛋白质相互作用水平)的信息数据;系统建模,即用这些信息构建描绘生命活动的数学模型;预测未知,即用这个模型预测生命未来的发展及外界干扰后系统的变异。
学术概念上的发展主要有:传统生物学是从基因组序列到结构,再到功能,而它从各个层次的相互作用到网络,再到功能。
与以往不同的是,系统生物学一开始就考虑元件之间的相互作用,把整个生命活动作为网络,考虑其相互作用。
看待生命活动本质的变化:因为没有一个生命活动是靠一个基因完成的,生命活动是一组基因相互作用实现的,这种相互作用形成一个网络,既包括每个单元的结构,又包括单元与单元之间的相互作用。
因此,系统生物学不仅考虑每个基因的活动,还描述了基因间的相互作用并导致了网络的产生。
研究思路的变化:传统的分子生物学研究步骤一般为:DNA序列→蛋白结构→蛋白功能(一维),而系统生物学是在二维的角度研究生命科学,即:相互作用→网络→功能,是由一组基因产生并相互作用共同实现的。
系统生物学的研究思路(研究流程):1.针对选定生物系统进行实验设计,了解系统所有组成成分:基因,RNA,蛋白,膜脂等2.通过系统行为动力学分析,总结系统设计和控制规律3.通过总结规律来提出新的实验设计,验证系统模拟的正确性6.(1)什么是非编码序列,非编码RNA,非编码基因?(2)以人的基因组为例回答:在基因组中有多少非编码序列,有多少存在转录本,举2~3个非编码核酸的生物学功能?答:(1)非编码序列是基因组中不编码蛋白质和多肽的序列;(基因组中不归属于基因调控元件,稳定元件之外的,也无明确生物学功能意义的基因序列统称为非编码序列,即不编码蛋白质同时也无明确生物学功能的序列)非编码RNA是指来自基因组的非编码的转录元件,即基因组中非编码序列的转录本;非编码基因指那些具有明确生物学功能的非编码RNA在基因组上非编码序列上的位置,即功能性的非编码RNA对应基因组上的位置称为非编码基因;(2)人类基因组中97~98%的序列是非编码序列,有70%~80%存在转录本,非编码核酸的生物学功能:1)Xist:X-inactivation(X染色体失活)是哺乳动物的一种剂量补偿机制,其中一半拷贝转录被抑制从而失活,抑制转录是通过一个2kb的非编码RNA(Xist RNA)实现的,xist RNA装配在失活X染色体的外侧,引起结构改变导致失活;2)Small RNA and RNAi: RNAi是由RNA(siRNA、microRNA)导致的转录后基因沉默现象,如由双链小RNA引起的干扰和转录后基因沉默现象,在植物病毒抗性和线虫中的转座子沉默;一些小核RNA调控基因转录。
(单链易降解,但发现细胞中存在另一种pathway,双链小RNA进入细胞后结合组蛋白形成复合体,该复合体和识别并降解target) 3)piRNA(具有大量转录本,功能不详)和Prions(生物复杂度到一定程度后会出现发病情况,可能和非编码RNA有关)等。
7.精准医学的重大意义是什么?实现精准医学的重要基础是什么?精准医学的重大意义;精准医学有可能导致医疗体系本质上的转变,把目前的医疗体系由诊断治疗过渡到健康保障,使得健康体系的关口前移,有可能产生新兴产业。
健康人可以通过组学等一系列研究,对现在的健康作以评估。
在健康检查的基础上,对未来可能导致疾病的部分进行干预,使得能够延缓疾病的发生,或者排除某些疾病的发生,使得健康得以保障。
实现精准医学的重要基础:1.必须获取分子水平上的数据信息,并挖掘其内涵,在挖掘组学数据时,一定要使用大数据分析技术,因此是大数据与组学的交汇。
组学包括基因组,转录组,蛋白质组,代谢组;大数据包括人群和队列2.建立分子水平上的知识与宏观疾病表型的联系,即基因型和表型的关联,搭建分子水平信息和疾病间的桥梁,在搭建桥梁时,生物信息学,生物网络,系统生物学的知识是其核心知识。