核酸芯片微阵列分析概述
第十章基因芯片微阵列数据库

Agilent等芯片采用双荧光标记法检测和数据分 析。双荧光标记杂交技术中,两种不同样品的mRNA 被用不同的荧光标记。标记产物与芯片上的DNA探针
杂交后,在不同的激发波长和发射波长检测后,通过
激光共聚焦荧光扫描检测杂交信号。同一探针上的两
种不同荧光信号的相对强度被用于推算相应靶基因在
两种不同样品中的相对表达量。两个样品中通常一个 是对照样品,一个是待测样品。如果不同的芯片使用 相同对照样品,则不同芯片上的待测样品中基因表达 的水平也可被比较。
第十章 基因芯片微阵列数据库
基因芯片是所有生物芯片的佼佼者。其芯片制 作技术、数据分析方法及在各种生命科学领域内的 应用均遥遥领先于其他类型的生物芯片。
第一节 常用基因芯片及其数据库
一、Affymetrix芯片
Affymetrix基因芯片系同类产品的首创,
为最受欢迎的基因芯片之一,在生物各领域
应用广泛。
因芯片数据包括四项:
1、探针组代号。Affymetrix给每个探针组独特代号。
一般探针组代号与靶基因一一对应,但有例外。
2、表达值。经由MA55处理后得到的探针组表达值,
相当于靶基因表达值。
3、表达值预测。有三字母分别代表表达值是否真的存
在:P代表存在,A代表不存在,M代表介于两者之间。
基因表达的存在与否由统计学经分析探针组中每根探
芯片上的25核苷酸探针通过一种基于光刻合成 及组合化学的独特工艺直接在芯片上合成。芯 片设计的核心技术是探针对的使用:每一根匹 配探针(PM)均有一根相应的错误探针(MM) 与其相匹配。两个探针间的唯一区别在于第13 个核苷酸。PM的该位置核苷酸可同其靶基因完 全互补,MM则相反。这种设计利于对非特异杂 交作出修正。每一靶基因都有相应的多组探针 对。
芯片数据提取与分析微阵列生物芯片...

摘要生物芯片技术是二十世纪出现的最具有时代特征的一项革命性技术它用承载有成千上万种DNA和蛋白序列的厘米见方的固体芯片取代了传统生物分析中所用的凝胶滤器和纯化柱它的出现对生物农业医学领域乃至整个人类生活健康的各个方面带来了巨大的影响生物芯片技术的作用就像生物微处理器能够在基因组规模上对基因表达谱病人基因型药物代谢疾病的发生和进展过程进行快速和定量的分析生物芯片检测技术对生物学的发展具有革命性的意义通过应用生物芯片扫描仪人们能够自动读取生物芯片上的信息在短短几分钟内获取大量的数据而在以前要读取这些数据需要几个月甚至几年的时间在荧光检测技术中体现生化反应程度的荧光由生物芯片扫描仪中的激光激发并通过光电倍增管或CCD相机捕获形成数字图像此图像即是生物芯片实验分析的原始数据因此生物芯片扫描仪性能以及对原始图像的处理效果将对后续分析具有重要影响本课题来源于生物芯片北京国家工程研究中心所承担的十五国家863计划生物芯片专项的研发项目微阵列生物芯片扫描仪的研制该项目致力于研制基于CCD相机和激光扫描显微镜结构的国产化生物芯片检测仪器目标是研制出价格低廉性能优良的国产生物芯片检测系统样机能使用该仪器进行临床疾病诊断分析本文首先介绍了有关生物芯片的基本概念和几种常用的生物芯片检测技术其中重点介绍了生物芯片的荧光检测技术然后探讨了生物芯片和生物芯片激光共聚焦扫描仪的工作原理以及目前国内外研发的最新进展接着阐述了我们选用的设计方案并且给出了仪器的原理图和结构图着重介绍了自制生物芯片激光共聚焦扫描仪系统的硬件电路及其相应嵌入式软件的设计在本文的最后我们对扫描仪的线性度灵敏度和重复性等性能指标进行了测试结果表明此生物芯片扫描仪是一台高性能的检测系统关键词生物芯片生物芯片扫描仪微阵列信号检测AbstractThe magic of biochip analysis is sweeping through the agricultural and medical sciences, replacing traditional biological assays based on gels, filters, and purification columns with small glass chips containing tens of thousands of DNA and protein sequences. Biochip function like biological microprocessors, enabling the rapid and quantitative analysis of gene expression patterns, patient genotypes, drug mechanisms, and disease onset and progression on a genomic scale. Biochip detection instruments are revolutionizing biology. These ingenious devices allow biochips to be read in an automated fashion, providing an amount of data in a few minutes that would have taken months or even years to acquire with antecedent technologies.In this technique, fluorescence intensities, which reflect the degree of biochemical reaction, are detected by imaging the array with a laser and capturing the image with a photomultiplier tube or a CDD camera, resulting in the production of digital images. The images from the reaction arrays constitute the essential raw data for biochip. Therefore, biochip scanner and robust image processing are particularly important and have large impacts on downstream analysis.This project is come from National Engineering Research Center for Beijing Biochip Technology. The project is supported by “863” project on biochip, which is studying on laser confocal biochip scanner and CCD biochip scanner. The target is working out a cheap and work well laser confocal biochip scanner, which can be used in clinic diagnosis. In this paper, the basic concepts and general application flows of biochip technology are introduced, including the detailed principles of fluorescence detections for biochip. We discuss the principle of biochip scanner and the latest development and research in the world; we also introduce our design of biochip including its principle figures and structure figures. We introduce in detail that the system’s hardware and the embedded software. The performances, including linearity, sensitivity, repeatability and so on, are tested with special methods. This biochip scanner is a high performance detection system.Keywords: Biochip Biochip scanner Microarray Signal detection1 绪论1.1生物芯片技术1.1.1生物芯片技术生物芯片biochip的概念来自计算机芯片发展至今不过十几年时间但进展神速它是指能对生物分子进行快速并行处理和分析的指甲盖大小的薄型固体器件[1]生物芯片能够以生物学上史无前例的快速度和精确性来研究生物的基因组信息其发展的最终目标是将生命科学和医学研究中许多不连续的分析过程包括样品制备生化反应及检测分析等集成到由一块或多块芯片构成的芯片实验室Lab-on-a-chip[1]或微型全分析系统micro total analytical system, μTAS[2]中自从1991年Fodor[3]等人提出DNA芯片的概念后近年来以DNA芯片为代表的生物芯片技术[4]~[7]得到了迅猛发展目前已有多种不同功用的芯片问世而且有的已经在生命科学研究中开始发挥重要作用生物芯片按功能分有基因测序芯片[8]表达谱芯片疾病诊断芯片[9]药物筛选芯片样品制备芯片[10]生化反应芯片[11]结果检测芯片[12]等按工作方式分有被动式芯片和主动式芯片[1]两种根据芯片结构和工作机理分为微阵列Microarray芯片和微流体Microfluidic芯片[13] [14]前者是由排成阵列形式的生物分子包括核酸蛋白质等构成其分析应用原理都是基于抗原和抗体的结合核酸分子的碱基互补作用等生物分子之间的亲和作用力所以也可通称为亲和型生物芯片后者则是以各种微管道网络为结构特征用来实现对包含生化组份微流体的控制和检测分析包括常见的毛细管电泳芯片[15][16]PCR反应芯片[11]介电电泳分离芯片[17][18][19]等本文谈到的生物芯片为微阵列生物芯片微阵列生物芯片是指采用光导原位合成或微量点样等方法将大量生物大分子比如核酸片段多肽分子甚至组织切片细胞等生物样品有序地固化于支持物如玻片尼龙膜等载体的表面组成密集二维分子排列然后与已标记的待测生物样品中靶分子反应反应结果用同位素法化学荧光法化学发光法或酶标法显示然后用精密的扫描仪或CCD 摄像技术记录通过计算机软件分析综合成可读的IC总信息从而判断样品中靶分子的数量[20][21]根据芯片上固定的探针不同微阵列芯片分为基因芯片蛋白质芯片细胞芯片组织芯片等微阵列生物芯片的检测过程如图1.1所示图1.1 微阵列生物芯片的检测过程因为基因表达的模式和它们的功能密切相关因此微阵列生物芯片为研究人类衰老药物反应激素反应脑疾病膳食及其他临床相关研究提供了史无前例的信息微阵列生物芯片技术也能用来检测基因序列的改变因而为在遗传筛选测试诊断领域建立新方法扫清了道路组织芯片和蛋白芯片正在对传统的组织免疫和生化分析进行微型化改造加速了人们对肿瘤分类蛋白-蛋白反应酶活性的分析由于微阵列生物芯片技术具有研究细菌病毒线虫果蝇植物奶牛鸡小鼠大鼠及灵长目基因组的能力它正在成为生物化学领域研究的诺亚方舟1.1.2生物芯片技术的历史基础生物芯片技术的出现在生物学发展的历史上是独特的因为还没有其它的技术把如此多的学科结合在一起并且能对生物体系提供定量和系统的分析20世纪90年代早期在斯坦福大学[22]发展起来的生物芯片技术主要结合了六门学科的内容它们是生物学化学物理学工程学数学和计算机科学下面从生物学的角度来观察生物芯片技术在历史发展过程中的继承性早在1949年Pauling及其同事就描述了基因突变改变的蛋白质和疾病之间的关系Pauling的实验表明患有镰刀型贫血症的病人红细胞中的血红蛋白较健康人的在凝胶电泳分析时迁移距离不一样Pauling等人把这种现象正确地解释为两者的血红蛋白表面电荷不一致通过调查比较正常个体镰刀型贫血症基因携带者和患病者Pauling等人认为血红蛋白编码基因的变化是引起血红蛋白改变的原因随后的基因测序证明了这一点Pauling等人发表的论文为人类疾病的分子遗传分析铺平了道路也为现在的生物芯片技术在遗传筛选检测和诊断领域的应用奠定了概念上的基础在Science杂志上发表的这篇有关血红蛋白的论文是生物芯片技术历史基础上的一个里程碑Watson和Crick于1953年在Nature杂志上发表的一篇杰出的论文中预测了DNA 分子的化学结构通过使用结构化学和模型的数据作者正确地推测DNA分子包含两条方向相反的链两条链通过碱基之间的氢键力结合在一起Watson和Crick还建议了特异的碱基配对法则A-T和 C-G以及磷酸基团分布在外部的双螺旋结构随后的生化和结构研究证实了这些预测Watson Crick和Wilkins由于发现了核酸的分子结构以及核酸在生物体中传递信息的重要性而分享了1962年的诺贝尔奖双螺旋结构的发现是十九世纪科学发现最重要的突破之一也是现今生物芯片技术中杂交反应的化学基础DNA和RNA聚合酶能把核苷酸连接起来合成DNA和RNA链20世纪50年代圣路易斯华盛顿大学的Kornberg及其同事受到Cori实验室有关糖原磷酸化酶工作的启发发现了DNA聚合酶随后Cori的另外一名学生Ochoa又发现了RNA聚合酶的活性Kornberg和Ochoa由于发现了核酸和脱氧核酸生物合成的机制而荣获1959年的诺贝尔奖聚合酶证明有很多实际的应用包括作为DNA重组聚合酶链反应PCR和微阵列分析中的关键酶聚合酶的发现在生物学的发展史上有着非常重要的意义一个特殊的DNA聚合酶是反转录酶它能以RNA为模板来合成DNA这个酶的活性是1970年由Baltimore Temin和Mizutani发现的他们结合DNA聚合酶分析和放射性同位素标记的方法发现在劳氏肉瘤病毒和其他RNA病毒合成过程中有反转录酶出现反转录酶含有核酸酶的活性以及在RNA病毒合成过程中必须有反转录酶的出现都表明有来自病毒的RNA作为模板以后的研究证明了这一点反转录酶的发现是出乎意料带有戏剧性的因为它看上去和当时认为的遗传信息应该从DNA流向RNA而不能逆向流动的观点是相反的Baltimore Temin和Dulbecco由于发现了肿瘤病毒和细胞遗传物质之间的相互作用而荣获1972年的诺贝尔奖反转录酶有很多实际上的用途包括在第一次生物芯片芯片实验中用作标记的酶[23]在20世纪70年代斯坦福大学的研究者研究了基于硝酸纤维素膜和尼龙膜的许多应用途径这些方法为二十年后生物芯片技术的建立提供了基本的理论基础1975年斯坦福大学的Crunstein和Hogness发表了第一篇描述生物芯片的论文作者采用了硝酸纤维素膜点上细菌克隆的方法来分离果蝇基因他们发表的文章也表明了在DNA杂交实验中行和列的重要性斯坦福大学的Davis及其合作者也用硝酸纤维素膜来检测细菌的噬菌斑类似的工作也用在高等生物中鉴别了第一个差异性表达的基因哈佛大学的Maxam和Gilbert以及MRC中心的Sanger和合作者在1977年分别独立地发明了DNA测序方法Gilbert和Sanger由于他们在确定核酸碱基序列上的贡献而分享1980年诺贝尔奖Sanger化学方法被用来对人的基因组进行测序测序得到的数据信息又被用来构建DNA生物芯片1980年的诺贝尔化学奖被授予给斯坦福大学的Berg由于他对核酸生化性质的基础研究特别是在重组DNA方面所作的工作Berg及其合作者建立的DNA重组技术是20世纪最重要的科技进步之一并且显示出很多实际的应用包括现在生物芯片技术中用到的克隆文库的制备DNA聚合酶发现后引发的另一革命性发明是20世纪80年代早期Cetus公司的Mullis及其同事发明的PCR技术PCR技术可以从少量的遗传物质中制备数以百万计的DNA拷贝确保可以从任何生物样品中对任何一个基因进行DNA分析PCR 技术在生物芯片样品制备过程和生物芯片用于诊断过程中都有广泛的应用荧光染料数十年来一直用于生物膜的检测包括Waggoner和Stryer在20世纪70年代做的早期研究而后在20世纪90年代早期有人将花青素cyanine这种染料用于DNA探针的酶促制备过程Pinkel及其同事在20世纪80年代和90年代早期发明了双色标记和检测方法用于染色体分析以上在荧光和荧光显微镜方面所做的工作为现在的生物芯片技术中荧光标记和荧光检测的应用奠定了基础在玻片上进行的初期的杂交反应是20世纪80年代晚期和90年代早期由Mirzabekov及其合作者在莫斯科Fodor及其合作者1991年在Affymax公司Maskos 和Southern1992年在牛津大学Eggers及其合作者在Baylor Smith及其合作者在美国威斯康星大学分别进行的在Imperial Cancer Research Fund (ICRF)工作的Hans Lehrach及其同事在20世纪80年代后期开创性地把机械手用于DNA阵列的快速制备他们使用固体针在尼龙膜上点入基因组DNA克隆制备了较大的阵列尽管他们制备的阵列还比较大但他们的工作表明机械手可以用于阵列的制备高精度的运动控制系统可广泛地用于光引导原位合成接触式点样和喷墨式点样1.2 生物芯片的使用生物芯片的使用过程一般来说包括如图1.2所示的几个步骤样品处理目标分子富集转录文库制备增扩标记数据处理放射显影光化学电化学活性酶促反应综合信息分析检测洗涤分子间反应或杂交芯片制作配体点阵及固定化图 1.2 生物芯片使用过程 1.2.1 样品处理 生物样品往往是非常复杂的生物分子混合体除少数特殊样品外一般不能直接与芯片反应必须将样品进行预处理例如从血液或活组织中获取的DNA/mRNA 样品在标记成为探针以前必须扩增以提高阅读灵敏度[24]根据样品来源基因含量检测方法和分析目的不同采用的分离扩增及标记方法也不同为了获得反应信号必须对样品进行标记标记方法有荧光标记法[25]生物素标记法同位素标记法等1.2.2 芯片制作生物芯片的制作需要做三方面的准备准备固定在芯片上的生物分子样品芯片片基和制作生物芯片的仪器研究目的不同期望制作的芯片类型不同制备芯片方法也不尽相同以基因芯片为例基本上可分为两大类一类是原位合成即在支持物表面原位合成寡核苷酸探针适用于寡核苷酸一类是预合成后直接点样多用于大片段DNA有时也用于寡核苷酸甚至mRNA 1光引导原位合成法 AffymaxSanta Clara, CA 的Fodor 和他的同事在微电子工业的光刻技术基础上做了极具创意的改进发明了光引导原位合成法[26]用紫外光和固相化学合成的方法制作微阵列这种发明于上世纪九十年代初期的光引导原位合成方法发展非常迅速已经成为应用最为广泛的微阵列生物芯片制备方法中的一种Affymetrix 公司利用光引导原位合成技术制备核酸微阵列生物芯片2000年售出了超过200 000片用这种方法制作的微阵列生物芯片光引导原位合成前玻片表面先作硅烷化处理使玻片表面上生成活性胺基团然后用第二种含有特殊化学基团methylnitropiperonyloxycarbonyl MeNPOC 的试剂修饰活性胺基团MeNPOC 基团对于各种化学反应试剂都很稳定但可以被强紫外光照射大约30秒后有选择性地去掉MeNPOC 基团能够抑止任何没有紫外光介入下的化学反应因此被称为光保护基团去掉光保护基团后基片去除保护的表面上可以和特定种类的DNA 碱基充分反应微阵列生物芯片表面上的分子与DNA 碱基键合在脱氧核糖的3’位置这个位置上有一个活性氨基磷酸酯基团如图1.3 合成单元活化亲核反应键合重复图 1.3 光导原位合成的化学过程DNA 碱基连在玻片表面上这一过程被称为耦合每一个耦合过的碱基都在其5’羟基位有一个光保护基团如图 1.3用紫外光照射后碱基上的MeNPOC 基团被去掉且可与第二个碱基耦合重复去除掩膜基团耦合新的碱基步骤可以在玻片上合成各种序列的寡聚核苷酸利用光掩膜可以对微阵列生物芯片上特定区域有选择性的去除光保护基团从而在微阵列生物芯片表面的各个位置合成寡聚核苷酸光掩膜是半导体工业中用于生产微处理器用的镀铬模板光掩膜包括表面镀铬的玻璃板以及板上各个没有铬的区域如图1.4铬阻止紫外光通过而没有铬的区域则允许紫外光通过且照射到基片表面上因为掩膜可以加工成涂铬区域和不涂铬区域的不同种组合紫外光可以按照任何顺序照射到基片的各个区域这样可以用一组光掩膜逐步合成各种序列的寡聚核苷酸微阵列每个光掩膜可以在基片的任何位置合成DNA碱基镀铬模板上的单元可以做得很小能够制备点径为2050m的微阵列现在Affymetrix公司可以制备密度大于250000点/cm2的微阵列生物芯片光掩膜紫外光表面修饰有保护基团的基片键合后的碱基图1.4 按光掩膜定义的方式进行键合相比接触式和非接触式点样方法光引导原位合成的主要优势是任何序列的微阵列都可以用4种碱基A, G, C和T来构建用几种试剂代替为微阵列上每个位点制备和储存样品是其一大优势尤其是需要制备复杂的微阵列生物芯片时而劣势是其局限于制备短长度的寡聚核苷酸微阵列< 30个核苷酸光掩膜和微阵列生物芯片的加工成本也相当昂贵但是光引导原位合成法可能是最为经济的制备大量全基因组微阵列生物芯片的方法2点样法点样法是将预先通过液相化学合成好的探针PCR技术扩增后的cDNA或基因组DNA经纯化定量分析后通过由阵列复制器arraying and replicating device ARD 或阵列点样仪arrayer及电脑控制的机器人准确快速地将不同探针样品定量点样于带正电荷的尼龙膜或玻片相应位置上支持物应事先进行特定处理例如以带正电荷的多聚赖酸或氨基硅烷包被再由紫外线交联固定后即得到微阵列生物芯片点样的方式分两种其一为接触式点样[27]即点样针直接与固相支持物表面接触将样品留在固相支持物上其二为非接触式点样即喷点它是以压电原理将样品通过毛细管直接喷至固相支持物表面打印法的优点是探针密度高通常1平方厘米可打印2500个探针缺点是定量准确性及重现性不好打印针易堵塞且使用寿命有限喷印法的优点是定量准确重现性好使用寿命长缺点是喷印的斑点大因此探针密度低通常只有1平方厘米400点点样机器人有一套计算机控制的三维移动装置多个打印/喷印头一个减震底座上面可放内盛探针的多孔板和多个芯片根据需要还可以有温度和湿度控制装置针洗涤装置打印/喷印针将探针从多孔板取出直接打印或喷印于芯片上检验点样仪是否优秀的指标包括点样精度点样速度一次点样的芯片容量样点的均匀性样品是否有交叉污染及设备操作的灵活性简便性等等图1.5所示为点样仪实物图图1.5 点样装置实物图1.2.3 芯片检测芯片结果的判读要依据标记的报告分子的种类来设计判读装置最早是用同位素标记法需经过曝光显影然后用具有寻址功能的扫描仪扫读荧光标记是芯片信息采集中使用最多也是最成功的一种报告标记它没有同位素的使用限制应用激光作为激发光源的共聚焦扫描装置具有极高的分辨能力可以定量测读结果并可以有极高的灵敏度和定位功能目前已被普遍用于芯片杂交结果判读[28]进行平行分析时需要采用两种或更多不同波长的激光来激发2种或2种以上的荧光素来示差显示杂交结果此时氩离子激光器及氦氖激光器是较好的选择例如General Scanning公司的Scan Array 3000是双色荧光标记双激光激发的[29]而其后的Scan Array 4000和5000则是四激光激发四色荧光标记的气体激光器虽然在性能方面有巨大的优势但是其体积较大而且使用寿命短限制了它在扫描仪系统中的使用最新的扫描仪系统中有些使用半导体固体激光器它体积小寿命长价格便宜而且随着科学技术的不断发展半导体固体激光器的性能也在不断提高逐渐接近气体激光器的性能使用半导体固体激光器取代气体激光器是未来生物芯片扫描仪开发的趋势1.2.4 芯片数据提取与分析微阵列生物芯片数据分析简单来说就是对微阵列生物芯片的图像进行处理对图像中斑点的荧光信号进行定量分析通过有效数据的筛选和相关基因表达谱的聚类最终整合荧光斑点的生物学信息微阵列生物芯片在一块片基上集成了数十个至数万个点的识别分子每个点对应于一个基因或一段核酸DNA RNA片断或cDNA序列和反应测定的光密度值对于多色荧光染料标记的芯片还包括了荧光强度的比例信息同时芯片制作的目的制作的条件和方法样品的制备反应条件清洗条件和检测条件等信息均与该芯片对应可见在芯片的制作测定前后都有大量的信息数据需要处理因此需要有一个专门的系统来处理芯片的数据[30]一个完整的芯片数据处理系统应该包括芯片图像分析和数据提取芯片数据的统计学分析目前商用芯片数据处理软件层出不穷并不断有新的软件推出常用的有Axon Instruments公司的GenePix Pro软件Biodiscovery 的ImaGene系列Parkard的QuantArray等微阵列芯片数据提取与分析主要包括图像数据提取芯片数据标准化处理Normalization比率Ratio分析基因聚类分析Gene Clustering[31][32][33]1图像数据提取激光扫描仪扫描芯片得到的Cy3/Cy5图像文件通过图像滤波定位信号斑点提取得到基因表达的荧光信号强度值和背景值最后以列表或矩阵形式输出提取的数据结果由于芯片的制作反应清洗和测定过程中难免灰尘的污染以及测定样品中核酸蛋白质细胞和组织碎片的干扰或者由于芯片扫描仪的噪音往往产生较大的刺峰信号如果不予以消除将影响实验的结果[31] ImaGene采用一种中值过滤器的方法这种方法只能消除较尖细的刺峰干扰对于较粗大的刺峰不能剔除对一些较粗大的背景噪声可以通过对二值化后的图像的进行图像分割计算各分割区域的特征圆度较好并且面积也比较符合指标的区域即可认为是信号点面积太大超过指标的区域或者面积比较大并且圆度指标比较差的区域可以认为是噪声点也有人采用基于模糊数学以及神经网络的数字形态学方法构造不同尺寸不同形状的滤波算子,经腐蚀膨胀等运算提高图像的质量[34][35][36]点样仪在芯片上所点点阵为一个阵列形式但是由于点样的误差这个矩阵形式的点阵会出现一定偏差例如整个点阵的扭曲或点阵中斑点位置的偏移而且由于芯片上较大组织碎片或者灰尘的污染得到图像中会出现尺寸较大且亮度较高的噪声点这些点使用模式识别的方法较难排除因此较多的软件对斑点的识别仍然需要人为干预和帮助最常用的斑点识别方法是在图像中选择需要识别的区域输入芯片阵列的行列数斑点半径和阵列的行列间距由计算机自动产生一个圆圈整列套在芯片图像中使每个圆圈内包括一个斑点由于点阵排列的不完全规则需要手动对单个点进行调整通常的定量程序可以提供不同的确定斑点信号值和背景值的方法可以选择整个斑点区域确定信号强度但因为斑点内像素强度并不一致因此斑点内有效信号像素并不组成一个圆形在精确定量的情况下需要在斑点区域内分离有效信号像素和背景像素[37][38]背景的测量方法也不尽相同对于标准的玻片片基微阵列生物芯片阵列上不同位置的背景水平是不同的因此通常对不同斑点选取不同的背景常以斑点圆形区域外的一个环状区域作为斑点背景区域微阵列生物芯片中阵列各斑点提取的数据有斑点像素均值斑点区域内各像素灰度值的平均斑点的面积斑点区域内像素总数斑点像素中值斑点区域内各像素灰度值的中位值斑点像素标准差斑点区域内像素灰度值的标准差背景像素均值背景像素中值和背景像素标准差等推荐使用斑点区域和背景区域像素灰度的中值作为斑点强度和其背景强度下文中若无特别说明均采用此方法计算斑点强度此外对于双色荧光标记的芯片还需要提取阵列各个斑点2种不同荧光的强度值比[31]图像分析的目的是将扫描得到的微阵列生物芯片图像变成一个斑点强度数据阵列在数据提取完成后必须将各样点的数据输出大部分软件将提取的数据按芯片上点阵排列顺序以TXT文本文件的格式存入磁盘以便供其他的分析处理软件调用或者将此数据集输入到特定的关系型数据库中保存便于进一步的分析处理和查询2芯片数据标准化由于样本差异荧光标记效率和检出率的不平衡需对Cy3和Cy5的原始提取信号进行均衡和修正才能进一步分析实验数据芯片数据标准化正是基于此种。
生物信息学名词解释

1.生物信息学:研究大量生物数据复杂关系的学科,其特征是多学科模型;处理及分析,并以生物学知识2.二级数据库:3.FASTA序列格式:是将DNA始,其他无特殊要求。
4.genbank序列格式:是GenBank身,以“//”结尾。
5.Entrez检索系统:是NCBI点。
6.BLAST:7.查询序列(query sequence)索并进行相似性比较的序列。
P988.打分矩阵(scoring matrix):在相似性检索中对序列两两比对的质量评估方法。
包括基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如PAM)两类方法。
P29 9.空位(gap):在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最佳比对结果,这样在其中一序列上产生中断现象,这些中断的位点称为空位。
P2918.直系同源:指由于物种形成事件来自一个共同祖先的不同物种中的同源序列,具有相似或不同的功能。
(书:在缺乏任何基因复制证据的情况下,具有共同祖先和相同功能的同源基因。
)19.旁系(并系)同源:指同一个物种中具有共同祖先,通过基因重复产生的一组基因,这些基因在功能上可能发生了改变。
(书:由于基因)UPGMA):最初,每个序列归为一类,然后找到):是一种不仅仅计算两两比对距算法要求进化速率保持恒定的缺陷。
):在一系列能够解释序列差异的的进化树中找):它对每个可能的进化位点分配一个概率,然tree):在同一算法中产生多个最优树,合并这):放回式抽样统计法。
通过对数据集多次):开放阅读框是基因序列的一部分,包含一段codon bias):氨基酸的同义密码子的使用频率与相量高的同功tRNA所对应的密码子,这种效应称为密码子偏好性。
30.基因预测的从头分析:依据综合利用基因的特征,如剪接位点,内含子与外显子边界,调控区,预测基因组序列中包含的基因。
31.结构域(domain):保守的结构单元,包含独特的二级结构组合和疏水内核,可能单独存在,也可能与其他结构域组合。
DNA微阵列(或芯片)技术原理及应用演示教学

DNA微阵列(或芯片)技术原理及 应用
Your site here
LOGO 1 概念理论
DNA微阵列或芯片是指在大规模集成电路所控制的 机器人在尼龙膜或硅片固相支持物表面,有规律 地合成成千上万个代表不同基因的寡核苷酸“探 针”,或液相合成探针后由阵列器(arrayer)或 机器人点样于固相支持物表面.这些“探针”可与 用放射标记物如32P或荧光物如荧光素、丽丝胺等 标记的目的材料中的DNA或cDNA互补核酸序列相结 合,通过放射自显影或激光共聚焦显微镜扫描后 ,对杂交结果进行计算机软件处理分析,获得杂 交信号的强度及分布模式图,以此反映目的材料 中有关基因表达强弱的表达谱.
Your site here
LOGO 3.4 DNA序列测定
❖ 虽然Sanger、Maxan、Gilbert均有其标准的 DNA测序方法,但对HGP这类大范围的测序 工作已显过时,而用DNA微阵列或芯片快速测 定待测DNA序列则具有十分诱人的前景 .Pease等阐述了该方法的原理并指出它是在人 类遗传学、诊断学、病理检测及DNA分子识别 等方面发挥作用的强有力工具.Hacia等用含有 48 000个寡核苷酸的高密度微阵列分析了黑 猩猩和人BRCA1基因序列差异,结果发现在 外显子11约3.4kb长度范围内的核酸序列同源 性在98.2%至83.5 %之间,高度提示了二者 在进化上的相似性.
Your site ite here
LOGO
2.2 液相探针的合成及在固相表面的 排列
由已知基因序列在液相中化学合成寡核苷酸链 探针,或通过PCR技术扩增已知基因的编码区 部分序列,或克隆的基因组片段,均需通过纯 化产物后再定量分析.再由具有多个微细加样 孔的阵列复制器(arraying and replicating device,ARD)或阵列机(arrayer)及由电脑 控制的机器人,准确、快速地将不同探针样品 定量点样于带正电荷的尼龙膜或预处理好的硅 片相应位置上,再由紫外线胶联固定后即得到 DNA微阵列或芯片
微阵列芯片法-概述说明以及解释

微阵列芯片法-概述说明以及解释1.引言1.1 概述概述微阵列芯片法是一种基于微纳米技术的生物组学分析方法。
通过将数万至数百万个生物探针固定在芯片上,微阵列芯片能够同时检测大量样本中的多个目标序列或分子,并提供高通量、高灵敏度、高特异性的分析平台。
微阵列芯片的原理是将具有特定功能的DNA、RNA或蛋白质序列固定在芯片表面的离散区域。
这些固定的探针序列可以与待测样品中的特定目标序列或分子发生特异性的互补反应。
通过检测与探针序列结合的目标分子的信号变化,可以准确地识别和定量目标分子的存在和表达水平。
微阵列芯片的应用非常广泛。
在生物学研究中,它可以用于基因表达分析、基因突变检测、单核苷酸多态性分析等。
在医学诊断中,微阵列芯片可以用于癌症早期检测、基因治疗效果评估、药物毒性筛查等。
此外,微阵列芯片还可以用于农业育种、环境监测以及食品安全等领域。
微阵列芯片具有许多优势。
首先,它可以同时检测大量目标序列或分子,大大提高了实验效率和吞吐量。
其次,微阵列芯片的检测灵敏度高,能够检测到非常低浓度的目标物质。
此外,微阵列芯片还能够实现高通量、高特异性的分析,减少了实验的时间和成本。
综上所述,微阵列芯片是一种重要的生物组学分析工具,具有广泛的应用前景和巨大的发展潜力。
在未来,随着技术的不断进步,微阵列芯片将更加成熟和完善,为生物学研究和医学诊断带来更多的突破和进展。
1.2 文章结构文章结构主要分为引言、正文和结论三个部分。
在引言部分,本文将首先概述微阵列芯片的基本概念和原理,同时介绍文章的结构安排和目的。
在正文部分,将深入探讨微阵列芯片的原理、应用和优势。
首先,阐述微阵列芯片的原理,即通过微小尺寸的阵列结构实现高通量的生物分析和检测。
其次,介绍微阵列芯片在生物医学、生物工程和环境监测等领域的广泛应用,如基因表达分析、蛋白质芯片和微生物检测等。
最后,分析微阵列芯片相比传统方法的优势,包括高通量、高灵敏度、低成本和快速分析等方面。
基因芯片及其数据分析

Page 3
2.基因芯片发展历史
Southern & Northern Blot
Dot Blot
Macroarray
Microarray
3.基因芯片癿杂交原理
如图,在一块基片表面固定了序列已知癿八核苷酸癿探针。当溶液中带有荧 光标记癿核酸序列TATGCAATCTAG,不基因芯片上对应位置癿核酸探针产 生互补匹配时,通过确定荧光强度最强癿探针位置,获得一组序列完全互补 癿探针序列。据此可重组出靶核酸癿序列。
Page 6
5.制备基因芯片癿固定方法
目前已有多种方法可以将寡核苷酸或短肽固定到固相支持 物上。这些方法总体上有两种,即原位合成( in situ synthesis )不合成点样两种。支持物有多种如玻璃片、 硅片、聚丙烯膜、硝酸纤维素膜、尼龙膜等,但需经特殊 处理。 作原位合成癿支持物在聚合反应前要先使其表面衍生出羟 基或氨基(视所要固定癿分子为核酸或寡肽而定)幵不保 护基建立共价连接;作点样用癿支持物为使其表面带上正 电荷以吸附带负电荷癿探针分子,通常需包被以氨基硅烷 或多聚赖氨酸等。
Page 7
6.基因芯片癿合成原理
基因芯片在片合成原理图 美国Affymetrix公司制备癿基因芯片产品在1.28*1.28cm2表面上可包含 300,000个20至25mer寡核苷酸探针,每个探针单元癿大小为10um X 10um。 其实验室芯片癿阵列数已超过到1,000,000个探针。
Page 8
Page 10
光纤微珠芯片癿组装
Page 11
光纤微珠芯片癿优点
光纤微珠芯片是利用独特癿微珠阵列(BeadArray)技术生产 癿芯片,具有高密度、高重复性、高灵敏度、低上样量、 定制灵活等特点,兊服了传统芯片癿多个技术瓶颈,丌仅 检测筛选速度很高,也显著降低了研究成本。光纤微珠芯 片有可能成为以后基因芯片癿发展方向。
生物芯片要点

生物芯片原理与技术复习题一、名词解释(59)1.基因芯片:把生物活性大分子(如蛋白质和核酸)或细胞等,密集排列在固定的固相载体上,形成微型的检测器件,固相载体通常是硅片、玻片、聚丙烯或尼龙膜等2.反向杂交:是将各种不同的探针按有序的方式固定到固有的固相支持表面上,再与样本中标记的靶基因进行杂交。
3.实验设计:主要是指根据实验目的、实验材料及实验条件而选择合适的芯片,设计出最佳的样品生长、处理与收集方法,并在此基础上制定出杂交方案。
4.类型比较:通过比较不同样品类型的表达谱来找到差异表达的基因5.类型发现:通过基因表达谱的研究来对生物学样品进行分类6.MA散点图:横坐标为1/2(log2R+log2G),代表点的整体荧光读,用A(Average)表示,纵坐标为log2(R/G)=log2R-log2G,代表两种荧光强度的比值对数,即对数比,用M(minus)表示7.MA图可以更直观的观察系统偏移的形式及是否存在强度依存的系统偏移。
是log2R对log2G的散点图的一种转换形式,顺时针旋转45度并把尺度缩小为原来的1/2.8.信噪比:得到的真实荧光信号的一个重要参数,典型的信噪比是信号峰值除以信号的变异9.假阳性率:为假阳性基因数占芯片上基因总数的比例(%),其计算公式可以简化为:PFR=FP/N,其中N为芯片上的基因总数。
10.Gridding:划格,根据芯片阵列的行和列的数目由计算机生成的一个网格。
11.生物芯片:把生物活性大分子(如蛋白质和核酸)或细胞等,密集排列在固定的固相载体上,形成微型的检测器件,固相载体通常是硅片、玻片、聚丙烯或尼龙膜等。
①狭义:微阵列芯片,主要包括cDNA微阵列、寡核苷酸微阵列、蛋白质微阵列和小分子化合物微阵列等②广义:能对生物成分或生物分子进行快速并行处理和分析的厘米见方的固体薄型器件,主要还包括微流体芯片和“芯片实验室”12.生物学重复:基因芯片实验的目的是解释生物问题,因此选择来源于同一生物群体的不同样本进行实验是最好的方法13.探针(probe):使用前标记了的,用于检测特定基因或转录产物存在或表达的DNA或RNA或寡核苷酸序列。
微阵列芯片

一个是计算机的发明,它改变了我们的经济和文化;
第二是微阵列芯片的发明,它将变更整个生命医学,
极大地提高人类的健康水平。”
9
微阵列芯片能给我们带来什么?
基因表达分析
– 同一物种不同组织 – 不同物种相同组织
药物筛选 检测疾病
– 癌变组织与非癌变组织
指导用药及治疗方案 司法鉴定
10
微阵列芯片如何工作?
20
点样仪
Hand-held Printer
Medium Through-put Printer
21
光导原位合成
1.将玻片氨基化,并用光不稳定保护剂将活化的氨基 保护起来
2.光通过挡光板照射到支持物上,受光部分的氨基解
保护,从而与单体分子发生偶联反应
22
光导原位合成
23
光导原位合成的芯片
每张基因 芯片超过 10万位点
由于芯片实验的花费较高所以重复次数ni 一般为2或3
如果使用的显著水平p=0.01,即允许100 个基因中有一个认为是误差导致的差异 显著基因,而芯片上的基因成千上万, 这样t检验分析变得将不可靠
47
聚类分析
从生物学角度讲,聚类分析的目的是找 到相似的表达谱,它们可能有相似的功 能
从数学角度讲,聚类的依据是组内各成 员在数学特征上相似,而与其它组中的 成员不同
– /MicroArray/SMD/ – 原始数据、归一化数据和图像
The Gene Expression Database (GXD)
– /mgihome/GXD/aboutGXD.s html
34
微阵列芯片检测结果的分析流程
微阵列芯片图像处理 数据的获取 存储与显示 数据归一化 芯5
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分配法为事先采用PCR技术合成靶标,然 后通过接触式点样等类似方法将合成好的 靶标分配到微阵列表面。合成法为通过光 引导原位合成技术等方法直接在微阵列表 面合成靶标。
♦ 寡聚核苷酸合成在微阵列靶标制备中具有最重要
的地位,目前最主要采用亚磷酰胺酯法。3种亚磷 酰胺酯(ACG)在其嘌呤或吡啶环上含有具有反 应活性的伯胺基,因此需要在胺基上加保护基团。 苯甲酰是典型的AC保护基团,而异丁酰基团通常 被用于保护G,第四种碱基T的吡啶环上没有伯胺 基,因此不必保护。所有四种亚磷酰胺酯碱基在5 羟基位置都有DMT基团,用于阻止羟基发生化学 偶联,直到合成时的去保护反应。选择性的去保 护反应会使合成一步一步进行。3磷酸已经被保护, 避免发生副反应,然后分别被 氰乙基和二异丙基 基团激活进行亲核进攻。合成结束后去除保护, 得到具天然DNA结构的寡聚核苷酸产物。
微阵列的制备
♦ 费用:指微阵列芯片制备方法的成本。随着商业
化的微阵列的更多出现,微阵列芯片的成本成为 一个重要的考虑因素。目前,已预点好几百个基 因的微阵列芯片的价格约100美元,包含数万个基 因(全基因序列或代表全基因组的基因集)的价 格约为20 000美元。 ♦ 容量:指微阵列芯片上所包含的基因,生物化学 或者化学材料的总量。包含10000种cDNA的芯片 相对于其子集,包含1000种cDNA的微阵列而言, 其容量为超大。但若两块芯片各包含5000种不同 的基因片段或者蛋白质,其容量孰大孰小则基于 哪块微阵列芯片包含源自稀有片段的cDNA或者难 于表达或纯化的蛋白质。
♦ 药物筛选 : 目前国外几乎所有的主要制药公司都
不同程度地采用了生物芯片技术,应用生物芯片 来寻找药物靶标,检查药物的毒性或副作用。用 芯片作大规模的筛选研究可以省略大量的动物试 验,缩短药物筛选所用时间,从而带动创新药物 的研究和开发。
♦ 基因测序 : 大规模基因检测是人类基因组计划面
临的首要任务,它涉及到基因多态性、突变或缺 失的检测。现在已可在1.28平方厘米生物芯片上, 用分子探针检测32Kb至几百Kb区域中任何区段, 这对检测和诊断患者是一个基因还是多个基因突 变,指导治疗和预后具有十分重要意义。
氨基化
可以通过有机反应合成各种各样的氨基硅烷 化衍生物,并根据氨基取代基和其它连接 于中心原子的三个有机基团的不同,各自 具有不同的性质和反应性。 如玻璃与3-氨丙基三甲氧基硅烷的反应就 显示了这类反应的一个基本机制。
♦ 氨基化表面在多数实验条件下都能正常使
用,并由较低的自发荧光和背景荧光。其 自发荧光较低,是因为表面处理过程中没 有在可见光区易发荧光而破坏芯片检测的 共轭环或不饱和环的结构出现。背景荧光 低是因为亲水性的氨基表面排斥了常用于 芯片检测直接标记的染料分子,如花青染 料等疏水分子的吸附。
♦ 通量:指单位时间内生产出的微阵列芯片的数量,通
常表示为每天生产的芯片数。作为微阵列检测系统的 标准,定义为单位时间内能扫描或识别的微阵列芯片 数量,单位通常为片/h。
♦ 精度:微阵列检测系统必须能在不同的时间内提供准
确和一致的检测图像,这个标准叫做微阵列检测系统 的精度。在实际应用中,对同一芯片进行的两次独立 检测中信号强度的变化应在+-10%。
自人肿瘤标本和其他感兴趣样品的切片,蛋白微 阵列包含提纯的蛋白质或细胞的抽提物。
二、核酸芯片作用原理
三、进行微序列分析的具体步骤及原理
♦ 微阵列表面处理 ♦ 靶标和探针的预处理 ♦ 微阵列的制备 ♦ 检测
NEXT
一个芯片表面具有以下性能
尺寸精确 平整 耐受性强 反应效率 平滑 均一 荧光惰性 可结合性
生物芯片的分类
♦ cDNA微阵列:第一个微阵列实验就是用cDNA微
阵列进行的。它得到的杂交信号强度好,因为基 片上固着的cDNA和溶液中的探针分子有较大的互 补性。
♦ 寡聚核苷酸芯片:应用于基因表达基因分型等多
个领域。靶标分子在杂交中有较好的特异性和较 高的型号强度。 以上两类通称核酸芯片。
♦ 组织微阵列和蛋白微阵列:组织微阵列上包含来
♦ 在实际应用方面,生物芯片技术可广泛应用于疾
病诊断和治疗、药物基因组图谱、药物筛选、中 药物种鉴定、农作物的优育选以及公司法鉴定、 食品卫生监督、环境检测、国防等许多领域。它 将为人类认识生命的起源、遗传、发育与进化, 为人类疾病的诊断、治疗和防治开辟全新的途径, 为生物大分子的全新设计和药物开发中先导化合 物的快速筛选和药物基因组学研究提供技术支撑 平台。总之生物芯片技术在医学、生命科学、药 业、农业和环境科学等,凡与生命活动有关的领 域中均具有重大的应用前景。生物芯片技术的深 入研究和广泛应用,将对21世纪人类生活和健康 产生极其深远的影响。
五.参考资料
生物芯片分析中译本(Microarray Analysis)
[美] M. 谢纳 科学出版社2004
生物芯片
主编:马立人 蒋中华 化学工业出版社2002
♦ 为了将第二个碱基偶联到第一个上,用弱
酸处理GPC基质来去除5羟基的DMT基团。 这个去保护或去三苯甲基化步骤能让5羟基 成为亲核试剂,进攻第二个碱基的激活的3 磷酸基团,让第二个碱基偶联到CPG基质 上的第一个碱基上,形成3到5的二核苷酸 骨架。偶联后,通过乙酰化作用将为反应 的5羟基钝化或加帽,防止在后续的偶联反 应中与亚磷酰胺酯发生反应。加帽后新形 成的二核苷酸的亚磷酸盐三酯被氧化成为 磷酸盐形式,稳定了磷酸连接。
♦ 样品点活性:指样品点上目标分子的化学和生物化学活性,
一般用活性靶标分子的比例表示。理想的微阵列,所有样 品点上分子都应该处于活性状态;对于大部分微阵列活性 指标是50%。样品点活性可能在制备或处理过程中降低
检测
♦ 速度:电机或微阵列点样仪的移动速度,即单位时间
里能够完成检测的微阵列的面积值,单位通常为 cm2/min。
玻璃基片材料
玻璃是迄今为止最常用的芯片材料,其基 本化学成分是一个由硅原子和氧原子构成 的四面体分子。由于硅原子是高正电性的, 氧原子是高负电性的,因此二者间价键作 用很强。。其适合作为芯片基片材料的性 质为:高度的物理化学稳定性,较低的热 膨胀系数,较低的自发荧光和反射率,化 学均一性和可抛光性以及在可见光区的高 度透明。
四、应用前景
♦ 疾病诊断: 与传统方法相比,生物芯片在疾病检
测诊断方面具有独特的优势,它可以在一张芯片 同时对多个患者进行多种疾病的检测。仅用极小 量的样品,在有短时间内,即可为医务人员提供 大量的疾病诊断信息。这些信息有助于医生在短 时间内作出正确的治疗措施。例如对肿瘤、糖尿 病和传染疾病等常见病和多发病的临床检验及健 康人群检查,均可以应用生物芯片技术。今后人 们可以拥有个人化验室,无论在地球任何地方, 随时都可以对自己的健康状况进行监测。
♦ 寡聚核苷酸合成的第一步还包括将第一个
碱基偶联到固体支持物上,最常见为可控 微孔玻璃珠。这种材料的多孔渗水性提高 了合成基质的表面积,提高了合成效率。 CPG计算机模型显示出了这种材料的特性。 多数寡聚核管酸合成使用的CPG孔径为50100nm.第一个碱基偶联到去氧核糖环上。 一旦第一个碱基连接到CPG上,寡聚核苷 酸合成就一步一步开始进行,直到最后一 个碱基偶联到寡聚核苷酸链上。
核酸芯片微阵列分析概述
03级化学系 03081004黄逸凡 03081025殷乃宁 03081085王炜臻
一、简介
生物芯片的定义
主要是指通过微加工和微电子技术在固体芯片 表面构建微型生物化学分析系统,以实现对生命机体 的组织、细胞、蛋白质、核酸、糖类以及其他生物组 分进行准确、快速、大信息量的检测。
♦ 密度:指基片上单位面积内的靶点或者样品点数。知道或
测量两相邻点的中心间距,即可计算出微阵列的密度。因 为微阵列密度与样品点中心间距平方的大小相关,点距间 小幅度变化也会引起大幅度的密度变化。
♦ 样品点尺度:指微阵列种样品点的大小,一般用样品点的
平均直径表示。因为样品点越小,最大密度越大,而密度 越大,微阵列每单位面积上的信息也越多。所以制备的样 品点越小,微阵列制备仪器越有价值。