基因表达谱芯片常见问题分析
基因常见问题解答

基因常见问题解答1.碱基序列对全基因合成的影响1. 长片段重复。
大量的长片段重复很可能会延长基因合成的时间,甚至导致基因完全无法合成。
2. 高GC%。
基因内部的局部高GC%会严重影响PCR扩增和测序。
3. 二级结构。
碱基序列的反转、重叠等会严重影响PCR扩增,在测序时也可能会因此而测不通或信号突然中断等。
4. 测序引物与基因内部的特殊序列结合导致无法正常测序,必须重新设计测序引物。
对策:对密码子进行优化,尽量减少基因序列中的重复序列,高GC%区和二级结构区。
2.PCR出现非特异性扩增带1. 引物与靶序列不完全互补、或引物聚合形成二聚体。
2. Mg2+离子浓度过高、退火温度过低,及PCR循环次数过多。
3. 酶量过多出现非特异性扩增。
对策:1. 重新设计引物。
2. 减低酶量或调换另一来源的酶。
3. 降低引物量,适当增加模板量,减少循环次数。
4. 适当提高退火温度或采用二温度点法(93℃变性,65℃左右退火与延伸)。
3.PCR出现片状拖带或涂抹带1. 酶量过多或酶的质量差。
2. dNTP浓度过高,Mg2+浓度过高,退火温度过低,循环次数过多。
对策:1. 减少酶量,或调换另一来源的酶。
2. 减少dNTP的浓度。
适当降低Mg2+浓度,减少循环次数。
4. DNA没有被限制性内切酶切开或者切割不完全1. 缺少识别序列。
2. 反应条件不合适。
3. 限制性内切酶对DNA甲基化敏感。
4. 内切酶稀释不正确或加入方法不正确。
5. 甘油浓度过高。
6. 限制性内切酶已部分或全部失活。
对策:1. 检查底物DNA中是否存在可被限制酶识别的DNA序列。
2. 使用随酶提供的反应缓冲液;增大酶量。
3. 检查DNA是否已被甲基化以及所用的限制性内切酶是否对甲基化敏感。
4. 限制性内切酶经稀释缓冲液稀释后应在当天用完;限制性内切酶通常在最后加入。
5. 更换新酶进行实验。
6. 酶的体积不能超过反应总体积的1/10。
5.电泳后电泳条带扩散,电泳条带移动距离异常1. 底物DNA不纯。
基因工程技术实验设置中常见问题的排查与解决

基因工程技术实验设置中常见问题的排查与解决在基因工程技术实验中,为了保证实验结果的准确性和可靠性,必须仔细排查和解决常见问题。
本文将介绍几个常见问题,并提供解决方法。
1. 污染问题污染是基因工程实验中的常见问题,可能影响实验结果。
常见的污染包括外源DNA污染和细菌能力传递污染。
为了排查和解决这些问题,实验室应采取以下措施:a) 设立样品对照和阴性对照,确保实验结果的可靠性。
b) 加强个人卫生意识,使用一次性手套、口罩和实验室服装,定期清洁工作空间和实验器材。
c) 定期检测实验室环境和耗材污染情况。
2. 实验方法问题实验方法的选择和操作正确与否直接关系到实验结果的准确性。
为了避免实验方法问题,需要做到以下几点:a) 熟悉和掌握所使用的实验方法,包括试剂的正确使用和操作步骤的严格遵守。
b) 阅读并理解实验方法的相关文献,尤其是注意已经遇到的问题以及对应的解决方法。
c) 在实验过程中,及时记录实验操作过程、结果和观察情况,以备后续分析。
3. 设备问题实验设备的故障或不正常工作也会对实验结果产生影响。
为了避免这些问题,需要采取以下措施:a) 定期检修设备,保证其正常运行。
如果发现设备故障,及时联系维修人员进行修复。
b) 在实验开始前,对关键设备进行功能性测试,确保其正常工作。
c) 储备备用设备,以备紧急情况使用。
4. 数据处理问题在基因工程实验中,数据处理是非常重要的环节。
为了保证实验结果的可靠性和准确性,需要注意以下几点:a) 严格按照实验设计和数据处理方案进行数据采集和处理。
b) 重复实验,并进行数据统计和分析,以减少随机误差。
c) 对实验结果进行合理解释,并结合相关文献进行结果比对和验证。
5. 生物安全问题基因工程技术涉及对遗传物质的操作,因此需要进行严格的生物安全控制。
为了排查和解决生物安全问题,应采取以下措施:a) 制定并执行严格的实验室安全操作规程,包括废液处理、标识和管理等。
b) 建立并定期更新生物安全操作手册,确保实验人员理解和遵守相关规定。
人骨髓间充质干细胞基因表达谱的芯片分析

Si c , co l ai Mei l c ne J i nvm ̄, h n cu 3 0 , hn c net Sh o o B s dc i , inU i i C a gh n10 2 C ia e e h f c a Se c l e 1
[ bt c] O j t eT vsgtt o cl nt as n li l pl ao a eohm n oe a o e n A s at r be i :onei e h m l u reec s dcn a apc i v u f u a n r wm s — cv i ta e e a g ib ia i c i tn l b m r e
s o dhg o g n i ftesp rtd MS sa d c NA mirary,frtefs i ,dslsdtes ei cmRN o ait f h we ihh mo e et o e aae C D co ra o h rtt y h n i me i oe h p cf c i A fav r y o e
基因组学研究技术的使用中常见问题

基因组学研究技术的使用中常见问题近年来,随着基因组学研究的迅猛发展,科学家们对基因组的研究越来越深入。
然而,在使用基因组学研究技术的过程中,科学家们也面临着一些常见的问题。
本文将探讨一些在基因组学研究技术使用中常见的问题,并提供解决方案。
1. 数据处理和分析基因组学研究涉及大量的数据处理和分析工作,而这些工作常常非常复杂和耗时。
在分析基因组数据时,科学家们常常需要使用各种统计学和计算机科学的方法,如基因组比对、拼接、变异分析等。
这些任务对于研究者的专业知识和计算资源要求较高。
解决方案:为了应对这些挑战,科学家们可以通过参加专业培训课程来提升数据处理和分析的技能。
此外,使用高性能计算机或云计算资源可以加速大规模基因组数据的处理和分析。
2. 数据存储和共享基因组学研究产生的数据量巨大,存储和共享这些数据成为一个巨大的挑战。
科学家们常常需要处理大规模的测序数据,这些数据可能需要存储数TB甚至PB级别的空间。
此外,研究成果的共享也面临着隐私和伦理等问题。
解决方案:为了解决数据存储和共享的问题,科学家们可以选择使用云存储服务或建立专门的数据中心。
此外,加强数据管理和隐私保护措施也是非常重要的。
3. 数据质量控制在基因组学研究中,数据质量的控制至关重要。
由于测序技术的特点,数据中常常包含噪音和错误信息。
因此,科学家们需要进行严格的质量控制,以确保研究结果的准确性和可靠性。
解决方案:为了解决数据质量控制的问题,科学家们可以采用质量评估和过滤的方法来去除低质量的数据。
此外,使用多次测序或不同测序平台的数据进行验证也是一种常用的策略。
4. 伦理和道德问题在进行基因组学研究时,科学家们需要面对一系列的伦理和道德问题。
例如,研究对象的知情同意、数据共享的隐私保护、研究结果的有效传播等等。
这些问题不仅关系到个人和社会的利益,也影响到整个基因组学研究领域的声誉和发展。
解决方案:为了应对伦理和道德问题,科学家们应遵守相关的法律法规和研究伦理准则。
基因芯片

a基因表达的检测 b发现新基因 c基因多态性的检测 d作物杂交优势预测 e鉴别假冒伪劣种子
a在空间科学上的用途 采用生物芯片技术,许多研究工作就可以在太空 中进行,成本低,研究效果却非常好. b商品检验、检疫 针对商检的内容和对象的不同,检验、检疫基 因芯片可分为四种:食品卫生检验芯片、植物检验 芯片、动物检验芯片、转基因植物检测芯片。 c环境保护 检测污染微生物或有机化合物对环境、人体、 动植物的污染和危害,同时也能够通过大规模的 筛选寻找保护基因、制备防治危害的基因工程药品 或能够治理污染源的基因产品。 d基因表达分析 e寻找新基因和基因功能研究
4完成了光敏保护试剂的全合成、对胸腺核苷 (T)5′﹣羟基的光敏保护N﹣酰基化和2′﹣脱 氧核苷的制备。
5开展了微型PCR装置、毛细血管电泳微芯片等方 面的研究工作,包括毛细血管制作、光学检测系统 温度控制系统等方面的研究工作。
中国的基因芯片的发展方向 1发展具有自主知识产权的高密度基因芯片制备的 关键技术,发展一个可进行高密度基因芯片加工基 因芯片的加工设备和工艺。 2发展和研制的基因芯片设计和分析软件。 3发展出高集成度的生物活性单元微阵列芯片,包 括DNA、PNA、多肽、蛋白质、病毒、细胞组和细 胞以及微小生物组织等生物活性微阵列芯片。玻片修饰技术、固定技术的研究, 以满足cDNA在不同修饰玻片上的高效率固定、杂 交的需要,成功地制作了每平方厘米超过25000点 的DNA芯片。 2多病毒基因检测芯片的研究,主要完成了4﹣6种 病毒基因的PCR共扩增、DNA探针的固化和简易 信号检测技术研究。 3高灵敏度的DNA芯片检测系统研究,现已初步建 立了DNA芯片检测仪,包括成像系统、软件和样品 平台等
一药物筛选 A 通过基因芯片的筛选,可以了解中药在基因水平 的调控机制,为中药的应用奠定坚实的理论基础。 B 通过基因芯片的筛选,能为中药的进一步开发和 设计提供理论指导,有利于研制单位重新组织中 药复方中的有效组分,得到专一性更强、疗效更 显著、毒性更低的新药。 C 基因芯片技术可以筛选药物的毒副作用和致畸 致突变作用。 意义:应用生物芯片来进行药物筛选寻找,查检药 物的毒性或副作用,用芯片做大规模的筛选研究可 以省略大量的动物试验,缩短药物筛选所用的时间 从而带动创新药物的研究和开发。
基因表达谱分析的原理与应用

基因表达谱分析的原理与应用基因是指能够决定生物体遗传特征的遗传物质,基因表达则是指在特定的条件下基因启动的过程。
基因表达谱则是指对一个生物体在不同生长发育和环境等各种因素下,基因在时间和空间上不同的表达状态进行测定、分析和综合描述,以期研究基因功能以及环境施加给生物体的影响等问题。
基因表达谱分析是最近二十年来应用广泛的核酸技术之一,为我们揭示了基因的思维和特性。
一、技术原理早期研究基因表达的方法是利用Northern blotting 单点测试,即测每个基因的mRNA(信使RNA)的表达,但结果只能单点测定基因表达状态,效率很低。
后来随着 DNA芯片技术、转录后基因组学和RNA-seq等技术的发展,不同基因表达谱的测定现在已经变得可操作且具有高通量、高灵敏度和高精准度等特点。
目前应用比较普遍的芯片有两种:cDNA 核酸芯片和OLIGO 芯片。
核酸芯片通过加工和操纵DNA序列,将其固定在极小的芯片上,然后检测芯片上基因表达状态,分析结果即可反映基因在细胞状况下的表达情况。
OLIGO芯片是用聚合酶链式反应技术提取细胞内RNA,从中制备出cDNA,并将其固定在芯片上,分别测试各基因的表达浓度和变化,可以得到大量的数据。
除了芯片技术,pPCR(Real-time Quantitative Polymerase Chain Reaction)也是基因表达谱分析的常用技术,它能快速、准确地定量测定RNA、DNA拷贝数,提供高分辨率的检测结果,是基因表达谱分析的重要手段之一。
二、应用领域基因表达谱分析原理简单,有着广泛的应用领域。
1. 疾病和药物研究基因表达谱分析是疾病和药物研究领域内的常用分析技术。
通过研究基因的表达差异,可以了解特定疾病的潜在机制。
比如,在肿瘤研究中,研究人员可用该技术对肿瘤细胞和正常细胞进行DNA芯片测序以区分哪些基因会被单一肿瘤细胞过表达,哪些基因仅在正常细胞中表达。
这种基因差异分析有助于研制针对个体疾病的个性化治疗方法。
基因芯片技术在基因表达研究中的应用

基因芯片技术在基因表达研究中的应用随着现代科学技术的不断发展,基因芯片技术作为一种新兴的科学技术,引起了人们的广泛关注。
基因芯片技术是一种基于DNA 光学成像技术的高通量分析技术,能够以高效的方式同时识别和监测上千个基因,并且可以用于大规模、高通量的基因表达研究。
一、基因芯片技术的原理基因芯片技术通过特定的方法把数万个 DNA 片段置于一个非常小的芯片上,在每个 DNA 碎片的位置上附着荧光分子或其他化学分子,然后监测每个位置上分子的光信号来测量每个 DNA 片段的实时表达情况。
通过这种方法,可以大规模地研究生物体内基因的表达模式,以及这些表达模式与生物体的生理状态和疾病发生的关系。
二、基因芯片技术是一种非常有前景的新兴分析技术,可以广泛应用于生命科学领域的基因研究、基因表达分析和疾病诊断。
下面我们将重点介绍基因芯片技术在基因表达研究方面的一些应用。
1、基因表达谱分析基因芯片技术不仅可以识别和量化单个基因的表达,同时还能够同时测量并比较限定的许多基因。
这种方法的产生使学者们无需单独的克隆和筛选,也不需要对基因的序列信息有很深的了解,就可以大规模快速、全面地分析基因表达谱。
举个例子,基因芯片技术可以在一个非常短的时间内分析一组基因的表达情况,通过分析,把不同结构和功能基因的表达情况可视化,这有助于学者们理解基因和生物体之间的关系。
这一应用在生命科学领域中被广泛使用。
2、发现基因与疾病之间的关系基因芯片技术不仅可以发现表达谱在基因水平上的变化,同时还能够帮助学者们发现与某些疾病有关的基因。
基因芯片技术通过对于基因的大规模分析,可以大大缩小关键基因的范围,这对于医学研究者来说,是一个极为宝贵的资源。
3、建立生命科学数据库基因芯片技术还可以通过全面的基因识别研究,为构建生命科学数据库作出重要贡献。
基因芯片技术可以获取基因表达谱信息,用以建立相应的数据库,这有助于学者们研究生物体的生理状态、基因调控网络的建立和控制机制的研究等方面。
基因组学研究中的高通量测序技术的使用中常见问题

基因组学研究中的高通量测序技术的使用中常见问题高通量测序技术是基因组学研究中的重要工具之一,它能够高效地测序大量基因组DNA或RNA序列。
然而,在使用高通量测序技术进行研究时,研究人员常常会遇到一些常见问题。
本文将介绍一些常见问题,并提供解决方案,以帮助研究人员顺利进行基因组学研究。
常见问题1:质量控制与数据准确性在进行高通量测序时,质量控制和数据准确性是至关重要的。
测序数据质量不佳可能导致结果的不准确或不可靠。
解决方案:1.1 库构建过程中选择优质的DNA/RNA样品,并避免使用低质量的样品。
1.2 使用质控工具(例如FastQC)分析测序数据的质量,并对低质量区域进行去除或修复。
1.3 在数据分析过程中,根据测序数据的质量分数,筛选并过滤掉低质量的序列。
常见问题2:数据处理与分析高通量测序技术产生的数据量巨大,数据处理和分析是一个复杂且耗时的过程。
许多研究人员在这个阶段遇到困难。
解决方案:2.1 使用合适的数据处理工具,如Trimmomatic和Cutadapt,进行质量过滤和去除接头序列。
2.2 选择适合的序列比对工具,如Bowtie、BWA或STAR,将测序数据与参考基因组比对。
2.3 使用专业的分析软件,如DESeq2或edgeR,进行差异表达分析。
2.4 学习使用常见的基因组学研究工具和基因数据库,如Ensembl或NCBI,以寻找相关基因注释和功能信息。
常见问题3:错配率和假阳性结果高通量测序技术中存在着一定的错配率,这可能会导致假阳性结果的出现,从而影响研究结果的可靠性。
解决方案:3.1 对于临床研究,选择合适的错配率阈值,并使用相关软件(例如VarScan、GATK或SAMtools)来识别和过滤由错配率引起的假阳性。
3.2 在实验设计中添加技术重复,并使用统计分析方法来验证结果,以减少假阳性的可能性。
常见问题4:分析结果的解释高通量测序技术产生的数据量大,数据分析结果丰富,但可能也会带来解释上的困难。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基因表达谱芯片常见问题分析 1 芯片实验和定量PCR的优劣比较? 基因表达谱芯片实验可以对大量基因一次性进行定量研究,定量PCR则对大量基因需逐一进行定量研究。 2 在芯片制作过程中的PCR原液是否可以为客户保存? 可以抽干冷冻保存一年。 3 可否用DNA和芯片杂交? 不可以,因为芯片上的样品是cDNA而真核基因DNA中普遍存在內显子,核酸杂交无法顺利进行。 4 对于临床症状不明显的的遗传病,如何取样? 可以从病人抽取血样或者骨髓。 5 如何保存血样? 将血样中血细胞分离出来,然后-80℃低温保存。 6 脱落细胞是否都是死亡的细胞, 其中是否可以抽提mRNA? 不完全是死亡的细胞, 但是mRNA的含量比较少, 建议最好用正常细胞抽提mRNA。 7 完成一张芯片的实验,需要的细胞的量是多少? 需要5×106的细胞量 8 提供的电泳图和OD值如何评价mRNA的质量? 电泳图可以分析mRNA和总RNA是否降解, OD值可以判断纯度。 9 是否可以将同一症状的病例混合后抽提,看共性表达? 可以。
10 芯片是否可以重复使用? 不可以。 11 杂交后的芯片如何保存? 避光常温保存几个星期。 12 在实验前期,如何定参照物? 根据实验设计来确定使用共同参照物还是各自的参照物。 13 如何消除基因芯片实验中的个体差异? 可以使用同一样品重复芯片实验,取其共性,获得可靠的数据结果。 14 芯片在杂交过程中为什么会发生非特异性杂交, 如何降低? 这是由于DNA碱基错配造成, 提高芯片杂交后洗脱液的温度可以降低非特异性杂交。 15 芯片上基因cDNA是从什么组织中取得的? 芯片上基因cDNA来源于美国I.M.A.G.E.项目,是从人的各种组织中分离确定的,并且每个基因cDNA具有明确功能定义的,与其它基因不相重复的。
16 芯片上有多少条有效基因? 目前芯片上的有效基因数目最多有7500条,每条基因都有明确的功能定义,不相重复。 17 基因表达谱芯片是如何进行分类的? 基因表达谱芯片是根据芯片的用途来分类的,每种芯片上包括与特定用途相关的基因。 18表达谱芯片是否可以按照器官来进行分类? 不可以。 19 基因芯片的假阳性率是多少? 一般控制在1%---2%。 20 芯片制作中如何控制芯片的质量 控制芯片的质量主要要以下几个方面, 玻片的选择, 点样的规范, 固定率, 芯片的背景,有效的避免融点等。 21 实验结果中的荧光信号散点图有何意义? 可以-直观反映杂交后的差异表达与正常表达的比率, 显示相关度和实验结果的好坏。 21 扫描背景不清楚会对实验结果产生什么影响? 会导致实验结果混乱,而导致实验失败, 如果是杂质污染等原因造成,可以通过洗片解决, 如果是mRNA不纯,则需要重新抽提。 22 实验失败有几种原因? mRNA的降解, MRNA的纯度差, 反转录酶失败, 标记效率低, CY3容易见光降解。 23 得到实验的结果后, 可以进行那些研究的工作? 可以通过基因的差异表达, 寻找目标基因, 进行聚类分析, 对差异基因进行进一步的功能研究。
基因芯片可靠性分析及数据处理 高利宏,曹 佳 (第三军医大学军事预防医学院卫生毒理学教研室,重庆400038) 基因芯片(gene chip)又称为DNA微阵列(DNA microar-ray),其基本原理是将众多的靶基因序列或寡聚核苷酸片段有序而高密度地排列在玻璃、硅、尼龙膜等固相载体上,用待检测的标记样本分子与之杂交,并利用激光共聚焦显微扫描等技术对芯片上成千上万的杂交信号进行实时、灵敏而准确的检测,辅以计算机统计分析从而得到样本的基因表达信息。 自1992年美国Affymitrix公司制备出世界上第1张寡聚核苷酸生物芯片至今,仅短短10余年时间,基因芯片技术已广泛运用于生物学与医学的基础研究、疾病诊断、新药开发、环境保护等许多方面。在MEDLINE上以genechip和icroarray为关键词检索, 2000年以前仅数百篇相关文献,而到2004年已达4 000余篇文献。该技术最大的优点在于具备高通量平行检测的特点,能在更全面广泛的基因组水平上揭示不同基因之间内在的相互关系,使研究效率明显提高,并极大地降低了基因表达检测的平均成本,这对于继人类基因计划(human genomeproject, HGP)实施以来呈几何级数增加的基因序列资源的利用有至关重要的意义。众多学者认为,该项技术是继DNA重组、PCR技术以后又一项生物科学领域的革命性进展,将对21世纪生命科学的研究思维和方式产生重要影响。 但不可否认,作为一项新兴的技术,基因芯片也是处于不断探索和完善的过程中。就技术本身而言,可以把它形容为“强大但不完美”———基因芯片实验从前期设计到最后的数据提呈目前都还存在着一些技术难点和缺点,在应用过程中也非全能,而存在一定的局限性,需要人们对其有更全面和深刻的认识。目前世界各地芯片研究人员正致力于其方法学的改进、实验流程的规范以及共同实验标准的建立。现主要对芯片技术的可靠性和数据处理两方面进行综述。 1 芯片技术的可靠性分析 认识芯片技术的可靠性,首先应该了解该技术的定位。一般来说,基于芯片高通量和高灵敏的检测特点,在成千上万探针数量的基因表达谱水平上研究特定时间组织的多基因表达程度,看似既多又好,但这实际上是一把双刃剑。因为在实际情况中,动物组织、细胞的基因表达谱并非“均质性”,不同个体或细胞株之间存在着一定的变异,而且表达谱对实验条件的变动也高度易感,在RNA抽提、cDNA逆转录等操作步骤上的微小差别,往往都能引起不同基因的表达改变,这样使微阵列检测所呈现的大量“阳性改变”基因中可能相当一部分难以判断确定的生物学意义。另一方面,微阵列实验是成百上千个核酸探针进行“同时杂交”,能影响芯片探针和实验样本中相应的靶片段的结合效率的因素可来自多方面———序列自身因素(序列长度、碱基比例、互补性等)、杂交实验条件(探针和靶序列浓度、阳离子浓度、pH等)及非特异性杂交片段等。以目前的芯片制作工艺,还难以保证每个探针杂交反应能同时具备最佳反应条件,因此实际的芯片探针杂交往往会产生大量的假阳性和假阴性。对单个基因测定的精度而言,高通量性的微阵列并不如低通量的Northern、real-time PCR等技术更精确。还应该注意到,微阵列技术的另一大应用限制是其测定的mRNA水平的改变仅属于基因表达的中间产物,并非功能蛋白,还远不能直接解释在细胞和组织水平上主要由功能蛋白参与的多种生理、病理变化的机制。而且,即使是在微阵列表达谱上表现出明显变化的不同基因,它们之间的因果关系如何,单靠微阵列技术本身也不能单独进行确切判断,需要进一步利用相应实验技术进一步研究[1, 2]。所以在目前阶段,DNA微阵列应主要定位于一种运用高通量手段在特定实验条件下观察基因组的整体性变化,以利于从纷繁的表达谱数据中寻找有效线索展开后续深入研究的定性实验。当然我们也应该看到,微阵列观察大批表达谱的特定的mRNA表达类型比传统分子生物学技术所检测的单个或少数基因表达更能全面地反映和预测相应的生物学机制,在蛋白质组技术普及应用以前,DNA微阵列技术还是在基因组水平研究基因表达最有效的方法。 一般来说,具备良好的灵敏度和较高特异度的核酸探针是保证芯片杂交数据可靠性的一个关键因素。目前,DNA微阵列根据探针的选择主要有两种类型———cDNA微阵列和寡聚核苷酸点阵芯片。 cDNA微阵列的探针一般来自于cDNA或EST文库的PCR扩增产物,长度为100~2 000 bp。这一类微阵列因其长链探针 灵敏性高、造价低、技术平台易于获得而被许多实验室广泛使用。但就探针构建而言存在以下一些不可靠因素:①cDNA探针针对来自同一基因家族不同成员的靶序列的检测时特异性不高,在序列选择时需注意尽量挑选文库中带3 '-末端的克隆片段以增强杂交特异性[3];②以不同荧光染料标记的探针进行杂交时存在标记效率不平衡的现象,常常需要试验组和对照组样本进行荧光交换标记重复试验;③双链cDNA探针相对于单链寡聚核苷酸更容易产生交联而影响杂交;④大规模的cDNA克隆文库往往存在克隆交叉污染,影响cDNA微阵列探针质量[4]。 寡聚核苷酸点阵芯片的探针由20~80 bp的短链寡聚核苷酸构成,研究人员可以从GenBank、EMBL等的核酸序列数据库及EST数据库(dbEST)寻找感兴趣的序列数据作为参考直接合成,不需要如cDNA微阵列一样准备cDNA克隆文库。为提高短链寡聚核苷酸探针的特异鉴别能力和容错能力,通常此类芯片会针对每一个目标序列的不同区域设计多组“冗余”探针,提高杂交信噪比,并且如Affymetrix公司的GeneChip专利设计以一组完全匹配(perfectmatch, PM)及中间有一错误位点匹配(mismatch, MM)探针区分特异性结合与非特异性结合的靶片段。这样,使寡聚核苷酸点阵芯片的特异性可以达到能区分大部分基因家族成员序列的水平,除可进行表达谱研究外,还可以用于检测基因突变和多态性[5]。但此类芯片因制作成本相对较高,不如cDNA微阵列使用广泛。 另外需要注意的一个问题是,虽然根据目前的制作工艺,每张芯片高密度集成寡聚核苷酸探针可达100 000个以上,但探针数量水平应该根据实验目来选择。使用高密度探针的芯片有利于进行基因组筛选和基因表达谱全面性观察,以期对研究对象有一个更全面的认识或者发现新的线索———一种基于“假想发生”的“fish”科学[6]。但如果研究人员期望能更有针对性地研究某类代谢途径,或能更有效地对芯片数据结果进行统计分析处理,选择低密度的“focused”芯片往往可靠性更好,也更为经济[7]。 芯片的系统误差存在于实验的全过程,包括如前所述的样本的生物差异、样本荧光双色标记偏差、以及探针杂交和洗脱条件不一致、信号采集误差等等,因此在芯片实验的设计上,重复性是保证数据可靠性的一个必要原则。一般而言,芯片的重复性设计包括3个层次:①芯片内同一基因探针多次点样;②同一份RNA样本进行多次芯片杂交;③用来自同一品系或类型的不同生物学个体进行重复实验。前两种类型的重复性试验主要针对的是芯片实验的技术性误差,有利于提高芯片数据的精确度,而后一种类型还包含了样本的生物性变异,使实验的重复性结果更具有广泛的生物和统计学意义[8]。在样本的重复次数上存在着一定争论, Lee等[9]认为3次比较适宜,Til-stone[10]认为重复次数的多少应该与想获得怎样的结果密切相关。而事实上,由于芯片昂贵的成本,很多实验室在具体的实验研究中却往往难以满足统计学分析所要求的重复例数,一些所发表的芯片实验论文也缺乏标准的统计学框架。在对芯片重复性进行了研究的文献中, Bartosiewicz等[11]报道芯片内点间误差为10%,片间误差14%;Yue等[12]报道片内误差为5%~10%,片间为10% ~30%,由此看出使用芯