2012研究生数学建模A题

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

摘要..................................................................................................................... - 1 -

一、问题的重述....................................................................................................... - 2 -

二、问题分析与建模思路....................................................................................... - 2 -

三、基本假设与符号说明....................................................................................... - 3 -

3.1 基本假设 ........................................................................................................ - 3 -

3.2 符号说明 ........................................................................................................ - 4 -

四、模型的建立与求解........................................................................................... - 4 -

4.1功率谱和信噪比的计算方法 ............................................................................. - 4 -

4.1.1 基于Voss映射求解功率谱和信噪比方法................................................ - 4 -

4.1.2 基于Z-curve映射求解功率谱与信噪比方法 ........................................... - 7 -

4.1.3 基于实数映射求解功率谱与信噪比方法 ............................................... - 10 -

4.2 对不同物种类型基因的阈值确定 ................................................................... - 11 -

4.2.1 人类基因序列阈值的确定 .................................................................... - 11 -

4.2.2鼠类基因序列阈值的确定................................................................... - 13 -

4.3 基因识别算法的实现..................................................................................... - 16 -

4.4 延展性研究................................................................................................... - 20 -

五、模型评价与改进............................................................................................. - 21 -

六、参考文献......................................................................................................... - 22 -

七、附录................................................................................................................. - 23 -

参赛密码

(由组委会填写)

第九届“华为杯”全国研究生数学建模竞赛

题目基因识别问题及其算法的研究

摘要

在生物学、医学、药学等诸多方面,DNA的研究都具有重要的理论意义和实际价值。在面对大量、复杂的基因序列数据时,如何更好更快捷地获取准确的基因信息,如何能够在众多的基因序列中确定功率谱和信噪比,如何能够对每类基因快速地得到其阈值确定方法,如何快速实现基因识别算法,是摆在我们面前的一个具有研究意义的实际课题。

我们运用计算机MATLAB软件,分析结果如下:

对于问题一,我们根据文献中给出的Voss映射,用快速傅里叶变换方法来实现功率谱和信噪比的求解。本文利用附件中的genes6中的数据,运行第1条DNA片段的基因数据,通过编程分析,得到功率谱和信噪比r =3.4474。在Z-curve 映射下我们得到功率谱和信噪比r = 4.5965,并发现二者呈现一定的常数比例关系。在实数映射下,我们得到功率谱和信噪比为r =3.1186。

对于问题二,假定运行的数据拥有足够的长度。首先根据快速傅里叶变换方法,运行相关程序得到在不同基因片段时能够得到的信噪比,然后将得到的信噪比进行数据分析与整合;其次,把外显子和内含子的功率谱都运行出来;最后将外显子和内含子内部结构已知的8个人类和92个鼠类的信噪比进行分类,找出2者的信噪比并确定以何种信噪比作为标准。我们预测到人类的基因序列组合信噪比为R=1.5861,鼠类的基因序列组合信噪比为R=1.7503。

对于问题三,我们假定3-周期性具有一定的普遍性。采用相邻峰值频谱差异法确定外显子的起点和终点。首先,画出genes6中的DNA序列功率谱图像;其次,截取总片断中呈3的倍数的小片段,逐步测验,得到不同的频谱图;第三,在基因片段N/3和2N/3处取峰值;最后,根据3-周期性,得到基因片段的两处端点。

对于问题四,我们运用的是频谱和信噪比方法探讨基因突变。首先利用genes200数据,得到信噪比;其次做描述性统计分析,得到基因序列信噪比折

相关文档
最新文档