数学建模 蛋白质分子量分解问题的探究

合集下载

分子量的分解问题

分子量的分解问题

4 模型的建立与求解
设 18 种氨基酸对应的个数为 量守恒定律 , 可列出 18 元一次方程 :∑ a
18 i =1 i
1 问题分析
蛋白质是由氨基酸脱水缩合形成 , 蛋白质由氨基 酸组成 , 氨基酸的通式为 :
⋅ xi = X
, 根据质 。
4.1
模型一优化穷举法
我们利用 Fortran 进行编程 , 先假定氨基酸 ai 个数 为 xi , 然后再对氨基酸 ai +1 个数进行 xi +1 循环 , 最终可求 得分子量 X 对应的氨基酸 , 但程序中 xi 每次循环次数会 达到 , 如分子量 186 的氨基酸对应 xi 最大只有 5, 这 样增加了无用的循环 , 因此对 xi 进行限制 :
N =0.0008X 8-0.0718X 9+2.6856X 10
(下转第9页)
SCIENTIST
7
2016年第10期
那么 :
3 洛伦兹磁力的作用与应用
假设具有 2 根导线 ,在一根导线上加油线性时变 电压(初级)或者线性时变电流 , 而接收线(次级)则 由另外一根导线充当。在线性的磁场 B = k1t 从左边开 始以光速 c0 向右边移动 ,同时次级导线被其切割 ,在 (广义的洛伦兹磁力)的影响下 , 电荷将顺着导线的放下往b端运动 , 则 + q (亦即正电 荷)会在 a 端发生过剩情况 ,从而在 a − b 两端产生 (感应电动势) 。
生命蛋白质是由若干种氨基酸经不同的方式组合 而成。在实验中 , 为了分析某个生命蛋白质的分子组成 , 通常用质谱实验测定其分子量 x( 正整数 ), 然后将分子 量 x 分解为 n 个已知分子量 ai (i = 1,2,..., n ) 氨基酸的和的 形式。某实验室所研究的问题中 : ai (i = 1,2,..., n ) 分 别 为 57,71,87,97,99,101, 103,113,114,115,128,129,131,137,147, 156,163,186 要求针对该实验室拥有或不拥有计算机的情况 , 对如何分解分子量 x 作出解答。

生物蛋白质计算题解题技巧

生物蛋白质计算题解题技巧

生物蛋白质计算题解题技巧
解题技巧可以分为以下几个方面:
1. 理解题目意义:首先要充分理解题目所给的生物蛋白质计算问题是什么。

明确题目要求和给定条件。

2. 确定计算公式:根据题目所给的生物蛋白质计算问题,确定使用的计算公式或方法。

常见的计算公式有质量百分比、摩尔浓度、摩尔质量等,根据题目给定的数据选择适用的公式。

3. 转换单位:将题目给定的数据根据需要的计算公式转换为相应的单位。

例如,摩尔质量的单位可以是克/摩尔,质量百分
比的单位可以是克/百分比等。

4. 根据公式计算:根据给定的计算公式和转换后的数据进行计算。

注意保留有效数字和单位。

5. 检查结果:将计算得到的结果进行检查,确保计算过程无误。

可以对结果进行估算,与已知的数据进行比较来验证计算的准确性。

6. 补充解释和分析:根据计算结果,对问题进行解释和分析。

可以讨论结果的意义、与其他相关问题的联系等。

总之,解决生物蛋白质计算问题需要充分理解题目意义,确定计算公式,转换单位,进行计算,检查结果,并进行解释和分析。

熟练掌握这些解题技巧可以帮助解决这类问题。

分子量分解问题优化设计模型

分子量分解问题优化设计模型

分子量分解问题优化设计模型作者:胡雨雯张嘉杨鑫来源:《大东方》2018年第03期摘要:本文首先研究了氨基酸合成蛋白质的规律,对于题目所给数据进行数据预处理,由于蛋白质合成方式复杂,我们假定了本题中只研究单链式合成而不考虑R基脱水缩合的问题。

在此基础上,本文建立穷举模型,利用Fortran语言对算法进行实现,使用循环语句嵌套编写出能够给出确定蛋白质分子量下的氨基酸组合全部情况及计算机运行时间,由1000带入时运算结果为28268种,用时0.828秒。

在此基础上,本文根据蛋白质中氮含量稳定为14%-18%这一约束条件,对所给出的程序进行优化,剔除与实际不相符的情况,蛋白质分子量为1000时有效结果为10954组,用时0.391秒。

在实际情况中,蛋白质分子量远大于1000,使用优化后的模型能够推广到分子量更大的蛋白质成分分析中。

此外,本文还讨论了质谱仪使用使得各类元素成分已知条件下如何进行分子量分解以及实验室不具备计算机时的利用质谱仪情况下蛋白质分子量分解的可行性。

关键词:分子量分解;优化模型设计;可行性分析;Fortran一、问题重述生命蛋白质是由若干种氨基酸经不同的方式组合而成。

在实验中,为了分析某个生命蛋白质的分子组成,通常用质谱实验测定其分子量x(正整数),然后将分子量x分解为n个已知分子量a[i](i=1,.......,n)氨基酸的和的形式。

某实验室所研究的问题中:n=18,x1000a[i](i=1,.......,18)分别为57,71,87,97,99,101,103,113,114,115,128,129,131,137,147,156,163,186要求针对该实验室拥有或不拥有计算机的情况,对如何分解分子量x作出解答,即针对任意一个分子量x具体给出由哪些a[i](i=1,.......,n)氨基酸组成。

二、问题分析(1)对于数据的分析通过大量资料的查阅以及比对,我们发现了题目中所给出额的已知氨基酸分子量数值均为羟基和羧基脱水之后的分子量,所以按照题意分析,题目应仅考虑羟基羧基脱水缩合形成肽链的情况而不考虑R基可能发生的脱水缩合等复杂情况。

3组——分子量分解问题

3组——分子量分解问题

在无计算机的情况下,考虑到计算量繁重,我们根据实验室得到的蛋白质分子 式以及所给氨基酸的分子式,构造多元线性方程组来求解,并给出示例求解过程, 方便实验室中需要的人在无计算机的情况下计算出任意给定的蛋白质具体由哪些氨 基酸构成及这些氨基酸的数量。
7
9. 参考文献
[1] 百 度 百 科 , 蛋 白 质 ( 生 命 物 质 的 基 础 ) ,h t t /view/15472.htm. [2] 卡尔﹒布兰登 蛋白质结构导论[M] 瑞典 上海科学技术出版社,2007 年 [3] 陈志杰.高等代数与解析几何[M].北京:高等教育出版社 2008 年. p ://
2. 问题分析
问题中要求针对实验室有无计算机的不同情况, 对如何分解分子量为 x作出解答。 题 目中已知分子由 18 种已知分子量的氨基酸 a[i]组成,所以最容易想到的就是穷举法, 18 重循环求解每一种可能的氨基酸组成情况。 但是此方法使用计算机求解都是指数量级 的复杂度,更不能在在实验室没有计算机的情况下使用手工计算。 此问题就是重在解决将蛋白质分子如何分解为 18 中氨基酸, 通过查阅资料并且考虑 到实际的实验室情况,我们进行分子量分解的时候可以获得更多相关专业准确地数据与 条件约束,以此我们可以在原有基础上简化模型。
表三 氨基酸分子量与分子式对照表 分子量 真实分子式 57 C2 H 3ON 71 87 97 99 101
编号 1 2 3 4 5 6
名称 甘氨酸 丙氨酸 丝氨酸 脯氨酸 缬氨酸 苏氨酸
C3 H 5ON C3 H 5O2 N C5 H 7ON C5 H 9ON C4 H 7O2 N
4
7 8 9 10 11 12 13 14 15 16 17 18
2 x1 2 x2 x3 8 x4 5, x x 2 x 5 x 7, 1 2 3 4 * 4 x1 4 x2 7 x3 14 x4 a 3, 3 x1 3 x2 4 x3 11x4 3.

蛋白质结构预测的数学模型

蛋白质结构预测的数学模型

蛋白质结构预测的数学模型蛋白质是生命中极为重要的一类分子,其在细胞中发挥着极其重要的作用。

而蛋白质的结构对于它的功能具有关键性的影响,也因此引起了大量学者的关注。

但是目前来说,蛋白质结构的预测仍然是一个十分复杂的问题,需要综合运用多种领域的知识和技术。

而在这其中,数学模型则是一个重要的工具和手段。

蛋白质的结构预测,在科学研究以及医药等领域中是一个非常重要的问题。

但是,由于蛋白质的结构非常的复杂,我们无法用一种简单的方式来描述它的形态。

因此,对于蛋白质的结构预测,我们常常需要运用多种理论和技术,其中包括了数学模型。

虽然蛋白质的结构非常的复杂,但是它的结构却是有规律可循的。

不同的氨基酸之间的作用力以及空间排布都会决定蛋白质的结构。

因此,基于蛋白质结构内在的规律来设计数学模型,成为了众多学者从事蛋白质结构预测的关键性工作。

目前,有多种数学模型用于蛋白质结构预测。

其中,最常用的便是分子力学方法。

这种方法主要通过模拟分子在力场中的运动,来预测蛋白质的结构。

同时,还有一种叫做 Monte Carlo方法的方法,它的主要思想是根据统计物理以及概率论的原理,来模拟分子在空间中的运动。

这些数学模型对于预测蛋白质的结构起着关键性的作用。

除此之外,还有一种基于机器学习的数学模型也非常得到了众多学者的关注。

这种模型主要利用很多已知信息,通过机器学习的方式,来预测蛋白质的结构。

虽然这种模型需要很多已知的信息来进行训练,但是一旦训练成功,它的预测精度可以非常高。

除了这些数学模型之外,还有一些其他的数学方法,比如分形和网络理论等等。

这些方法和技术都可以被用于对蛋白质的结构进行预测。

总的来说,对于蛋白质结构预测,数学模型起着极为关键的作用。

无论是分子力学模型,还是基于机器学习的数学模型,它们都在蛋白质结构预测的过程中作出了巨大的贡献。

但是我们也需要认识到,目前这个领域仍然存在很多的问题和挑战。

随着科技的不断发展和进步,相信在不久的将来,蛋白质结构预测的精度会得到极大的提高,并为我们带来更多的科学和技术上的进展。

蛋白质分子量分解问题

蛋白质分子量分解问题

蛋白质分子量分解问题【摘要】分子量分解问题即求解任意给定分子量的蛋白质的氨基酸组成。

针对这一问题提供的条件,本文给出了一般性的求解多元一次整系数线性方程[1]的非负整数解的模型。

【关键词】多元一次整系数线性方程;非负整数解1.问题重述生命蛋白质是由若干种氨基酸经不同的方式组合而成。

在实验中,为了分析某个生命蛋白质的分子组成,通常用质谱实验测定其分子量X (正整数),然后将分子量X分解为n个已知分子量氨基酸的和的形式。

某实验室所研究的问题中:a[i]分别为57,71,87,97,99,101,103,113,114,115,128,129,131,137,147,156,163,186。

对如何分解分子量X作出解答,即针对任意一个分子量X具体给出由哪些氨基酸组成。

2.符号系统a[i]:第i种氨基酸的分子量;x[i]:待测定蛋白质分子中第i种氨基酸的个数;X:待测定蛋白质的分子量;N:待测定蛋白质的分子量为X时的所有解的个数;3.模型建立3.1多元一次整系数线性方程组的一般性数学模型实际情况下,蛋白质分子量是由氨基酸分子量的总和,再减去脱去的水分子分子量的总和,由于题目中所给的氨基酸分子量均已去除一个水分子的分子量,因此,本文在计算蛋白质分子量时,在没有其他约束条件下,根据本题已知的蛋白质分子量X以及每种氨基酸的分子量即可知,题目实际上就是求解多元一次整系数线性方程:■(a[i]■x[i])-x的所有非负整数解。

因此可以列出其一般性通用数学模型如下:■(a[i]■x[i])=Xx[i]≥0(i=0,1,2 (18)3.2考虑含氮量情况下的改进数学模型而实际上,蛋白质是由C(碳)、H(氢)、O(氧)、N(氮)组成,一般蛋白质可能还会含有P(磷)、S(硫)、Fe(铁)、Zn(锌)、Cu(铜)、B(硼)、Mn(锰)、I(碘)、Mo(钼)等。

生命体蛋白质中氮的含量相对比较稳定,维持在16%,波动范围在15%~17% 。

分子量分解问题

够方便 、 具体地 给 出分子量小于 1 0 0 0的蛋 白质是 由哪些氨基酸构成的。 经过 分析我们将分子量分解问题 简化 为求解 n 元一次 方程的所有非 负 整数解的问题 , 针 对简化后的 问题 , 我们首先设计 了穷举 算法, 并通过优化该算法 , 又设 计 了启发 式算 法, 启发式算法的优点在 于它比盲 目型的 搜索法( 穷举法) 要 高效, 一个经过仔细设计的启发函数 , 往往在很快的 时间内就可得 到一个搜 索问题 的最优解。
【 关键词】 MA T L A B ; 穷举算法 ; 启发式算法; 跟踪 查询表
5 . 1 优化穷举法求解 子量 x ( 正整数) , 然后将分子量 x分解为 n 个 已知分子量 a 『 ; 1 ( i = 1 ……, 在 拥有计算 机的情况 下 .通常 地 ,求解 该模 型采用穷举 法 . 用 n ) 氨基酸 的和 的形式。某实验室所研究 的问题 中: MA T L A B编写循环算法求解 但是无论采用穷举法循环思想还是动态 n =1 8 , x 1 0 0 0 规划 的算法编写程序 . 求解过程 中始终时 间复杂度大. 耗费时间长 . 当 a[ i ] ( i = l …. , 1 8 )分别 为 5 7 , 7 1 , 8 7 , 9 7 , 9 9 , 1 0 1 , 1 0 3 , 1 1 3 , 1 1 4 , 1 1 5 , 1 2 8 , 为很大的数值时 . 该方程的解 的个数随 x的增大以指数的倍数增长 1 2 9 , l 31 , 1 3 7 , 1 4 7, 1 5 6 , 1 63 , 1 8 6 . 由上述算法运行结果易知 . 利用穷举 法对该模 型进 行求解 显然不 要求针对该实验室拥 有或不拥有计算机的情况 . 对如何分解分子 合理 , 效率低下 , 且不切实 际. 实际意义不大 . 为此我们对穷举 法进行 量 x作 出解答 ,即针 对任 意一个 分子 量 x具体 给 出由哪些 a f i 1 ( i = 了 2点优化 。 1 ……, n 1 氨 基 酸组 成 ( 1 ) 剔 除分子量组合明显大于 1 0 0 0的组合方式 2 . 问题 分 析 ( 2 ) 对每个氨基酸分子量的个数进行 限制 这个题 目 是有关生命蛋白质分解的.首先我们通过上网了解蛋白质 经过优化 , 计算机的计算时间明显缩 短。 使穷举法行之有效 ( 优化 算法见 附录 1 ) 以 及氨基酸的一些相关知识 , 发现问题本身有一些不符合实际的情况 : ( 1 ) 氨基酸组成蛋 白质的时候会 失去 一分子 的水 . 而且氨基酸组 5 . 2启 发 式 算 法 合方式不同形成不 同形状 的蛋 白质如链形 、 环形等会失去不 同个数 的 考 虑分解 x 的一个反 问题 , 将若 干个分 子量 a 『 i 1 ( i _ 1 2一 . ^ I I ) 经 组 水分子。 合, 构成更大分子量的蛋 白质 . 从中寻找具有分子量 x的各种构成 ( 2 ) 蛋 白质水解的程度不同所得到 的氨基酸分子的质量也不同 为了实现 上述方法 , 设集合 L ( a [ i ] ) = { O , a 2 a [ i ] , …… . . . [ 1 0 0 0 / a [ i ] ] . a ( 3 ) 本题所 给的数据并不是 实际氨基酸 的分子 量 . 而是 比实 际氨 [ i ] ) , ( i _ 1 , 2 , …. , 1 8 ) 。 基酸少 1 8 . 即 一 个 水 的 分 子 量 通过循环将集合 L中元素一一组合 .如果 x 1 0 0 0 且x 使方程 ( 1 ) ( 4 ) 蛋 白质中有些氨基酸是相互依存 的。 即, 一种氨基酸 的存在 是 有解 , X 为正整数 , 则找到一个符合条件 的 X 值。 以其他某一种或某几种氨 基酸的存在为前提的 同时 , 可以设置数组 c ( i ) 和s ( i ) 。其 中, c ( x ) : 1 则表示该 x的不定方 以上情况我们将在假设 中进行补充说 明 程( 1 ) 有解 , 反之 c ( x ) = 0则表示 x 不 符合 条件。s f x ] 则表示该 x的不定 由题意可得 , 该分子量分解 问题可简化为求解 n 元一次方程 的所 方程( 1 ) 的解 的个数 有非负整数解的问题 . 即求解下列不定方程 6 . 模 型 分 析 根据题意 , 我们作 以下几点分析 : 本文提 出了一种无实际约束条件的 n 元 一次线 性模 型 . 并在原有 ( 1 ) 对一些给定 的值 x , 不定方程 ( 1 ) 可能无解 ; 但对 实际问题 , 应 的穷举 法模 型基础上进一步提出优化模型 有解 , 若出现无解 , 说明数值 x 有偏 差. 应 重新测定 对 于穷举法模型 . 在纯理论的条件下提出 . 求得 的解 数量庞大 . 无 ( 2 ) 以I T I 表示方程 ( 1 ) 右端 X 的上界。 此时 m = l O 0 0 , n = 1 8 , 考虑用穷 论对于拥有计算机还是 没有计算机 的情况 . 求 解过程 中时 间复杂度 举法求 出全部解 , 这时 , 每个 I ] 的取值范围为 0 x 【 i 】 【 r n i 1 1 , 所以穷举 的 高 , 并且 随着 x 值的不断增 大. 求得 的解得数 目 庞大. 导致求解效率低 次数要达到 1 8 1 8 , 故穷举法在实际上是不可行 的. 必须进行优化。 下, 不符合实验室实际具体情况 . 实际意义不大。 3 . 模 型 假 设 对 于启 发式算法模型 . 因算法的计算量 也较 小 . 故计算 时间上是 可行 的。由于存储解的跟踪信 息表需一个 mn的矩阵 q. 所 以空间需求 针对 2中对问题 的分析 , 我们做一下假设 : ( 1 ) 忽略氨基酸形成蛋白质的过程中脱掉水分子的质量 的影 响. 忽 为 m n , 当i n与 n很 大时. 可以用压缩存放来发掘潜力 略蛋 白质水解程度 的不同 , 不存在成环 以及多条链的情况 为此 , 选择第二种模型更贴合实际 , 满足实际的需要 . 并可根据第 ( 2 ) 各氨基酸分 子量的数值是精 确的 . 经质谱法 测定的蛋 白质 的 二种算法建立相关 的追踪信息表 分子量是正确的 , 即上述 n元一次方程具有非负整数解 而查表法根据之前制定 的数据表格 . 能够有效地查取可 以拆分 的 ( 3 ) 各种氨基 酸之 间没有相互影 响 . 即不存在某种 氨基酸 的存 在 x 值 , 实现对 x 的分解 . 尤其对 于没有计算机 的情况 . 对x 的分解次数 已另一种氨基酸的存 在为前提 的情况 对应 x的所有解得情况 , 可最大程度上减 小工作量 , 加快求解速度 . 提 ( 4 ) 蛋白 质 的组成时 , 不考虑氨基酸的排列顺序 . 即只考虑氨基 酸 高效 率。 的数 量和种类 7 . 模 型 推 广 ( 5 ) 本题忽略生物学 上某些必然 氨基 酸的影响 . 即各氨基酸 出现 考虑到分子量小 于 1 0 0 0 的蛋 白质本身是一种不太符合实际 的假 的概 率相同。 设, 本文只是通过通用模 型的分析与建立 , 对有关求解 n元 一次方程 ( 6 ) 被测定的蛋 白质 仅由给定分子量 的氨基酸组成 . 而不含有其 的同类 问题有一定 的可适用性和指导意义。 此类模 型还可 以运用在投 他物质或元素 , 即给定 的蛋 白质分子量就是几个 已知分 子量 的和 资、 运输 、 订购物资等方面运用 。

蛋白分子拆解机制的研究

蛋白分子拆解机制的研究蛋白质是生命活动中不可或缺的基本分子。

它们不仅构成生物体内的各种组织和器官,还在生物体内扮演着重要的代谢和调控功能。

然而,任何生物体内的蛋白质都有其寿命,它们必须被及时分解以释放出构成它们的小分子,同时避免产生无用或有害的堆积产物。

在生物体内,蛋白质的分解主要通过两个途径进行:一个是通过泛素依赖性通路,即泛素-蛋白酶体途径;另一个是通过泛素非依赖性通路,即自噬途径。

这两个途径各有特点,但都是带有高度选择性的,并且在不同的生理和病理状态下发挥作用。

在泛素-蛋白酶体途径中,蛋白质首先在其分子表面依附泛素,引导泛素连接酶的作用,使得泛素链加入到蛋白质泛素化的位置上。

随后,蛋白质与酶体膜融合,使得泛素化的蛋白质进入酶体内部,被酶体核心酶水解为小分子,再通过转运水解产物回到细胞代谢循环中。

而在自噬途径中,蛋白质则通过自噬体路径被降解。

其过程中,蛋白质通过ATG基因介导的膜源性体系形成自噬体,进入到溶酶体,在其中被水解酶分解为小分子。

此外,不同于泛素-蛋白酶体途径,自噬途径常常在细胞外环境恶劣和内源性损伤应激状态下发挥着重要作用。

无论是泛素-蛋白酶体途径还是自噬途径,都是高度复杂的生物化学反应。

其组成的蛋白质和荷体蛋白分子自身的结构和性质会影响到这些反应的速度、效率和特异性。

因此,对于蛋白质亚细胞分布以及结构和丰富性的了解对于揭示蛋白质分解的分子机制扮演着至关重要的角色。

最近,许多研究人员将目光投向了泛素-蛋白酶体途径和自噬途径的分子机理研究。

他们通过构建蛋白质的自动泛素化反应体系和自噬体修饰体系模型,来揭示蛋白质分解的分子机制和结构基础。

例如,在泛素-蛋白酶体途径中,研究人员以蛋白酶体折叠酶Usp14为例,揭示了其与去除蒂基酸修饰的泛素结构的结合机制,从而提供了与泛素链去除和分解相关的分子细节。

此外,研究人员也利用对解剖结构的了解,基于泛素-蛋白酶体途径的分子筛选技术,对新型的TAB-15分子进行了鉴定,其可作为泛素酶的细胞稳定性调节剂。

《分子量分解问题》

分子量分解问题组号:第12小组程引 02 算法设计论文撰写刘静伟 04 C程序编程论文撰写李海欣 09 matlaB程序实现1问题提出生命蛋白质是由若干种氨基酸经不同的方式组合而成。

在实验中,为了分析某个生命蛋白质的分子组成,通常用质谱实验测定其分子量x (正整数),然后将分子量x分解为n个已知分子量a[i](i=1,2……n)氨基酸的和的形式。

某实验室所研究的问题中:n=18, x 1000a[i](i=1,2……18)分别为57, 71, 87, 97, 99, 101, 103, 113, 114, 115, 128, 129, 131, 137, 147, 156, 163, 186要求针对该实验室拥有或不拥有计算机的情况作出解答。

2问题分析#问题本身有一些不符合实际的情况如下:1)氨基酸组成蛋白质的时候会失去一分子的水,而且氨基酸组合方式不同形成不同形状的蛋白质如链形、环形等会失去不同个数的水分子;2)蛋白质水解的程度不同所得到的氨基酸分子的质量也不同;3)蛋白质中有些氨基酸是相互依存的,即,一种氨基酸的存在是以其他某一种或某几种氨基酸的存在为前提的;4)当给定的蛋白质重量增加时,所得到的解的个数可能成指数倍数上升,计算量庞大3模型假设针对2中对问题的分析,我们做一下假设:1)不考虑蛋白质水解时水分子的量,即,给定的蛋白质分子量就是几个已知分子量的和。

2)不考虑蛋白质水解程度的不同;3)被测定的蛋白质仅由给定分子量的氨基酸组成,而不含有其他物质或元素4)氨基酸组合成蛋白质的过程是任意排列组合的,一种氨基酸的存在不是以其他某一种或某几种氨基酸的存在为前提的;|4模型分析与建立给定蛋白质的分子量X 和各种氨基酸的分子量a(i),测定蛋白质的组成,即求解n 元线性方程X x a ni i =∑=1i 的所有整数解的问题。

当n=18时即为本题所要求解的问题 X x a i i =∑=181i ①i x 是非负整数(i=1,2,3……18) 再拥有和不拥有计算机的情况下可以使用不同的算法,,这里分别为“优化穷举法”和“矩阵”解法在拥有计算机的情况下求解——“优化穷举法”利用传统穷举法,我们可以先计算给定的蛋白质分子量X 包含ia 的最多的个数[X\i a ],即i x ∈{0,1,2…[X\i a ]},所以当全部结果都列举出来时,利用排列组合可以算出,要穷举的次数为]\[181i ∏=i a X ,当X=1000时将达到*10^17次,显然在实际计算中是不可行的。

对分子量分解问题的探究

… 一

G1 毛+c l 2 +…+C 1
I +c 1
= l ‘+C 2 2 k 2 +…+c 2 ¨ 。 +

个纯粹的整数线性方程 的模型。即告 ^一 。
3 模型假设 不考虑蛋 白质分子分解过程中的发 生水解 ,即对于题 目中 X 只 可 写 成 之 和 的形 式 。 构成蛋 白质的氨基酸分子两两之 间可 以完全 自由组合 ,且 互不影响。实验室测得 的蛋 白质分子量数据 没有误差 。分子量 较小的多肽 也视 为蛋白质 。 4 符号 系统 x 蛋 白质 分 子 量 Y 分解特定的 x的可能情 况总数 a i ( i = 1 … 2. , 1 8 ) 从小到大排列的第 i 个分子量 X l ( i = 1 … 2. , 1 8 ) 某一种 蛋 白质分解 中,第 i 个分子量 的氨基 酸 的 个 数 N( x , i ) 将 x分解为前 i 个分子量对应 的氨基酸的方案数 b 第i 个氨基酸分子 中含氮原子的个数 A 已知蛋 白质分子 中含有 的氨基酸 分子 的序号 的集合 5 模 型 建 立 5 . 1 n元一次线性不定方程模型 根据给定的 x和 a i 测定其组成 ,可 以转化 为求 1 1 元一次
1 O 3, l l 3, l 1 4, l 1 5, 1 2 8, 1 2 9, 1 31 , 1 3 7, 1 47, 1 5 6,
A进行有限次初等变换可得 : 其 中 ,d = ( a l , a 2 , . . , ) , , , d E J ( 2 )设 b =d . b 。( 其 中b ’ ∈ , ) ,则可将 B第 n列 乘 以 b ’ ,
中文科技期刊数据库 ( 文摘版 ) 工程技术
科创新
2 0 1 5 年8 月 ・ 8 9 ・
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

分子量分解问题的研究摘要生命蛋白质在形成过程中由若干种氨基酸经不同的方式组合而成,针对拥有一定分子量的蛋白质分子在形成过程中所存在的若干的不同的组合方式问题,在给定的蛋白质分子量x条件下,我们分不拥有计算机和拥有计算机两种情况考虑:一、在没有计算机的情况下,我们通过题中条件建立多元一次方程组,建立了一般数学模型,利用矩阵法得出不附加任何约束条件下的最为一般的数学模型,求解满足已知条件的解,得到不同x条件下方程通解的表达式;二、在拥有计算机的情况下,共建立三个数学模型:分别为:1、不考虑任何其他约束条件下的蛋白质分解,我们用Fortran编程穷举满足方程的所有解,但是我们发现直接编程通过18次循环来求解十八元一次方程工作量较大,因此在模型一中我们将程序循环的上限合理地改为了{ EMBED Equation.KSEE3 \* MERGEFORMAT|][]1[n…]1[1-i 1iai aanx---,从而减少程序运行次数。

当X取1000的时候,运行的次数已经减少到28268次,提高了程序运行的效率,运行时间减少到0.187秒。

提高了程序运行的效率,缩短了运行时间。

2、在模型二中通过考虑确定C、H、O、N各元素的相对分子含量,在原有的FORTRAN程序中增加了4个约束条件,建立延伸拓展模型,得出合理的有可能在生活中存在的氨基酸的组合数。

减少了无用解的数目,缩短了程序运行时间。

以分子式为的蛋白质为例。

其相对分子质量为936,分解成氨基酸的组合形式有256种,所用时间<2s,组成形式只有原来的1/100,时间缩减为原来的1/5。

3、模型三通过生物化学手段确定蛋白质中所含氨基酸的种类M,从而减少方程中未知量的个数,将18元整数一次方程简化为M(M<=18)元一次方程,从而大大减少了运算量,节省了时间。

最后我们对模型进行了分析,并得到模型的整体评价和推广前景。

关键词 n元一次不定方程,矩阵法,氨基酸、各元素含量一、问题重述生命蛋白质是由若干种氨基酸经不同的方式组合而成。

在实验中,为了分析某个生命蛋白质的分子组成,通常用质谱实验测定其分子量x (正整数),然后将分子量x分解为n个已知分子量a[i](i=1,.......,n)氨基酸的和的形式。

某实验室所研究的问题中:n=18, x 1000a[i](i=1,.......,18)分别为57, 71, 87, 97, 99, 101, 103, 113, 114, 115, 128, 129, 131, 137, 147, 156, 163, 186要求针对该实验室拥有或不拥有计算机的情况作出解答。

二、问题分析蛋白质是以为基本单位构成的生物高分子。

由生物常识可知,组成蛋白质的氨基酸总共有20种,由于亮氨酸和异亮氨酸、谷酰胺和赖氨酸相对分子质量相同,所以题目中给出的氨基酸分子质量有18种。

分析某个生命蛋白质的分子组成,即通过N元一次方程求出组成蛋白质的氨基酸的种类和数目。

在没有计算机的情况下,常采用辗转相除法解N元一次方程,但由于过程繁琐,计算量大,我们尝试改用矩阵法。

在有计算机的情况下,我们可以利用蛋白质本身的特性,补充约束条件,结合FORTRAN语句编程,可以有效减少运算结果和运算时间。

三、模型假设1、忽略各个氨基酸分子结合失去一分子水的影响,给定的蛋白质分子量X单纯只是几个已知的氨基酸分子量之和而不考虑其他影响因素;2、假设所有被测定的蛋白质均由给定分子量的20种氨基酸组成,不含有其他组成成分。

因为组成蛋白质的20种主要氨基酸中有两对分子量相等,故为18种相对分子质量;3、假设氨基酸分子结合过程中是任意排列组合的,不存在互斥或互补现象,即任何两种氨基酸都可以同时存在于同一个蛋白质中,没有任何一种氨基酸的存在是以其他氨基酸的存在为前提的。

实际中这一假设是成立的;4、假设给定的蛋白质分子量X和氨基酸已知分子量数据准确,无测量误差;5、假设实验测定中蛋白质是水解完全的;6、假设实验室拥有测定物质化学性质的仪器四、符号系统:第i 种氨基酸的实际分子质量 :蛋白质分子中各组成氨基酸的数目 :蛋白质分子的实际分子质量:第i 种氨基酸C ,H ,O ,N 原子的个数 %、%、%、%:该蛋白质中相应元素的质量分数 :该蛋白质含有的氨基酸种类数目五、模型建立5.1在没有计算机的情况下由题目可知,本题是一个典型的多元一次不定方程的求解问题。

所谓多元一次不定方程,就是可以写成下列形式的方程:1122...n n a x a x a x A +++=,它是指未知数的个数多余方程个数的方程,这类方程可能有无穷多解。

传统方法中常用的方法为辗转相除法,但是当n 较大的时候计算起来比较繁琐,因此,我们利用矩阵的初等变换求不定方程的通解。

是18个整数,经过一系列初等整消法变换,矩阵(1) 可化为整数矩阵(2) 其中,d 是的最大公因数,并且定理1 设(n a a a ,...,21)=1,02,01,...,n x x x 为不定方程b x a x a x a nn =+++...2211的一组特解121,...,-n t t t 为任意整数,那么它的通解为:0111022201110112211.....................;(...)n n n n n n n n n n x x a t x x a t x x a t x x a t a t a t -----⎧=+⎪=+⎪⎪⎨⎪=+⎪⎪=-+++⎩证明 由1122...n n a x a x a x b +++=及0001111...nn a x a x a x b +++=,得 000111222()()()0n n na x x a x x a x x -+-+-= 故0000111222111()()()...()n n n n n n a x xa x x a x x a x x ----=-------, 显然上式有n-1个自由未知量,不难求得它的n-1个解为:112211(,0,...,0,);(0,,0,...,0,);....................................(,...,0,,);n n n n n a a a a o a a εεε--=-=-=-因为行列式 1210 (000) (00)...............0,0......n n n n nn na a D a a a a a a -==≠---- 所以D 的n 个列线性无关,从而它的前n-1个列线性无关,即1,2,...1n εεε-线性无关,故方程000111222()()...()0n n na x xa x x a x x -+-++-= 的任意解是121,,...n εεε-的线性组合。

所以,0001122112211(,,......)n n n n x x x x x x t t t εεε-----=+++ =121112211(,,...,...),n n n n n n a t a t a t a ta t a t ------- 即 011122201110112211.....................;(...)n n n n n n n n n n x x a t x x a t x x a t x x a t a t a t -----⎧=+⎪=+⎪⎪⎨⎪=+⎪⎪=-+++⎩其中121,,...n t t t -为任意整数。

证毕。

定理2 设12(,,...)1,na a a =则不定方程b x a x a x a n n =+++...2211有解;任取2n n -个整数,1,2...1,1,2,...i ja i n j n =-=及n 个数12,,...n a a a 做矩阵: 111211,11,21,12.....................n n n n n n a a a A a a a a a a ---⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦ 使0A ≠,并作伴随矩阵:11211,1,112221,22121,........................n n n n nn n nnn A A A A A A A A A A A A A ---⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦其中A为a 的代数余子式;设00012,,...,n x x x 为方程的任一组特解,那么方程的通解为:1,111121101,221222212101,11..................n n n n n n n n n A x A A x A x A A x t t t A x A A x ----⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪=+++ ⎪ ⎪ ⎪ ⎪ ⎪⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭ 其中121,,...,n t t t -为任意整数。

证明 由1122...n n a x a x a x b +++=及0001111...nn a x a x a x b +++=,得 000111222()()()0n n na x x a x x a x x -+-+-= 由行列式性质得10,1,2,...,1.nj i j j aA i n ===-∑所以 A 的前n-1列是方程(3)的解。

又 A =10n A-≠,所以 A 的n 个列线性无关,从而它的前n-1列线性无关,故(3)的任意解是 A的前n-1列的线性组合。

从而有任意整数121,,...,n t t t -,使得1,111121101,221222212101,11..................n n n n n n n n n A x A A x A x A A x t t t A x A A x ----⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪=+++ ⎪ ⎪ ⎪ ⎪ ⎪⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭证毕5.2在有计算机的情况下模型一:不考虑任何其他约束条件下的蛋白质分解在不考虑任何其他约束条件时,我们想到用穷举法法解决此问题,根据方程式,利用循环结构,对18种氨基酸可能的组合进行罗列。

显然这种穷举法的计算量过大,程序运行时间长,产生的无用结果多。

于是我们将穷举法加以改进。

因为,限制了的取值范围为,即:然后,结合FORTRAN语言以循环嵌套为主体编写程序(见附录)。

通过程序运算,我们得到了下表中分子量、氨基酸组合方式、程序运行时间的数据:分子量解的个数运行时间100 0 0.000200 4 0.000300 14 0.000400 45 0.000500 158 0.000600 522 0.000700 1508 0.000800 4291 0.003900 11249 0.0061000 28268 0.1871100 67339 0.4521200 154143 0.7331300 338158 1.607 1400 716481 3.011 1500 1467221 5.320 1600 2915738 13.135 1700 5633990 23.899 1800 1061149239.297 1900 19517035 75.161 200035119056137.640接着,我们用MATLAB 绘制了“N -X 拟合曲线图”和“t -X 拟合曲线图”。

相关文档
最新文档