概率统计方法模型(上)

概率统计方法模型(上)
概率统计方法模型(上)

数学建模案例分析—主成分分析的应用--概率统计方法建模

§8 主成分分析的应用 主成分分析的基本思想是通过构造原变量的适当的线性组合,以产生一系列互不相关的新变量,从中选出少数几个新变量并使它们尽可能多地包含原变量的信息(降维),从而使得用这几个新变量替代原变量分析问题成为可能。即在尽可能少丢失信息的前提下从所研究的m 个变量中求出几个新变量,它们能综合原有变量的信息,相互之间又尽可能不含重复信息,用这几个新变量进行统计分析(例如回归分析、判别分析、聚类分析等等)仍能达到我们的目的。 设有n 个样品,m 个变量(指标)的数据矩阵 (1)1112 1(2)21222()12m m n m n n n nm x x x x x x x x X x x x x ??? ?? ? ? ? ?== ? ? ? ? ????? 寻找k 个新变量12,,,()k y y y k m ≤ ,使得 1、1122,(1,2,,)l l l lm m y a x a x a x l k =+++= 2、12,,k y y y 彼此不相关 这便是主成分分析。主成分的系数向量12(,,,)l l l lm a a a a = 的分量lj a 刻划出第j 个变量关于第l 个主成分的重要性。 可以证明,若12(,,,)T m x x x x = 为m 维随机向量,它的协方差矩阵V 的m 个特征值为 120m λλλ≥≥≥≥ ,相应的标准正交化的特征向量为12,,,m u u u ,则 12(,,,)T m x x x x = 的第i 主成分为(1,2,,)T i i y u x i m == 。 称1 / m i j j λλ =∑为主成分(1,2,,)T i i y u x i m == 的贡献率, 1 1 /k m j j j j λλ ==∑∑为主成分 12,,k y y y 的累计贡献率,它表达了前k 个主成分中包含原变量12,,,m x x x 的信息量大 小,通常取k 使累计贡献率在85%以上即可。当然这不是一个绝对不变的标准,可以根据实 际效果作取舍,例如当后面几个主成分的贡献率较接近时,只选取其中一个就不公平了,若都选入又达不到简化变量的目的,那时常常将它们一同割舍。 计算步骤如下: 1、由已知的原始数据矩阵n m X ?计算样本均值向量12?(,,,)T m x x x x μ== ; 其中1 1(1,2,,)n i ij j x x i m n ===∑

数学建模案例分析消费分布规律的分类概率统计方法建模

§7 消费分布规律的分类 为研究辽宁、浙江、河南、甘肃、青海5省份在某年城镇居民生活消费的分布规律,需要用调查资料对这5个省分类.数据见下表: 其中,X 1:人均粮食支出; X 2:人均副食品支出; X 3:人均烟、酒、茶支出; X 4:人均其它副食品支出; X 5:人均衣着商品支出; X 6:人均日用品支出; X 7:人均燃料支出; X 8:人均非商品支出. 在科学研究、生产实践、社会生活中,经常会遇到分类的问题.例如,在考古学中,要将某些古生物化石进行科学的分类;在生物学中,要根据各生物体的综合特征进行分类;在经济学中,要考虑哪些经济指标反映的是同一种经济特征;在产品质量管理中,要根据各产品的某些重要指标而将其分为一等品,二等品等等. 这些问题可以用聚类分析方法来解决. 聚类分析的研究内容包括两个方面,一是对样品进行分类,称为Q 型聚类法,使用的统计量是样品间的距离;二是对变量进行分类,称为R 型聚类法,使用的统计量是变量间的相似系数. 设共有n 个样品,每个样品i x 有p 个变量,它们的观测值可以表示为 n i x x x x pi i i i ,,2,1),,,,(21 == 一、样品间的距离 下面介绍在聚类分析中常用的几种定义样品i x 与样品j x 间的距离. 1、 Minkowski 距离 m m p k kj ki j i x x x x d 11 ][),(∑=-= 2、绝对值距离 ∑=-=p k kj ki j i x x x x d 1),( 3、欧氏距离 21 21][),(∑=-=p k kj ki j i x x x x d 二、变量间的相似系数 相似系数越接近1,说明变量间的关联程度越好.常用的变量间的相似系数有 1、 夹角余弦

数学建模案例分析3 随机性人口模型--概率统计方法建模

§3 随机性人口模型 如果研究对象是一个自然村落或一个家族人口,数量不大,需作为离散变量看待时,就利用随机性人口模型来描述其变化过程。 记 ()t Z —时刻t 的人口数(只取整数值) ()()()n t Z p t p n ==—人口为n 的概率 模型假设 1、在[]t t t ?+, 出生一人的概率与t ? 成正比,记作t b n ?,出生二人及二人以上的概 率为()t o ?; 2、在[]t t t ?+, 死亡一人的概率与t ? 成正比,记作t d n ?,死亡二人及二人以上的概率为()t o ?; 3、出生与死亡是相互独立的随机事件; 4、进一步设n b 和n d 均为与n 成正比,记,,n d n b n n μλ==λ和μ分别是单位时间内 1=n 时一个人出生和死亡的概率。 模型建立 由假设3~1,可知()n t t Z =?+可分解为三个互不相容的事件之和:()1-=n t Z 且t ?内出生一人;()1+=n t Z 且t ? 内死亡一人;()n t Z =且t ?内无人出生或死亡。按全概率公式 ()()()()t d t b t p t d t p t b t p t t p n n n n n n n n ?-?-+?+?=?+++--1)(1111 即 ()() ()()())(1111t p d b t p d t p b t t p t t p n n n n n n n n n +-+=?-?+++-- 令0→?t ,得关于()t p n 的微分方程 ()()()()t p d b t p d t p b dt dp n n n n n n n n +-+=++--1111 又由假设4,方程为 ()()()()()()t np t p n t p n dt dp n n n n μλμλ+-++-=+-1111 (1) 若初始时刻)0(=t 人口为确定数量0n ,则()t p n 的初始条件为 ()? ? ?≠== 00 ,0,10n n n n p n (2)

数学建模案例分析--概率统计方法建模9习题四

习题四 1、在一个人数很多的团体中普查某种疾病,为此要抽验N 个人的血,可以用两种方法进行。(1)将每个人的血分别检验,这就需要验N 次;(2)按k 个人一组进行分组,把从k 个人抽来的血混合在一起进行检验,如果这混合血液呈阴性反应,就说明这k 个人的血都呈阴性反应,这样,这k 个人的血就只需验一次。若呈阳性,则再对这k 个人的血分别进行化验。这样,k 个人的血总共要化验k+1次。假设每个人的血呈阳性的概率为p ,且这些人的试验反应是相互独立的。试说明当p 较小时,选取适当的k ,按第二种方法可以减少化验的次数。并说明当k 取什么值时最适宜? 2、人群中有健康人和病人两类,病人可以通过与健康人接触将疾病传染给健康人。任何两人之间的接触是随机的,当健康人与病人接触时是否被感染也是随机的。如果通过实际数据或经验掌握了这些随机规律,试估计平均每天有多少健康人被感染。 3、某商店要订购一批商品零售,设购进价1c ,售出价2c ,订购费0c (与数量无关)。随机需求量r 的概率密度为p(r),每件商品的贮存费为3c (与时间无关)。问如何确定订购量才能使商店的平均利润最大。这个平均利润是多少?为使这个平均利润为正值,需要对订购费0c 加什么限制? 4、若零件寿命服从指数分布,证明不存在预防性更换策略。又问,若失效率r(t)为减函数,是否会存在预防性更换策略? 5、用连续热轧方法制造钢材时要经过两道工序,第一道是粗轧(热轧),形成钢材的雏形;第二道是精轧(冷轧),得到规定长度的钢材。粗轧时由于设备,环境等方面随机因素的影响,钢材冷却后的长度大致上呈正态分布,其均值可以在轧制过程中由轧机调整,而其均方差则是由设备的精确度决定的,不能随意改变。精轧时把多出规定的部分切掉,但是如果发现粗轧后的钢材已经比规定长度短,则整根报废。精轧设备精度很高,可以认为轧出的成品材完全符合规定长度要求。根据轧制工艺的要求,要在成品材规定长度l 和粗轧后钢材长度的均方差σ已知的条件下,确定粗轧后的均值m ,使得当轧机调整到m 进行粗轧,再精轧后得到成品材时的浪费最少。 6、若上题中钢材粗轧后,长度在l l 与1之间时降级使用(比如经济价值上每一根降级材相当于α根成品材)。长度小于1l 才整根报废。试选用合适的目标函数建立优化模型,使某种意义下的浪费量最小。 7、某种水泥在凝固时放出的热量Y (卡/克)与其中的四种化学成分X 1,X 2,X 3,X 4有关,现有13个水泥样品的样本数据列于下表:

数学建模案例分析5化妆品销售量的预测--概率统计方法建模

数学建模案例分析5化妆品销售量的预测--概率统计方法建模

§5 化妆品销售量的预测 某公司在各地销售一种化妆品,观测15个城市在某月内对该化妆品的销售量Y及适合使用该化妆品的人数 x和人均收入2x。数据见下表: 1

要求通过以上数据建立预测模型,当已知任一个城市的适用人数和人均收入),(2 1 x x 时,能够预测在这个 城市的销售量。 这个问题本质上就是多元线性回归模型,如果随机变量Y 与固定变量m x x x ,,,2 1 之间有显著的线性相 关关系,即 ) ,0(~,222110σεεN x b x b x b b Y m m +++++= 称为m 元线性回归模型。 一、 模型中的参数估计 设通过实验或历史资料得到观测数据 ) ,,2,1(),,,,,(21n i x x x y im i i i =。令 ???? ? ? ? ??=??????? ? ?=??????? ??=m nm n n m m n b b b B x x x x x x x x x X y y y Y 102 1222 21 1121121,111, 由最小二乘估计,得 Y X X X B T T 1)(?-= 称m m x b x b x b b y ?????22110 ++++= 为变量Y 关于变量m x x x ,,,2 1 的线 性回归方程。 同样还可以得到2 σ的估计量为 ∑=---=n i i i y y m n 122 )?(11 ?σ 这里),,2,1(?????22110n i x b x b x b b y im m i i i =++++=。 二、回归模型的显著性检验

概率论模型

《概率论与数理统计》课程时间报告 题目:《非诚勿扰》女生的最优选择问题 学院:经济与管理学院 班级:会计二班 姓名:蔡静静,吴宇平,代学甜,蒋燕,陈阿慧学号:20151016208;20151016075;20151016196;20151016181;20151016183; 指导老师:夏宝飞 《非诚勿扰》女生的最优选择问题 一、研究背景(研究意义是什么) ①人们在生活中常常面临选择,而选择会带来不 同的结果,有些好,有些坏,这时候就需要人们 去估计不同选择的风险与概率,进而做出选择。 而在我们的周围就有一些事情的概率往往呈现 出一个定值,并且这个定值可以用概率论的知识 求出,从而达到方便人们作出更优选择的目的。 ②介绍黄金比例以及它在生活中的体现。黄金比

例是指达芬奇黄金比例,其比值为1:0.618。 0.618被公认为最具有审美意义的比例数字。它 由古希腊数学家欧多克索斯在公元前4世纪研究 并建立起相关的比例理论。不仅如此,和黄金比 例相同或相近的事物,往往能给人们带来美的享 受,这也让黄金比例成为美好的代名词,譬如本 次问题中女生找到最心仪男生的概率就为37%, 相当接近于黄金比例。所以每当我们遇到机遇时,美好的事情发生的比例也极有可能是37%哦。 二、研究内容 1、理论基础(基本知识点) 古典概型、微积分、均匀分布、泊松分布 2、实际应用(建模及数据整理) 策略:总共面试n人,不选择其中 前k人,从第k+1人起,一旦有比前面更优秀的男生,则选择。 问:如何决定k,使选到最中意的男生的概率最大?对于某个固定点值k,能选到最中意男生的总概率为 k i?1=k n 1 i?1 n i=k+1

数学建模的相关问题求解方法

数学建模的相关问题求解方法: 1.量纲分析法 是在物理领域建立数学模型的一种方法,主要是依据物理定律的量纲齐次原则来确定个物理量之间的关系,量纲齐次原则是指一个有意义的物理方程的量纲必须一致的,也就是说方程的两边必须具有相同的量纲,即: dim左=dim右并且,方程中每一边的每一项都必须有相同的量纲。 例子见书《数学建模方法与实践》P17—P23 2.线性规划法 线性规划法是运筹学的一个重要分支应用领域广泛。从解决各种技术领域中的优化问题,到工农业生产、商业经济、交通运输、军事等的计划和管理及决策分析。 线性规划所解决的问题具有以下共同的特征: (1)每一个问题都有一组未知数(x1,x2,……,xn)表示某一方案;这些未知数的一组定值就代表一个具体方案。由于实际问题的要求,通常这些未知数取值都是非负的。 (2)存在一定的限制条件(即约束条件),这些条件是关于未知数的一组线性等式或线性不等式来表示。 (3)有一个目标要求,称为目标函数。目标函数可表示为一组未知数的线性函数。根据问题的需要,要求目标函数实现最大化或最小化。 例子见书《数学建模方法与实践》P26—P30 3.0—1规划法 用于解决指派问题,是线性规划的特殊情况。例子见书《数学建模方法与实践》P31 4.图解法 用于求解二维线性规划的一种几何方法,其方法步骤见书《数学建模方法与实践》P34 5.单纯形法 也是一种求解线性规划的常用方法,其基本原理和方法见书《数学建模方法与实践》P37——P39,计算步骤P40。 6.非线性规划法 在目标函数和(或)约束条件很难用线性函数表示时,如果目标函数或约束条件中,有一个或多个是变量的非线性函数,则称这种规划问题为非线规划问题。例子见书《数学建模方法与实践》P44——P45 7.最短路及狄克斯特拉算法 狄克斯特拉算法是图论中用于计算最短路的一种方法,详见书《数学建模方法与实践》P58 8.克罗斯克尔算法 克罗斯克尔算法是用来求解一个连通的赋权图的最小生成树的方法,详见书《数学建模方法与实践》P59 9.普莱姆算法同上 10.欧拉回路及弗洛来算法 欧拉回路是指若存在一条回路。使他经过图中每一条边且只经过一次又回到起始点,成这种回路为欧拉回路,并成图为欧拉图。在一个图中,连接一个节点的边数称为该节点的度数。欧拉图的性质见书《数学建模方法与实践》P61。弗罗莱算法是计算欧拉回路的一种方法。详见书《数学建模方法与实践》P61。 11.网络流与最大流最小截集定理 对于任意给定的图,图上不同的截集有不同的容量。同时图上不同的流又不同的流值。称具有最小容量的截集为最小截集,具有最大容量的流为最大流。网络理论的基本定理将证明最大流的流值等于最下截集的容量。定理见书《数学建模方法与实践》P65。 12.概率统计模型 在实际生活中,往往会遇到一些随机出现的事件,如物质的“供需”。还有一些需根据出现的数据来归类,从而确定某一事件的归属问题。解决这些问题的数学工具就是概率统计的知识。例子见书书《数学建模方法与实践》P73。其中有随机性存储模型和多元统计判别模型。但是概率统计方法有很多不足之处:要求大量数据、要求有典型的统计规律、计算工作量等。 13.层次分析法 层次分析法是一种定量分析和定性分析相结合的多目标决策分析方法。特别是将决策者的经验给与量化,对目标(因素)结构复杂且缺乏必要的数据的情况下实用。层次分析法原理、标度、层次模型、计算方法、层次分析法的计算步骤等见书《数学建模方法与实践》P93—P96。 14.变分法 动态过程的另一类问题是所谓的动态优化问题,这类问题一般要归结为求最优控制函数使某个泛函达到极值。当控制函数可以事先确定为某种特殊的函数形式时,问题又简化为求普通函数的极值。求解泛函极值问题的方法主要有变分法和最优控制理论方法。变分法是研究泛函极值问题的一种经典数学方法。最优控制问题是现代科学技术中经常遇到的研究课题。利用经典的变分法可最大(小)值原理,可以对实际动态系统的最优控制问题建立数学模型。书《数学建模方法与实践》P100。另见书《数学建模教材》P218。 15.曲线拟合的线性最小二乘法 线性最小二乘法

概率论中几种概率模型方法总结

概率论中几种概率模型方法总结 绪论:概率论中几种常用的概率模型是古典概型、几何概型、贝努里概型.本文对概率论中几种概率模型方法进行了总结。 1 古典概型 古典概型及其概率是概率论的基础知识,它既是进一步学习概率的基础,下面就一些典型事件的分析来说明古典概型的概率计算方法。古典概型的概率计算可以分为三个步骤:确定所研究的对象为古典概型;计算样本点数;利用公式计算概率。即如果随机试验只有有限个可能结果,而且每一个可能结果出现的可能性相同,那么这样的随机试验就是古典概型问题。若设Ω是一个古典概型样本空间, 则对任意事件A 有: A m P ( A ) ==Q n 中的样本点数中的样本点数。在计算m 和n 时,经常使用排列与组合计算公式。在确定一个试验的每个基本事件发生的可能性相同时,经常根据问题本身所具有的某种“对称性”,即利用人们长期积累的关于“对称性”的实际经验,认为某些基本事件发生的可能性没有理由偏大或偏小。关于古典概型的数学模型如下: 1.1 袋中取球问题 1.1.1 随机地同时从袋中取若干球问题 随机地同时从袋中取若干球问题是古典概型中的一类最基本问题,其特点是所考虑的事件中只涉及球的结构而不涉及取球的先后顺序,计算样本点数时只需考虑组合数即可。概率中的很多问题常常可以归结为此类问题来解决。 事件1 一袋中有m + n 个球,其中m 个黑球, n 个白球,现随机地从袋中取出k 个球( k ≤m + n) ,求其中恰好有l 个白球( l ≤n)的概率。 分析:随机地从袋中取出k 个球有k m+n C 种可能的结果,其中“恰好有l 个白球”这 一事件包含了l k-l n m C C 种结果,因此所求概率为l k - l n m k m + n C C P =C 这个结论可以作为一个公式来应用。用它可以解决一些类似的问题。 1.1.2 随机地从袋中不放回地取球若干次 随机地从袋中不放回地取球若干次就是指随机地从袋中每次只取一个球,取后不再放回袋中,连续进行若干次。这样的取球过程实际上是按顺序取的,所考虑的事件也会涉及到取球的顺序,所以要用排列数计算样本点数。 事件2 一袋中装有m + n 个球,其中m 个黑球, n 个白球,现随机地从中每次取出一

数学建模案例分析消费分布规律的分类概率统计方法建模

§ 7消费分布规律的分类 为研究辽宁、浙江、河南、甘肃、青海 5省份在某年城镇居民生活消费的分布规律,需要用 调查资料对这5个省分类?数据见下表: 指标 省份、\ X 1 X 2 X 3 X 4 X 5 X 6 X 7 X 8 辽宁 7.90 39.77 8.49 12.94 19.27 11.05 2.04 13.29 浙江 7.68 50.37 11.35 13.30 19.25 14.59 2.75 14.87 河南 9.42 27.93 8.20 8.14 16.17 9.42 1.55 9.76 甘肃 9.16 27.98 9.01 9.32 15.99 9.10 1.82 11.35 青海 10.06 28.64 10.52 10.05 16.18 8.39 1.96 10.81 其中,X 1 :人均粮食支出; X 2 : 人均副食品支出; X 3:人均烟、酒、茶支出; X 4 : 人均其它副食品支出; X 5:人均衣着商品支出; X 6 : 人均日用品支出; X 7:人均燃料支出; X 8: 人均非商品支出. 在科学研究、生产实践、社会生活中,经常会遇到分类的问题 ?例如,在考古学中,要将某些 古生物化石进行科学的分类;在生物学中,要根据各生物体的综合特征进行分类;在经济学中, 要考虑哪些经济指标反映的是同一种经济特征;在产品质量管理中,要根据各产品的某些重要指 标而将其分为一等品,二等品等等 ? 这些问题可以用聚类分析方法来解决 ? 聚类分析的研究内容包括两个方面,一是对样品进行分类,称为 Q 型聚类法,使用的统计量 是样品间的距离;二是对变量进行分类,称为 R 型聚类法,使用的统计量是 变量间的相似系数. 设共有n 个样品,每个样品 人有p 个变量,它们的观测值可以表示为 x i - (x ii , x 2i , ,x pi ), i =1 2 ,n 、样品间的距离 、变量间的相似系数 相似系数越接近i ,说明变量间的关联程度越好.常用的变量间的相似系数有 1、夹角余弦 F 面介绍在聚类分析中常用的几种定义样品 x i 与样品X j 间的距离. 1、Mi nkowski 距离 d(X i ,X j )=[》X ki — Xq ] km 2、绝对值距离 p d(X i ,X j )=送 X ki -Xq k=1 3、欧氏距离 p d(X i ,X j )珂' X ki km X kj

概率统计文献综述

文献综述 概率论在经济中的应用 概率论在经济中的应用 摘要 概率统计是一门相当有趣的数学分支学科.随着科学技术的发展和计算机的普及,它最近几十年来在自然科学和社会科学中得到了比较广泛的应用,在社会生产和生活中起着非常重要的作用.当今概率统计与经济的关系可以说是息息相关的,几乎任何一项经济学的研究、决策都离不开它的应用,例如:实验设计、多元分析、质量控制、抽样检查、价格控制等都要用到概率统计知识.实践证明,概率统计是对经济学问题进行量的研究的有效工具,为经济预测和决策提供了新的手段.本文主要讲解概率统计的一些方法、理论研究以及对其经济应用进行一些简单的描述. 关键词:概率统计,多元分析,价格控制,经济预测和决策 引言 经济学的数学化已经成为不可否认的事实,而R数学化的趋势愈演愈烈.特别是近十几年来,由于金融学、保险学等经济学分支学科越来越普遍的应用,研究

随机事件的概率论在经济学中得到越来越快的发展,而且近几年诺贝尔奖也授予在经济学的随机处理方面做出突出贡献的学者,比如1990年奖获的证券组合选择理论,1994年获奖的博弈理论(王文华,2007);同时由于概率论考虑了样本与总体之间的关系的这一特性,对实证经济学特别是经济计量学可以说起到-r非常大的推动作用.甚至可以说,当代实证经济学的发展就是概率统计知识在经济模型中的实际应用.如果考虑在实证经济学领域的诺贝尔获奖者,那概率论对经济学的影响就更大了,包括第一届诺贝尔奖获得者丁博根、第二届诺贝尔获奖者萨谬尔森等在内,前前后后大约有20名经济学家研究和应用概率论在经济学中的作用(史树中,2002),因此概率论在经济学巾有十分广泛的作用. 依据文献对概率统计在经济中的应用的相关知识进行归纳整理,并有条理的系统阐述出来,为更好地完成论文做充分的准备. 1概率论与经济相结合的背景简介 从理论研究角度看,借助概率论方法研究经济问题至少有三个优势:其一是前提假定用概率论语言描述得一清二楚,概率论强调事物处于不可能事件和必然事件之间,即事物出现的概率在(0,1)之间,这符合经济现象的现实.经济学强调经济现象要用数学来描述,由于概率论引进概率的概念,使得数学描述成为概率论描述的一个特例,因此概率论能够穷尽各种可能,能够更加清楚地描述经济现象;其二是逻辑推理严密精确,可以防止漏洞和谬误.通过内生化经济现象出现的概率,同时依据概牢论的严密逻辑,推导经济运行的各种轨迹.再结合现有的经济理论,查看概率论的逻辑是否符合经济的行为规律,使得概率论与经济学达到共同解释问题的目的;其三是可以应用已有的概率论模型或概率论定理推导新的结果,得到仅凭直觉无法或不易得出的结论,传统的经济学假定经济现象或者经济行为在确定性的条件下发生,因此运用现有的经济理论能够清楚阐述经济现象的本质,概率论的引进使得经济学能够研究在不确定性条件下的行为,扩大了经济学的视野,得出的结论也更加具有概括性.运用概率论方法讨论经济问题,学术争议便可以建立在这样的基础上:或不同意对方前提假设;或找出对方论证错误;或是发现修改原模型假设会得出不同的结论.因此,运用概率论方法做经济学的理论研究可以减少尤用争论,并且让后人较容易在已有的研究工作上继续

概率统计模型

第五章概率统计模型 一、主要内容 1、利用初等概率知识建立几个初等概率模型,它们都是实际生活中常碰到的问题。 2、利用存储知识建立随机存储模型。 3、利用决策论知识建立随机性决策模型。 4、利用排队论知识建立排除类问题的模型,这里仅探讨其中M/M/1排除模型中较简单的部分。 二、学习目标 1、掌握初等概率模型建模方法,熟悉常用的随机变量的分布及数字特征。 2、了解随机性存储论概念,理解随机性存储模型的建立与简单分析。 3、掌握随机性决策模型,会建立实际问题的随机性决策模型,并能进行相关分析。 4、了解排除论基本知识,会求解简单的排队问题模型。 三、本章知识结构 四、重点和难点: 重点:初等概率模型、存储模型、决策模型、排队模型的建立思路与解法。 难点:存储模型、排队模型的建立 五、学习方法建议 一是要大量阅读、思考别人做过的模型,二是要亲自动手,认真地做上几个实际题目我们的具体建议如下: (1)学习中随时翻阅相关数学专业知识方面的书籍,《概率论与数理统计》、与《运筹学》专业书籍,应放在身边随时备查 (2)开始时可能感到无从入手,不必担扰,随着学习过程逐渐展开,只要你是认真的,定会一步一步解脱困惑. (3)尽早复习一下概率统计知识,熟悉不确定事物的处理勤动脑,勤思考与勤动手是学好数学建模课的关键,务求落实 六、重点难点辅导:

1、初等概率模型主要介绍了可靠性模型、传染病流行估计、常染色体遗传模型等三类 问题: (1) 可靠性模型 计算抓住一点:元件串通则可靠度相乘;元件并联则不可靠度相乘。 设某种机器的工作系统由N个部件组成,各部件之间是串联的,即只要有一个部件失 灵,整个系统就不能正常工作.为了提高系统的可靠性,在每个部件上都装有主要元件的备用件及自动投入装置(即当所使用元件损坏时,备用元件可自动替代之而开始工作)明显地,可以把问题当作并联来处理,备用件越多,整个系统正常工作的可靠性就越大,?但是,备 用件过多势必导至整个系统的成本、重量和体积相应增大,工作精度也会降低?因此,配置 的最优化问题便被提出来了:在某些限制性条件之下,如何确定各部件的备用件数量,使整个系统的工作可靠性最大?这就有了约束条件。 易见,问题的目标函数为非线性的,决策变量又取整数,故为非线性整数规划问题. (2) 传染病流行估计的数学模型 假定人群中有病人或更确切地说是带菌者,也有健康人,即可能感染者,任何两人之间的接 触是随机的,当健康人与病人接触时健康人是否被感染也是随机的?问题在于一旦掌握了随 机规律,那么如何去估计平均每天有多少健康人被感染,这种估计的准确性有多大? ?设人群只分病人和健康人两类,病人数和健康人数分别记为i和s,总数n不变,即 i +s=n (1) ?人群中任何二人的接触是相互独立的,具有相同概率P,每人每天平均与m人接触; 当健康人与一病人接触时,健康人被感染的概率为入. 由假设2知道一个健康人每天接触的人数服从二项分布,且平均值是m则 m= ( n -1) p 于是 n -1 又设一健康人被一名指定病人接触并感染的概率为口,则由假设3及⑵式得 r 入m P"! =,P = n T 那么一健康人每天被感染的概率P2为 肖(4) 由于健康人被感染的人数也服从二项分布,其平均值卩为, —sp =(n - i)p2 标准差二为

数学建模案例分析2 随机存储模型--概率统计方法建模

§2 随机存储模型 模型一、销售量为随机的存储模型 报童每天清晨从报社购进报纸零售,晚上将没有卖出的报纸退回。如果购进报纸太少不够卖,会少赚钱;如果购进太多买不完,将要赔钱。报童应如何确定每天购进的报纸数量,以求获得最大的收入。 模型假设1、报纸每份购进价b ,零售价a ,退回价c ,且c b a >> 2、市场需求量是随机的,报童已通过经验掌握了需求量r 的随机规律,r 视为连续随 机变量,其概率密度函数)(r p 。 模型建立 记 n —每天购进量,报童每天的收入R 是n 的函数 ()()()()()? ??>----≤-=r n r n c b r b a r n n b a n R ,, 但目标函数不应是报童每天的收入,而应是他长期卖报的日平均收入。从大数定律的观点看,这相当于每天收入的期望值,即日平均收入: ()()()()[]()()()??∞-+----=n n dr r p n b a dr r p r n c b r b a n G 0 ()()()()()()()()??∞-+-----=n n dr r p b a n np b a dr r p c b n np b a dn dG 0 () ()()()??∞-+--=n n dr r p b a dr r p c b 0 令0=dn dG ,得到 ()()c b b a dr r p dr r p n n --=??∞ 又因为()10=?∞ dr r p ,上式又可表示为 ()c a b a dr r p n --=?0 (1) 使报童平均日收入最大购进量n 由(1)确定 评注 由()()c b b a dr r p dr r p n n --=??∞0,()?=n dr r p p 01是卖不完的概率, ()?∞ =n dr r p p 2是卖完的概率。上式表明,购进的份数应使卖不完与卖完的概率之比等于卖出一份赚的钱b a -与退回一份赔的钱c b -之比。 模型二、到货时间为随机的存储模型 模型假设1、商品订货费1c ,每件商品单位时间的储存费为2c ,缺货费3c ,单位时间需求量为r ;

概率论经典模型

第七章 参数估计典型题解 1.设总体X 具有分布列 1 ()(1) ,1,2,k P X k p p k -==-= ,求p 的矩估计 和极大似然估计. 解 (1)矩估计 1 1 2 1 1 1(1) (1) k k k k p EX k p p p kq q p ∞ ∞ --=== -== = -∑ ∑. 令 X EX =,即 1X p = ,解之得p 的矩估计为 1?p X =. 注:这里用到了 12 1 11, 1(1) k k kx x x p ∞ -== = <-∑. 事实上,令∑∞ =-= 1 1 )(k k kx x S 逐项积分得 x x x dt t k dt t S x k k k x k -= = = ?∑ ? ∑ ∞ =-∞ =1)(0 1 1 1 , 两边对x 求导得 2 ) 1(1)(x x S -= . (2)极大似然估计 ()1 1 121 12(,,,;)(1) (1)(1) , ln (,,,;)1)ln(1)ln . n i i i n x n x n nx n n n i n L x x x p p p p p p p L x x x p n x p n p =---=∑= -=-=-=--+∏ 令 12ln (,,,;) 0n d L x x x p dp = ,即 (1)01n x n p p --+ =-, 解之得p 的极大似然函数估计为 1?p X =. 2.总体X 的密度函数 1 12 2 1,[,], ()0,x f x θθ∈- - ?=? ?其他. 求θ的矩估计与极大似 然估计. 解 (1)矩估计 1 212 1?()22 E X xf x dx xdx X θθ θθθ+∞+-∞ - = = = ?=?=? ?. (2)极大似然估计

数学建模案例分析4足球门的危险区域--概率统计方法建模

§4 足球门的危险区域 一、问题提出 在足球比赛中,球员在对方球门前不同的位置起脚射门对对方球门的威胁是不一样的。在球门的正前方的威胁要大于在球门两侧射门;近距离的射门对球门的威胁要大于远射。已知标准球场长为104米,宽为69米;球门高为2.44米,宽为7.32米。 实际上,球员之间的基本素质可能有一定差异,但对于职业球员来讲一般可以认为这种差别不大。另外,根据统计资料显示,射门时球的速度一般在10米/秒左右。下面要建模研究下列问题: (1)针对球员在不同位置射门对球门的威胁度进行分析,得出危险区域; (2)在有一名守门员防守的情况下,对球员射门的威胁度和危险区域作进一步研究。 二、问题分析 根据这个问题,要确定球门的危险区域,也就是要确定球员射门最容易进球的区域。球员无论从哪个地方射门,都有进与不进两种可能,这本身就是一个随机事件,无非是哪些地方进球的可能性最大,即是最危险的区域。影响球员射门命中率的因素很多,其中最重要的两点是球员的基本素质(技术水平)和射门时的位置。对每一个球员来说,基本素质在短时间内是不可能改变的,因此,我们主要是在确定条件下,对射门位置进行分析研究。也就是说,我们主要是针对同素质的球员在球场上任意一点射门时,研究其对球门的威胁程度。 某一球员在球门前某处向球门内某目标点射门时,该球员的素质和球员到目标点的距离决定了球到达目标点的概率,即命中球门的概率。事实上,当上述两个因素确定时,球飞向球门所在平面上的落点将呈现一个固定的概率分布。稍作分析容易断定,该分布应该是二维正态分布,这是我们解决问题的关键所在。 球员从球场上某点射门时,首先必定在球门平面上确定一个目标点,射门后球依据该概率分布落入球门所在平面。将球门视为所在平面上的一个区域,在区域内对该分布进行积分,即可得到这次射门命中的概率。然而,球员在选择射门的目标点时是任意的,而命中球门的概率对目标点的选择有很强的依赖性。这样,我们遍历球门区域内的所有点,对命中概率作积分,将其定义为球场上某点对球门的威胁程度,根据威胁度的大小来确定球门的危险区域。 三、模型假设 1、在理想状态下,认为球员的基本素质是相同的,或差别不大; 2、不考虑球员射门后空气、地面对球速的影响,设球速为10米/秒; 3、球员射门只在前半场进行,为此假设前半场为有效射门区域; 4、只考虑标准的球场:长为104米,宽为69米;球门高为2.44米,宽为7.32米。 四、符号说明 Ω:半场上的一个球门所在平面,是地面以上的半平面; D :球门内有点在球门平面π上所表示的区域,即Ω?D ; ),(y x A :球场上的点,),(y x 为其坐标; ),(z y B :球门内的点,),(z y 为其坐标; ),(z y p :从球场上A 点对准球门内B 点射门对,命中球门的概率; ),(y x D :球场上点),(y x 对球门的威胁度;

概率图模型介绍与计算

概率图模型介绍与计算. 概率图模型介绍与计算 01 简单介绍概率图模型是图论和概率论结合的产物,它的开创者是鼎鼎大名的Judea

Pearl,我十分喜欢概率图模型这个工具,它是一个很有力的多变量而且变量关系可视化的建模工具,主要包括两个大方向:无向图模型和有向图模型。无向图模型又称马氏网络,它的应用很多,有典型的基于马尔科夫随机场的图像处理,图像分割,立体匹配等,也有和机器学习结合求取模型参数的结构化学习方法。严格的说他们都是在求后验概率:p(y|x),即给定数据判定每种标签y的概率,最后选取最大的后验概率最大的标签作为预测结果。这个过程也称概率推理(probabilistic inference)。而有向图的应用也很广,有向图又称贝叶斯网络(bayes networks),说到贝叶斯就足以可以预见这个模型的应用范围咯,比如医疗诊断,绝大多数的机器学习等。但是它也有一些争议的地方,说到这就回到贝叶斯派和频率派几百年的争议这个大话题上去了,因为贝叶斯派假设了一些先验概率,而频率派认为这个先验有点主观,频率派认为模型的参数是客观存在的,假设先验分布就有点武断,用贝叶斯模型预测的结果就有点“水分”,不适用于比较严格的领域,比如精密制造,法律行业等。好吧,如果不遵循贝叶斯观点,前面讲的所有机器学习模型都可以dismiss咯,我们就通过大量数据统计先验来弥补这点“缺陷”吧。无向图和有向图的例子如(图一)所示:

图一 (a)无向图(隐马尔科夫) (b)有向图 概率图模型吸取了图论和概率二者的长处,图论在许多计算领域中扮演着重要角色,比如组合优化,统计物理,经济等。图的每个节点都可看成一个变量,个状态(取值范围),节点之间的边表示变量之间的关系,它除N每个变量有. 了可以作为构建模型的语言外,图还可以评价模型的复杂度和可行性,一个算法的运行时间或者错误界限的数量级可以用图的结构性质来分析,这句话说的范围很广,其实工程领域的很多问题都可以用图来表示,最终转换成一个搜索试问还有什么问题不是搜索问题?目标就是快速的定位到目标,或者查找问题,树是图,旅行商问题是基于图,染色问题更是基于图,他们具有不同的图的结 构性质。对于树的时间复杂度我们是可以估算出来的,而概率图模型的一开始

概率论模型

第三篇概率论模型 在概率论的应用实例中,通过对应用问题建模主要培养处理随机问题的能力,掌握归纳和处理随机现象的思想方法。学会应用期望值和标准差衡量随机现象的特征、归纳随机现象的基本规律和特征、解决在不确定环境下的风险管理和决策问题。 解决不确定问题首先遇到概率的计算问题,常用到的计算方法有古典概型、加法公式、条件概率、乘法公式、全概率公式与贝叶斯公式等。与此相关的应用实例有:彩票中奖概率的计算,至少两人生日在同一天,有趣的蒙特莫特(Montmort)问题,论掷骰子游戏中的概率计算,意料之外“数理”之中!敏感性问题调查,抽签(抓阄)公平吗,对于疑难病症要进行综合检查,说谎的孩子,如何追究责任等。 描述随机现象的常用方法是用随机变量,这样就便于用分析的方法来处理,许多不确定应用问题可以用常见的随机变量来描述,如二项分布、泊松分布、均匀分布和正态分布等;计算不确定性问题的平均值和波动程度用随机变量的数学期望与方差(或标准差)才比较客观。关于随机现象分布的归纳和随机变量的数学期望的应用实例有:泊松(Poisson)分布与突发事件概率的计算,选择题的给分标准,分赌本问题,奖品的诱惑下切勿上当,选择题能考出真实成绩吗?“摸大奖”真的免费吗?赌徒输完问题,考试成绩的标准分,几种保险理赔的概率分布及其在保险实务中的应用,计算机网络病毒随机传播的概率模型,求职面试问题(动态决策问题),减少验血的工作量,报童的策略(随机存储问题),建大厂还是建小厂?应该定购多少本挂历,可使总利润最大?正态分布的应用,如何有效安排人力等。 有些不确定性问题需要用多个随机变量来描述和解决,根据多维随机变量的分布与数字特征对所要解决问题进行优化,如组合证券投资决策的均值——方差模型等。应用多维随机变量解决应用问题的实例有:这样找庄家公平吗?配对问题——蒙特莫特问题的继续讨论,组合证券投资决策模型等。 大数定律反映相互独立的随机变量的平均值依概率收敛于一个常数的特征,中心极限定理反映的是一系列相互独立的随机变量和的极限分布为正态分布的特征,大数定律与中心极限定理在保险精算等方面有着广泛的应用。与大数定律和中心极限定理相关的应用实例有:中心极限定理的例子,蒲丰投针与蒙特卡洛(Monte—Carlo)方法,随机变量平均值的稳定性,大数定律在保险中的应用,人寿保险问题,电影院座位数的设定,价格预测,产品市场占有率的预测等。 130

数学建模基础概率统计部分1数理统计的基本知识

数学建模基础概率统计部分1数理统计的基本知识 注:建模的基础知识主要包括:数值分析(插值、差分等)、微分方程、优化规划、概率统计分析等几大部分,建模就是各种方法的综合应用。 一、统计量 1.描述集中趋势的统计量: 在描述统计资料的方法中,对集中趋势的测量方法是比较重要的方法。有很多时候数据都是杂乱无章的,但是其中却有着一种必然的因素,就是事物的本质特征,而这种本质特征,可以通过变量的集中趋势来体现。集中趋势代表了现象的一般水平和发展状态,能够说明现象的变动趋势。 (1)算数平均值:∑==n i i X n X 1 1 分组数据:11 n n i i i i i i n X X f X n ====∑∑(加权平均) 对于组距式的分组数,可以利用组中值来计算平均值,虽然这样是一个近似的值,但是作为集中趋势的反应也是可以的: 1n i i i n X X n ='≈∑ i X '为第i 组的组中值(区间的中中心值) 如: 假定某公司考虑是否增开班车避免员工不必要的时间浪费,随机调查了10名员工上班时间所用的时间,如表所示,试对公司整体上班时间情况进行简单分析。

分析:数据并未分组,所以利用∑==i i X n X 1 计算平均值,可以看出整体上班时 间的集中趋势, 34min X =,但是这一结果对于10个人来说并不太理想,因为期中9人的上班 时间都在这一水平之下,原因是第10个人的上班时间比较长;所以再用平均值分析,要将这个数据剔除掉,之后在计算可得24min X =,显然这一就比较合理了,而且时间并不是太长,所以公司可以不用增开班车,以节约成本。 (2)众数:指全部数据中出现次数最多的数值; 众数的作用: 众数在某些场合具有不可替代的作用,比如:在集贸市场了解某种商品的交易价格时,由于无法收集到有关销售量或者销售额的数据,最简单的方法就是了解市场上出现次数最多的交易价格,以此作为平均价格。 众数还有一个作用是,区别总体。当数据出现两个众数时,它提醒我们是否数据是来自两个不同的总体。比如:两个生产灯泡的厂家将一批产品混在一起,如果灯泡寿命差距较大,进行抽样检测时,会发现有两个众数。 求众数一般需要将数据进行分组,统计数据的频数,即可以得到众数,对于组距式的数据表,可以用内插法近似计算: 1 012 M L d ?=+ ??+?, 众数组为出现次数最多的区间,其中L 为众数组下限,d 为组距,1?为众数组与前一组的次数之差,2?为众数组与后一组的次数之差。 有时为了简便,也可以利用组中值来代替众数。 MATLAB 求众数方法: function y=Num_max(p); p=p(:); k=unique(p); B=hist(p,k) ;y=k(B==max(B)); p=p(:)将输入数据写成列向量; unique(p)排序并去掉重复数据; B=hist(p,k)做直方图,返回值为数据p 的频数向量; (3)中位数:将数据由小到大排序后位于中间位置的那个数值.

概率论的局限性分析

概率论的局限性分析 引言 概率论是一门研究随机现象的数量规律学科。概率论在发展的过程中有许多的流派,对于概率本身也有许多不同的解释,各有自身的缺陷,造成了学术界的争论。概率论的公理化方面也存在一定的争议,目前的概率论是以柯尔莫哥洛夫(kolmogorov)公理系统为基础的[1]。该公理系统具有一定的局限性,比如菲纳特和熊大国等学者指出了该公理系统的一些缺点和不足[2]。目前的概率理论要解决许多问题都是有前提条件的,并非可以解决所有的概率问题,比如对事件的概率,可能不同的条件,或者不同的人会给出不同的概率,那么应当如何来综合和折衷,概率论并没有解决。而笔者在研究中发现,概率论本身在许多时候也是有前提的,并不能解决所有的概率问题,而其中有一个根源在于概率值完全可能是随机变量,而不是一个固定的值,而这种随机不确定性如果在概率论模型中推演下去,其中的许多参数、变量和方法都可能是不确定的,这就意味着一种自由的、不受限的概率表达方式可能需要更多的参数,乃至于无限参数。这一问题可以说明现有概率论的局限性,乃至于类似的问题可能存在于数学的其他领域,而这也将对其他的学科产生影响。 1 概率定义反映出的问题 关于概率的定义,重要存在古典概型、几何概型和统计概率三种定义,它们在解决实际问题中起着十分重要的作用,但是一直存在争议,各种定义各有自己的优势和缺陷。古典概率定义要求试验的可能总是有限的、互不相容及等可能性的,几何概率虽然克服了试验结果的有限性,但同样要求某种等可能性,而许多实际问题是不具备这些条件的,所以这两种定义都带有局限性。统计概率虽然没有前面两种定义那种局限性,但却建立在大量重复试验的基础上,况且,试验

相关文档
最新文档