深圳杯数学建模A题获奖论文

合集下载

数学建模2015深圳A题医保诈骗论文(完整版)

数学建模2015深圳A题医保诈骗论文(完整版)

建立在医保欺诈中的应用模型摘要:本文围绕医保欺诈的识别而展开讨论,运用层次分析法和模糊综合评价相结合的方法对可能的医保欺诈进行判断。

首先,对附件中大量数据进行筛选整理得到所需可用的数据。

然后,根据层次分析法确定模型的准则层、方案层并确定各识别因子的权重。

接着,结合模糊综合评价确立的各识别因子的隶属函数和医保欺诈度阈值,建立了医保欺诈识别模型,找出了可能的医保欺诈。

对于医保欺诈的识别,首先运用EXCEL中数据透视表、VLOOKUP函数等对附件中多张表的大量数据进行筛选整理,提炼出病人ID号、性别、年龄、所对应的账单号、处方中药物的种类、单张处方费用、单张处方拿药次数、单张处方总费用、单张医保卡的使用次数等与欺诈有关的数据。

然后,根据层次分析法确定医保诈骗识别模型的准则层:单张医保卡使用次数和单张处方总费用,方案层:病人年龄、性别,处方中药物种类、单张处方费用、单张处方拿药次数,并确定各识别因子的权重。

接着运用模糊统计法确立各识别因子的隶属函数,并设定结点阀值作为检测判断的依据,最后,运用matlab语言对附件中的数据进行判断,得到可能的医保欺诈的数据。

该模型可以在一定程度上可以识别医保诈骗。

关键字:医疗保险;诈骗识别;层次分析;模糊综合评价一、问题重述医疗保险欺诈,是指公民、法人或者其他组织在参加医疗保险、缴纳医疗保险费、享受医疗保险待遇过程中,故意捏造事实、弄虚作假、隐瞒真实情况等造成医疗保险基金损失的行为。

骗保人进行医保欺诈时通常使用的手段,一是拿着别人的医保卡配药,二是在不同的医院和医生处重复配药。

下面这些情况都有可能是医保欺诈:单张处方药费特别高,一张卡在一定时间内反复多次拿药等。

请根据附件中的数据,找出可能的欺诈记录。

注:数据中病人姓名、身份证号、电话号码、医保卡号为非真实数据。

数据见2.1 2.2 2.3 2.4 2.5 2.6二、问题分析医疗保险是为补偿疾病所带来的医疗费用的一种保险,关系到国家民生和发展的重大问题,而从全国范围来看,医保欺诈呈逐年递增态势;医保欺诈不仅扭曲了保险定价机制,损害保险经营的最大诚信原则,而且还严重威胁医保基金安全,妨碍医保政策的有效实施。

2014深圳杯A题论文

2014深圳杯A题论文

题目:计划生育政策调整对人口数量、结构及其影响的研究【摘要】人口的数量和结构是影响经济社会发展的重要因素。

从20世纪70年代后期以来,我国开始实施计划生育政策,该政策的实施,有效地控制了我国人口的过快增长,对经济发展和人民生活的改善做出了积极的贡献。

但另一方面,其负面影响也开始显现。

劳动人口绝对数量开始步入下降通道,人口老龄化,负担过重。

为了研究计划生育政策调整对人口数量和结构的影响,本文对以下几个方面进行探索:首先,为了研究我国未来人口的数量及发展趋势,利用spss软件做出我国出生率、死亡率及自然增长率的线性图,并建立灰色预测GM(1,1)模型对我国未来十年的人口数量进行预测,在2026年我国总人口将达到151835万人。

综合可以发现,我国未来人口将继续以一种缓慢的方式增加,在达到一定的峰值后开始减少。

此外,小组还拟合出了我国未来十年城镇与农村人口数量、男女出生性别比、来老年人口比例等函数,根据函数预测未来人口结构变化,得出,我国未来人口将进入老龄化阶段,男女比例失衡,大量农村人口涌入城市,造成城市人口负担的加重,影响我国社会的稳定发展。

其次,组员在阅读并研究了我国人口战略发展研究的论文后,对其中的一些报道进行了分析与总结。

最后,针对北京市计划生育的新政策,本文将夫妻双方”是否为独生子女”看成性状来考虑,新计划生育政策对北京未来10年的影响。

首先用2003年到2013年北京10年的常住人口数,出生率和死亡率,及户籍人口数,利用拟合函数模型预测2013年到2015年的户籍人口。

然后利用最小二乘拟合原理模拟出了未来10年北京市户籍人口的出生率和死亡率,最后利用概率与统计相关知识的计算得出了未来10年北京市的常住人口,对比得出新计划生育政策对北京市的影响,户籍人口与常住人口之比降低,北京市人口负担将加重,人口抚养比将增大,将给北京市社会带来更大的压力。

关键词:spss线性图灰预测GM(1,1)模型人口老龄化单独二胎一、问题重述问题一、人口问题有着悠久的研究历史,其研究模型都依赖生育模式、生育率、死亡率和性别比等多个因素。

全国大学生数学建模大赛国家一等奖论文A题

全国大学生数学建模大赛国家一等奖论文A题
海床情况进行求解。
=
− − ( − 1)′
, = 1, 2, · · ·, 210

当逐渐增大,锚链受到的竖直向下方向的合力与支持力之差先逐渐接近于0,
再等于0,直至小于0。当合力小于0时,锚链以海床接触,此时海床提供向上的支持
力,其大小与′ 相等。因此可将小于0 的值都作零处理,故锚链接触海床时,
对于问题二,首先考虑第一个子问题,将风速36/直接代入问题一的模型中,
得出此条件下的吃水深度为0.723,各钢管倾斜角度(度)依次为8.960、9.014、9.068
、9.123,钢桶倾斜角(度)为9.179,锚链链接处的切线方向与海床的夹角(度)为18.414,
游动区域半径为18.80。发现此条件下,水声通讯系统设备的工作效果较差,且锚被
计与应用对海上科学发展有重要意义。
1.2 问题的提出
已知某近浅海传输节点(如图1所示),将浮标视作底面直径2为、高为2、质量
为1000的圆柱体,锚的质量为600,钢管共4节,每节长度为1,直径为50,
每节钢管的质量为10。水声通讯系统安装在一个长为1、外径为30的密封圆
柱形钢桶内,设备和钢桶总质量为100。
Step1: 遍历求解
令吃水深度ℎ的初始值为0.1,以0.0005为单位逐步增加至2。( 浮标高度为2,
完全浸没时吃水深度ℎ则为2 ),记录对应的数据,选取水下物体竖直方向高度和
与海域水深最接近的组别,进一步进行计算,结果如下表所示(具体程序见附录):
表 1: 不同风速的相关结果表
以风速24/的情况为例,绘制游动区域图:
题意的变量临界值。以水深16、系统各部分递推关系式和钢桶与竖直方向夹角小
于5°为约束条件,将多目标优化转化为单目标优化。通过调节决策变量中锚链的型

2023深圳杯数学建模a题作品

2023深圳杯数学建模a题作品

2023深圳杯数学建模A题作品:全面评估及个人观点1. 介绍2023年深圳杯数学建模竞赛是一项备受关注的赛事,而A题作品更是备受瞩目。

在这篇文章中,我将对2023深圳杯数学建模A题作品进行全面评估,并共享我对这一主题的个人观点和理解。

2. 作品深度和广度评估2023深圳杯数学建模A题作品的深度和广度是非常值得探讨的。

作品是否能充分涉及数学建模的各个方面,例如建模过程、模型的建立和求解等。

作品是否能深入探讨问题背后的数学原理和应用,以及对实际问题的解决方案是否具有实用性和可行性。

在评估作品的深度和广度时,我将从以下几个方面进行考量:- 作品的数学建模过程是否完整,包括问题的分析、模型的建立和求解方法的选择等。

- 作品对数学原理的理解和运用是否准确和深刻。

- 作品所涉及的实际问题是否具有一定的现实意义,解决方案是否能够得到实际应用。

3. 作品中的关键内容在撰写文章时,我会重点关注作品中的关键内容,如数学建模的方法和应用、解决问题的思路和技巧等。

我会根据这些关键内容,深入剖析、探讨和总结,以期能够帮助你更全面、深刻地理解A题作品所涉及的内容。

4. 个人观点和理解作品中所涉及的数学建模方法和应用,对我而言都是非常有意义的。

通过分析作品,我得以深入了解数学建模的实际运用和意义,进而加深对数学建模的理解和认识。

作品中的解决问题的思路和技巧也为我在今后的学习和工作中提供了很好的参考和借鉴。

总结在撰写这篇文章的过程中,我将以尽可能深入和全面的方式评估2023深圳杯数学建模A题作品,并共享我对这一主题的个人观点和理解。

我相信通过文章的阅读,你将能更全面、深刻地理解A题作品所涉及的内容,从而为今后的学习和研究提供有力支持。

评估A题作品的深度和广度是一项重要的任务,需要从多个维度进行考量。

作品的数学建模过程是否完整和清晰,包括对问题的准确定义和目标、模型的建立和求解方法的选择等。

作品是否能充分运用数学理论和方法,对问题进行深入分析,并提出实用性强的解决方案。

2015深圳杯数学建模a题课程论文

2015深圳杯数学建模a题课程论文

《数学建模II》课程论文组别学生一学生二学生三时间成绩摘要:医疗保险是关系到国计民生和国家发展的重大问题,基金统筹定额标准对医疗保险的发展、完善和社会稳定发展有重要影响。

本文探讨了年基金支付总额与年龄之间的关系,给出新的定额标准,并对按参保人年龄结构分类的每一类定点医疗机构下一年度的定额总费用进行预测。

针对问题一,我们建立模型一和模型二。

模型一计算出人均支付基金总额,利用excel 画出折线图,并且根据折线图的分布进行不同区间对你曲线进行拟合,利用隶函数,确定出人均支付基金总额与年龄的之间的函数关系,并通过相关性检验,得到了相应的方程。

模型二分析得到年基金支付总额与看病次数近似成正比关系,然后将年基金支付总额0到180万分成6 段,利用每个年龄看病次数占总的看病次数的比重求的每段一个平均年基金支付总额,再求的每个区间段的平均人数,平均总额与平均人数的比即为新的定价。

针对问题二,对附件4的数据进行分析,建立了聚类分析模型,对46个医疗机构进行的分类,运用SPSS 进行求解,把医疗机构分成了5类,分类结果见表五,然后在新的定额标准下,利用excel 求的每一个医疗机构的总费用,最后用均值表示为每一类医疗机构的下一年的预测费用为:关键词::统计回归聚类分析拟合一、问题描述近来,为给各县市居民的医保方便,各县市纷纷出台有关社会基本医疗保险普通门诊统筹的相关办法,其中,职工医疗保险、外来劳务人员大病医疗保险、未成年人医疗保险、城乡居民基本医疗保险的参保人全部纳入门诊统筹的范围。

医疗保险欺诈,是指公民、法人或者其他组织在参加医疗保险、缴纳医疗保险费、享受医疗保险待遇过程中,故意捏造事实、弄虚作假、隐瞒真实情况等造成医疗保险基金损失的行为。

骗保人进行医保欺诈时通常使用的手段,一是拿着别人的医保卡配药,二是在不同的医院和医生处重复配药。

下面这些情况都有可能是医保欺诈:单张处方药费特别高,一张卡在一定时间内反复多次拿药等。

全国数学建模大赛A题获奖论文

全国数学建模大赛A题获奖论文

全国数学建模大赛A题获奖论文城市表层土壤重金属污染分析摘要本文旨在对城市土壤地质环境的重金属污染状况进行分析,建立模型对金属污染物的分布特点、污染程度、传播特征以及污染源的确定进行有效的描述、评价和定位。

对于重金属空间分布问题,首先基于克里金插值法,应用Surfer 8软件对各数据点的分布情况进行模拟,得到了直观的重金属污染空间分布图形;随后,分别用内梅罗综合污染指数以及模糊评价标准和模型对城区内不同区域重金属的污染程度进行了评判。

对于金属污染的主要原因分析问题,基于因子分析法、问题一的结果和对各个金属污染物的来源分析等因素,判断出金属污染的主要原因有:工业生产、汽车尾气排放、石油加工并推测该区域是镍矿富集区。

随后讨论了污染源之间的相互关系和不同金属的污染贡献率。

针对污染源位置确定问题,我们建立了两个模型:模型一以流程图的形式出现,基于污染传播的一般规律建立模型,求取污染源范围,模型作用更倾向于确定污染源的位置;模型二基于最小二乘法原理,建立了拟合二次曲面方程,在有效确定污染源的同时也反映了其传播特征,模型更加清楚,理论性也更强。

在研究城市地质环境的演变模式问题中,我们对针对污染源位置确定问题所建模型的优缺点进行了评价,同时建立了考虑了时间,地域环境和传播媒介的污染物传播模型,从而反映了地质的演变。

综上所述,本文模型的特点是从简单的模型建立起,强更准确的数学模型发展,逐步达到目标期望。

关键词:重金属污染,克里金插值最小二乘法因子分析流程图一、问题重述问题背景随着城市经济的快速发展和城市人口的不断增加,人类活动对城市环境质量的影响日显突出。

对城市土壤地质环境异常的查证,以及如何应用查证获得的海量数据资料开展城市环境质量评价,研究人类活动影响下城市地质环境的演变模式,日益成为人们关注的焦点。

评价和研究城市土壤重金属污染程度,讨论土壤中重金属的空间分布,研究城市土壤重金属污染特征、污染来源以及在环境中迁移、转化机理,并对城市环境污染治理和城市进一步的发展规划提出科学建议,不仅有利于城市生态环境良性发展,有利于人类与自然和谐,也有利于人类社会健康和城市可持续发展[1]。

2013年深圳杯数学建模竞赛A题:食品质量安全抽检数据分析

2013年深圳杯数学建模竞赛A题:食品质量安全抽检数据分析

答卷编号:论文题目:A题:食品质量安全抽检数据分析组别:本科生参赛队员信息(必填):参赛学院:教育实验学院A题:食品质量安全抽检数据分析摘要“民以食为天”,食品安全问题越来越引起社会各界的重视,因此食品的抽检对了解食品安全情况就起到了非常重要的作用,食品的运输、加工、包装、贮存、销售以及餐饮等每一个环节都可能影响食品的质量与安全。

本文主要对深圳市这三年各主要食品领域微生物、重金属、添加剂含量等安全情况的变化趋势;食品产地与食品质量的关系,食品销售地点(即抽检地点)与食品质量的关系,季节因素与食品质量的关系;以及如何改进食品抽检的办法,使之更科学更有效地反映食品质量状况且不过分增加监管成本(食品抽检是需要费用的)等问题进行了分析研究,建立了相应的数学模型,运用了SPSS及MATLAB软件工具对模型进行了求解。

对于问题一,首先将三年的不合格数据进行统计分类,由相关标准将不合格食品按主要食品领域分为十类,将不合格的项目分为微生物、重金属、添加剂、食物固有成分四类。

然后对三年不合格主要食品按照此类别进行筛选,计算出每年各主要食品领域中每类不合格项目在总的不合格项目中所占比例,并根据此比例对年份做出折线图,由此得到食品安全情况的变化趋势。

对于问题二,首先本文运用统计学的方法把三年来食品的产地、抽检地点、季节因素进行了分类并统计。

然后运用归一化原理分别计算出了每年各个食品产地、抽检地点、季节因素占总不合格数的比例。

再对这些比值进行K-均值聚类分析,聚为三类,由此把这三个因素对食品质量的影响分为良好、一般、严重三个等级,以表示食品产地、抽检地点、季节因素与食品质量的关系。

对于问题三,首先将所有食品进行分类,然后运用了统计学的方法统计出了每年在各主要食品领域抽检的总数目以及其中的合格数、不合格数,并计算出各主要食品领域的不合格率,再配合问题一中所统计出的各不合格项目在该食品领域所占的比例,得到了各主要食品领域不合格项目的不合格率,再以此不合格率为基础建立基于实际数据的层次分析法来确定各主要食品领域和不合格项目的权重,最后基于此权重来调整食品的抽检方法。

C4西安电子科技大学-2016“深圳杯”数学建模挑战赛获奖论文-组委会指定发布

C4西安电子科技大学-2016“深圳杯”数学建模挑战赛获奖论文-组委会指定发布

二、问题的分析
要对“禁摩限电”政策的实行进行科学的、不带意识形态的论证,需要考虑多种不 同因素, 建立适合的数学模型。 不同的因素和指标包括交通资源总量 (即道路通行能力) 、 交通需求、各种交通工具的效率及对安全和环境的影响等。 从道路通行能力出发,由于道路通行能力与车辆行驶速度密切相关,可以通过计算 将道路通行能力化归为关于车速的函数。为了分析摩托车、电动车对交通状况的影响, 还可以类比气流的传播,引入交通波模型,从而对其对于道路通行能力的具体影响得到 进一步的认识。 从出行成本和交通需求层面分析,在考虑出行时间的基础上,可以通过建立出行总 成本模型,可以得出不同交通工具的广义出行费用的差别所在。为了解决人们对摩托车 等交通工具的交通需求与道路通行能力不能满足无限增长的摩托车数的实际情况之间 的矛盾,必须采取一定措施,如拥挤定价政策。在多项式 Logit 模型的基础上,可以讨 论实行拥挤定价政策的可行性。 从交通效率层面分析,为了分析电动车、公交车和自行车在上下班高峰期的不同效 率, 引入引力模型和等值线模型, 通过可达性这一指标分析不同出行方式间效率的不同。 可以发挥当今“互联网+”背景下网络中大数据的作用,并且以大数据下的信息为指导, 从“穹顶智能同出行方式的可达性的大小,以期通过转变出行方式的,使得城市交通更加的顺 畅。 从城市道路交通时空资源使用情况层面分析,可以运用时空分析法,计算不同交通 方式道路交通时空资源占用量的数值大小,分析不同交通工具对于空间的占用量的不同。 基于安全方面考虑,为了具体不同交通工具的衡量安全性,参考施密德模型,定义 出安全系数,通过计算安全系数的大小定量比较不同交通工具的安全性大小,同时还可 以假设检验对交通工具的安全性进一步论证;最后从噪声环境污染方面考虑,给出噪声 声级表达式,分析摩托车的使用对于噪声产生的影响。 基于对深圳市现有的交通资源总量 (即道路通行能力) 、 交通需求、 各种交通工具的 效率及对安全和环境的影响的分析,对于深圳市“禁摩限电”提出一个可行的方案,分 别从对于摩托车进行禁止和对于电动车进行限制两个方面进行阐述,对于“禁摩限电” 政策的实施提出指导意见,最后对提出的方案进行评估,分析方案的合理性。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

网络侧估计终端用户视频体验建模摘要现代社会,使用手机APP观看视频已经成为当代社会的一种普遍形式,本文依据统计回归方法,对网络侧变量和用户体验变量之间的函数关系进行拟合,令其余无关变量均近似地服从正态分布。

采用多重拟合方式拟合出不同的评价函数,并进行误差检验。

选择误差最小的评价函数。

并基于评价函数,两个用户体验变量进行预测。

同时对用户观看视频体验进行综合评价,采用多级指标,运用AHP及模糊综合评价法评价用户观看视频的满意度。

求出权重,建立评价矩阵。

得到用户观看视频满意度处在较满意和一般满意之间。

最后,由于多种原因,本文建立的用户体验变量评价函数具有一定程度的误差,因此基于原有数据,建立灰色系统模型,再次进行预测,比较结果。

建立GM(1,1)模型对相关指标进行预测,取预测区间长度为100,得出预测值,并绘制残差图对预测值进行检验。

并与评价函数预测结果进行对比。

验证评价函数的正确性。

同时得到结论,基于原始数据直接建立灰色系统,预测相对更加准确。

关键词:统计回归;综合评价;灰色预测;残差检验一.问题重述随着科技的日益进步,无线宽带网络也随之无限升级。

智能终端在大众生活中普及,越来越多的用户选择在智能终端上(以手机为主)应用客户端APP来观看网络视频,这是一种基于TCP(是一种面向连接的、可靠的、基于字节流的传输层通信协议)的视频传输以及播放。

在观看网络视频时,有很多因素指标会影响用户对于视频的观看体验,而其中两个关键指标是初始缓冲等待时间和卡顿缓冲时间,我们可以用初始缓冲时延和卡顿时长占比(卡顿时长占比=卡顿时长/视频播放时长)来定量评价用户体验。

研究表明影响初始缓冲时延和卡顿时长占比的主要因素有初始缓冲峰值速率、播放阶段平均下载速率、端到端环回时间(E2ERTT)以及视频参数。

然而这些因素和初始缓冲时延以及卡顿时长占比之间的关系并不明确。

本文拟通过数学建模的方式对网络端视频用户体验做综合评价和预测,以采取针对性的措施提高网络端视频用户体验的满意程度。

本文尝试解决以下问题:1、根据实验数据建立起用户体验评价变量和网络侧变量之间的函数关系。

2、对网络侧终端用户体验进行定量的综合评价。

3、针对网络侧用户体验进行预测。

二.问题分析与思考本题目附件中提供试验数据共89266组,由于希望提高问题分析的准确性,首先要对数据进行考察,并将不合理数据予以剔除,因此,进行数据的信度与效度检验就必不可少。

2.1数据信度检验信度检验为判断分析数据结果准确性,即数据结果的可靠性检验。

常用的方法有:拉以达准则,Dixon准则以及Crubbs准则法等,然这三种方法都是基于样本大致服从正态分布而给出的,因此,我们采取最常见也是最可信的拉以达准则进行数据的信度检验。

拉以达准则又称3原则,是先假设一组检测数据只含有随机误差,对其进行计算处理得到标准偏差,按一定概率确定一个区间,认为凡超过这个区间的误差,就不属于随机误差而是粗大误差,含有该误差的数据应予以剔除。

这种判别处理原理及方法仅局限于对正态或近似正态分布的样本数据处理,它是以测量次数充分大为前提的,由于本模型中测量次数较多,因此拉以达原则在合理范围之内。

图1:统计数据分析结构图本文利用Matlab软件,将附件中的各指标数据利用程序进行分析以及剔除(详见附录1)。

共剔除数据7713组,剩余81553组数据。

剔除数据总数小于,在合理范围之内。

图2:剔除异常数据后的数据分布结构图在此后的建模过程中,只针对这81553组数据进行分析。

拉依达准则判断粗大误差的基本思想是以给定的置信概率99.73%为标准,以三倍测量列的标准偏差限为依据,凡超过此界限的误差,就认为它不属于随机误差的范畴,而是粗大误差。

含有粗大误差的测量值称为异常值,异常值是不可取的,应该从测量数据中剔除。

用拉依达准则判断和剔除含有粗大误差的异常值时,应先算出等精度独立测量列Xi(i=1,2,…,n)的平均值,残余误差,并按贝塞尔公式算出该测量列的标准偏差S,如果某测量值的残余误差,满足下式,则认为是含有误差的异常值,须剔除不要。

该判别式即为拉依达准则2.2相关方法评价是基于研究对象的某些属性(指标),将之变为客观客观定量计值或者主观效度的行为。

本文介绍几种本文涉及的方法:(1)统计回归分析法由于客观事物内部规律的复杂性以及人们认识程度的限制,无法准确的分析实际对象内在的因果关系,因此需要建立合乎机理规律的数学模型。

动态测量数据的数学处理问题大多可以转化为回归分析问题。

确定变量之间的数学关系式并对其进行可信度检验。

根据所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值。

并给出这种预测却控制的精确程度。

(2)层次分析法(AHP)层次分析法指的是将决策问题的有关元素分解成目标、准则、方案等层次,在此基础上进行定性分析和定量分析的一种决策方法。

它的特点是对复杂决策问题的本质、影响因素及内在关系等进行深入分析后,构建层次结构模型,把决策的思维过程数学化,进而提供一种简单的决策方法。

层次分析法的结果合理性较大,在本文中也会有涉及,用以权重的求解。

(3)模糊综合评价法客观世界中,存在着许多不确定的现象,这种不确定性主要表现在两个方面:一是随机性,二是模糊性。

在概率论研究中,通常以在上的取值的分布函数来描述这种随机性。

同样,在上取值的隶属函数就描述了事件的模糊性。

模糊数学是描述模糊问题的不可或缺的工具。

模糊综合评价同时可以实现模糊识别,模糊分析,模糊聚类以及预测的功能,是一种非常优越的分析方式。

由于本题中各指标之间的关系并不明确,其具有模糊性,因此本文主要采用模糊分析来对该问题进行综合评价。

(4)灰色预测法灰色预测是通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型从而预测事物未来发展趋势的状况。

预测某一特征量或达到此特征量的经历时间。

三.模型基本假设1,假设用户观看视频时,在网络传输速率基本一致的情况下,视频卡顿的出现是随机的;2,假设卡顿时长与在同一网络环境下,使用客户端观看视频的人数基本成线性的正比关系;3,经过剔除后的统计数据真实可信且抽样样本能够完全反应总体的特征;4,假设除网络侧变量和用户体验变量外的其余变量均近似地服从正态分布。

四.基本符号说明:自变量与因变量间的回归模型系数,;:子变量与子变量间的回归模型系数,;模糊综合评价因素集,,各因素,;模糊综合评价评语论域(评价集),;判断矩阵;模糊关系矩阵;权重向量;综合评价矩阵。

五.模型的建立与求解5.1统计回归模型统计回归是基于数据的统计分析,对于内部规律具有复杂性的客观事物,建立合乎机理的数学模型,其基本思路结构如下: 图3:统计回归模型结构流程图由于采样数据的随机性,在上步利用拉以达原则剔除后,以现有的数据进行分析。

首先进行标准化处理。

数据的标准化(normalization )是将数据按照一定规则缩放,使之落入一个小的特定区间。

这样去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。

其中最典型的就是0-1标准化和Z 标准化,当然,也有一些其他的标准化方法,用在不同场景。

本文采用Z-score 标准化(标准差标准化)。

转化函数为:。

其中为所有样本统计检N Y 修应分类研结构简相关分预测决现实问提炼问根据定性理论设置收集整根据目标和进行统计计算数据的均值,为样本数据的标准差。

经过Z-score标准化后,变量的平均值为0,标准差为1。

为了数据处理的简便性,将均值迁移到1。

5.1.2模型建立与求解1、针对初始缓冲时延的回归模型(1)模型的建立记用户体验变量分别为(初始缓冲时延),(卡顿时长占比);网络侧变量分别为(初始缓冲峰值速率),(播放阶段平均下载速率),(E2ERTT)。

首先,为了能大致的分析与,,之间的关系,利用剔除后的数据分别作出对,,的散点图。

图4:对的散点图图5:对的散点图图6:对的散点图从图4中可以发现,对有比较明显的反比关系,对虽然较为模糊,但大体上则类似于一次或二次函数关系,对关系比较模糊,但大体上呈现一种线性关系。

综合以上分析,建立如下的回归模型:经过多次利用MATLAB软件多次拟合实验,最终选择如下的回归模型:其中,,,即为回归变量,而影响的其他因素均包含在随机误差中,应大致的服从均值为零的正态分布。

(2)模型的求解直接利用MATLAB统计工具箱中的命令regress求解:[b,bint,rint,stats]=regress(y,x,alpha)输入回归模型中的数据(n维向量形式),为对应于回归系数的数据矩阵,alpha为置信水平(缺省时),输出是的估计值,常记作,bint是的置信区间,为残差向量,rint为r的置信区间,stats为回归模型的检验统计量,有三个值,第一个是回归方程的决定系数(是相关系数),第二个是的统计量值,第三个是与统计量对应的概率值。

针对以上回归模型的回归系数估计值及其置信区间(取置信水平),检验统计量,,的结果如下:表1:统计模型(1)的求解结果参数参数估计值参数置信区间-596.7539 [-601.1,-592.25]718.6450 [712.9,724.3]-115.8773 [-139.2,-92.6]1215.3 [119.16,123.9]=0.8641=54467<0.0000001(3)结果分析与预测表1显示,=0.8641指的是因变量的86.41%可由模型确定,值远远超过检验的临界值,远小于,因此以上模型整体来看是可用的。

表1中的回归系数给出了以上模型的估计值,即=-596.7539,=718.6450,=-115.8773,=1215.3,检查置信区间后发现,没有参数的置信区间内包含零点,表明回归变量对估计值都是显着的。

将回归系数的估计值代入上述模型,即可预测用户体验变量(初始缓冲时延)的预测值,得到预测方程:因此,依据以上方程,就可以预测用户体验变量(初始缓冲时延)的预测值,使用MATLAB软件,预测出100组数据,由于数据过于庞大,只节选几组放在这里。

表2:统计模型的预测结果(节选)初始缓冲峰值速率(kbps) E2ERTT(ms)播放阶段平均速率(kbps)初始缓冲时延(ms)预测49450 54 3719 1108 1085.93636850517 52 5902 1095 1029.7097147988 47 5806 1051 948.433408356457 55 5978 1099 1111.96285256690 54 5931 1133 1101.85219374000 58 6212 1132 1280.11592458178 54 6146 1020 1109.39591366762 58 6154 1029 1225.80795448445 57 6127 1133 1073.506341经过统计,预测合理的数据为86%,与结果分析中的取值基本一致。

相关文档
最新文档