医保欺诈行为的主动发现 - 数学建模练习
数学建模-以医保欺诈行为探讨可能的欺诈记录

医保欺诈行为的主动发现摘要医疗保险欺诈,是指公民、法人或者其他组织在参加医疗保险、缴纳医疗保险费、享受医疗保险待遇过程中,故意捏造事实、弄虚作假、隐瞒真实情况等造成医疗保险基金损失的行为。
骗保人进行医保欺诈时通常使用的手段,一是拿着别人的医保卡配药,二是在不同的医院和医生处重复配药。
下面这些情况都有可能是医保欺诈:单张处方药费特别高,一张卡在一定时间内反复多次拿药等。
请根据附件中的数据,找出可能的欺诈记录。
医疗保险是关系到国计民生和国家发展的重大问题,基金统筹定额标准对。
医疗保险的发展、完善和社会稳定发展有重要影响。
本文探讨了年基金支付总额与年龄之间的关系,给出新的定额标准,并对按参保分类的每类定点医疗机构下一度的定额总费用进行预测。
针对问题一,我们建立模型一和模型二。
模型一计算出人均支付基金总额,利用excel画出折线图,并且根据折线图的分布进行不同区间对你曲线进行拟合,利用隶函数,确定出人均支付基金总额与年龄的之间的函数关系,并通过相关性检验,得到了相应的方程。
模型二分析得到年基金支付总额与看病次数近似成正比关系,然后将年基金支付总额0到180万分成6段,利用每个年龄看病次数占总的看病次数的比重求的每段一个平均年基金支付总额,再求的每个区间段的平均人数,平均总额与平均人数的比即为新的定价。
针对问题二,对附件4的数据进行分析,建立了聚类分析模型,对46个医疗机构进行的分类,运用SPSS进行求解,把医疗机构分成了5类,分类结果见表五,然后在新的定额标准下,利用excel求的每一个医疗机构的总费用,最后用均值表示为每一类医疗机构的下一年的预测费用为:医疗机构下一年总费用第一类医疗机构6072315第二类医疗机构21330.48第三类医疗机构9025437第四类医疗机构7327655第五类医疗机构50665304一、问题重述近来,为给各县市居民的医保方便,各县市纷纷出台有关社会基本医疗保险普通门诊统筹的相关办法,其中,职工医疗保险、外来劳务人员大病医疗保险、未成年人医疗保险、城乡居民基本医疗保险的参保人全部纳入门诊统筹的范围。
医保骗保欺诈行为及对策探讨课题

医疗保险常见欺诈违规行为及对策探讨摘要我国医疗保险制度实施以来,欺诈违规行为随之出现,形式和手段不断翻新,对医疗保险基金的安全造成极大的影响,社会危害极大。
随着我国医疗卫生体制改革的深入,医疗保险参保人数将迅速增加,基金规模不断扩大,医保欺诈行为内容、形式更具有欺骗性,遏制医疗保险欺诈违规行为困难逐步加剧。
我们结合基层工作实践,对常见的医疗保险欺诈违规行为及其形式进行了总结分析,并对其防范对策措施进行探讨。
一、我国医疗保险欺诈违规行为现状“欺诈行为”是指“当事人一方故意制造虚假或歪曲事实,或者故意隐匿事实真相,使表意人陷入错误而作出意思表示的行为”,其构成要件之一是“须有欺诈的故意”。
从欺诈行为性质来划分,可以分为民事欺诈和刑事欺诈。
民事欺诈是传统民法探讨的概念。
是指一方当事人故意告知对方虚假情况,或者故意隐瞒真实情况,诱使对方当事人作出错误意思表示的行为。
刑事欺诈即刑法中所指的诈骗罪。
是指以非法占有为目的,用虚构事实或者隐瞒真相的方法,骗取公私财物的行为。
医疗保险欺诈是指违反医疗保险管理法规和政策,采用虚构保险事故以及其他方法,直接或间接骗取医保基金的行为,这一行为,具有两个基本特征:一是主观表现为直接故意,并且以非法占有医保基金或非法获得医保待遇为目的。
第二是实施手段主要是通过虚构事实和隐瞒真相。
即故意虚构未曾发生的保险事故,或者对发生的保险事故编造虚假的原因或者夸大损失程度,以达到骗取医疗保险基金或医疗保险待遇的目的。
根据有关部门的调查资料,我们列举了2005年15个调查地区查处的医疗保险基金欺诈违规行为,以及例数、金额等,通过对比分析不难看出一些问题。
15个调查地区查处的医疗保险基金欺诈行为情况(2005年)从上表所列欺诈违规行为看,形式多样,发生的频率和金额不等,发生欺诈违规频率比较多的是“过度医疗(检查、用药)”、“分解住院”、“降低入院标准”、“分解收费”、“串换药品名和诊疗项目”、“冒用与出借医保卡”等。
医保欺诈行为的主动发现

医保欺诈行为的主动发现针对在医疗行业中存在的医疗保险欺诈行为,应当有合适的方法去及时发现并制止,只有这样才能使医疗保险金能真正落到实处。
本文使用主成分分析、K-means聚类分析等方法, 并运用MATLAB. SPSS等软件对数据进行分析,并对我国医保行业现状进行分析,为相关部门自动识别医保诈骗提供具体的模型及识别方法。
关键词:医保欺诈:主动发现:主成分分析;K-means聚类一、数据挖掘预处理由于本文主要研究的是医保欺诈行为,所以数据处理中只保留所有参保人员,将非参保人员的就诊拿药数据剔除,减少无关数据的干扰。
(-)数据淸洗。
针对本文的研究目的,有目的地进行数据淸洗。
首先是删除大量对于本次数据挖掘没有用的数据,只保留相关数据列:其次是对于缺失的必要数据采用数据归约的方法填补空缺。
(二)数据转换。
将文本型、字符型数据转换为数字型数据,以方便后续研究。
如用"T 和"0"代替性别的"男”、"女”;将出生日期转换为患者年龄等。
二、医保欺诈行为主动发现模型(-)类型回:医保卡持有人已死亡。
这是最容易发现的骗保行为,故优先考虑该种类型的骗保行为主动发现。
通过MATLAB编程对医保卡和身份证号列进行筛选处理,找到一个医保卡ID对应多个医保手册号的情况。
利用MATLAB软件进行筛选,将筛选岀的ID利用Excel 的vlookup 函数査找出对应的身份证号,找出嫌疑人的关键信息。
可以将一卡两人用、一卡三人用的医保卡ID和医保手册号筛选出来。
而病人也有死亡标志说明,可以查出死亡病人的ID再査找英医保卡消费情况,对比病人的死亡时间以及账单号的交易时间,若病人的死亡时间在前而交易时间在后,则为医保欺诈记录。
根据所使用的数据表,暂未发现这类医保欺诈,但仍应该警惕,及时把死亡者的医保卡注销,避免这类医保欺诈的发生。
(二)类型目:医保卡持有人未亡。
对预处理后的数据进行分析,可以发现病人的医保费用与参保人的年龄、消费频率、消费药品的金额之间具有一定的关联性。
基于主成分分析和聚类分析的医保欺诈行为主动发现

基于主成分分析和聚类分析的医保欺诈行为主动发现作者:尹菊芳韩雪来源:《科教导刊》2017年第36期摘要考虑到病人医保欺诈的多种可能性,本文采用主成分分析和聚类分析方法建立病人欺诈可疑度评价模型,对病人是否存在欺诈行为作出分析和判别。
关键词主成分分析聚类分析医保欺诈防范中图分类号:TP311 文献标识码:A DOI:10.16400/ki.kjdkx.2017.12.069Abstract Considering the many possibilities of patient's medical insurance and fraud, this paper uses principal component analysis and cluster analysis to establish the evaluation model of suspicious patients’ fraud, and analyzes and discriminates the patients' fraud.Keywords principal component analysis; cluster analysis; medicare and fraud; prevent0 引言随着医改的不断深入,医疗保障体系不断拓展覆盖保障人群,做好医保欺诈的防范,尤其是在规范医疗行为方面显得尤为重要。
在有关机构的调查中显示,过度医疗,分解住院,冒用出借医保卡,虚假收费等为目前欺诈比例最大的几个手段。
本文将针对以深圳某医院一个月的35810个患者记录为例分析医保欺诈行为。
根据病人单月内消费次数、消费金额、购药数量、购药种类及病人医保卡的使用人数等,采用主成分分析和聚类分析方法,找出可能存在欺诈行为的记录。
1 数据处理1.1 指标变量的选取目前社会上医保欺诈的手段多种多样,总体来说可归结为6种情况:拿着别人的医保卡配药,即一张医保卡被多个人使用;单次消费特别高,一个病人对应一个或多个账单,这些账单的费用有高有低,选取其中最高的费用作为一个考评指标;一张卡在一定时间内反复多次拿药;某段时间内消费总金额过高;某次购药数量很多;某段时间内反复购买大量药品。
数学建模练习题 医保欺诈的主动发现

医保欺诈的主动发现摘要随着城镇职工基本医疗保险覆盖面的逐步扩大,参保人员结构更为复杂,医疗保险基金在医疗领域面临欺诈的风险也越来越大。
防范医疗欺诈问题,是研究社会医疗保险的重要课题之一,以此医疗保险欺诈为背景提出了问题,本文运用聚类分析、等方法成功解决了这个问题,并在大量医保名单中找出了医保欺诈行为。
首先根据数据2.1,我们对数据进行了预处理,利用Excel的删除重复项功能对人数进行了识别,然后查找并删除了死亡患者的数据,最后得到58014个不同的ID号,然后利用SPSS分别对身份证号、医保手册号采取标记重复个案的方法,标识出重复数据,其次利用k均值聚类分析法对Userupdate(用户更新次数)进行了分析,确定了主个案和重复个案占的比重,并画出其占比重的饼状图,发现第二类聚类中心数大,以上三种数据特征则表示极可能是医保欺诈行为。
另外根据数据2.2,考虑到可能的欺诈行为,将其分为三类,分别为单张处方单价过高,但其与总价、数量之间存在着相互影响,对此我们先对单价、数量、总价进行相关分析,发现单价与总价呈弱相关;然后用聚类分析对医嘱子类、单价、数量、总价进行分类,案例数少的类即有欺诈嫌疑;其次,对病人ID号标记重复个案,由于重复个案所占比例较大,对重复个案进一步进行了聚类分析;最后,若下医嘱科室与病人科室不一致则可能为欺诈,对此我们绘制了简单线图,不在y=x直线上的即为欺诈记录。
最后,对所建立的模型和求解方法的优缺点给出了客观的评价,并指出了改进的方法。
关键词:医保欺诈 SPSS k均值聚类分析标志重复个案一、问题复述1.1 问题背景随着我国医疗保险事业快速发展,在保险赔付过程中,存在着一些借助病案进行医疗保险欺诈的事件,医疗保险欺诈,是指公民、法人或者其他组织在参加医疗保险、缴纳医疗保险费、享受医疗保险待遇过程中,故意捏造事实、弄虚作假、隐瞒真实情况等造成医疗保险基金损失的行为。
骗保人进行医保欺诈时通常使用的手段,一是拿着别人的医保卡配药,二是在不同的医院和医生处重复配药。
基于数据挖掘的医疗保险欺诈检测模型研究

基于数据挖掘的医疗保险欺诈检测模型研究1. 引言医疗保险欺诈是当前医疗保险行业面临的严重问题之一。
欺诈行为不仅导致保险公司巨额损失,还影响了医疗保险市场的正常运作。
因此,建立一个有效的医疗保险欺诈检测模型对于保险公司和整个医疗保险行业都具有重要意义。
2. 数据挖掘在医疗保险欺诈检测中的应用数据挖掘是从大量数据中发现模式和规律的技术,可以应用于医疗保险欺诈检测中。
大量的医疗保险数据可以通过数据挖掘技术来挖掘隐藏的关联关系和异常模式,从而识别出潜在的欺诈行为。
3. 数据预处理在建立医疗保险欺诈检测模型前,首先需要对原始数据进行预处理。
预处理包括数据清洗、数据集成、数据转换和数据规约等步骤,以提高数据的质量和准确性,并为后续的数据挖掘过程做好准备。
4. 特征选择特征选择是从所有可用特征中选择最重要和相关的特征,以提高分类模型的准确性和效率。
在医疗保险欺诈检测中,可以根据经验知识和专家意见,结合数据挖掘算法,选择与欺诈行为相关的特征进行分析。
5. 模型构建医疗保险欺诈检测模型的建立是整个研究的核心部分。
常用的数据挖掘算法包括决策树、逻辑回归、支持向量机和神经网络等。
这些算法可以通过对已知欺诈和非欺诈样本的训练,识别和预测未知样本的欺诈概率。
6. 模型评估模型评估是判断模型性能和准确性的重要步骤。
常用的评估指标包括准确率、召回率、F1值和AUC等。
通过对模型进行评估,可以选择最优的模型,并对其进行进一步的优化。
7. 模型优化为了进一步提高医疗保险欺诈检测模型的性能,可以通过特征工程和模型调参等手段进行优化。
特征工程可以通过创建新的特征、组合特征和降维等方式来提取更有用的信息。
模型调参则是调整模型的超参数,以达到更好的分类效果。
8. 模型应用建立完善的医疗保险欺诈检测模型后,可以将其应用于实际保险业务中。
通过实时监测保险数据,检测潜在的欺诈行为,并采取相应的措施,如拒绝理赔、退保或调整保险费率等,以减少保险公司的损失。
打击骗保医保试题及答案

打击骗保医保试题及答案一、单选题(每题2分,共10分)1. 骗保行为不包括以下哪一项?A. 伪造医疗费用发票B. 重复报销医疗费用C. 医保卡借给他人使用D. 按实际发生的医疗费用报销答案:D2. 以下哪项不是打击骗保行为的措施?A. 加强医保基金监管B. 建立医保基金违规行为举报制度C. 减少医保基金的投入D. 完善医保法律法规答案:C3. 骗保行为的直接后果是什么?A. 增加医保基金的负担B. 提高个人信用记录C. 减少医疗费用D. 提高医疗服务质量答案:A4. 以下哪项不是医保基金的合法用途?A. 支付住院费用B. 支付门诊费用C. 用于个人投资D. 支付药品费用答案:C5. 骗保行为的法律责任是什么?A. 警告B. 罚款C. 拘留D. 以上都是答案:D二、多选题(每题3分,共15分)1. 以下哪些行为属于骗保行为?A. 伪造病历B. 冒用他人医保卡C. 医保卡遗失不报D. 医保卡过期继续使用答案:ABD2. 打击骗保行为的措施包括哪些?A. 建立医保基金违规行为举报制度B. 加强医保基金监管C. 减少医保基金的投入D. 完善医保法律法规答案:ABD3. 骗保行为的危害包括哪些?A. 损害医保基金的合法性B. 增加医保基金的负担C. 减少医疗服务质量D. 破坏医疗秩序答案:ABD4. 以下哪些是医保基金的合法用途?A. 支付住院费用B. 支付门诊费用C. 用于个人投资D. 支付药品费用答案:ABD5. 骗保行为的法律责任包括哪些?A. 警告B. 罚款C. 拘留D. 以上都不是答案:ABC三、判断题(每题1分,共10分)1. 骗保行为是合法的。
()答案:错误2. 医保卡可以借给他人使用。
()答案:错误3. 医保基金只能用于支付医疗费用。
()答案:正确4. 骗保行为会导致医保基金的负担增加。
()答案:正确5. 骗保行为不会受到法律的制裁。
()答案:错误6. 医保基金的投入应该逐年减少。
()答案:错误7. 医保基金的合法用途不包括用于个人投资。
基于大数据分析的医疗保险欺诈检测与防范策略研究

基于大数据分析的医疗保险欺诈检测与防范策略研究随着医疗保险的普及和进一步发展,医疗保险欺诈问题也日益突出。
欺诈行为不仅损害了医疗保险市场的公平竞争环境,也对个人和社会造成了经济损失。
因此,如何通过大数据分析来检测和防范医疗保险欺诈成为了当今社会的一个重要问题。
一、大数据分析在医疗保险欺诈检测中的应用大数据分析是指通过从海量数据中提取、分析和利用信息来获得新的认知、提供智能化决策支持的过程。
在医疗保险欺诈检测中,大数据分析可以帮助发现潜在的欺诈行为模式和异常。
首先,通过大数据分析可以检测和分析大量的医疗保险数据,包括保险索赔记录、医疗服务数据、个人身体健康数据等。
通过对这些数据的深入挖掘和分析,可以发现欺诈行为的模式和规律。
其次,大数据分析可以利用机器学习算法和模型来识别异常行为和欺诈模式。
通过建立机器学习模型和数据挖掘算法,可以将医疗保险欺诈行为和正常行为进行分类,并提高检测的准确性和效率。
最后,大数据分析还可以通过建立数据标准化和共享机制,实现跨机构数据的共享和整合,从而进一步提高欺诈检测的效果和能力。
二、医疗保险欺诈的检测策略1. 数据预处理在对医疗保险数据进行分析之前,需要进行数据预处理的阶段。
这包括数据清洗、去重、异常值处理等步骤,以确保数据的质量和准确性。
同时,还需要进行数据的统一标准化,将不同来源和格式的数据进行整合和转换,以便于后续的分析和挖掘。
2. 特征选择和提取在进行欺诈检测之前,需要对医疗保险数据进行特征选择和提取。
特征选择是指从众多的特征中选取出最具有区分度和预测能力的特征。
特征提取则是通过对原始数据进行转换和计算,将数据转化为更高维度的特征向量,以便于后续的模型训练和分析。
在医疗保险欺诈检测中,一些常用的特征包括就医次数、就医地点、药品购买记录等。
3. 模型构建和训练在特征选择和提取之后,需要构建适当的模型来进行医疗保险欺诈检测。
常见的模型包括逻辑回归、支持向量机、随机森林等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
题目医保欺诈行为的主动发现摘要医疗保险是关系到国计民生和国家发展的重大问题,基金统筹定额标准对医疗保险的发展、完善和社会稳定发展有重要影响。
本文探讨了年基金支付总额与年龄之间的关系,给出新的定额标准,并对按参保人年龄结构分类的每一类定点医疗机构下一年度的定额总费用进行预测。
针对问题一,我们建立模型一和模型二。
模型一计算出人均支付基金总额,利用excel画出折线图,并且根据折线图的分布进行不同区间对你曲线进行拟合,利用隶函数,确定出人均支付基金总额与年龄的之间的函数关系,并通过相关性检验,得到了相应的方程。
模型二分析得到年基金支付总额与看病次数近似成正比关系,然后将年基金支付总额0到180万分成6段,利用每个年龄看病次数占总的看病次数的比重求的每段一个平均年基金支付总额,再求的每个区间段的平均人数,平均总额与平均人数的比即为新的定价。
针对问题二,对附件4的数据进行分析,建立了聚类分析模型,对46个医疗机构进行的分类,运用SPSS进行求解,把医疗机构分成了5类,分类结果见表五,然后在新的定额标准下,利用excel求的每一个医疗机构的总费用,最后用均值表示为每一类医疗机构的下一年的预测费用为:医疗机构下一年总费用第一类医疗机构 6072315第二类医疗机构 21330.48第三类医疗机构 9025437第四类医疗机构 7327655第五类医疗机构 50665304关键字:统计回归聚类分析拟合一、问题重述近来,为给各县市居民的医保方便,各县市纷纷出台有关社会基本医疗保险普通门诊统筹的相关办法,其中,职工医疗保险、外来劳务人员大病医疗保险、未成年人医疗保险、城乡居民基本医疗保险的参保人全部纳入门诊统筹的范围。
医疗保险欺诈,是指公民、法人或者其他组织在参加医疗保险、缴纳医疗保险费、享受医疗保险待遇过程中,故意捏造事实、弄虚作假、隐瞒真实情况等造成医疗保险基金损失的行为。
骗保人进行医保欺诈时通常使用的手段,一是拿着别人的医保卡配药,二是在不同的医院和医生处重复配药。
下面这些情况都有可能是医保欺诈:单张处方药费特别高,一张卡在一定时间内反复多次拿药等。
请根据附件中的数据,找出可能的欺诈记录。
社会基本医疗保险门诊统筹实行定点医疗。
某市医疗保险定点医疗机构为社区卫生服务机构及镇卫生院。
保险按照年度定额筹集,每人每年100元。
由于医疗保险基金收入规模是相对固定的,而医疗消费的种类与数量具有较大的不确定性,导致年基金支付额是相对不确定的,因此医院、医疗保险经办机构、患者三者的经济关系是相当复杂的,经过分析已有数据发现,参保人的实际医疗费用与其年龄有很大的关系,因此必须考虑年龄结构的因素来制定门诊统筹定额标准。
分析附件中的数据,并建立模型求解下列问题:1.由已有数据分析年基金支付额与年龄之间的关系,并根据年龄的不同分成若干类,为各年龄段的人给出新的定额标准。
2.在新的定额标准下把各家定点医疗机构按照其目前定点签约人的年龄结构将其分成若干类,制定每一类定点医疗机构下一年度的定额总费用模型。
二、问题分析从附件中发现,本题带有较多的数据表,分析数据表发现,年基金支付额与参保人的年龄、看病次数、每个医疗机构的定点人数都有一定的相关性,可以先用spss对其进行相关性分析,根据结果和用excel绘制的各种图表进一步分析,建立模型,求解出年龄与年基金支付总额之间的关系,也可以根据各年龄的年基金支付总额对总基金支付额的贡献值来求出它们的关系。
然后可以根据年龄的不同将年支付基金按一定的标准进行划分为若干类,在均衡各医疗机构所得利益与居民所获基金赔偿的条件下,并为各个不同年龄段的人给出新的定额标准。
由附件中给出的医疗机构与定点签约人年龄的关系可以看出,定点医疗机构与定点签约人年龄的关系不是很明显,而且只有年龄这一个单一的因素来将医疗机分类,可以用模糊聚类分析法来考虑医疗机构的分类问题,选取合适的相似系数,建立模糊相似矩阵,从而对所有医保门诊进行分类。
但首先对所给数据进行标准化可以提高数据计算的精度,从而使计算结果的准确性得到进一步的提高,由新的定额标准结合各年龄的基金支付特点来考虑下一年度的定额总费用。
三、符号说明表示年龄;表示年基金支付总额;表示每个年龄的总的看病次数;表示每个年龄的年基金支付总额;表示所有年龄对应的看病次数的总和;表示看病次数的比重;表示A段来说总的参保人数;表示每个年龄的参保人数;表示A区间段的最终定价;表示对于B区间段每个年龄的基金支付总额;表示对于B区间段每个年龄的看病次数占看病次数总和的比重;表示平均基金支付总额;表示对于B区间段平均参保人数;表示B区间段的最终定价;表示对于C区间段最终的定价;表示C区间段的年基金支付总额;表示C区间段平均参保人数;表示对于D区间段最终的定价;表示对于E区间段最终的定价;表示对于F区间段最终的定价;表示参保人员缴纳的总的费用;表示所在年龄的年基金支付总额的和;表示盈利比率;表示第i个医疗机构m个年龄的年基金支付总额的指标;表示第i个医疗机构第m个年龄的年基金支付总额;表示正规化调整以后的第i个医疗机构第m个年龄的年基金支付总额;表示调整以前第i个医疗机构第m个年龄的年基金支付总额;表示第i个医疗机构中年基金支付总额的最大值;表示第i个机构中年基金支付总额的最小值;表示第j个医疗机构第k个年龄的年基金支付总额;表示第i个医疗机构的年基金支付总额的平均值;表示第j个医疗机构年基金支付总额的平均值。
四、模型假设1、假设该市基金金额只下一年度与年龄、参保人数,看保人数有关,因素的影响2、假设不同人群间统济、统一管理和统一待遇水平3、假设所有参件中的保人都遵相关数据真实可靠守医疗有发生侵害医疗筹共保险基金行为的参保人员4、假设附所有保险的有关规定没各个指标5、假设所有的相关数据具有独立性相呼影响6、由于数据过少,假设参保排除其他人数与今年一样五、模型的建立与求解模型一为了研究年基金支付与年龄的关系,对附件1、2、3所给数据进行分析,分别得出年龄与看病人数、年龄与看病次数(见表五)、年龄与定点参保人数及年龄与年基金支付总额之间的关系图,其中年龄与基金支付总额见下表由上图可知,年龄与年基金支付总额之间并不是一直存在简单的线性、二次或三次的函数关系,故以图额的关系进行拟合,由图可将年龄分为三段:0到17岁、18到49岁、50到110岁。
1、0到17岁经过对0到17岁之间年龄与年基金支付总额之间的关系,用spss分别对其进行二次三次的拟合,拟合结果如下:由上表可知,对年龄与年基金支付总额进行二次拟合的F值为4.728,sig值为0.029,而对其进行三次拟合时F的值为中两个最低点17和19为分割点,对年龄进行分段,并对各个年龄段中年龄与基金支付总16.667、sig的值为0.000,即相比之下,进行三次拟合时显著性更强,故采用三次拟合的结果,即:问题一要求从已有数据分析年基金支付额跟年龄之间的关系,我们根据题中给的第一个表利用excel做出了一个年基金支付总额跟年龄的折现统计图,如图一。
我们观察图形得到:从图形看我们可以把图形大致划分成几段来分析:从刚出来开始,在很小的一个年龄段中,年基金支付总额随着年龄的增加而增加;在从五岁到十五六这个年龄段里,年基金支付总额随着年龄的增加而减小;从十五六岁再,四十岁到五十岁、到四十岁左右这个年龄段里,年基金支付总额随着年龄的增加而增加;在接下来的年龄段中六十岁以后这两个年龄段中,年基金支付总额随着年龄的增加而减小;五十岁到六十这个年龄段,年基金支付总额随着年龄的增加而增加。
年基金支付总额从图中分析,与年龄没有成数学上某种特定的函数关系,因此我们又做出一个看病次数与年龄的关系,如图:从图形中,我们不难发现,各年龄的看病次数与年龄的关系,跟年基金支付总额跟年龄的关系大致相同。
在不同年龄段的上升趋势以及在不同年龄段的下降趋势都基本上是吻合一致的。
为此,我们运用统计学中的知识以及年基金支付总额与看病次数的关系建立模型二——统计学模型模型二从数据表中我们到180万这个区间范围内,因此,我们可以把年基金支付总额所属的区间段分为六段:A段年基金支付总额0到30万的区间;得出:年基金支付总额都在0B段年基金支付总间;C段年基金支付总额60万到90万的区间;D段年基金支付总额90万到120万的区间;E段额30万到60万的区年基金支付总额120万到150万的区间;F段年基金支付总额150万到180万的区间。
对于A段,年基金支付总额与看病次数与年龄见附录。
设每个年龄的总的看病次数为,每个年龄的年基金支付总额为,对于A段来说,P表示所有年龄对应的看病次数的总和,可得P= (3)利用Excel可以算得P=748657为了要得到A段基金支付总额,我们需要根据每个年龄的看病次数占所有年龄对应的看病次数的总和的比重,然后给出一个一个平均的年相应的平均年基金支付总额。
设每个年龄的看病次数占看病次数的总和为,得到= (4)平均年基金支付总额是每个年龄的年基金支付总额与所对应的看病次数的比重的乘积,然后在求总的和。
设平均年基金支付总额为Q可得 Q= (5)同样利用excel计算得到Q=18452345.1634设每个年龄的参保人数为,对于A段来说总的参保人数为X,可得X= (6)平均参保人数M,可得:M=利用excel计算得到M=177826最终的定价为每个区间段的平均年基金支付总额与平均参保人的比值,A段的最终定价设为,得到=利用excel求解得到下面结果: =20.46根据上面的算法,对于B段区间:设平均基金支付总额为,= (7)表示对于B区间段每个年龄的基金支付总额,表示对于B区间段每个年龄的看病次数占看病次数总和的比重。
利用excel计算得到结果: =45345530.0447又因为对于B区间段平均参保人数为,利用excel计算得到:=6732可以得到最终的定价为,得利用excel求解,可得结果: =78.8对于C区间段来说,可以得到=表示对于C区间段最终的定价,表示C区间段的年基金支付总额,表示C区间段平均参保人数。
利用excel求解,结果如下: =84.51对于D,E,F区间段,同样利用excel求解,可得各自的结果如下:对于D区间段来说,=48.82对于E区间段来说,=71.83对于F区间段来说,=80.03此上的数据定价是按照基金会不以盈利为目的的参保定价,如果我们需要把基金会盈利考虑到其中,我们做了下面的改进计算:以后的盈利按照现在的盈利比率,根据表中的数据我们得到参保人员所缴纳的总的费用是总的参保人数与的金额。
利用excel我们计算得到参保人员缴纳的总的费用为:R=10584600元,所在年龄的年基金支每个人参保所要缴纳付总额的和为:I=731187613。