航空公司数据挖掘数学建模

合集下载

数据挖掘技术在航空航天大数据分析中的应用

数据挖掘技术在航空航天大数据分析中的应用随着航空航天领域数据的不断积累，如何利用这些海量数据去发现隐藏在背后的有价值信息已经成为一个迫切需要解决的问题。

而数据挖掘技术作为一种有效的数据分析方法，正在被广泛应用于航空航天领域的大数据分析中。

本文将探讨数据挖掘技术在航空航天大数据分析中的应用，并着重介绍其在航空航天安全、飞行模拟和航班调度等方面的具体应用。

首先，数据挖掘技术在航空航天安全领域的应用可以帮助识别潜在的安全风险。

通过对航空公司的安全数据进行挖掘分析，可以发现与安全相关的模式和规律。

例如，通过挖掘航班晚点数据和天气数据之间的关系，可以预测某些特定天气条件下的航班延误概率，进而采取相应的措施，提高航班的准点率。

此外，数据挖掘技术还可以通过分析航空事故和故障数据，发现造成事故和故障的主要因素，以便采取相应的安全措施，减少事故和故障的发生。

其次，数据挖掘技术在航空航天领域的飞行模拟中也发挥着重要作用。

在飞行模拟中，通过对飞行员的训练数据进行挖掘和分析，可以发现训练中存在的问题并加以改进。

例如，通过分析飞行员的操作记录和飞行表现数据，可以发现他们在特定场景下的常见错误和不足，并为他们提供有针对性的训练。

此外，数据挖掘技术还可以用于对飞行过程中的风险和异常情况进行识别和预测，提醒飞行员采取相应的措施，确保飞行的安全。

另外，数据挖掘技术在航空航天领域的航班调度中也有着广泛的应用。

随着航空业务的不断扩大，航班调度变得越来越复杂。

数据挖掘技术可以通过对航空管制数据、航班时刻表和航班晚点数据等进行挖掘和分析，提供精确的航班调度策略。

例如，通过分析航班晚点数据，可以发现造成航班晚点的主要因素，如天气、机械故障、交通管制等，进而优化航班调度方案，提高航班的准点率和航空公司的运营效率。

除上述应用外，数据挖掘技术在航空航天领域还有其他一些重要的应用。

例如，通过对航空公司的乘客数据进行挖掘和分析，可以发现乘客的偏好和需求，提供个性化的服务，提高乘客的满意度；通过对航空器设计和生产过程的数据进行挖掘和分析，可以发现优化设计和生产流程的潜在机会，提高航空器的性能和安全性。

航空预订票数学建模.doc

航空预订票数学建模航空预订票数学建模篇1试谈机票订票模型与求解一、概述１．问题背景描述在激烈的市场竞争中，航空为争取更多的客而开展的一个优质服务项目是预订票业务,本模型针对预订票业务，建立二元规划订票方案，既考虑航空的利润最大化，又尽可能减少乘客订票而飞机满员无法登机的抱怨，从而赢得美誉。

航空的经济利润可以用机票收入除飞行费用和赔偿金后的利润衡量,声誉可以用持票按时前登记、但因满员不能飞走的乘客，即被挤掉者限制在一定数量为标准，这个问题的关键因素――预订票的成可是否按时前登机是随机的，所以经济利益和声誉两个指标都应该在平均意义下衡量。

针对此种现象，航空一般都采用超量订票的运营模式，即每班售出票数大于飞机客数。

按民用航空管理有关规定旅客因有事或误机，机票可免费改签一次，此外也可在飞机起飞前退票.航空为了避免由此发生的损失，采用超量订票的方法，即每班售出票数大于飞机客数.但由此会发生持票登机旅客多于座位数的情况,在这种情况下,航空让超员旅客改乘其它航班,并给旅客机票价的20%作为补偿。

为了减少发生持票登机旅客多于座位数的情况,航空需要对乘客数量进行统计，从而对机票预售量做出一定估算,从而获得最大的利润。

2。

问题的提出某航空执行两地的飞行任务。

已知飞机的有效客量为１50人。

按民用航空管理有关规定旅客因有事或误机,机票可免费改签一次，此外也可在飞机起飞前退票。

航空为了避免由此发生的损失，采用超量订票的方法,即每班售出票数大于飞机客数。

但由此会发生持票登机旅客多于座位数的情况,在这种情况下，航空让超员旅客改乘其它航班，并给旅客机票价的２０％作为补偿。

要求（１）假设两地的机票价为1500元,每位旅客有0.04的概率发生有事、误机或退票的情况,问航空多售出多少张票，使该的预期损失达到最小?（2）上述参数不变的情况下，问航空多售出多少张票，使该的预期利润达到最大，最大利润为多少？3。

分析与建立模型(1)假设两地的机票价为1500元,每位旅客有0.04的概率发生有事、误机或退票的情况,问航空多售出多少张票,使该的预期损失达到最小?（2）上述参数不变的情况下，问航空多售出多少张票，使该的预期利润达到最大,最大利润为多少?设飞机的有效客数为N，超订票数为S（即售出票数为NS），k为每个座位的盈利值，h为改乘其他航班旅客的补偿值。

数学建模各类方法归纳总结

数学建模各类方法归纳总结数学建模是一门应用数学领域的重要学科，它旨在通过数学模型对现实世界中的问题进行分析和解决。

随着科技的不断发展和应用需求的增加，数学建模的方法也日趋多样化和丰富化。

本文将对数学建模的各类方法进行归纳总结，以期帮助读者更好地了解和应用数学建模。

一、经典方法1. 贝叶斯统计模型贝叶斯统计模型是一种基于概率和统计的建模方法。

它通过利用先验知识和已知数据来确定未知数据的后验概率分布，从而进行推理和预测。

贝叶斯统计模型在金融、医药、环境等领域具有广泛应用。

2. 数理统计模型数理统计模型是基于概率统计理论和方法的建模方法。

它通过收集和分析样本数据，构建统计模型，并通过参数估计和假设检验等方法对数据进行推断和预测。

数理统计模型在市场预测、风险评估等领域有着重要的应用。

3. 线性规划模型线性规划模型是一种优化建模方法，它通过线性目标函数和线性约束条件来描述和解决问题。

线性规划模型在供应链管理、运输优化等领域被广泛应用，能够有效地提高资源利用效率和降低成本。

4. 非线性规划模型非线性规划模型是一种对目标函数或约束条件存在非线性关系的问题进行建模和求解的方法。

非线性规划模型在经济学、物理学等领域有着广泛的应用，它能够刻画更为复杂的现实问题。

二、进阶方法1. 神经网络模型神经网络模型是一种模拟人脑神经元系统进行信息处理的模型。

它通过构建多层神经元之间的连接关系，利用反向传播算法进行训练和学习，实现对复杂数据的建模和预测。

神经网络模型在图像识别、自然语言处理等领域取得了显著的成果。

2. 遗传算法模型遗传算法模型是一种模拟自然界生物进化过程的优化方法。

它通过模拟遗传、交叉和突变等过程，逐步搜索和优化问题的最优解。

遗传算法模型在组合优化、机器学习等领域具有广泛的应用。

3. 蒙特卡洛模拟模型蒙特卡洛模拟模型是一种基于随机模拟和概率统计的建模方法。

它通过生成大量的随机样本，通过对样本进行抽样和分析，模拟系统的运行和行为，从而对问题进行求解和评估。

数学建模的概念方法和意义

动态规划
解决多阶段决策问题，如最优路径、生产调度等。
03
数学建模的意义与应用
在科学领域的应用
01
物理建模
通过建立数学模型来描述物理现象和规律，如牛顿第二定律、热传导方程等。
化学建模
02
03
生物建模
通过数学模型描述化学反应过程和机理，如反应动力学方程、化学平衡方程等。
用数学模型研究生物学问题，如种群增长模型、基因表达模型等。
心理学研究
数学建模在心理学研究中用于描述人类认知过程、情感反应和心理发展规律。
公共政策分析
数学建模在公共政策分析中用于评估政策效果、预测社会趋势和制定科学决策。
04
数学建模的未来发展与挑战
人工智能与数学建模
人工智能与数学建模的结合
人工智能技术为数学建模提供了强大的计算能力和数据分析能力，使得复杂模型的建立和求解成为可能。
金融建模
数学建模在金融领域中用于股票价格预测、风险评估和投资组合优化。
经济学分析
数学建模在经济分析中用于描述市场供需关系、经济增长和经济发展模式等。
计量经济学
数学建模在计量经济学中用于探索经济现象的内在规律和因果关系。
在社会领域的应用
社会学研究
数学建模在社会学研究中用于分析社会结构、人口动态和人类行为模式。
假设不合理
在建模过程中，为了简化问题，常常会做出一些假设，但这些假设有时可能与实际情况存在较大偏差。
数据不足或数据质
量差
在建模过程中，需要用到大量的数据，但有时数据可能不足或质量较差，导致模型无法准确反映实际情况。
02
数学建模的主要方法
代数法
代数法

数学建模在商业领域中的应用研究

数学建模在商业领域中的应用研究数学是自然科学中非常重要的一门学科，它为人们提供了一种揭示自然现象本质的工具和方法。

在商业领域中，数学建模能够帮助企业分析当前市场环境和产品竞争力，预测未来市场发展趋势，重构业务流程和经营模式，提高企业的经营效益和竞争力。

本文将介绍数学建模在商业领域中的应用研究。

1. 数据挖掘数据挖掘是指从大量数据中提取有用信息的过程，是商业领域中数学建模的一个重要环节。

整合和分析企业内部和外部的大量数据，可以帮助企业了解自身的竞争优势和劣势，优化产品和服务，提升客户满意度和品牌知名度。

数据分析的方法有很多，如聚类分析、回归分析、决策树分析、神经网络分析等。

以在线教育平台为例，通过对学生数据的收集和处理，可以识别出学生的学习习惯、知识水平和学业需求，从而针对性地推荐适合学生的课程和学习计划，提高学生的学习效果和成绩。

2. 预测模型预测模型是商业领域数学建模应用的另一个重要环节。

预测模型可以根据历史数据和环境变化情况，预测未来市场和企业发展趋势，为企业制定合理的战略规划和经营决策提供支持。

常见的预测模型有时间序列模型、回归分析模型、神经网络模型等。

以汽车生产企业为例，预测车市的需求趋势和时机，可以帮助企业及时制定生产计划和销售策略，避免过剩或缺货的情况发生，提高企业市场占有率和经济效益。

3. 优化模型优化模型是指以最小化成本、最大化效益等为目标，寻找最优解的过程。

通过优化模型，企业可以找到最优的运营方案和决策方案，从而降低企业的成本和提高效益。

常见的优化模型有线性规划模型、整数规划模型、动态规划模型等。

以航空公司为例，优化航班调度和机组人员排班，可以减少空闲机组和机器的数量，提高航班的正常运营率和乘客的满意度。

4. 风险模型风险模型是指对可能出现的各种风险进行分析和评估，制定相应的应对策略的过程。

通过风险模型，企业可以预测和管理各种潜在风险，提高经营的稳定性和可控性。

常见的风险模型有风险评估模型、蒙特卡罗模拟模型等。

数学建模(航空公司的预定票策略)

数学建模竞赛承诺书我们完全明白，在竞赛开始后参赛队员不能以任何方式（包括电话、电子邮件、网上咨询等）与队外的任何人（包括指导教师）研究、讨论与赛题有关的问题。

我们知道，抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料（包括网上查到的资料），必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺，严格遵守竞赛规则，以保证竞赛的公正、公平性。

如有违反竞赛规则的行为，我们将受到严肃处理。

我们参赛选择的题号是（从A/B中选择一项填写）： B我们的队号为：11参赛队员：1. 电子0903 徐路源2. 数学0901 王璐璐3. 数学0901 张乐孝指导教师或指导教师组负责人：数模组日期： 2010 年 8 月 10 日评阅编号（由评阅老师评阅前进行编号）：.数学建模竞赛编号专用页评阅编号：预测机票价格和预定数量限额最优问题摘要本文所要讨论的问题可以归结为一个趋势拟合和基于二项分布求最优决策的问题。

建立了两个模型：分别用来预测机票的未来价格和求机票的预定限额。

首先我们根据所给的2005年10月～2010年3月期间，每月经济舱机票平均价格(单位:元)数据，通过Matlab 软件用函数去拟合，所得函数即为机票预订价格的数学模型。

可表示为：f(x)=a1*exp(-((x-b1)/c1)^2)+a2*exp(-((x-b2)/c2)^2)+a3*exp(-((x-b3)/c3)^2)+a4*exp(-((x-b4)/c4)^2) +a5*exp(-((x-b5)/c5)^2) + a6*exp(-((x-b6)/c6)^2)但在预测中发现，由模型所得参考价格不合实际。

单方面拟合出的模型并不具有实际价值。

之后我们采用趋势外推法中最小二乘法的周期波动模型来解题。

通过与实际价格的比较，发现其误差较小且置信度较高。

所以我们得到的机票预定价格的数学模型即为)122sin(*4632.0)122cos(*9938.0)122sin(0239.58)122cos(*9355.492690.73877.638~xx x x xx ytππππ-+-++=价格随时间呈周期性变化，每过一个周期价格略有上升。

航班延误问题数学建模

题目：航班延误问题作者：***班级：信息13-1班学号：************航班延误问题摘要航班延误相对于航班正常，是指航班服务的迟延耽误，即航班在进港或离港时超过了民航主管部门批准的航班时刻表所载明的一定时间，俗称民航航班的“晚点”或“误点”。

根据《民航航班正常统计办法》，航班延误具体是指航班降落时间比计划降落时间（航班时刻表上的时间）延迟30分钟以上或航班取消的情况。

近几年，由于航班延误而引起的航空公司与乘客之间的纠纷事件越来越多，如果不能及时解决航班延误事件，二者矛盾会更加激化。

本文基于收集到的数据，建立了时间序列模型，对题目进行深入研究，做出了判断，分析出国内航班延误的真实原因。

最后本文基于航班总数的时间序列数据，建立模糊综合评价模型，针对航班延误问题，提出了预防措施、善后措施及改进措施。

针对问题一，首先，我们对原始数据进行了处理，得到航班总数，正常航班数，不正常航班数的时间序列数据，并对其进行整理分析，绘制出我国航班变化情况折线统计图；其次，我们根据各种影响航班延误的主要因素的数据进行分析，根据上述指标统计得到的数据对空管、机场、航空公司等进行一级评估，得到每一个单位在延误中延误等级,最后在对整体进行评估，得到考虑了空管、机场、航空公司影响情况下的航班综合延误等级。

最后我们得出结论：我们不认为题目所论述的结论是正确的。

针对问题二，首先，本文对原始数据进行了整理，得到了各航班延误原因比例图，紧接着作出这个比例图的直方图，进而依据数据特征并结合现实具体情况来分析航班延误的四个主要影响因素，即恶劣天气的影响、航空交通管制、航空公司的运行管理和空中流量等影响因素，并提出了其他影响航班延误的原因。

针对问题三，我们从航班延误时间最短和航班延误成本最小两个点入手，为航空公司在航班延误上提出了合理的预防措施，善后措施和改进措施等。

预防措施有：1.预订机票时使用民航资源网数据分析中心的“航线运力数据分析系统”提前查询航线航班历史准点率信息，尽量选择预定历史准点率高的航班机票；2.使用“非常准”等网站的航班延误智能预报、航班不正常跟班服务；3.关注天气措施，出发当天及时与航空公司及机场的问询处取得联系；4.投保航班延误保险。

数学建模数据处理方法

数学建模数据处理方法数学建模是解决实际问题的重要方法，而数据处理是数学建模中不可或缺的一环。

数据处理方法的好坏直接影响到模型的准确性和可靠性，因此需要对数据进行准确、全面的处理和分析。

下面将从数据采集、数据清洗、数据分析三个方面介绍数学建模中的数据处理方法。

一、数据采集数据采集是数学建模中首先需要完成的工作。

数据采集工作的质量对最终结果的精确度和代表性具有至关重要的影响。

数据采集必须具有相应数据的覆盖范围，数据即时性、真实性和准确性。

采集数据的方法主要有以下几种：1.问卷调查法：通过问卷调查的方式获得数据，是一个经典的数据采集方法。

问卷设计要考虑问题的准确性、问卷的结构和便于回答等因素，其缺点在于有误差和回答方式有主观性。

2.实地调查法：通过实地调查的方式获得数据。

实地调查法拥有远高于其它数据采集方法的数据真实性和准确性，但是它也较为费时费力走，不易操作。

3.网络调查法：通过网络调查的方式获得数据，是应用最广的一种调查方法。

以网络搜索引擎为代表的网络工具可提供大量的调查对象。

在采用网络调查时要考虑到样本的代表性，避免过多的重复样本、无效样本。

此外，由于网络调查法易遭受假冒调查等欺骗行为，结果不能完全符合事实情况。

二、数据清洗在数据采集后，需要对数据进行清洗，以确保数据的准确性和完整性。

数据清洗是数据处理过程中的一项重要工作，它能大大提高数据的质量，保证数据的准确性、真实性和完整性。

数据清洗的过程中主要包括以下几个方面的工作：1.清洗脏数据：包括数据中的重复、缺失、无效和异常值等。

其中缺失值和异常值是数据清洗的重点，缺失值需要根据数据具体情况处理，可采用去除、填充、插值等方式，异常值的处理就是通过人工或自动识别的方式找出这些数据并去除或修正。

2.去除重复数据：在数据采集时出现的重复数据需要进行去重处理，在处理过程中需要注意保持数据的完整性和准确性。

3.清洗无效数据：清洗无效数据是指对数据进行筛选、排序、分组等操作，以得到有意义的数据，提高数据的价值和质量。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

2013年广东工业大学大学生数学建模竞赛承诺书我们仔细阅读了2013年广东工业大学大学生数学建模竞赛的竞赛规则.我们完全明白，在竞赛开始后参赛队员不能以任何方式（包括电话、电子邮件、网上咨询等）与队外的任何人（包括指导教师）研究、讨论与赛题有关的问题。

我们郑重承诺，严格遵守竞赛规则，以保证竞赛的公正、公平性。

如有违反竞赛规则的行为，我们将受到严肃处理。

我们参赛的题目是：A题航空客运数据挖掘我们的参赛报名号为：00号参赛队员(打印并签名) ：姓名____袁嘉蔚__学号__3111008344__院系班级应数11统2姓名___王文冲__ 学号_3111008197___院系班级应数11信安1姓名____庄楚贤__学号_3211008315__院系班级___应数11统1日期：2013 年 5 月 13 日航空客运数据挖掘模型摘要随着交通工具的不断发展，目前航空公司的主要竞争对手已不局限于同行业之间，而更多的倾向于其他的交通行业，如：火车，长途汽车等。

为了使自己能在目前的激烈竞争中取得更大的优势，航空公司大都采取自己独特的经营策略，虽然他们的形式各异，但最终都是通过降低自己的空座率来提高自己的盈利。

然而要降低空座率，首先需要对客户进行一定的分析，其中包括：客户的流失预测，客户的细分和客户的价值评估等方面。

因此本文着重建立客户流失模型，客户细分模型以及客户价值评估模型，以供航空公司参考。

对于客户流失模型，本文首先通过定义流失度来衡量某一客户的流失情况，再找出客户某些固有的属性与流失度之间的映射关系，来判断客户的流失情况。

由于每个顾客的属性较多，所以就要对这些属性进行塞选，并从中找出一些主要的影响因素。

首先是通过查找相关资料及与专业人士交流，把一些明显无关紧要的因素给去除掉；再利用神经网络算法，找出剩下的对流失度影响较大的属性。

最后将这些主要因素与流失度建立一个较好的映射关系。

针对客户价值评估模型，本文通过参考相关文献确定几个能对航空公司营业产生影响的主要因素进行综合评价，根据客户综合得分的高低对其价值作出判断。

基于所给的数据量较大，我们运用随机抽样原理，采用因子分析方法，确定主要因子的个数和各因子的权重，导出衡量客户价值大小的总表达式，在断定该表达式有较好的稳定性后，用它来计算各个客户的价值大小。

根据上面的流失预测以及客户价值评估这两方面对客户进行细分，并且根据所分不同类别的客户采取不同的优惠策略，从而来实现降低空座率。

关键词：数据挖掘，客户流失，客户细分，价值评估，神经网络，因子分析一．问题重述航空公司要降低空座率，就要先对客户进行定量和定性的分析，并针对不同的客户实施不同的优惠措施，从中来提高其乘机人数。

而对客户的分析主要有三个方面，即：客户流失预测、客户细分、客户价值评估。

客户流失预测，讲的就是由于每个客户并不一定一直都会乘坐某一固定航空公司的飞机，我们需要借助现有的历史数据，通过对客户某些属性值，如会员卡积分，会员卡级别，乘坐路程等等的分析，来预测他是否会有流失倾向。

客户价值评估主要是对所有的客户对公司价值量大小的评估，其中的价值量主要是针对于盈利的多少为指标，所以此问题也将转化为对分析每个顾客对公司盈利额的作用。

客户细分则通过对所有的客户进行分类，使得航空公司可以根据具体的某一类实施一定的优惠策略，从而来降低空座率。

二．符号说明第i个季度的乘机次数n i,i=1,2,3,4,5,6,7,8客户的流失度r i会员卡级别：x1飞行次数：x2观测窗口总基本积分：x3第一年总票价：x4第二年总票价：x5观测窗口总飞行公里数：x6观测窗口季度平均基本积分累积：x7最后一次乘机时间至观察窗口末端时长x8观测窗口中第1年其他积分x9观测窗口中第2年其他积分x10积分兑换次数x11平均折扣率x12观测窗口中其他积分x13三、模型的建立与求解1.客户流失预测1.1模型分析客户流失管理是航空公司通过对客户需求满意度调查进行有针对性的挽留客户的一个重要方法，其中最关键的就是对客户流失行为做出预测，即通过对客户的一些属性进行分析，从中进行预测出客户是否会有流失趋势，从而实施一些具有针对性的挽留措施。

在航空公司对顾客的流失进行分析时，由于顾客是一个具备多属性的个体，其中包括会员卡号，入会时间，性别，会员卡级别，飞行次数，观察窗口积分等。

对于客户的流失情况，这些属性都可能对其有着一定的影响。

然而根据所给数据里面顾客的属性有很多，首先应当从里面根据一般常识以及专业人员从里面剔除掉一些属性，再通过两次神经网络，从原始数据上几十个属性中提炼出与客户流失度相关性较大的属性，并且计算分析变量的权重值，建立客户流失预测模型并对客户流失趋势进行预测。

图1.11.2模型建立1.2.1流失度顾客流失度是对顾客对企业保持度的一个定量描述，它在一定程度上能够反映顾客的忠诚情况，其数值越大表示对企业的忠诚程度越小。

在此模型中根据顾客在八个季度中每个季度的乘机次数，对其进行分析，统计得到相关的进行流失度。

设这八个季度分别的乘机次数为：n1、n2、n3、n4、n5、n6、n7、n8，第i个客户的流失度记为：r i根据分析，当顾客长期乘坐此飞机，还有乘坐的次数越多且不断增加那么其忠诚度将会相对的越高，即在计算流失度r i的时候应当综合考虑顾客的乘机次数及其乘机次数的变化趋势。

所以综合考虑上面的因素，可以有下面一些式子来表示：第i个客户的变动累加值记为：R iR i=∑m j+1 m j8j=1,其中m j表示第j各非零的季度的乘机次数再对R i进行归一化处理得到相应的流失率r i。

根据600个客户在八个季度中的乘机次数，计算利用相关数据进行计算得到相应的流失度（限于篇幅，罗列了其中的20个）如下表1：由上表可以看出所得到的流失率与分析的一致，如：第1名顾客他只有在第三季度乘过一次飞机，其余的都没有坐过，所以流失率很高；而对于第10名顾客，他经常乘坐飞机，且每个季度都有去，所以流失率很低，这与计算的结果r=0.03完全符合。

所以上面这个式子可以作为评价顾客流失率的一个标准。

1.2.2主因素的提取在原始数据中根据相关的业务人员经验，可以初步剔除掉其中的一些无关因素，例如年龄，性别，卡号，工作所在地等因素。

在剩下的这些属性的基础上，我们需要再次寻找影响客户流失的显著特征，这就需要对里面的大量数据进行计算，分析。

作为一个综合评价的系统，因素的提取是否客观合理也将称为一个关键点。

在此我们应用神经网络算法来解决此类问题。

相对与其他算法，神经网络可以通过训练来实现任意的非线性映射，且具有较强的泛化能力。

因为这些数据没有一定的线性关系，且变量之间的关系相对较为复杂，常常是有相互关联而非独立的，各种变量之间也隐藏着各种不明确关系。

所以在此用神经网络算法会相对较好。

具体算法如下：1. 将神经网络的输入值为顾客的属性指标，分别记为：x 1、x 1、···、x n 。

而网络的输出值记为y ，其中y 表示顾客的流失率，即y=r 。

并且通过大量的数据进行测试，可以得到顾客属性与流失率的关系，即映射函数：y =f(x 1,x 1,···,x 1)。

2. 在这个函数关系式中，假定只改变其中的一个变量x i (i =1,2,···,n)，其他的变量保持不变，我们就可以根据映射关系f 计算出指标x i 改变后的输出值y 。

3. 将各输入属性的平均值作为输入指标，并计算出相应的输出，记为中点估计值：y ̅。

当其中一个输入属性x i 变化100%时，可求出相应的输出值y的绝对变化量：y var i =|y −y ̅|，再相应的求出输入属性x i 对输出值y 的相对变化量: y xvar i =y vari y ̅。

4. 比较所有输入指标变化对输出变量的相对变化量，进而得出输入指标变量x i 对输出变量y 的相对贡献率c i (i =1,2,···,n )。

其中c i =y xvar i ∑y xvar i n i=1，选取其中贡献率高达80%的因子作为主要因素，并且作为下一步的BP 神经网络训练的输入值。

1.2.3 基于神经网络的客户流失度计算使用上面计算得出的因子来评估客户的流失度，通过BP神经网络，即由一个输入层，若干个隐藏层和一个输出层构成，来刻画用户特征与流失度之间的关系，如下图1，网络的输入值为每个顾客的关键影响因素，输出端为计算得出的客户流失度大小。

图1.2假设通过上面的方法提取到了N，随机在总体中抽取K各个体作为样本，并用X i和 Y i分别表示输入和输出值，对于某一输入X i=*x1k,x2k,···,x Nk+,k=1,2,···,K，网络的输出值为：Y i。

节点i的输出记为O ik，其输入为net ik=∑w ji O j。

输j入与输出的关系为：O ik=f(net ik)对于隐层节点和输出节点，激活函数f一般采用Sigmoid函数即为S型函数，因为从数学角度看，S型函数具有可微分性，正是因素S型函数更接近与生物神经元信号输出形式。

同时BP算法本身也要求网络的输入输出函数是可微的，并且我们要计算的客户流失度需要现在在（0，1）之间，所以选择用这S型函数作为输出层函数。

通过上面的步骤，利用计算因子和系那个关样本数据来训练用于计算客户流失度的神经网络模型。

训练好的神经网络模型即可作为我们以后用来计算流失度的计算模型。

1.3 模型的计算在总体数据中我们随机抽取其中的600个数据作为一个样本，同时根据人工评价选取顾客属性中的会员卡级别、查测窗口总基本积分、第一年精英资格积分、第二年精英资格积分、第一年总票价、第二年总票价、观测窗口总飞行公里、观测窗口总加权飞行公里数、观测窗口季度平均飞行次数、平均折扣率、第一年乘机次数、第二年乘机次数、第一年里程积分、第二年里程积分、观测窗口总精英积分、观测窗口中其他积分、非机动积分总和等这35个因素作为一开始的影响指标。

1. 计算每个顾客的流失度。

2. 顾客的所有属性中的数据进行归一化处理。

3. 对上面列举的35个属性进行神经网络学习，并得到相应顾客属性与流失率之间的映射函数O i =f(net i )。

4. 计算每个属性的平均值x i ̅，i 表示第i 个属性的平均值。

5. 将*x 1̅̅̅，x 2̅̅̅，···，x 35̅̅̅̅+，这组数据带入上面学习得到的神经网络函数，得到y ̅。