多元回归模型在新建机场客运量预测中的应用研究——基于动态聚类分析

合集下载

北京理工大学数学专业应用回归分析期末试题(MTH17095)

北京理工大学数学专业应用回归分析期末试题(MTH17095)

课程编号:07000237 北京理工大学2011-2012学年第二学期2009级应用回归分析期末试题A 卷1.(35)Consider the following model:0112233i i i i i y x x x ββββε=++++,where y=labor force paticipation (%)by family heads of poor families, x 1=mean family income ($), x 2=mean family size,x 3=unemployment rate (% of civilian labor force unemployed).Two versions of the model were estimated as follows (the standard errors are in the brackets).(A)123ˆ33.460.01915.520.813i i i i yx x x =-+++ (48.78) (0.019) (9.46) (1.911)()Re 15,5130.13,3716.98T s n SS SS A ===(B) 12ˆ26.510.01815.30i i i yx x =-++ (44.37) (0.018) (9.12)()Re 3778.11s SS B =(1)Interpret the coefficient of mean family income in model (B);(2)Carry out a t-test to test whether in model (A) mean family size has a significant effect upon labor force paticipation;()0.05α=(3) Carry out a partial F-test to test whether in unemployment rate has a significant effect upon labor force paticipation;()0.05α=(4)What is the adjusted coefficient of determination 2R in model (A); (5)Test the significance of model(B);()0.05α=(6)Find a 95% confidence interval for the coefficient 1β of 1x in model (B); (7)Interpret the confidence coefficient 95% in (6).x 1=national income (100 million yuan) x 2=volume of consumption (100 million yuan) x 3=volume of passengers on railway (ten thousands persons) x 4=length of airline of civil aviation (ten thousands persons) x 5=number of inbound tourist arrivals (ten thousands persons) y=volume of passengers of civil aviation (ten thousands persons)(1)What problem do the VIFs imply? (2)Which regression coefficients may have the wrong sign? (3)Discuss the reasons for the problem in (2).3.(12)Consider the following model (n=8):2012y x x βββε=+++where y=body temperature of a pig (centi) x=time length after the pig is infected (hours)(1)Test the significance of 2x ;()0.05α= (2)Predict body temperature at x=80; (3)If the observations of x lie in (8,64),what ’s your suggestion about the prediction in (2); 4.(18)()()()2,:,,0,,0y X X n p rk X p E Var V V βεεεσ=+⨯===>, (1)Find GLSE for β;(2)Find an unbiased estimator for 2σ.5.(20)Full model ()()112220,,1,2,,,cov ,0,i i i i i i j y x x E i j n i ji j ββεεσεε⎧⎪=++⎪⎪==⎨⎪⎧=⎪=⎨⎪≠⎩⎩subset model ()()1120,,1,2,,,cov ,0,i i i i i j y x E i j n i ji j βεεσεε⎧⎪=+⎪⎪==⎨⎪⎧=⎪=⎨⎪≠⎩⎩(1)Under subset model caculate OLSE 1ˆβfor 1β; (2)Assume full model is true,caculate ()()11ˆˆ,E Var ββ. Attached list:()()()()()0.0250.0250.0250.050.0511 2.201,12 2.1788,5 2.5706,1,11 4.8443,2,12 3.8853t t t F F =====课程编号:MTH17095 北京理工大学2012-2013学年第二学期2010级应用回归分析期末试题A 卷Attached list:()()()0.050.050.041,22 4.30,1,23 4.28,3,22 3.418,F F F ===()()0.0250.02522 2.074,23 2.0687t t ==1.(28)Consider the following model:01122ˆyx x βββ=++,n=25,where y=deliver time (minutes), x 1=number of cases of product, x 2=distance walked by the route driver (feet).Two versions of the model were estimated as follows (the standard errors are in the brackets).(A)12ˆ 2.341 1.6160.014yx x =++ (1.097) (0.171) (0.004)()Re 5784.543,233.732T s SS SS A ==(B) 1ˆ 3.321 2.176yx =+ (1.371) (0.124)()Re 402.134s SS B =(1)Interpret the coefficient of number of cases of product in model (A);(2)Carry out a t-test to test whether for model (A) number of cases of product has a significant effect upon deliver time;()0.05α=(3)Carry out a partial F-test to test whether distance has a significant effect upon deliver time;()0.05α=(4)Test the significance of model(B);()0.05α=(5)Find a 95% confidence interval for the parameter 1β from model (B);(6)Find a 90% Bonferroni confidence interval for the parameter 0β and 1β from model (B); (7)Explain the result in (6).2.(18) Consider the following model:01122ˆyx x βββ=++,n=25,where y=deliver time (minutes), x 1=number of cases of product, x 2=distance walked by the route driver (feet).(1)What are the horizontal scale and vertical scale in the following partial regression plot?What does the plot indicate?(2)It is reported that studentized residual at point 9 9993.2138,0.4983r h ==,where ii h is the ith diagonal element of hat matrix H,and COOK ’s distance 9 3.418D =.Interpret the results. (3)The correlation coefficients 12r between x 1 and x 2 is 120.824r =.What does the result imply? What are sources of the problem?3.(15)To study the relationship between the annual per capita expenditure on education and the annual per capita consumption expenditure,two models are used to fit the data,where y:The annual per capita expenditure on education, x:The annual per capita consumption expenditure.4.(21) Consider the simple linear regression model:011y x ββε=++,with ()()20,E Var εεσ==,and ε uncorrelated.(1)Show ()221R xx E MS S σβ=+; (2) Show ()2Re s E MS σ=.5.(18)A linear regression model is written as follows: 11223344y x x x x ββββε=++++,()()20,E Var εεσ==.The data is shown in the following table:(2)Caculate OLSE 1ˆβ for 1β; (3)Caculate ()1ˆVar β.课程编号:MTH17095 北京理工大学2013—2014学年第二学期2011级应用回归分析期末试题*卷(年份推断为2011,试卷类型未知)附表:()()0.050.0255,10 3.33,10 2.2281F t ==1.(28分)中国民航客运量回归方程为:(括号里是标准误差)12345ˆ450.90.3540.5610.007321.5780.435yx x x x x =+--++, (178.08)(0.085) (0.125) (0.002) (4.030) (0.052)16,13843371.750,13818876.769n SST SSR ===其中:y —民航客运量(万人) x 1—国民收入(亿元) x 2—消费额(亿元)x 3—铁路客运量(万人) x 4—民航航线里程(万公里) x 5—来华旅游入境人数(万人) (1)解释回归方程中民航航线里程的回归系数; (2)检验回归方程的显著性;()0.05α= (3)计算回归方程的决定系数,并作出解释; (4)计算回归的标准误差,解释这一结果; (5)对模型中来华旅游入境人数对民航客运量是否有显著影响进行t-检验; (6)建立x 4的回归系数4β的置信水平为95%的置信区间。

Spss对民航客运量的多元回归分析:

Spss对民航客运量的多元回归分析:

Spss对民航客运量的多元回归分析:1.首先方法选择:进入法。

然后分析相关性表格:国民收入,消费额,民航航线里程,来华旅游人数都与民航客运量高度相关,而铁路客运量和民航客运量的相关性较低。

通过观察调整后的判定系数为0.994,拟合优度较高,不被解释的变量较少。

回归方程的显著性小于0.05,说明被解释变量与解释变量的线性关系是显著的。

可以建立线性方程。

在显著性系数中,铁路客运量的sig 大于0.05,所以是不显著的,说明自变量铁路客运量对因变量的影响是不明显的,应该移除该变量。

回归方程:ˆY =-195.945+0.519X 1-0.771X 2+0.001X 3+15.983X 4+0.344X 52.方法选择:后退法。

然后分析相关性表格:由表可以看出:除了铁路客运量的相关性较低外,其余变量的相关性都较高。

采用后退法后,调整变量更高,拟合优度更高。

回归方程的显著性为0,认为被解释变量和解释的变量线性关系是显著的,可以建立线性方程。

在剔除变量铁路客运量后,剩余变量的sig 都变得更小,显著性更显著。

回归方程为:ˆY =-153.930+0.509X 1-0.754X 2+15.980X 4+0.347X 53.方法选择:逐步回归法。

然后分析相关性表格:铁路客运量相关性较低,其他变量相关性都较高。

采用逐步法后,调整值很高,拟合优度很高。

说明可以用该模型预测。

sig 值小于0.05,说明显著性很高。

采用逐步回归法后,变量得显著性很高。

变量为国民收入和民航航线里程。

回归方程为:ˆY =-299.004+0.083X 1+17.316X 4。

多元回归分析在市场预测中的使用实证

多元回归分析在市场预测中的使用实证

多元回归分析在市场预测中的使用实证市场预测是投资者和商业决策者在制定策略和计划时必备的重要工具。

而多元回归分析作为一种广泛应用于社会科学、经济学、统计学等领域的分析方法,被广泛用于市场预测领域。

本文将以实证研究的方式,探讨多元回归分析在市场预测中的应用效果,为投资者和商业决策者提供参考。

多元回归分析是一种通过建立一个包含多个自变量的数学模型来预测一个因变量的统计方法。

在市场预测中,我们经常需要综合考虑多个因素对市场的影响,并建立一个回归模型来预测市场的变化。

多元回归分析可以帮助我们确定哪些因素对市场变化有显著的影响,并使用这些因素来做出预测。

首先,多元回归分析可以帮助我们识别哪些因素对市场变化具有重要影响。

通过收集大量的市场数据,我们可以将多个可能的因素作为自变量,将市场的变化作为因变量,建立一个回归模型。

通过对回归模型的分析,我们可以确定哪些自变量对市场变化有显著的解释能力,即哪些因素对市场变化有重要的影响。

这有助于我们理清市场的复杂关系,识别关键因素,从而更准确地进行市场预测。

其次,多元回归分析可以帮助我们建立一个预测模型。

通过对市场数据的回归分析,我们可以得到一个建立在多个因素基础上的数学模型,该模型可以使用已知的自变量的取值来预测未来市场的变化。

这种预测模型可以用于制定投资策略、制定销售计划等,并帮助投资者和商业决策者做出科学的决策。

然而,多元回归分析也存在一些限制。

首先,回归模型的可靠性依赖于所选的自变量。

如果选择的自变量不恰当或相关性不强,得到的预测结果将不可靠。

因此,在进行多元回归分析时,我们需要慎重选择自变量,并对自变量之间的相关性进行分析。

其次,回归模型建立在历史数据的基础上,而市场的环境在未来可能发生变化。

因此,通过回归模型得到的预测结果只是一种参考,不能完全代表市场的真实情况。

在实际应用中,多元回归分析已经被广泛应用于市场预测中。

例如,在金融领域,通过对股票市场的回归分析,研究者可以找到与股票价格相关的因素,包括公司财务数据、宏观经济指标等。

基于机器学习的航空客运量预测模型研究

基于机器学习的航空客运量预测模型研究

基于机器学习的航空客运量预测模型研究航空客运量预测一直以来都是航空运输领域的一个重要问题。

随着航空业的发展和客运量的增长,航空公司需要准确地预测航班的客运量,以便进行航班安排、资源分配和票价制定。

在这样的背景下,基于机器学习的航空客运量预测模型应运而生。

机器学习作为一种人工智能技术,能够从数据中学习并自动调整模型以实现预测目标。

因此,基于机器学习的航空客运量预测模型能够利用过去的航空客运数据,自动分析特征和模式,并在此基础上预测未来的客运量。

首先,建立一个可靠的航空客运量数据集非常重要。

这个数据集应该包括大量的航空公司的客运量数据,包括航班时间、航班路线、航班类型、航班航空器、航空公司等特征数据。

此外,还需要考虑到一些外部因素,如经济指标、节假日和天气等因素的影响。

通过收集并整理这些数据,就可以构建一个完整的航空客运量数据集。

接下来,需要对数据进行预处理和特征工程。

预处理过程包括数据清洗、数据变换和数据归一化等步骤。

数据清洗是为了去除异常值和缺失值,确保数据的准确性。

数据变换可以将非数值型特征转换为数值型特征,以便机器学习算法能够处理。

数据归一化可以将不同特征的数据缩放到相同的范围,避免某些特征对预测结果的影响过大。

特征工程的目的是根据领域知识和特征的相关性进行特征选择和数据转换,以提高模型的准确性和预测能力。

然后,选择合适的机器学习算法来构建航空客运量预测模型。

常用的机器学习算法包括回归算法、决策树算法、支持向量机算法和神经网络算法等。

根据数据集的特征和问题的要求,可以选择最合适的算法进行建模。

同时,为了进一步提高模型的性能,可以使用交叉验证和网格搜索等技术来优化模型的参数。

在模型构建完成后,需要对模型进行评估和验证。

评估指标可以使用均方根误差(RMSE)、平均绝对百分误差(MAPE)和决定系数(R^2)等。

通过与实际客运量进行对比,可以评估模型的准确性和可靠性。

如果模型表现不佳,可以对数据集进行进一步的调整和特征工程,甚至尝试其他机器学习算法。

交通流量预测的数学模型构建与应用

交通流量预测的数学模型构建与应用

交通流量预测的数学模型构建与应用第一章:引言在当今城市化程度日益高涨的情况下,交通流量预测已经成为了一项重要的任务。

在城市交通管理中人们常常需要了解未来的交通流量,以便合理规划道路资源,制定出更加有效的交通管理策略。

因此,构建一个可靠的交通流量预测数学模型对于城市交通管理至关重要。

本文将从数学模型构建与应用两个方面探讨交通流量预测。

第二章:交通流量预测的数学模型构建2.1 多元线性回归模型多元线性回归模型是一种比较常用的交通流量预测模型,它可以分析影响预测变量的多种因素。

多元线性回归模型的基本形式为:y=a0+a1x1+a2x2+……+anxn+ε其中,y为预测变量,a是回归系数,x是自变量,ε是误差项。

对于交通流量预测模型而言,预测变量为交通流量,自变量可以是天气、时间、历史数据等。

2.2 时间序列模型时间序列模型是另一种常用的交通流量预测模型。

它根据历史数据的时间序列规律,预测未来交通流量的模型。

时间序列模型的基本形式为:yt=f(yt-1,yt-2,……)+εt其中,f是时间序列模型的函数,ε是误差项。

在时间序列模型中,yt表示当前的交通流量,yt-1、yt-2等表示过去的交通流量值。

2.3 神经网络模型神经网络模型是一种非线性模型,可以有效地逼近交通流量的复杂规律。

神经网络模型的基本结构包括输入层、隐藏层和输出层。

输入层接收交通流量的相关因素,隐藏层进行运算并产生新的变量,输出层给出预测结果。

第三章:交通流量预测的应用3.1 基于交通流量预测的交通管理策略制定交通流量预测可以帮助城市交通管理人员分析和评估不同策略对交通流量的影响。

这有助于制定更有效的交通管理策略,包括优化巡逻或巡视的时间和路线,调整交通信号灯的时间设置,优化公共交通路线等。

3.2 基于交通流量预测的交通调度基于交通流量预测的交通调度可以使交通运输更加高效。

例如,在公共交通领域,公交车可以根据预测交通流量调整开车时间和路线,保证车辆不过度拥挤,在不同高峰期合理配置车辆。

航空旅客流量预测模型及应用研究

航空旅客流量预测模型及应用研究

航空旅客流量预测模型及应用研究随着全球经济的快速发展和人民生活水平的提高,航空旅客运输需求不断增长。

在这个背景下,航空公司和机场管理者迫切需要准确预测旅客流量,以优化资源配置和增加运营效率。

因此,航空旅客流量预测模型及应用研究成为一个重要的课题。

航空旅客流量预测模型是一种基于数学统计和机器学习方法的模型,主要用于分析航空旅客的需求,并根据历史数据和各种影响因素进行预测。

这些影响因素可能包括季节性变化、节假日、经济因素、航空公司宣传力度、机票价格等。

预测结果可以为航空公司和机场管理者提供重要决策支持,例如,制定飞行计划、调配机组人员和优化机场服务。

航空旅客流量预测模型的研究可以分为两个阶段:建模和预测。

在建模阶段,首先需要收集历史数据,包括航空旅客出行数量、时间、地点等信息。

然后,可以使用各种数学统计方法,例如回归分析、时间序列分析等,来探索历史数据中的规律和趋势。

此外,还可以通过数据挖掘和机器学习算法,如神经网络、支持向量机等,构建预测模型。

在预测阶段,根据历史数据和影响因素,利用建立的模型进行旅客流量预测,并提供预测结果和可视化展示。

航空旅客流量预测模型的应用可以涵盖多个领域。

首先,航空公司可以利用预测模型来制定航班计划和定价策略。

航空旅客流量的准确预测可以帮助航空公司合理安排航班数量和起降时间,以满足旅客需求,减少空座率,并提高运营效率。

其次,机场管理者可以通过预测模型来优化资源配置和服务布局。

准确预测旅客流量可以帮助机场管理者调配安检人员、登机口和航站楼等,提高旅客通行效率,并提升旅客体验。

此外,政府部门也可以利用预测模型来制定相应政策,例如,加大投资机场基础设施建设、推动航空业发展等。

当然,航空旅客流量预测模型的研究也面临一些挑战和限制。

首先,航空旅客流量受多种因素影响,包括天气、航空安全局势、地缘政治等。

这些因素的变动往往难以预测和量化,因此会给预测模型的准确性带来一定挑战。

其次,数据的可靠性和获取方式也是一个问题。

基于快速聚类分析的航空分担率模型在新建机场客运量预测中的应用




基于聚类分析 的航空分担率模型 , 其应用 的可行性进行 了进一步的探讨 , 对 并结 合阿拉善 盟
地区新 建机场的客运量进行 了预测 , 得到 比较理想 的预测结果 。该研究 为新 建机场 的客运 量预测 提 供 了一 种可 行的方法 , 可供实 际需要借鉴 。
关键 词 预 测 ; 类 分 析 ; 空 分 担 率 ; 建 机 场 客运 量 聚 航 新 中 图分 类 号 : 56 3 F 2 . 文献标志码 : B

O 引 言
在我 国 , 机场 业 务量 的 预测 受 到 越 来 越 多 的 重视 , 这是 由于机 场 的规划 、 建设 与经 营管 理都 需 要 以机场 航空 业务 量作 为参 考依 据 。新 建 机场航
空业 务量 预测 的最 大 问题 是 没 有 历 史 航 空数 据 ,
种 多元统计方法 , 用于多指标体 系的分类 。 适
传统的做法是采用统计调查和相似类 比。由于在 统计 调查 和相 似 对象 的选 择 中 , 只进 行 了定 性 的
比较 , 没有 进行 深入 的定 量 聚类分 析 , 易 掺杂人 容 为 因素 的影 响 , 使 调查 预测 结 果 与实 际 出入 较 致 大 。因此 , 在新 建 机 场 的 预 ’ 阶段 需 要 选 择一 种 狈 0 有 效 的预测 方法 , 这种 方 法要 能够 合理 、 有效 地 降
表 1 数 据 矩 阵
用 与新 建机 场相 似 的机 场 的航 空分 担 率 , 进 行 来
新 建机 场业 务量 预测 。这 种方 法考 虑到 交通 方式
之 间 的竞争 与协 作 关 系 , 一 定 程 度 上 可 以 限制 在
机 场业 务量 预测 过 程 中的 随 意性 和人 为 影 响 , 提

如何使用逻辑回归模型进行航空客流预测(Ⅰ)

航空客流预测是航空公司和机场管理部门的重要工作之一。

通过对未来客流量的合理预测,可以更好地安排飞机的航线和座位,提高运营效率,减少资源浪费。

逻辑回归模型是一种常用的客流预测方法,它可以通过对历史数据的分析和建模,来预测未来客流的情况。

本文将探讨如何使用逻辑回归模型进行航空客流预测。

1. 数据收集与准备在使用逻辑回归模型进行航空客流预测之前,首先需要进行数据的收集和准备工作。

这包括收集历史客流数据、航班信息、机场情况等相关数据,并进行数据清洗和处理。

在数据清洗过程中,需要处理缺失数据、异常值和重复数据,以保证数据的质量和准确性。

同时,还需要对数据进行特征选择和转换,以便适应逻辑回归模型的要求。

2. 模型建立与训练在数据准备工作完成后,接下来就是建立逻辑回归模型并进行训练。

逻辑回归模型是一种广义线性模型,它可以用来预测二分类或多分类问题。

在航空客流预测中,通常将客流量划分为高、中、低三个等级,然后使用逻辑回归模型来预测客流量所属的等级。

在模型建立过程中,需要将数据集分为训练集和测试集,然后使用训练集数据来训练模型,并使用测试集数据来评估模型的性能。

3. 模型评估与优化在模型训练完成后,需要对模型进行评估和优化,以确保模型的预测性能达到要求。

评估模型的常用指标包括准确率、精确率、召回率和F1值等,这些指标可以帮助我们判断模型的预测效果。

如果模型的性能不理想,可以尝试调整模型的参数或者使用特征工程的方法来优化模型。

4. 模型应用与预测经过评估和优化后,逻辑回归模型就可以用来进行航空客流预测了。

在预测过程中,需要将实时的航班信息和机场情况输入到模型中,然后模型会根据历史数据和建立的模型来预测未来客流量的情况。

预测结果可以帮助航空公司和机场管理部门做出合理的决策,提高运营效率和服务质量。

5. 模型监控与更新最后,建立好的逻辑回归模型需要进行监控和更新,以适应不断变化的客流情况。

在模型应用的过程中,需要不断收集新的数据并更新模型,以确保模型的预测性能始终保持在一个较高的水平。

机场旅客吞吐量预测方法研究(交通运输规划与管理专业优秀论文)

南京航空航天大学硕士学位论文摘要近几年,城市化水平的提高、城乡地面交通网络的逐步完善,促成了地区机场群的形成。

这些机场群的出现给机场旅客吞吐量的预测带来了难题。

本文分析了目前机场旅客吞吐量常用预测方法的特点及影响机场旅客吞吐量形成的各种因素。

在此基础上根据处于机场群中各机场旅客吞吐量形成的特性,考虑到机场与机场之间的竞争因素的影响,结合巢式离散模型在城市交通方式选择中预测的原理将机场之间的竞争因素引入到机场旅客吞吐量的预测方法中。

本文先使用回归预测法对机场辐射区域内的旅客需求量进行预测,然后使用巢式离散选择模型建立机场选择巢式离散模型,使用该模型求出的效用函数对区域内总的旅客需求量进行重新分配,从而得到具体某机场的旅客吞吐量。

使用这种预测方法不仅考虑了机场所处地区社会经济条件对机场旅客吞吐量的影响,也考虑了区域内机场之间的竞争因素。

在理论研究的基础上本文还结合苏南(硕放)机场的实际对机场群中某一机场进行了航空旅客吞吐量的预测,并且就苏南(硕放)机场的发展提出了一些个人的看法。

关键词:机场群,需求量预测,旅客吞吐量预测,巢式离散模型,回归分析I机场旅客吞吐量预测方法研究IIAbstractThese years, the improvements of the level of urbanization and transport network havepromoted the formation of regional airports systems. The emergence of these airport groups brought new problems to the airport passenger throughput prediction. This paper analyzed the characteristics of the common methods for predicting the airport passenger throughput and the influence factors of the airport passenger throughput. Based on these analysis results, in accordance with the formation characteristics of passenger throughput of the airport in the airport groups, this paper used the Nested-Logit model which is often used in forecasting the city traffic choose activities in forecasting the airport passenger throughput. And this method considers the competition factor between the airport and nearly airports.First this text used the regression method to forecast the region passenger total demand. Then it used the Nested-Logit model to establish the airport choice Nested-Logit model. Used the utility function which is obtained by this model, the text redistributed the total demand and obtained the passenger throughput of the specific airport. This forecast method not only has considered the influence of the social and economic condition in the airport radiation areas, but also has considered the competition and promotion factors between the region airports. On the basis of theoretical study, this article forecasted the Su Nan (Shuo Fang) Airport passenger throughput with actual condition of this airport, and gave some personal opinion about the development of the Su Nan (Shuo Fang) Airport at last.Key words: multi-airports group, airport passenger throughput, demand forecasting, Nested-Logit model, Regression analysis知识水坝为您整理南京航空航天大学硕士学位论文图表清单图2.1 递减法 (7)图2.2 三层B-P网结构示意图 (8)图2.3 1991-2006年我国GDP与机场旅客吞吐量 (11)图2.4 1991-2006年我国人口与机场旅客吞吐量 (11)图2.5 1994-2006我国旅游人数与机场旅客吞吐量 (12)图2.6 06年长三角十机场旅客吞吐量比例与机场所在地相关经济指标比例 (13)图2.7本文预测方法流程图 (16)图3.1 NL模型结构示意图 (21)图4.1 机场竞争NL模型框架图 (25)图4.2 NL参数标定方法流程图 (26)图4.3 NR迭代算法 (31)图5.1无锡机场所处地理位置图 (35)图5.2 无锡硕放机场30-120分钟通勤时间内辐射区域 (37)表1.1 世界主要区域机场群各类机场的组成比率 (1)表1.2 长三角地区主要运输机场 (1)表1.3 长三角主要机场2001-2006旅客吞吐量所占份额 (1)表2.1 长三角地区各机场基础设施及运力水平统计表(06年) (14)表4.1 影响旅客选择机场的决定因素 (25)表4.2 机场竞争NL模型特性变量的选择 (27)表4.3 机场竞争NL模型数据整理 (28)表4.4 参数t值检验结果 (31)表5.1 1993-2006年无锡硕放机场旅客吞吐量和飞机起降架次 (33)表5.2 各不同等级道路时速 (37)表5.3 1999-2006年无锡硕放机场辐射区域内某些经济指标占全国总量的比例 (38)表5.4 1999-2006年无锡硕放机场辐射范围内的经济指标及机场的业务量 (38)表5.5 1999-2006年无锡硕放机场辐射范围内财政收入数据(单位:亿元) (39)表5.6 2000-2006苏南机场辐射范围内航空旅客需求总量预测值、实际值与误差(单位:万人次) (40)表5.7 2000-2007年无锡硕放机场辐射区域内各城市民航旅客需求量预测值 (40)表5.8 06年各地到各机场的民航旅客比例预测值(%) (41)V知识水坝为您整理机场旅客吞吐量预测方法研究VI 表5.9 2000-2007年各地将无锡硕放机场作为始发或达到机场的客流量预测 (42)表5.10 06年无锡地区客流量的流向 (43)表5.11 06年无锡硕放机场旅客吞吐量多种预测方法的预测结果与相对误差 (43)表5.12 苏南(硕放)机场旅客吞吐量及机场设计能力 (44)承诺书本人郑重声明:所呈交的学位论文,是本人在导师指导下,独立进行研究工作所取得的成果。

中国民航客运量的回归模型(1)

回归分析论文题目:中国民航客运量的回归模型我国民航客运量的变化趋势及其成因摘要改革开放以来,中国的经济飞速发展,人民的生活水平也发生了很大的变化;民航一直是交通运输中的一种不可少的方式,一定程度上也反映了人民的生活水平的提高,为了对民航客运量做出准确地评估和预测,本文利用多元线性回归分析方法研究我国民航客运量的变化趋势及其成因,数据来自《中国统计年鉴》(1981—2010年民航客运量),利用spss软件对数据进行处理和分析.关键词多元线性回归分析、回归方程、显著性检验、相关性、民航客运量一、模型的建立与分析(一)研究我国1981年至2010年民航客运量与各影响因素之间的关系1)数据来源:《中国统计年鉴》(1981—2010年民航客运量)如下表1表1.我国民航客运量与影响因素2)研究方法:建立y 与自变量53412,,,,x x x x x 的多元线性回归模型如下:10122334455y=+ββχ+βχ+βχ+βχ+βχ+ε其中 E(ε)=0 var (ε)=2σ3)实证分析:(1)对收集数据作相关分析,用spss 软件计算增广相关矩阵,输出结果如下表2.相关性从相关矩阵看出,y 与1x ,2x ,4x ,5x 的相关系数都在0.9以上,说明所选自变量与y 高度线性相关的,用y 与自变量做多元线性回归是合适的。

y 与3x 的相关系数3y r =0.809,p 值=0,这说明铁路客运量对民航客运量影响较弱。

一般认为铁路客运量与民航客运量之间呈负相关,铁路与民航共同拥有旅客,乘了火车就乘 不了飞机。

但就中国的实际情况分析我国居民收入普遍不高,一般外出、旅游乘火车的比较多,而且随着我国铁路建设越来越普遍,乘坐火车外出的人也越来y 民航客运总量(万人) x1GDP(万元)x2居民消费(万元) x3铁路客运量(千人)x4民航航线里程(万公里) x5来华旅游入境人数(万人) Pearson 相关性y 民航客运总量(万人) 1.000 .996 .994 .809 .936 .932 x1GDP (万元) .996 1.000 .995 .820 .929 .922 x2居民消费(万元) .994 .995 1.000 .784 .950 .937 x3铁路客运量(千人) .809 .820 .784 1.000 .597 .622 x4民航航线里程(万公里) .936 .929 .950 .597 1.000 .978 x5来华旅游入境人数(万人).932 .922 .937 .622 .978 1.000 Sig. (单侧)y 民航客运总量(万人) . .000 .000 .000 .000 .000 x1GDP (万元) .000 . .000 .000 .000 .000 x2居民消费(万元) .000 .000 . .000 .000 .000 x3铁路客运量(千人) .000 .000 .000 . .000 .000 x4民航航线里程(万公里) .000 .000 .000 .000 . .000 x5来华旅游入境人数(万人).000.000.000.000.000.愈多。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
rn Business Trade Industry
2010年 第 2O期
多元 回归模 型在新 建 机 场客运量预测 中的应 用研究
— — 基 于动态聚类 分析
悦 慧 安 然
(中 国 民 航 大 学 ,天 津 300300)
设 7"/i表 示 第 i类 中 所 包 含 的 样 本 个 数 ,则
ni一 ∑ ( 1,… ,c)
设 -T∈RN 表 示 第 i类 的 中 心 ,则
 ̄ — 已 '
l-eijx j


i 耋 一 li
( ‘ ’ 一’'f。 )
所 以第 i类 的 类 内 差 异 为
(4)
( )
即 整 体 类 内差 异 为
(6)
s( )一蚤S‘ ( )一蚤 lJ l- z,一Xi。l (7)
动 态 聚 类 分 析 的 目 的 就 是 寻 找 = ( , )使 得 S( )
取 得 最 小 值 ,即
S( )一 ra in{S(tA )
(8)
聚 类 终 止 条 件 为 :第 一 ,迭 代 次 数 。 当 目前 的 迭 代 次 数
关 键 词 :新 建 机 场 ;客 运 量 预 测 ;动 态聚 类 分 析 ;多元 回 归
中 图 分 类 号 :F22
文 献 标 识 码 :A
文 章 编 号 :1672—3198(201O)20—001 3一O3
0 引 言
相 似 性 用 欧 氏距 离 度 量 ,其 表 达 式 为 :
机 场 是 航 空 运 输 最 重 要 的 基 础 设 施 。 从 全 国 机 场 体 系 看 ,我 国 面 临 着 机 场 总 量 不 足 、密 度 偏 低 的 挑 战 ,根 据 《全 国 民 用 机 场 布 局 规 划 》,未 来 十 年 国 内 将 新 增 70余 个 机 场 。 同 时 ,机 场 规 模 成 为 民 航 业 发 展 的 又 一 挑 战 ,它 直 接 影 响 机 场 的 建 设 投 资 成 本 和 运 营 成 本 ,规 模 过 大 会 造 成 资 源 的 浪 费 ,规 模 过 小 又 不 足 以 满 足 市 场 的 发 展 需 求 。 机 场 业 务 量 作 为 机 场 的 主 要 生 产 指 标 ,其 预 测 数 据 是 确 定 机 场 建 设 规 模 的 重 要 依 据 ,对 机 场 的 建 设 、运 营 和 管 理
一 \0,否则
则 矩 阵 一 ( )具 有 如 下 性 质 :
具 有 重 大 影 响 。
∈ {0,1}且 一 1( 一 1,… ,n)

对 于 新 建 机 场 ,在 进 行 业 务 量 预 测 时 最 棘 手 的 问 题 是 缺 乏 历 史 数 据 。 目前 ,大 部 分 新 建 机 场 在 进 行 航 空 业 务 量 预 测 时 采 用 基 年 预 测 法 或 相 关 系 数 法 等 ,对 所 参 考 机 场 的 数 据 未 做 任何 处 理 ,实 现 比较 简 单 ,但 预 测 精 度 并 不 非 常 理 想 。 例 如 我 国 绵 阳 机 场 、珠 海 机 场 就 因 建 设 规 模 过 大 致 使 各 项 设 施 得 不 到 充 分 利 用 。 基 于 此 ,笔 者 首 先 选 取 与 新 建 机 场 所 处 区域 地 理 、社 会 环 境 相 似 的 机 场 ,进 行 聚 类 分 析 , 择 优 筛 选 出综 合 条 件 与 新 建 机 场 条 件 最 接 近 的 已建 机 场 ;
等 于 指 定 的 迭 代 次 数 时 终 止 聚 类 ;第 二 ,类 中 心 点 偏 移 程
度 。新 确 定 的 类 中心 点 距 上 次 迭 代 所 形 成 的 类 中 心 点 的 最
大 偏 移 量 小 于 指 定 的 量 时 终 止 聚 类 。两 个 条 件 中 任 意 一 个
摘 要 :针 对 新 建 机 场航 空业 务 量 预 测 中缺 乏 历 史数 据 的 难 题 ,利 用 动 态聚 类 分 析 方 法 ,筛 选 相 似 机 场 ,获 得 预 测 所 需
数 据 ,依 此 构 筑 新 建 机 场 的 多 元 回 归 预 测 模 型 。通 过 实 际数 据 检 验 ,证 明 该 方 法是 可 行 的 ,且 精 度 较 高 。
在 聚类 分 析 结 果 的 基 础 上 ,结 合 多 元 回归 模 型 进 行 预 测 。 1 预 测 基 本 原 理 与 建 模 步 骤 1.1 预 测 基 本 原 理
基 本 原 理 是 :在 对 新 建 机 场 没 有 任 何 先 验 知 识 的 情 况 下 ,根 据 其 所 在 地 区 的 诸 多 特 征 ,找 出 一 批 相 似 样 本 ,首 先 按 照 动 态 聚 类 准 则 进 行 迭 代 ,使 样 本 实 现 最 优 化 分 类 ;在 此 基 础 上 ,利 用 与 新 建 机 场 同 类 的 已 建 机 场 的 历 史 数 据 ,建 立 多 元 线 性 回归 模 型 ,即可 作 为 新 建 机 场 的业 务 量 预 测 模 型 。 1.2 预 测 建 模 步 骤
_√毒(z肛一ccgk)。
(2 5
指 定 聚 类 数 目 ,确 定 初 始 类 中 心 ,对 样 本 进 行 聚 类 。 其
聚 类 准 则 为 :假 设 将 ”个 样 本 z』∈ R ( — l,… ,n)分 成 c
类 ,对 i一 1,… ,c和 j一 1,… , ,我 们 定 义
f 1,如 果 第 个 样 本 属 于 第 i类
(1)进 行 动 态 聚 类 分 析 设 所 考 察 的 问 题 有 项 指 标 解 释 变 量 X 一 (371,… , - z ),选 择 样 本 ,得 到 个 样 品 的 观 测 值 X 一 (z 1,… ,Xi口),i 一 1,… , ,构 建 样 本 数 据 矩 阵 ,记 为
s∽ ( )一 d}1:rj—i}I。 J I
相关文档
最新文档