多模型拟合与组合预测

合集下载

两类组合预测方法的研究及应用

两类组合预测方法的研究及应用

两类组合预测方法的研究及应用摘要:组合预测方法是将多种单一预测模型进行合理、有效的组合,以提高单一预测模型的精度和可靠性。

本文首先介绍了组合预测方法的基本思想和原理,随后对两类典型的组合预测方法——加权平均和集成学习方法,进行详细的讨论和研究。

最后,在实际应用中,根据不同的预测对象和需求场景,我们可以灵活地选择不同的组合预测方法以提高预测精度和稳定性。

关键词:组合预测;加权平均;集成学习;模型融合一、前言在对未来进行预测的过程中,单一的预测模型受限于所使用的数据和算法,难以将所有的信息充分利用。

因此,将多个预测模型相结合,实现模型的融合,能够提高预测的精度和稳定性。

组合预测方法就是将多种单一预测模型进行合理、有效的组合已达到提高预测精度的目的,成为当前预测领域中的研究焦点之一。

本文将对两类典型的组合预测方法——加权平均和集成学习方法,进行详细的讨论和研究。

在实际应用中,根据不同的预测对象和需求场景,我们可以选择不同的组合预测方法,扩大预测的适用范围,以达到提高预测精度和稳定性的目的。

二、组合预测方法的基础概念组合预测方法是将多种单一预测模型进行合理、有效的组合,以提高单一预测模型的精度和可靠性。

组合预测方法包括加权平均、集成学习等多种方法。

在组合预测中,可以使用多种模型,例如传统的回归模型、神经网络模型、支持向量机模型、决策树模型等。

不同的模型有不同的预测能力和表现,组合多种模型能够提高预测的泛化能力,提高预测的精度和稳定性。

三、加权平均方法加权平均方法是组合预测中最为常见的方法之一,它主要是基于多个单一模型的输出结果进行加权平均来得到最终的预测结果。

加权平均方法需要选择合适的权值,不同的权值组合会影响加权平均方法的预测效果。

1. 等权平均法等权平均法是最简单的组合预测方法之一,它对多个模型的输出结果进行等权求和。

这种加权平均方法在数据集较小且模型之间的差异较小时,效果会比较好。

但当数据集增大或者模型间差异加大时,等权平均法的预测效果会降低,需要使用更为灵活的加权平均方法来提高预测精度。

211189560_基于多因子融合和Stacking集成学习的大坝变形组合预测模型

211189560_基于多因子融合和Stacking集成学习的大坝变形组合预测模型

2023年4月水 利 学 报SHUILI XUEBAO第54卷 第4期文章编号:0559-9350(2023)04-0497-10收稿日期:2022-09-13;网络首发日期:2023-03-31网络首发地址:https:??kns.cnki.net?kcms?detail?11.1882.TV.20230331.1519.001.html基金项目:国家自然科学基金项目(U2243223,51739003)作者简介:王瑞婕(1998-),硕士生,主要从事水工结构安全监控研究。

E-mail:wangrj@hhu.edu.cn通讯作者:包腾飞(1974-),博士,教授,主要从事水工结构及岩土工程的安全监控、光纤传感器在结构健康监测中的应用研究。

E-mail:baotf@hhu.edu.cn基于多因子融合和Stacking集成学习的大坝变形组合预测模型王瑞婕1,包腾飞1,2,3,李扬涛1,宋宝钢1,向镇洋1(1.河海大学水利水电学院,江苏南京 210098;2.河海大学水文水资源与水利工程科学国家重点实验室,江苏南京 210098;3.三峡大学水利与环境学院,湖北宜昌 443002)摘要:变形是反映大坝服役形态变化的直观表征,构建高效准确的变形预测模型对于大坝结构安全控制十分重要。

传统单因子及单算法变形预测模型存在泛化能力不足、鲁棒性差等问题,易出现预测偏差甚至误判。

针对这一问题,本文选取不同变形解释因子及回归算法,构建多种单因子单算法预测模型,结合Stacking集成学习思想,对上述模型进行组合,提出了大坝变形组合预测模型。

该组合模型以Stacking集成学习为核心,采用高斯过程回归作为元学习器,从算法、因子两方面对单因子单算法预测模型进行集成,并通过k折交叉验证减小模型过拟合风险。

以某混凝土拱坝变形监测数据为例,通过多模型构建与性能比较,对所提出模型的准确性与有效性进行评估。

结果表明:单因子单算法预测模型具备准确性和多样性的特征;通过算法、因子集成,组合模型的预测精度和鲁棒性得到了显著提高,在水位波动期的预测能力得到了有效增强。

预测算法之多元线性回归

预测算法之多元线性回归

预测算法之多元线性回归多元线性回归是一种预测算法,用于建立多个自变量与因变量之间的关系模型。

在这种回归模型中,因变量是通过多个自变量的线性组合进行预测的。

多元线性回归可以用于解决各种问题,例如房价预测、销售预测和风险评估等。

多元线性回归的数学表达式可以表示为:Y=β0+β1X1+β2X2+...+βnXn+ε其中,Y是因变量,X1、X2、..、Xn是自变量,β0、β1、β2、..、βn是相应的回归系数,ε是误差项。

多元线性回归的主要目标是找到最佳的回归系数,以最小化预测误差。

这可以通过最小二乘法来实现,最小二乘法是一种优化方法,可以最小化实际值与预测值之间的误差平方和。

多元线性回归可以有多种评估指标,以衡量模型的拟合程度和预测效果。

其中,最常用的指标是R平方(R2),它表示因变量的变异中可以被自变量解释的比例。

R平方的取值范围在0和1之间,越接近1表示模型越好地解释了数据的变异。

多元线性回归的模型选择是一个关键问题,尤其是当面对大量自变量时。

一个常用的方法是通过逐步回归来选择最佳的自变量子集。

逐步回归是一种逐步加入或剔除自变量的方法,直到找到最佳的模型。

在应用多元线性回归进行预测时,需要注意以下几个方面。

首先,确保所有自变量和因变量之间存在线性关系。

否则,多元线性回归可能无法得到准确的预测结果。

其次,需要检查自变量之间是否存在多重共线性问题。

多重共线性会导致回归系数的估计不可靠。

最后,需要通过交叉验证等方法来评估模型的泛化能力。

这样可以确保模型对新数据具有较好的预测能力。

总结起来,多元线性回归是一种强大的预测算法,可以用于建立多个自变量与因变量之间的关系模型。

通过合理选择自变量和优化回归系数,可以得到准确的预测结果,并帮助解决各种实际问题。

但是,在应用多元线性回归时需要注意问题,如线性关系的存在、多重共线性问题和模型的泛化能力等。

论船舶交通流量及几种预测方法

论船舶交通流量及几种预测方法

论船舶交通流量及几种预测方法摘要:船舶交通流是指连续运行的海上船舶等交通工具的总和,对其进行定量描述的参数有船舶交通流方向、船舶交通流量、船舶交通流密度、船舶交通流宽度、船舶交通流速度等。

本文主要对船舶交通流量及其预测方法进行简单介绍.,并分析这几种方法特性,以便对船舶交通流提出较为系统的预测方法,更好的为船舶交通规划和调度管理提供依据。

标签:船舶交通流量;影响因素;预测方法1 船舶交通流量船舶交通流量是船舶交通流的一个反映尺度,是指单位时间(年/月/日/小时)内通过水域中的某一地点的所有的船舶艘数,船舶交通流量越大,该水域对应地点的交通规模就越大,也就越繁忙,并且在一定程度上船舶交通流量的大小能反映其所在水域交通的是否有序与拥堵状况.船舶交通量的调查研究是船舶交通规划中的重要组成部分,只有掌握了实时的交通流量数据信息,才能更准确地对未来的交通流量进行预测,为船舶交通规划设计与调度管理提供实时的更准确有效的依据。

船舶交通流量的统计通常按时均值、日均值、月均值、高峰时交通量、年最大小时交通量、年最大日交通量等,其中前三者分别表示时间段内小时、日、月的平均交通流量,后三者分别表示全天各小时交通量中最大的1个小时的交通流量、1年内各小时交通量中最大1个小时交通量、1年内各日交通流量中最大的1个日交通量.后面所用数据均为日到达量统计。

2 船舶交通流量预测及其影响因素船舶交通流量的预测具有提前的(预测性)、总是有误差的(非实际观测性)、在空间上可扩张与缩小的(选择性)等特点,它是一种可测性增量的研究,是一种艺术性色彩很浓的研究,同时,它的预测与水运经济有关,又不完全属于经济预测,它是一种有条件的微观预测。

船舶交通流量具有惯性原则、类推原则、相关性原则、概推断原则等,它的预测一般有直觉法、因果法、外推法等基本方法。

船舶交通流量的大小与多方面的因素有关,如社会经济发展水平、研究的交通流所处地域、当地的物产、货运市场等,其影响因素又有内因与外因之分。

投资学中的多因素模型与投资组合优化

投资学中的多因素模型与投资组合优化

投资学中的多因素模型与投资组合优化在当今复杂多变的金融市场中,投资者们都在寻求一种有效的方法来降低风险、提高收益。

投资学中的多因素模型和投资组合优化便是帮助投资者实现这一目标的重要工具。

多因素模型是一种用于解释资产收益的理论框架。

它认为,资产的收益不仅仅取决于市场整体的表现,还受到多种因素的影响。

这些因素可以包括宏观经济因素,如经济增长率、通货膨胀率、利率等;行业因素,如行业竞争格局、行业发展趋势等;以及公司自身的因素,如公司的盈利能力、财务状况、管理水平等。

以股票投资为例,传统的资本资产定价模型(CAPM)仅考虑了市场风险这一个因素,即股票的收益与市场整体的波动相关。

然而,多因素模型则拓展了这一思路,认为除了市场风险,还有其他因素对股票收益产生影响。

比如,一家公司的盈利增长速度如果高于同行业平均水平,那么即使市场整体表现不佳,该公司的股票也可能有较好的收益。

多因素模型的构建通常需要大量的数据和复杂的统计分析。

首先,研究者需要确定可能影响资产收益的因素。

这可能需要对经济、行业和公司的各种数据进行深入研究和分析。

然后,通过历史数据来验证这些因素与资产收益之间的关系,并确定每个因素的权重。

多因素模型的优点在于它能够更全面地解释资产收益的来源,从而为投资决策提供更准确的依据。

它可以帮助投资者更好地理解不同资产之间的风险和收益特征,以及它们在不同市场环境下的表现。

然而,多因素模型也并非完美无缺。

它依赖于历史数据来确定因素和权重,而历史不一定会重演。

此外,模型中选择的因素可能并不完全准确,或者某些重要的因素被遗漏。

投资组合优化则是在多因素模型的基础上,进一步寻求最优的资产配置方案。

其目标是在给定的风险水平下,实现投资组合收益的最大化;或者在给定的收益目标下,使投资组合的风险最小化。

在进行投资组合优化时,首先需要明确投资目标和约束条件。

投资目标可以是追求高收益、降低风险或者实现资产的保值增值等。

约束条件则可能包括投资期限、资金规模、法律法规限制等。

面向多目标预测的时间序列模型研究

面向多目标预测的时间序列模型研究

面向多目标预测的时间序列模型研究引言时间序列是指各个时刻上观测到的数据点的有序序列,它在许多领域都有着广泛的应用,如金融、气象、交通等。

时间序列分析旨在揭示其中的模式和规律,以便进行预测和决策。

然而,传统的时间序列模型往往只能用于单目标预测,对于多目标预测问题却无法很好地解决。

因此,本文将研究面向多目标预测的时间序列模型,以提高预测的准确性和效果。

第一章多目标预测问题介绍1.1 多目标预测概述多目标预测是指同时预测多个目标变量的值。

在实际问题中,我们经常遇到需要同时预测多个目标变量的情况,如股票市场中需要同时预测多只股票的价格变化,气象学中需要同时预测多个气象参数的变化等。

因此,解决多目标预测问题对于提高预测的准确性和应用效果具有重要意义。

1.2 多目标预测的挑战多目标预测相对于单目标预测存在一些独特的挑战。

首先,多目标预测需要处理更多的目标变量,增加了模型的复杂性。

其次,多个目标变量之间可能存在相关性,需要考虑变量间的相互影响。

此外,多目标预测还需要解决目标之间的权衡问题,如设置合适的权重,以便更好地平衡各个目标的重要性。

第二章相关研究综述2.1 单目标预测模型传统的时间序列预测模型,如自回归移动平均模型(ARIMA)、指数平滑等,主要用于单目标预测。

这些模型基于历史数据进行建模,并通过拟合模型参数来进行预测。

然而,这些模型仅适用于单个目标变量,无法直接应用于多目标预测问题。

2.2 多目标预测模型近年来,随着机器学习和深度学习的广泛应用,许多研究者开始关注多目标预测问题,并提出了一些新的模型。

例如,基于神经网络的多目标预测模型(MNN),它可以同时预测多个目标变量的值,并考虑了变量之间的相关性。

此外,还有基于集成学习的多目标预测模型,如随机森林、支持向量回归等,通过多个基学习器的组合来提高预测性能。

第三章面向多目标预测的时间序列模型设计3.1 多目标神经网络模型基于神经网络的多目标预测模型是目前研究较为广泛且有效的方法之一。

资产管理中的多因子模型与投资组合优化

资产管理中的多因子模型与投资组合优化

资产管理中的多因子模型与投资组合优化资产管理是指通过优化投资组合,实现资产配置、风险控制和收益最大化的过程。

为了有效管理资产,投资者需要了解不同因子对投资组合的影响,并利用多因子模型进行投资组合优化。

一、多因子模型的介绍多因子模型是指通过考虑多个因素对投资组合收益的影响来进行投资决策的一种模型。

常见的因素包括市场因子、价值因子、动量因子、盈利能力因子等。

多因子模型的优势在于可以综合考虑多个因素,相对于单一因子模型能更准确地预测资产收益。

二、多因子模型的构建多因子模型的构建需要收集大量的历史数据,并通过统计分析方法进行因子提取和因子选择。

其中,因子提取可以使用主成分分析、因子分析等方法,目的是找出能够解释大部分资产收益变动的共同因素。

然后,根据因子的稳定性、解释力和可操作性等指标,选择适合的因子用于模型构建。

三、多因子模型的应用多因子模型可用于投资组合构建、风险控制和绩效评估等多个方面。

在投资组合构建阶段,投资者可以根据自身需求和风险偏好,选择不同的因子权重,构建符合自己目标的投资组合。

在风险控制方面,多因子模型可以通过监测因子暴露水平,及时调整投资组合以实现风险控制。

另外,在绩效评估中,多因子模型可以帮助投资者分析投资组合的超额收益,找出超额收益的来源,并评估策略的有效性和稳定性。

四、投资组合优化与多因子模型的结合投资组合优化是资产管理中的核心问题之一,其目标是通过调整资产配置,获得预期收益的同时尽量降低风险。

多因子模型与投资组合优化的结合可以帮助投资者更好地实现投资目标。

在多因子模型的基础上,投资者可以使用数学优化方法,如线性规划、二次规划等,来寻找最优的投资组合。

通过设定约束条件,如风险控制指标、资产配置比例等,投资者可以在满足这些条件的前提下,找到最优的投资组合。

投资组合优化与多因子模型的结合还可以考虑不同因子的相关性和交互作用。

通过分析因子之间的相关性,投资者可以避免选择相关性过高的因子,以降低投资组合的相关风险。

基于VineCopula模型与多资产投资组合VaR预测

基于VineCopula模型与多资产投资组合VaR预测

基于VineCopula模型与多资产投资组合VaR猜测摘要:随着金融市场的日益复杂化和多元化,投资者面临着越来越大的风险和不确定性。

有效的风险管理对于投资组合的成功至关重要。

本文将介绍一种基于VineCopula模型的方法来猜测多资产投资组合的VaR,并对其有效性进行评估。

一、引言在金融投资中,风险管理是分外重要的,特殊是在多资产投资组合中。

值得注意的是,资产间的相关性在投资组合的风险评估中起着关键作用。

然而,传统的方法往往轻忽了资产之间的非线性干系和尾部依靠干系,这可能导致对风险的误判。

因此,使用更准确的模型来猜测投资组合的VaR显得尤为重要。

二、VineCopula模型VineCopula模型是一种基于多变量概率分布的模型,能够抓取到变量之间的非线性干系和尾部依靠性。

它通过将多元概率密度函数分解为多个条件边缘分布和条件依靠结构来建模。

VineCopula模型基于Copula函数的理论,具有较好的灵活性和表达能力。

三、多资产投资组合多资产投资组合是指投资者通过将资金分离投资于不同的资产类别,以实现风险分离和收益优化的策略。

然而,资产之间的相关性对投资组合的风险水平有着重要影响。

传统的投资组合理论(如马科维茨理论)假设资产之间的相关性是线性的,这在现实中并不完全成立。

因此,使用VineCopula模型来描述资产间的相关干系将更为准确。

四、基于VineCopula模型的多资产投资组合VaR猜测使用VineCopula模型对多资产投资组合的VaR进行猜测的基本步骤包括:数据预处理、建立多元概率分布、参数预估和模型选择、VaR计算以及模型验证。

起首,将收益率数据进行预处理,包括数据平滑、对数收益率转换等。

然后,使用VineCopula模型来拟合多元概率分布,并通过最大似然预估方法预估模型参数。

接下来,使用模型选择准则(如C、BIC)来确定最佳的Copula结构。

然后,通过模拟方法计算多资产投资组合的VaR。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多模型拟合与组合预测对时间序列建模好比替人物画速写;简单几笔素描突出人的特点并由此推测人物个性。

时间序列模型也能模拟数据特征、提炼数据信息、预测数据规律。

然而,正如每张素描仅能反映人物某一侧面,多个角度的素描才能完整逼真人物形象,非线性复杂时间序列的数学模型仅是该序列的某种简化和抽象,其所包含的变量和参数必定是有所选择并十分有限的。

不同模型对同一序列的描述往往各有特点、各有适用场合、也各有不足之处。

理论和实践表明,多模型的拟合与组合预测能提高模拟的功效和预测的精度。

事实上,在预测实践中,对于同个问题,我们常采用不同的预测方法。

不同的预测方法其预测精度往往也不相同。

一般是以预测误差平方和作为评价预测方法优劣的标准,从各种预测方法中选取预测误差平方和最小的预测方法。

不同的预测方法往往能提供不同的有用信息,如果简单地将预测误差平方和较大的方法舍弃,将推动一些有用的信息。

科学的作法是将不同的预测方法进行适当组合,形成组合预测方法。

其目的是综合利用各种预测方法所提供的信息,以提高预测精度。

早在1954年,美国人Schmitt 曾经采用组合预测方法对美国37个最大城市的人口进行预测使预测精度提高。

1959年,J.M.Bate t C 。

W 。

J 。

G 拒有对组合预测方法进行比较系统的研究,研究成果引起预测学者的重视。

此后,国外关于组合预测的研究成果层出不究,我国近十几年也很重视组合预测的研究,取得一系列研究成果。

采用组合预测的关键是确定单个预测方法的加权系数。

设对于同一个问题有)2(≥n 种预测方法。

给出如下记号:t y 为实际观察值;it f 为第i 种方法的预测值;it t it f y e -=为第i 种方法的预测误差;i k 为第i 种方法的加权系数,∑∑====ni ni it i t if k f k11;1为组合预测方法的预测值;t t t f y e -=为组合预测方法的预测误差,于是∑==-=ni it i t t t f k f y e 1。

其中,N t n i ,,2,1;,,2,1 ==。

记组合预测方法的预测误差平方和∑==Ni t e J 12,则⎥⎦⎤⎢⎣⎡=∑∑∑===)(111Nt jt it j i nj ni e e k k J记组合预测方法的预测加权系数向量为T n n k k k ],,,[21 =K ,第i 种预测方法的预测误差向量为T iN i i i e e e ],,,[21 =E ,预测误差矩阵为,,[21E E e = ],n E ,于是n n Tn T K E K e e )(==J中⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡=nn n n n n n E E E E E E E E E 212222111211)(E 而∑-====Nt it ii j Tiji ij a E E E 12,i T iE E E E 。

ii E 为第i 种预测方法的预测误差平方和。

)(n E 反映了各种预测方法提供的预测误差信息,称为预测误差信息矩阵。

记T n 1]1,,1,1[⨯= n R ,则国中权系数的约束条件∑==ni i k 11改为1=n K R Tn 。

于是组合预测问题可表示成非线性规划模型(11.1)n n Tn K E K )(min =J(11-1a )⎝⎛≥=01..nn n K K R T t s)111()111(c b --11.1 综合模拟和预测的基本思想自从60年代末模型综合研究开创以来,在经济预测和决策及证券投资等方面得到了有效的应用,但是在统计预测研究和应用方面目前尚属初级阶段。

由前几章的讨论可见,不同的预测模型预测精度往往有差异。

怎样对这些模型的预测结果进行客观的综合应用,一直是人们在探讨的一个问题,眼下大多是人为定性综合。

本章提供一种科学的组合预测方法对模型进行定量综合,以期提高预测结果的可靠性和客观性。

设N t X t ,,2,1},{ =为某个统计量的观测序列,N t J j j xt ,,2,1,,,2,1)},(ˆ{ ==,为对应的用J 个预测模型得到的拟合序列。

对K k x k N ,,2,1,, =用J 个不同模型获得的预测值记为J j j xk N ,,2,1),(ˆ =+,将这J 个模型对k N x+ˆ的组合预测值记为k N x +ˆ,则通常有以下两类综合模式:11.1.1 权重综合K k j x W xk N j Jj k N ,,2,1),(ˆˆ1==+=+∑ (11-2)式中J j W j ,,2,1, =为第j 个模型在综合预测值中所占的权重,一般情况下为了保持综合模型的无偏性,j W 应满足归一化约束条件11=∑=jJj W(11-3)构成j W 的方法有多种,常用的有算术平均法、均方倒数法、方差倒数法、二项式系数法、简单加权法和最优加权法等,将在下面加以介绍。

11.1.2 区域综合设J 种预测值有置信区间J j j j x l N l N ,,2,1)),()(ˆ( =±++δ,则l N x +ˆ的置信区间是这J 个区间的交集))()(ˆ()ˆ(1j j x xl N l N Jj l N l N ++=++±=±δδ (11-4)如果上式为空集,则依次排除该时刻最大和最小预测值的置信区间,若剩余模型超过半数则仍由上式进行区域综合,否则需要新建模预测。

若有模型无法估计置信区间,则将其排除后也按上法处理。

11.2 最优加权法在研究和应用中我们通常较多地采用权重综合的方法,在确定各个模型的权重时,首先想到的是在某一意义上求得最优权重向量,因此下面先讨论最优加权法。

最优加权法的基本原理是依据某种最优准则构造目标函数Q ,在约束条件(记为s.t.)下极小化Q 求得综合模型的加权系数,这些权重系数就是各个模型的最优权。

11.2.1 最优加权模型设N t x t ,,2,1},{ =为观测序列,有J 个预测模型对之进行预测,拟合值记为N t J j j xt ,,2,1,,,2,1)},(ˆ{ ==,则最优加权模型的组合权重系数J j W j ,,2,1, =,是以下规划问题的解:⎪⎩⎪⎨⎧=)(..),,,(min 210t s w w w Q Q J (11-5)式中Q 为目标函数,s. t. 为该规划问题的约束条件。

在有些实际问题中还要求j w 非负,即。

J j w w j j Jj ,,2,1,0,11=≥=∑=(11-6)目标函数Q 的形式由误差统计量及极小化准则的类型确定,常用的误差统计量有以下几种: ① 拟合误差t e)())(ˆ()(ˆˆ111j e w j xx w j x w x xx e t j Jj t j j J j t j Jj t t t t ∑∑∑====-=-=-= (11-7)② 相对误差 t t x e /,(11-8) ③ 对数误差 N t e t ,,2,1, ='t t t x x e ˆlog log -='(11-9)目标函数极小化准则也有多种,最常用的有最小二乘准则、最小一乘准则和极小极大化准则,分别构成如下形式的目标函数:① 2*1)(t Jj e Q ∑==(11-10) ② ||*1t Nt e Q ∑==(11-11) ③ *1max t Nt e Q ≤≤=(11-12)式中误差统计量可从(11-7)—(11-9)式中选取。

以上准则有时还考虑(对时间t )加权的情形。

选取第一种目标函数,以拟合误差为统计量,采用常用的最小二乘准则,则可以获得最优权系数的解析解。

11.2.2 最小二乘准则下综合模型最优权系数我们选取拟合误差t e 为误差统计量,此时的规划模型为⎪⎪⎩⎪⎪⎨⎧==∑∑==1..min 121j Jj t Nt w t s e Q Q (11-13)为求解J j w j ,,2,1, =,将上式表示为矩阵形式,令Jj e e e e j e j e j e e R w w w W N N j j ,2,1,),,,())(,),(),(()1,,1,1(,),,,(212121=====ττττJ J ij t t Nt j i ij e E j e i e e e e ⨯====∑)(),()(1τ(11-14)J J ⨯矩阵E 对称正定,称为信息阵,由上式得:W J e e e j e w x x e t t t t j Jj t t t ))(,),2(),1(()(ˆ1==-=∑=(11-15)W e e e W J e e J e e e e e J N N N ),,,()()1()()1(21111 =⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=(11-16)(11-13)式的矩阵形式可表示为:⎪⎩⎪⎨⎧===1..min W R t S EW W e e Q Q τττ (11-17)引入Lagrange 剩子λ,使Q 取极小值的必要条件为:0)1(2(=--W R EW W dWdττλ 即R E W R EW 1,0-==-λλ又由 0))1(2(=--W R EW W d dττλλ得1)(11==-R E R W R λττ即可解得Lagrange 乘子,11)(--=R E R τλ 从而得最优权,W 0和最小Q 值Q 0⎪⎩⎪⎨⎧==-----1101110)()(R E R Q RE R E R W ττ Q 0即为最优综合模型的误差平方和。

为保证1-E 存在,要求J 个模型的误差向量j e 线性无关。

11.2.3 最小二乘准则下最优综合模型的精度分析关于最小二乘法得到的最优综合模型的精度以及最小的目标函数Q 0有以下几个主要结论:结论1:最小二乘法可以求得误差平方和最小的综合预测模型,因而它是最优的,其精度优于其中任何一个单一模型和综合模型。

记00,W Q 对应于最优综合模型;Q ,W 对应任一综合模型;)()(,j j W Q 对应参加综合的第j 个模型,由于目标函数Q 是模型精度的保证,Q 0是Q 的极小值,因此有0Q Q ≥,又有τ)0,,0,1,0,,0()( =j W ,由最优解的唯一性知,除非0)(W W j =,否则必有0Q Q >,因此可以得出上面的结论。

结论2:记min λ和max λ分别为对称正定矩阵的最小和最大特征,则最优综合模型的误差平方和Q 0满足:[2]J Q J //max 0min λλ≤≤(11-18)上式中J 为参加综合的模型个数,该不等式表明,J 越大,Q 0的变化范围越小,Q 0绝不可能减小到J /min λ以下,也不可能超过J /max λ。

结论3:jj Jj e trE J trE Q ∑==≤10,/,其中trE 为矩阵E 的迹由矩阵迹的定义知,J j Jj jj J j e trE λλλ,,,111∑∑====为E 阵的非负特征根。

相关文档
最新文档