088-基于岭估计的概率积分法预计参数的求取
基于遗传算法的概率积分法预计参数求取方法研究

置 最 大进 化 代 数 ; 随 机 生 成 个 个 体 作 为 初 始 群 体 P( 0 ) 。 步骤 二 : 个体 评价 。计 算群 体 P( t ) 中各个 个 体 的
适应 度 。
+ c t g 0 0・ C }
偏 移距 , 且外 移为正 , 内移 为负 , m。
{ 收稿 日期 : 2 0 l 2 —1 2 一l 4 作者 简介 : 李亚东( 1 9 8 7 一) , 男, 硕士研究生 , 研究方向为: 变形监测与数据处理 。
第 5期
李亚东等 .基于遗传算法 的概 率积分 法预计 参数 求取方法研究
参数 的确 定。本文采 用遗传算法求取预计参数 , 将预测值与 实测值进 行对比。表 明线性遗传算法求参的精度 高 , 有一
定 的 可 靠性 和 准确 性 。
关键词 : 沉 陷预计 ; 概率积分法 ; 遗传算 法
1 前
言
算法求 参 , 并 验证其 可靠性 。
概率积 分法 是我 国重 要 的沉 陷预 计 方法 之 一 , 使 用概 率积分 法对 相关矿 区进行 地表 移动 变形 预计 工作 的前 提 , 就是对 预计参 数 的求取 , 而求取 预计 参 数 的可 靠性 很 大程度 上 又决 定 了开采 沉 陷 预计 的精 度 , 所 以 高效 准确 的求 取概率 积分 法预计 参数具 有 十分 重要 的 意 义… 。 目前 , 主要 的求 取 开 采沉 陷预 计参 数 的方 法 有 最小 二乘法 、 遗传 算法 、 模矢 法等 。本文 采用遗 传
行编码 运算 , 不需要有关体 系的任何先验 知识 , 沿 多 种路线进行平行搜索 , 不会 落入局部较优 的陷阱 , 能
一种确定岭估计参数的方法

地矿测绘 2009, 25( 1): 1~ 2 Survey ing andM app ing of G eo logy and M ineral R esources
A M ethod of R idge E stimation Param eters D eterm ining
W ANG Jian qiang1, X ING Cheng1, ZHU Guang bin1, JIA Zh i q iang2
( 1. School of Geodesy and Geoma tics, W uhan University, W uhan H ubei 430079, China; 2. T ianjin Ins titute of Geotechnical Investiga tion& Survey ing, T ianjin 300191, Ch ina)
1. 2 岭估计性质
根据式 ( 2)可得:
X ( k ) = (N + kI ) - 1NN - 1BTPL = ZkX
( 3)
由式 ( 3)可知, 岭 估计 是最小 二乘 估计 的线 性估 计。根 据
式 ( 3), 由矩阵反演公式 [ 1] 可得:
Zk = (N + kI ) - 1N = (E + kN - 1 ) - 1 = I - k (N + kI ) - 1
1
2 i
<
0
( 9)
式 ( 9)表明 X ( k )的均方误 差是 k 的递 减函数, 但是 当 k 增
遗传算法求概率积分法预计参数程序设计

遗传算法求概率积分法预计参数程序设计作者:王瑞云来源:《安徽理工大学学报·自然科学版》2013年第01期摘要:目前基于概率积分法求取地表移动预计参数的优化算法,如线性最小二乘法,具有易发散、易出现局部解、对初值要求较高、抗粗差干扰性弱等问题。
遗传算法(Genetic Algorithm)是一种高效的全局寻优搜索方法,采用人工进化的方式对目标空间进行随机优化搜索。
采用遗传算法,利用地表任意点的概率积分法数学模型编写了求取地表移动预计参数的程序,通过皖北某矿井的1013工作面的观测数据并结合地质采矿条件反演了地表移动预计参数,通过与传统的优化算法所求取的参数比较,证明了遗传算法反演结果的准确性和可靠性。
关键词:MATLAB;遗传算法;概率积分法;预计参数中图分类号:TD327文献标志码:A概率积分法是我国矿山开采沉陷预计的主要方法,提高概率积分法预计精度的关键在于减少模型误差和参数误差,模型误差主要来自于该方法的基本假设,往往难以改进,此时致力于减小参数误差意义更为明显[1]。
目前求取概率积分法地表移动预计参数常采用传统的优化算法,如线性最小二乘法等,但此类算法对参数初值要求较高,而且容易出现局部极小值等问题,从而使拟合的参数失去准确性。
遗传算法(Genetic Algorithm,简称GA)是一种宏观意义下的仿生算法,它模仿的机制是一切生命与智能的产生与进化过程。
它通过模拟达尔文“优胜劣汰、适者生存”的原理鼓励产生好的结构,通过模仿孟德尔遗传变异理论在迭代过程中保持已有的结构,同时寻找更好的结构[2]。
与传统的优化算法相比,遗传算法适用于高度非线性的不连续多峰函数的优化,可以有效的避免出现局部极小值,而且遗传算法对初值参数的依赖性不高,在所设定的参数范围内通过人工进化的方式获得最优解,因而具有较强的可操作性和简便性。
由于GA在大量问题求解过程中独特的优点和广泛的应用,许多基于MATLAB的遗传算法工具箱相继出现,其中出现较早、影响较大、较为完备者当属英国设菲尔德(Sheffield)大学推出的遗传算法工具箱[3]。
岭估计的一种新的算法

岭估计的一种新的算法
朱建军
【期刊名称】《测绘信息与工程》
【年(卷),期】1997(000)003
【摘要】提出了岭估计的一种新的迭代算法,在算法中,不仅岭参数K值要迭代计算,估值本身也是采用叠失相加的渐近方法,数值计算结果表明,岭参数K的初始取值达到一定数值后,对岭估计结果的影响并不显著,且新方法所得估计的均方误差要比原来的各种岭估计的均方误差小。
【总页数】4页(P22-25)
【作者】朱建军
【作者单位】中南工业大学
【正文语种】中文
【中图分类】P207
【相关文献】
1.油田设备新度系数一种新算法 [J], 王战琦
2.一种新的粒子群算法与人工鱼群算法的混合算法 [J], 袁光辉;樊重俊;张惠珍;王斌;覃太贵
3.基于岭估计的一种新的有偏估计 [J], 高月;
4.广义岭估计的一种新的改进方法 [J], 殷立爽; 范永辉
5.一种新的仿生算法:种群阻滞增长模拟算法 [J], 罗亚波;郝海强
因版权原因,仅展示原文概要,查看原文内容请购买。
概率积分法

12
河南理工大学
一 、基本原理——(二)单元下沉
若过原点取另一组直角坐标系 (x1oy1) ,则在新坐标 系中,使 ds1微小面积发生下沉的概率应为:
P(ds1 ) f ( x1 )dxf ( y1 )dy f ( x1 ) f ( y1 )ds1
如果微面的面积和位置相同,则应有: 故:
df ( x 2 ) f ( x 2 y 2 ) ( x 2 y 2 ) f ( x 2 y 2 ) f (y ) C C 2 2 2 2 dx ( x y ) ( x ) ( x 2 y 2 )
2
df ( y 2 ) f ( x 2 y 2 ) ( x 2 y 2 ) f ( x 2 y 2 ) f (x ) C C 2 2 2 2 dy ( x y ) ( y ) ( x 2 y 2 )
11
河南理工大学
一 、基本原理——(二)单元下沉
单元体采出后,使A(x,y,z)点附近某一小块面积 ds 发生下沉的事件,等于在 xoz 剖面上 x 处的一小 段岩石dx有下沉发生和在yoz剖面上y处的一小段岩 石dy有下沉发生两事件同时发生。因此发生ds下沉 事件的概率为此二事件发生概率之积:
P(ds) f ( x )dxf ( y )dy f ( x ) f ( y )ds
8
河南理工大学
一 、基本原理
(二)单元下沉 设有如右图所示 的岩层剖面和坐标系 统,坐标原点通过开 采中心,在Z水平上位 于处的某段岩石 dx 的 下沉是随机的。岩石 各段下沉的概率分布 密度应当是坐标x的连 续函数。
9
河南理工大学
一 、基本原理——(二)单元下沉
由假设1:各岩层的岩石在水平方向是均质的,即水 平各向同性,则开采中心线两侧岩石法向下沉的 概率关于此轴对称。因此可用 f(x2) 来表示这个对 称的概率密度函数,则在该剖面上位于 x处一段 dx 的岩石发生下沉的概率为
2021年概率积分法用于开采沉陷预计时参数求取方法研究现状(2)

概率积分法用于开采沉陷预计时参数求取方法研究现状(2) 概率积分法用于开采沉陷预计时参数求取方法研究现状参数误差包括参数选取误差和参数反演误差。
一方面,在缺乏预计区域内预计参数的情况下,采用临近矿区的概率积分法预计参数,由于各矿区本身地质采矿条件的差异,存在误差不可避免; 另一方面,在利用数据处理方法反演预计参数的同时,由于各参数之间的相关性和数据处理方法的局限性,反演出的参数与真实值总是存在一定的差异。
目前,对参数选取误差的修正方案主要有2 种。
(1)建立本矿区的岩移观测站,通过观测站反演本矿区的预计参数,这是修正参数选取误差的主要方法。
(2)采用非线性科学辅助进行参数选取。
郭文兵、邓喀中、邹友峰等在分析沉陷预计参数与地质采矿因素关系的基础上,提出利用人工神经网络进行沉陷预计参数的选取[8-9],研究结果表明,神经网络方法选取的概率积分法参数误差在5%以内。
栾元重采用神经网络对下沉系数和主要影响角进行了建模,实现了岩层 ___参数的类比[10]。
张庆松等采用粗集理论对岩移数据进行预处理,提高了神经网络方法选取参数的效率和准确度[11];研究结果表明,各地质采矿因素对下沉的支持度由大到小依次为采厚、采深、采宽、采长、岩性和煤层倾角。
麻凤海等利用改进的BP 神经网络对沉陷预计参数进行建模[12],研究结果表明,神经网络选取概率积分法预计参数误差在6%范围内。
柴华彬、邹友峰提出利用相似第二准则和模式识别理论进行沉陷预计参数的选取[13-14],给出了基于π准则的开采沉陷预计参数计算公式和确定方法。
研究认为:地表下沉系数和主要影响角正切主要与岩体的综合变形模量有关,采深和采厚对其影响较小;拐点偏移距与采深的`比值和水平 ___系数也主要与岩体的综合变形模量有关,但采深和采厚也对其具有一定的影响。
于宁峰、杨化超提出将粒子群优化(PSO)算法和BP 神经网络进行融合,采用改进的混合粒子群优化算法优化神经网络的权值和阈值,在分析概率积分法参数与地质采矿条件之间关系的基础上, 建立了基于PSO 优化BP 神经网络的概率积分法预计参数的优化选择模型[15]。
岭回归参数选择

岭回归参数选择岭回归是一种用于解决多重共线性问题的线性回归方法,通过对模型添加惩罚项来控制模型复杂度,以提高模型的泛化能力和稳定性。
其中,惩罚项的系数λ是需要选择的重要参数,本文将讨论如何选择合适的岭回归参数。
一、岭回归基本原理岭回归中,通过对模型参数大小的平方和进行惩罚,将线性回归问题转换为以下优化问题:minimize RSS(w) + λ||w||² (其中w为模型参数)其中RSS(w)为残差平方和,是预测值与实际值之间的差异平方和,||w||²为参数的平方和,λ是惩罚系数,用于控制惩罚项与RSS之间的比例关系。
通过调整λ的大小,可以灵活地平衡模型拟合程度和泛化能力,如下图所示:图示了当λ取值不同时,模型的预测能力和泛化能力之间的平衡情况。
当λ过大时,模型的拟合效果较差,但可以得到较好的泛化能力;当λ过小时,模型的拟合效果较好,但在测试集上的表现可能较差,即出现过拟合现象。
因此,选择合适的λ非常重要,可以通过交叉验证等方法来确定。
1、交叉验证法交叉验证法是一种常用的模型选择方法,可以保证模型的泛化能力。
在岭回归中,可以将数据集划分为训练集和测试集,然后对不同的λ进行模型训练和测试,以找到最优的λ值。
常用的交叉验证方法包括k折交叉验证和留一交叉验证。
其中,k折交叉验证将数据集分为k个大小相等的子集,每次将其中一个子集作为测试集,其余子集作为训练集,重复k次,将结果进行平均,即得到模型的表现。
留一交叉验证则是将每个样本都作为单独的测试集,其余样本作为训练集。
具体方法如下:(1)将数据集分为训练集和测试集,一般按照7:3或8:2的比例进行划分。
将训练集再按照k折或留一交叉验证的方式进行划分,得到k组训练集和测试集。
(2)对于每组训练集和测试集,分别进行岭回归模型的训练和测试,计算对应的均方误差(MSE)或R方值(R2 score)等指标。
(3)重复上述步骤,得到k组不同的MSE或R2 score值。
概率密度函数的估计参数估计

概率密度函数的估计参数估计概率密度函数(Probability Density Function,简称PDF)是概率统计学中一个非常重要的概念,用于描述连续随机变量的概率分布情况。
参数估计是统计学中一个关键的问题,它指的是通过样本数据来估计总体分布的参数。
本文将对概率密度函数的参数估计方法进行详细介绍。
一、参数估计的目标参数估计的目标是找到一组最合适的参数值,使得概率密度函数能够较好地拟合样本数据分布。
一般来说,参数估计可以分为两种类型:点估计和区间估计。
点估计是指利用样本数据直接估计出概率密度函数的参数值,而区间估计则是对参数进行区间估计,给出一个参数取值的范围。
二、点估计的方法1. 最大似然估计(Maximum Likelihood Estimation,简称MLE)最大似然估计是一种常用的参数估计方法,其基本思想是寻找一组参数值,使得样本观测值出现的概率最大。
对于给定的样本数据,若假设一个概率分布模型,并通过极大化似然函数来求解参数值,就得到了最大似然估计。
2. 矩估计(Moment Estimation)矩估计是通过样本矩直接估计总体矩的方法。
对于连续型分布而言,可以通过样本矩来估计分布的矩,从而得到参数的估计值。
3. 最大后验概率估计(Maximum A Posteriori Estimation,简称MAP)最大后验概率估计是贝叶斯估计的一种特殊情况,其基本思想是在最大化后验概率与似然函数的乘积,从而得到参数的估计值。
相对于最大似然估计,最大后验概率估计将先验分布考虑在内,可以有效地克服样本容量小引起的估计不准的问题。
三、区间估计的方法1. 置信区间估计(Confidence Interval Estimation)置信区间估计是通过样本数据计算出一个参数的区间估计范围,其置信水平表征了参数估计值位于置信区间内的可能性大小。
常用的置信区间估计方法有:正态分布置信区间估计、大样本置信区间估计、Bootstrap置信区间估计等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
U( x,y,φ) = U( x) Cycosφ + U( y) Cxsinφ ( 13)
[关键词] 岭估计; 概率积分法; 求参; 开采沉陷; L 曲线法 [中图分类号] TD325. 2 [文献标识码] A [文章编号] 1006-6225 ( 2012) 02-0017-03
Prediction Parameters Calculation of Probability Integration Method Based on Ridge Estimate
王明柱1,2 ,郭广礼1,2 ,王 磊1,2 ,王 彬1,2
( 1. 中国矿业大学 江苏省资源环境信息工程重点实验室,江苏 徐州 221116; 2. 中国矿业大学 国土环境与灾害监测国家测绘局重点实验室,江苏 徐州 221116)
[摘 要] 采用最小二乘拟合求取概率积分法预计参数时,经常遇到发散问题,致使求参结果 失真。而求参过程中法矩阵的病态是造成结果发散的主要原因之一。将岭估计应用于预计参数的求取 中,能够有效地克服传统最小二乘拟合求参时法矩阵的病态。在给出基于岭估计求参模型的同时,使 用 Matlab 实现了参数的自动求取。最后通过模拟算例验证了该求参模型克服法矩阵病态的有效性及求 参结果的可靠性。
概率积分法是进行开采沉陷预计的主要方法, 预计过程中预计参数的准确性决定了地表移动变形 预计的精度。参数的影响因素主要有: 覆岩的岩性 和地层结构、采深、采厚等[1]。我国 大部分矿区 都根据所设的地表移动观测站反演出了适合自己矿 区的概率积分预计参数。
预计参数的求取通常采用最小二乘拟合的方 法,该方法计算简单,且求参精度能满足工程需 求。而最小二乘拟合求参过程中法矩阵一旦病态, 就致使迭代结果发散、失真,造成求参困难。为解 决由于法方程系数阵病态而导致最小二乘估计不稳 定问题,统计学家们提出了岭估计、广义岭估计、 主成分估计等有偏估计来改善这种情况下的最小二 乘估计。岭估计法从减小均方误差的角度出发,最 初由 A. E. Hoerl 于 1962 年提出,并于 1970 年由他 和 R. W. Kennard 对该方法做了系统的发展。该方 法成为目前使用最多的一种有偏估计[2]。
数经第 1 次改正后变为 Z0 +Δ Z^ 1 ,记为Z^1 。再将Z^1
作为第 2 次计算的初值,求得经第 2 次改正后的参
数Z^2 。如此 迭 代,直 至 max | ^ ^ ΔZi+1 / Zi | < Eps 停
止。Eps 为限制误差,一般可取 0. 0001 ~ 0. 001。
求出 q,tanβ0 ,θ,S1 ,S2 ,S3 , S4 后, 认 为 这些参数已知。则任一点水平移动预计公式中只剩 下水平移动系数 b 未知。其预计公式为[1]
ρ,选择不同的 k 值将得到许多 ( ρ,η) 点。将这 些点经过曲线拟合得到一条曲线,选择该曲线曲率
最大的点所对应的岭参数即为所求。利用这条曲线
来选择岭参数的方法称为 L 曲线法。
令 η^ = log‖X^ ‖2 ,ρ^ = log‖AX^ -L‖2
则 η^ = 2log‖X^ ‖ = 2η,ρ^ = 2log‖AX^ -L‖ = 2ρ
靠。基于岭估计的曲面拟合法不仅可以有效地抵御
法矩阵病态的干扰,还可适用于非正规观测站和残
缺观测站资料的求参。
概率积分法的预计参数有下沉系数 q、主要影
响角正 切 tanβ、主 要 影 响 传 播 角 θ、拐 点 偏 移 距
S1,S2,S3,S4 及水平移动系数 b。其任一点移动 变形预计具体计算公式可参见文献 [1]。进行基
采用岭估计可有效克服病态矩阵干扰,使求参
结果更可靠,确保概率积分法开采沉陷预计精度。
1 岭估计
1. 1 岭估计基本原理 设有观测方程:
AX = L+ Δ
( 1)
式中,L 是观测值; A 是系数阵; X 是待估计参数 的真值; Δ 是噪声,Δ ~ N ( 0,δ20 I) 。则上式常规 的最小二乘解为
Wi = f( xi ,yi ,q,tanβ,S1 ,S2 ,S3 ,S4 ,cotθ) ( 6) 首先选 取 参 数 初 值 q0 ,tanβ0 ,S10 ,S20 ,S30 , S40 和 cotθ0 ,初值的向量形式记为 Z0 。其值可根据 文献 [9] 上的经验值进行选取,也可以参照临近
矿区已有的实测参数。将 ( 6) 式在 ( xi,yi,q0, tanβ0 ,S10 ,S20 ,S30 ,S40 ,cotθ0 ) 处按泰勒级数展 开,展开式中略去二次及以上项,则有
WANG Ming-zhu1,2 ,GUO Guang-li1,2 ,WANG Lei1,2 ,WANG Bin1,2
( 1. Key Laboratory of Resources Environment Information Engineering of Jiangsu Province,China University of Mining & Technology,Xuzhou 221116, China; 2. Key Laboratory of Land Environment and Disaster Monitoring of State Bureau of Surveying and Mapping,China University of Mining & Technology,Xuzhou 221116,China)
^X = N-1 ATPL
( 2)
若法矩阵 N = ATPA 条件数很大,即为病态矩
阵时,求逆就会出现不稳定,致使最小二乘估计的 方法不可 能 得 到 未 知 参 数 的 精 确 估 值[3]。 岭 估 计 法可解决 这 类 问 题[4]。 其 基 本 思 想 是 利 用 原 最 小
二乘估计的数学模型,在其法方程系数矩阵 N 的
‖AX^ -L‖2 + kΩ ( X^ ) = ‖AX^ -L‖2 + k X^TX^
= ‖AX^ -L‖2 +k‖X^ ‖2 = min
( 4)
式中,‖·‖为欧氏 2-范数; Ω ( X^ ) 为稳定泛函。
‖AX^ -L‖和‖X^ ‖都是岭参数 k 的函数。以
log‖X^ ‖作为纵坐标 η,log‖AX^ -L‖作为横坐标
Wi = f( xi ,yi ,q0 ,tanβ0 ,S10 ,S20 ,S30 ,S40 ,cotθ0 ) +
qf Δq
+
f tanβ
Δtanβ
+
f S1
ΔS1
+
f S2
ΔS2
+
f S3
ΔS3
+
f S4
ΔS4
+
f cotθ
Δcotθ
( 7)
考虑模型误差和测量误差,式 ( 7) 可写为
Wi测
+ Vi
= f Δq q
+ f Δtanβ tanβ
+
f S1
ΔS1
+
f S2
ΔS2
+
f S3
ΔS3
+
f S4
ΔS4
+
Байду номын сангаас
f Δcotθ cotθ
+
W0i
( 8)
式中,
W0i = f( xi ,yi ,q0 ,tanβ0 ,S10 ,S20 ,S30 ,S40 ,cotθ0 ) ( 9) 则误差方程的一般形式为
关于岭参数的确定,目前已经有不少的方法,
如岭迹法、L 曲线法、两步解法及 GCV 法等,但
是到目前为止还没有一种公认的好方法。相比较而
言,L 曲线法易于确定岭参数,是一种确定岭参数 的良好方法[5]。本文使用 L 曲线法来确定岭参数, 在此进行简述,其他方法可参见文献 [5-7]。
根据正则化原理,( 1) 式的岭估计准则为
Vi
=
f Δq q
+
f Δtanβ tanβ
+
f S1
ΔS1
+
f S2
ΔS2
+
f S3
ΔS3
+
f S4
ΔS4
+
f cotθ
Δcotθ
-
l0i
( 10)
式中,lwi = Wi测 - W0i ,7 个一阶偏导式详见文献
[10]。
上式的矩阵形式为
^ Vn×1 = An×7 Δ Z7×1 -ln×1
文献 [8]。
2 概率积分法预计参数的岭估计模型
2. 1 求参的岭估计模型 概率积分法预计参数可由地表点实测移动变形
资料求出。当布置的测点为正规观测站时,可采用 最小二乘曲线拟合法; 当测点为非正规观测站即一 系列散点时,可采用最小二乘曲面拟合法。若最小 18
二乘的法矩阵病态,则易造成求参结果失真、不可
( 11)
由( 4) ,( 5) 式确定岭参数 k,则 7 个参数改正
数的岭估计解为
王明柱等: 基于岭估计的概率积分法预计参数的求取
2012 年第 2 期
^Δ Z7 ×1
=(
N7 ×7
+
kI)
A P l -1 T 7×n n×n n×1
( 12)
即求出第 1 次的参数改正数 Δ Z^1 ,则所求参
Abstract: Divergence problem will often result in parameters distortion in solve prediction parameters of probability integration method with least square method. Morbidity of normal matrix is one of main divergence reasons. Ridge estimate was applied in solving prediction parameters,which could effectively overcome distortion of normal matrix. At the same time,Matlab was used to realize parameters' automatic solving. A simulation example was present to verify the model. Key words: ridge estimate; probability integration method; parameter solve; mining subsidence; L curve method