参数估计的若干方法及应用

参数估计的若干方法及应用
参数估计的若干方法及应用

应用统计学:参数估计习题及答案

简答题 1、矩估计的推断思路如何?有何优劣? 2、极大似然估计的推断思路如何?有何优劣? 3、什么是抽样误差?抽样误差的大小受哪些因素影响? 4、简述点估计和区间估计的区别和特点。 5、确定重复抽样必要样本单位数应考虑哪些因素? 计算题 1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计,并考量估计结果符合什么标准 2、某学校用不重复随机抽样方法选取100名高中学生,占学生总数的10%,学生平均体重为50公斤,标准差为48.36公斤。要求在可靠程度为95%(t=1.96)的条件下,推断该校全部高中学生平均体重的范围是多少? 3、某县拟对该县20000小麦进行简单随机抽样调查,推断平均亩产量。根据过去抽样调查经验,平均亩产量的标准差为100公斤,抽样平均误差为40公斤。现在要求可靠程度为95.45%(t=2)的条件下,这次抽样的亩数应至少为多少? 4、某地区对小麦的单位面积产量进行抽样调查,随机抽选25公

顷,计算得平均每公顷产量9000公斤,每公顷产量的标准差为1200公斤。试估计每公顷产量在8520-9480公斤的概率是多少?(P(t=1)=0.6827, P(t=2)=0.9545, P(t=3)=0.9973) 5、某厂有甲、乙两车间都生产同种电器产品,为调查该厂电器产品的电流强度情况,按产量等比例类型抽样方法抽取样本,资料如下: 试推断: (1)在95.45%(t=2)的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围 (2)以同样条件推断其合格率的可能范围 (3)比较两车间产品质量 6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件,其中合格品190件,要求: (1)计算样本合格品率及其抽样平均误差

应用统计学概念整理

应用统计学概念整理 第一章:导论 1.只能归类于某一类别的非数字型数据称为分类数据 2.只能归于某一有序类别的非数字型数据称为顺序数据 3.按数字尺度测量的观测值称为数值型数据 4.包含所研究的全部个体的集合称为总体 5.从总体中抽取的一部分的元素的集合称为样本 6.用来描述总体特征的的概括性数字度量称为参数 7.用来描述样本特征的概括性数字度量称为统计量 8.说明事物类别的一个名称称为分类变量 9.说明事物有序类别的一个名称称为顺序变量 10.说明事物数字特征的一个名称称为数值型变量 11.只能取可数值的变量称为离散型变量 12.可以在一个或多个区间中取任何值的变量称为连续型变量 第二章:数据收集 1.从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征 的数据收集方法,称为抽样调查。 2.为特定目的而专门组织的全面调查称为普查 3.按照国家有关法律规定,自上而下地统一布置,自下而上地逐级提供基本数据的调查方 式称为统计报表 第三章:数据的图表展示 1.落在某一特定类别或组中的数据个数,称为频数 2.把各个类别及其落在其中的相应频数全部列出,并用表格形式表示出来,称为频数分布 3.一个样本或总体中各个部分的数据与全部数据之比,称为比例 4.将比例乘以100得到的数值,称为百分比或百分数,用%表示 5.样本或总体中各不同类别数值之间的比值,称为比率 6.分类数据的图示:条形图,pareto图,对比条形图,饼图 7.将各有序类别或组的频数逐级累加起来得到的频数称为累计频数 8.将各有序类别或组的百分比逐级累加起来称为累计频率 9.顺序数据的图示:累计频数分布图,环形图 10.根据统计研究的需要,将原始数据按照某种标准划分成不同的组别称为数据分组 11.分组后的数据称为分组数据 12.把变量值作为一组称为单变量值分组 13.将全部变量值一次划分为若干个区间,并将这一区间的变量值作为一组,称为组距分组 14.在组距分组中,一个组的最小值称为下限,最大值称为上限 15.一个组的上限与下限的差称为组距 16.各组组距相等的组距分组称为等距分组 17.各组组距不相等的组距分组称为不等距分组 18.每一组的下限和上限之间的重点值称为组中值

LOGIT模型参数估计方法研究_金安

第4卷第1期2004年2月 交通运输系统工程与信息 Jo ur nal of T r anspo rt atio n Sy stems Eng ineer ing and Infor matio n T echno lo gy Vo l.4No.1Febr uar y 2004 文章编号:1009-6744(2004)01-0071-05 LOGIT 模型参数估计方法研究 金 安 (广州市规划局交通研究所,广州510030) 摘要: 离散选择模型,特别是L OG IT 模型在交通需求模型建立过程中,应用非常广泛,许多实际的交通政策问题都涉及到方式选择,然而L OG IT 模型的建立非常困难,尤其是效用函数及参数估计.本文重点就L O GIT 模型参数估计的有关问题进行讨论,特别是运用统计方法如何对效用函数的变量进行选取及比较不同形式效用函数. 关键词: L O GI T 模型;参数估计;t 检验;似然率检验中图分类号: N 945.12 On Methodology of Parameter Estimation in L OGIT Model JIN An (Instit ute o f T r aspo r tatio n,G uang zho u P la nning Bur eau,Guang zho u 510030,China ) Abstract : Disagg reg ate choice mo del ,especially L O GIT m odel ,hav e been used w idely in dev elo pment of tr avel demand mo del ,many pr actical tr anspor tation policy issues ar e concerned w ith mode choice.But pro cedure o f development of L OG IT mo del is difficult,especially mo del calibr atio n and for m of utility functio n.T his paper discuss r elat ional pr oblems o n development of L OG IT model,P articular emphasis is placed o n pr actical pr ocedur es for selection the co rr ect ex planato ry var iables and on compar ing differ ent ver sions of utility functio n using st atistical metho ds.Keywords : L OG IT mo del;par ameter est imation;t -test;likeliho od test CLC number : N 945.12 收稿日期:2003-11-24 金安:广州市规划局交通研究所工程师,工学硕士.研究方向为交通规划及交通需求模型. 1 引 言 实践过程中,LOGIT 模型效用函数不可能预先知道,模型师在建立LOGIT 模型最初阶段几乎没有效用函数任何信息,最多认为在效用函数中会有哪些可能的变量,但也不能确定所有的变量是否都需要,更不可能知道哪些变量需要进行函数变换或效用函数参数的具体数值是多少.这些问题只有通过拟合合适的观测数据,并检验这些模型来确定哪一个最能够描述观测数据.本文主要介绍拟合和测试LOGIT 模型方法. 2 数据的要求 估计和检验过程的第一步是选择合适的观测数据,用于建立LOGIT 方式选择模型所需的数据有: (1)对个体实际方式选择行为的观测.例如, 要建立工作出行方式选择模型,需要对上班出行者方式选择进行观测的数据. (2)所有被选择和没有被选择方式的相关属性值.这些属性可能作为模型中的变量.例如,假设总出行时间被认为是模型中的一个变量,则对于样本中每一个个体而言,所需数据包括每一种可能方式的总出行时间.如果属性数据仅包含被选择方式,LOGIT 模型就不能建立. (3)任何可能作为变量的个体属性值.例如,汽车拥有水平,则需要样本中每个个体家庭汽车拥有水平数. 3 模型的设定 所需数据收集后,下一步工作是设定一种或多种效用函数形式.设定步骤包括确定效用函数中变量、属性的函数变换以及效用函数的形式.这个步

(整理)参数估计方法.

第七章 参数估计 第一节 基本概念 1、概念网络图 {}???? ??? ?? ???????????????????→??????单正态总体的区间估计区间估计一致性有效性无偏性估计量的评选标准极大似然估计矩估计点估计从样本推断总体

2、重要公式和结论

例7.1:设总体),(~b a U X ,求对a, b 的矩估计量。 例7.2:设n x x x ,,,,21 是总体的一个样本,试证 (1);21 10351321x x x ++= ∧ μ (2);12541313212x x x ++=∧μ (3).12 143313213x x x -+=∧μ 都是总体均值u 的无偏估计,并比较有效性。 例7.3:设n x x x ,,,,21 是取自总体),(~2 σμN X 的样本,试证 ∑=--=n i i x x n S 1 22 )(11 是2 σ的相合估计量。

第二节 重点考核点 矩估计和极大似然估计;估计量的优劣;区间估计 第三节 常见题型 1、矩估计和极大似然估计 例7.4:设0),,0(~>θθU X ,求θ的最大似然估计量及矩估计量。 例7.5:设总体X 的密度函数为 ?????≥=--. , 0,1)(/)(其他μθ θμx e x f x 其中θ>0, θ,μ为未知参数,n X X X ,,,21 为取自X 的样本。试求θ,μ的极大似然估计量。 2、估计量的优劣 例7.6:设n 个随机变量n x x x ,,,21 独立同分布, ,)(11,1,)(1 22 12 1∑∑==--===n i i n i i x x n S x n x x D σ 则 (A )S 是σ的无偏估计量; (B )S 是σ的最大似然估计量; (C )S 是σ的相合估计量; (D )x S 与2 相互独立。 例7.7:设总体X 的密度函数为 ?????<<-=, , 0,0),(6)(3 其他θθθx x x x f n X X X ,,,21 是取自X 的简单随机样本。 (1) 求θ的矩估计量∧ θ;

《应用统计学》模拟考试题参考标准答案

《应用统计学》模拟考试题参考答案

————————————————————————————————作者:————————————————————————————————日期:

应用统计学模拟考试题答案 得分评阅人一、判断题(共10小题,每小题1分,共10分) 请在你认为正确的题号前的括号内划“√”,在你认为 错误的题号前的括号内划“×”。 (√)1、在统计调查中,抽样调查因为诸多优点而最经常被采用。 (√)2、按照计量尺度的差异,可以将统计数据分为分类数据、顺序数据和数值型数据三类。 (×)3、抽样误差是抽样调查中可以设法消除的误差。 (×)4、在假设检验中,如果所计算的P值越小,说明检验结果越不显著。(√)5、不存在趋势的时间序列称为平稳时间序列。 (√)6、拉氏物价指数是以基期的商品交易量作为同度量因素加权的。(√)7、展示时间序列数据的最佳图形是线图。 (√)8、统计表主要由表头、行标题、列标题、数字资料和表外附加五部分组成。 (×)9、多数情况下,t分布是一个右偏分布。 (×)10、平均数、中位数、众数等都是用来衡量数据离散趋势的。 得分评阅人二、单选题(共10小题,每小题1分,共10分) 请将唯一的正确答案选项写在题号前的括号内。 ( A)11、下列变量中属于数值型变量的是 A、汽车轮胎的直径 B、汽车的内燃机类型 C、产品等级 D、学生生源类别 (C)12、以下各种抽样方式中一定属于非随机抽样的方式是: A、简单随机抽样 B、等距抽样 C、重点抽样 D、类型抽样 (C )13、下列图形中不能展示分类数据的图是: A、条形图 B、饼图 C、直方图 D、环状图 (B)14、经验数据表明某电话订票点每小时接到订票电话的数目X是服从常

非线性模型参数估计方法步骤

EViews非线性模型参数估计方法步骤 1.新建EViews工作区,并将时间序列X、P1和P0导入到工作区; 2.设定参数的初始值全部为1,其方法是在工作区中其输入下列命令 并按回车键 param c(1) 1 c(2) 1 c(3) 1 c(4) 1 3.估计非线性模型参数,其方法是在工作区中其输入下列命令并按 回车键 nls q=exp(c(1))*x^c(2)*p1^c(3)*p0^c(4) 4.得到结果见table01(91页表3. 5.4结果)(案例一结束) Dependent Variable: Q Method: Least Squares Date: 03/29/15 Time: 21:44 Sample: 1985 2006 Included observations: 22 Convergence achieved after 9 iterations Q=EXP(C(1))*X^C(2)*P1^C(3)*P0^C(4) Coefficient Std. Error t-Statistic Prob. C(1) 5.567708 0.083537 66.64931 0.0000 C(2) 0.555715 0.029067 19.11874 0.0000 C(3) -0.190154 0.143823 -1.322146 0.2027 C(4) -0.394861 0.159291 -2.478866 0.0233 R-squared 0.983631 Mean dependent var 1830.000 Adjusted R-squared 0.980903 S.D. dependent var 365.1392 S.E. of regression 50.45954 Akaike info criterion 10.84319 Sum squared resid 45830.98 Schwarz criterion 11.04156 Log likelihood -115.2751 Hannan-Quinn criter. 10.88992 Durbin-Watson stat 0.672163 (92页表3.5.5结果)(案例二过程) 5.新建EViews工作区,并将时间序列X、P1和P0导入到工作区;

统计学——参数估计

第8 讲参数估计 本讲的主要内容 8.1 参数估计的一般问题 8.2 一个总体参数的区间估计 8.3 两个总体参数的区间估计 8.4 样本量的确定 学习目标 1.估计量与估计值的概念 2.点估计与区间估计的区别 3.评价估计量优良性的标准 4.一个总体参数的区间估计方法 5.两个总体参数的区间估计方法 6.样本量的确定方法 8.1 参数估计的一般问题 8.1.1 估计量与估计值 估计量与估计值(estimator & estimated value) 1.估计量:用于估计总体参数的随机变量 如样本均值,样本比例, 样本方差等 例如: 样本均值就是总体均值m 的一个估计量 2.参数用θ表示,估计量用表示 3.估计值:估计参数时计算出来的统计量的具体值 如果样本均值?x=80,则80就是m的估计值 8.1.2 点估计与区间估计 点估计 (point estimate) 1.用样本的估计量的某个取值直接作为总体参数的估计值 例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计 2.无法给出估计值接近总体参数程度的信息 ⑴虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值 ⑵一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量 区间估计 (interval estimate) 1.在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到 2.根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 比如,某班级平均分数在75~85之间,置信水平是95% 区间估计的图示

参数估计方法

参数估计的方法 矩法 一、矩的概念 矩(moment )分为原点矩和中心矩两种。对于样本n y y y ,,, 21,各观测值的k 次方的平均值,称为样本的k 阶原点矩,记为k y ,有∑==n i k i k y n y 1 1,例如,算术 平均数就是一阶原点矩;用观测值减去平均数得到的离均差的k 次方的平均数称为样本的k 阶中心矩,记为k y y ) (-或k μ ?,有∑-= -=n i k i k y y n y y 1 ) (1)(,例如,样本 方差 ∑-=n i i y y n 1 2 ) (1就是二阶中心矩。 对于总体N y y y ,,, 21,各观测值的k 次方的平均值,称为总体的k 阶原点矩,记为)(k y E ,有∑= =N i k i k y N y E 1 1)(;用观测值减去平均数得到的离均差的k 次方 的平均数称为总体的k 阶中心矩,记为 ] )[(k y E μ-或 k μ,有 ∑-= -=N i k i k y N y E 1 ) (1])[(μμ。 二、矩法及矩估计量 所谓矩法就是利用样本各阶原点矩来估计总体相应各阶原点矩的方法,即 ∑= =n i k i k y n y 1 1→)(k y E (8·6) 并且也可以用样本各阶原点矩的函数来估计总体各阶原点矩同一函数,即若 ))(,),(),((k y E y E y E f Q 2= 则 ),,,(k y y y f Q 2?= 由此得到的估计量称为矩估计量。 [例8.1] 现获得正态分布),(2σμN 的随机样本n y y y ,,, 21,要求正态分布),(2σμN 参数μ和2σ的矩估计量。 首先,求正态分布总体的1阶原点矩和2阶中心矩: ?=?? ? ???--? =?=∞ +∞-∞ +∞-μσμσπdy y y dy y yf y E 2 2 exp 2)(21)()( (此处?? ? ???--2 2exp σμ2)(y 表示自然对数底数e 的?? ? ???--2 2σμ2)(y 的指数式,即] [2)(22 σμ--y e )

《应用统计学》模拟考试题及参考答案(全)

应用统计学模拟考试题答案 (√)1、在统计调查中,抽样调查因为诸多优点而最经常被采用。 (√)2、按照计量尺度的差异,可以将统计数据分为分类数据、顺序数据和数值型数据三类。 (×)3、抽样误差是抽样调查中可以设法消除的误差。 (×)4、在假设检验中,如果所计算的P值越小,说明检验结果越不显著。(√)5、不存在趋势的时间序列称为平稳时间序列。 (√)6、拉氏物价指数是以基期的商品交易量作为同度量因素加权的。(√)7、展示时间序列数据的最佳图形是线图。 (√)8、统计表主要由表头、行标题、列标题、数字资料和表外附加五部分组成。 (×)9、多数情况下,t分布是一个右偏分布。 (×)10、平均数、中位数、众数等都是用来衡量数据离散趋势的。 ( A)11、下列变量中属于数值型变量的是 A、汽车轮胎的直径 B、汽车的内燃机类型 C、产品等级 D、学生生源类别 (C)12、以下各种抽样方式中一定属于非随机抽样的方式是: A、简单随机抽样 B、等距抽样 C、重点抽样 D、类型抽样 (C )13、下列图形中不能展示分类数据的图是: A、条形图 B、饼图 C、直方图 D、环状图 (B)14、经验数据表明某电话订票点每小时接到订票电话的数目X是服从常数为120的泊松分布,请问该订票点每10分钟内接到订票电话数目 Y的分布类型是: A、正态分布 B、泊松分布 C、二项分布 D、超几何分布 (D)15、下列有关统计分组的一些说法中,错误的是: A、统计分组是指按照某些重要标志把总体分成若干部分的科学分类

B、数值型数据的分组的组数主要取决于数据的全距和组距的大小 C、统计分组的目的是为了展现总体的内部结构或分布规律 D、统计分组只能按照一个标志单独进行 (C)16、下面有关相关关系的一些说法错误的是: A、相关关系是一种普遍存在的关系 B、简单相关系数是用来定量描述变量之间线性相关程度的 C、简单相关系数为零时,说明两个变量之间不存在任何关系 D、简单相关系数绝对值越大,两个变量之间的相关程度越密切 (B)17、已知一组数据为10,8,7,3,5,6,8,请问这组数据的中位数为 A、8 B、7 C、6.5 D、10 (B)18、某样本数据的方差是36,均值是10,则该组数据的离散系数是: A、3.60 B、0.60 C、1.67 D、0.28 (D)19、下列有关参数估计的说法错误的是 A、参数估计就是利用样本统计量的值来对总体的参数进行估计 B、参数估计有点估计和区间估计等形式 C、区间估计必须有相应的置信度作为保证 D、区间估计的宽度越大说明估计的精确度越高 (C)20、下列有关时间序列的说法错误的是: A、长期趋势是指指标值随时间变化呈现出持续的上升或下降的变动 B、循环波动是一种周期性变动 C、季节变动是指周期为一年上的周期性变动 D、不规则变动是没有特定规律的随机变动 21、在假设检验中,如果检验统计量的P值大于给定的显著性水平α,则在做决策时,需要在显著性水平α的情况下,___不能拒绝_原假设。 22、一组数据的最大值是85,最小值是33,中位数是55,众数是42,则该组数据的极差是52 。 23、样本统计量的概率分布称为抽样分布。

第三章参数估计

第三章参数估计 重点: 1.总体参数与统计量 2.样本均值与样本比例及其标准误差 难点: 1.区间估计 2.样本量的确定 知识点一:总体分布与总体参数 统计分析数据的方法包括:描述统计和推断统计(第一章) 推断统计是研究如何利用样本数据来推断总体特征的统计学方法,包括参数估计和假设检验两大类。 总体分布是总体中所有观测值所形成的分布。 总体参数是对总体特征的某个概括性的度量。通常有 总体平均数(μ) 总体方差(σ2) 总体比例(π) 知识点二:统计量和抽样分布 总体参数是未知的,但可以利用样本信息来推断。

统计量是根据样本数据计算的用于推断总体的某些量,是对样本特征的某个概括性度量。 统计量是样本的函数,如样本均值()、样本方差(s2)、样本比例(p)等。 构成统计量的函数中不能包括未知因素。 由于样本是从总体中随机抽取的,样本具有随机性,由样本数据计算出的统计量也就是随机的。统计量的取值是依据样本而变化的,不同的样本可以计算出不同的统计量值。 [例题·单选题]以下为总体参数的是( ) a.样本均值b.样本方差 c.样本比例d.总体均值 答案:d 解析:总体参数是对总体特征的某个概括性的度量。通常有总体平均数、总体方差、总体比 例题·判断题:统计量是样本的函数。 答案:正确 解析:统计量是样本的函数,如样本均值()、样本方差()、样本比例(p)等。构成统计量的函数中不能包括未知因素。 [例题·判断题]在抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定的、唯一的。 答案:错误 解析:作为推断对象的总体是唯一的,但作为观察对象的样本不是唯一的,不同的样本可以计算出不同的统计量值。。

机器学习中的参数估计方法

机器学习中的参数估计方法 分类:机器学习2015-01-10 19:46 20人阅读评论(0) 收藏举报 机器学习参数估计 前几天上的机器学习课上,老师讲到了参数估计的三种方法:ML,MAP和 Bayesian estimation。课后,又查了一些相关资料,以及老师推荐的LDA方面的论文《Parameter estimation for text analysis》。本文主要介绍文本分析的三类参数估计方法- 最大似然估计MLE、最大后验概率估计MAP及贝叶斯估计,以及三者之间的区别。 1、最大似然估计MLE 首先回顾一下贝叶斯公式 这个公式也称为逆概率公式,可以将后验概率转化为基于似然函数和先验概率的计算表达式,即 最大似然估计就是要用似然函数取到最大值时的参数值作为估计值,似然函数可以写做 由于有连乘运算,通常对似然函数取对数计算简便,即对数似然函数。最大似然估计问题可以写成 这是一个关于的函数,求解这个优化问题通常对求导,得到导数为0的极值点。该函数 取得最大值是对应的的取值就是我们估计的模型参数。

以扔硬币的伯努利实验为例子,N次实验的结果服从二项分布,参数为P,即每次实验事件发生的概率,不妨设为是得到正面的概率。为了估计P,采用最大似然估计,似然函数可以写作 其中表示实验结果为i的次数。下面求似然函数的极值点,有 得到参数p的最大似然估计值为 可以看出二项分布中每次事件发的概率p就等于做N次独立重复随机试验中事件发生的概率。 如果我们做20次实验,出现正面12次,反面8次 那么根据最大似然估计得到参数值p为12/20 = 0.6。 2、最大后验估计MAP 最大后验估计与最大似然估计相似,不同点在于估计的函数中允许加入一个先验,也就是说此时不是要求似然函数最大,而是要求由贝叶斯公式计算出的整个后验概率最大,即 注意这里P(X)与参数无关,因此等价于要使分子最大。与最大似然估计相比,现在需要多加上一个先验分布概率的对数。在实际应用中,这个先验可以用来描述人们已经知道或者接受的普遍规律。例如在扔硬币的试验中,每次抛出正面发生的概率应该服从一个概率分布,这个概率在0.5处取得最大值,这个分布就是先验分布。先验分布的参数我们称为超参数(hyperparameter)即

经典参数估计方法(3种方法)

经典参数估计方法:普通最小二乘(OLS)、最大似然(ML)和矩估计(MM) 普通最小二乘估计(Ordinary least squares,OLS) 1801年,意大利天文学家朱赛普.皮亚齐发现了第一颗小行星谷神星。经过40天的跟踪观测后,由于谷神星运行至太阳背后,使得皮亚齐失去了谷神星的位置。随后全世界的科学家利用皮亚齐的观测数据开始寻找谷神星,但是根据大多数人计算的结果来寻找谷神星都没有结果。时年24岁的高斯也计算了谷神星的轨道。奥地利天文学家海因里希.奥尔伯斯根据高斯计算出来的轨道重新发现了谷神星。高斯使用的最小二乘法的方法发表于1809年他的著作《天体运动论》中。法国科学家勒让德于1806年独立发现“最小二乘法”,但因不为世人所知而默默无闻。勒让德曾与高斯为谁最早创立最小二乘法原理发生争执。1829年,高斯提供了最小二乘法的优化效果强于其他方法的证明,因此被称为高斯-莫卡夫定理。 最大似然估计(Maximum likelihood,ML) 最大似然法,也称最大或然法、极大似然法,最早由高斯提出,后由英国遗传及统计学家费歇于1912年重新提出,并证明了该方法的一些性质,名称“最大似然估计”也是费歇给出的。该方法是不同于最小二乘法的另一种参数估计方法,是从最大似然原理出发发展起来的其他估计方法的基础。虽然其应用没有最小二乘法普遍,但在计量经济学理论上占据很重要的地位,因为最大似然原

理比最小二乘原理更本质地揭示了通过样本估计总体的内在机理。计量经济学的发展,更多地是以最大似然原理为基础的,对于一些特殊的计量经济学模型,最大似然法才是成功的估计方法。 对于最小二乘法,当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得模型能最好地拟合样本数据;而对于最大似然法,当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该是使得从模型中抽取该n组样本观测值的概率最大。 从总体中经过n次随机抽取得到的样本容量为n的样本观测值,在任一次随机抽取中,样本观测值都以一定的概率出现。如果已经知道总体的参数,当然由变量的频率函数可以计算其概率。如果只知道总体服从某种分布,但不知道其分布参数,通过随机样本可以求出总体的参数估计。 以正态分布的总体为例,每个总体都有自己的分布参数期望和方差,如果已经得到n组样本观测值,在可供选择的总体中,哪个总体最可能产生已经得到的n组样本观测值呢?显然,要对每个可能的正态总体估计取n组样本观测值的联合概率,然后选择其参数能使观测值的联合概率最大的那个总体。将样本观测值联合概率函数称为变量的似然函数。在已经取得样本观测值的情况下,使似然函数取极大值的总体分布参数所代表的总体具有最大的概率取得这些样本观测值,该总体参数即是所要求的参数。通过似然函数极大化以求得总体参数估计量的方法被称为极大似然法。

应用统计参数估计练习

参数估计书面作业 1.某企业生产袋装方便面,规定每袋重量为100 克。为对产品质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的某批次120袋方便面中随机抽取了25 袋,测得每袋重量如下表。已知产品重量的分布服从正态分布,且总体标准差为10 克。试估计该批产品平均重量的置信区间,置信水平为95%。 解:总体正态分布,总体标准差已知=10,n=25.(属于第一种情况)计算得样本平均数=105.36 1-a=95%,Z /2 1.96 (1)若重复抽样 2)若不重复抽样

2某工厂有1500名工人,现用简单随机重复抽样法抽取50 个工人调查其工资水平,结果见下表。 要求: (1)计算样本平均数及其标准差(注意样本标准差的计算,分母要减1); (2)估计该厂工人周工资的95%置信区间。 解:(1) Xf 样本均值X? Xf 560(元) 样本标准差S (X X)2f(524 560)2 * 4 (660 560)2 * 3 1074.2857 2)区间估计 50 1 1

抽样平均(标准)误差 用样本 标准差 S 代替 ,则有 S 1074.2857 n 50 95%,Z 1.96 2 3. 已知某种木材的抗压力实验值服从正态分布,现对 十个样品 做抗压 力实验得到如下数据 (单位: Mpa ): 48.2, 49.3, 45.7, 47.1, 51.0, 44.6, 43.5, 41.8, 39.4, 46.9 试对该木材平均抗压力进行区间估计( 95%置信水平)。 解:总体正态,小样本,总体标准差未知(要用样本标准差代替,注 意样本标准差的计算) 4. 某城市想要估计下岗职工中女性所占的比率,随机地抽取了 100 名下岗职工,其中 65 人为女性职工。试以 95%的置信水平估计该城 市下岗职工中女性比率的置信区间。 解:已知 n=100, p = 65% , 1- a = 95%, 4.6353 560 1.96* 4.6353 560 9.0852 / 2 =1.96 n

第二章参数估计

第二章 参数估计 一、填空题 1、总体X 的分布函数为);(θx F ,其中θ为未知参数,则对θ常用的点估计方法有 , 。 2、设总体X 的概率密度为 (),(;)0,x e x f x x θθ θθ--?≥=?

该总体的一个样本,设用矩法求得μ的估计量为1?μ 、用极大似然法求得μ的估计量为2?μ ,则1?μ=2?μ。 _________________ 8、?n θ是总体未知参数θ的相合估计量的一个充分条件是_______ . 解:??lim (), lim Var()0n n n n E θθθ→∞ →∞ ==. 9、已知1021,,x x x 是来自总体X 的简单随机样本,μ=EX 。令 ∑∑==+=10 7 6 181?i i i i x A x μ ,则当=A 时,μ?为总体均值μ的无偏估计。 10、 设总体()θ,0~U X ,现从该总体中抽取容量为10的样本,样本值为 0.51.30.61.7 2.21.20.81.5 2.01.6, , , , , , , , , 则参数θ的矩估计为 。 11、 设1?θ与2?θ都是总体未知参数θ的估计,且1?θ比2?θ有效,则1?θ与2?θ的期望与方差满足_______ . 解:1212 ????()(), ()()E E D D θθθθ=<. 12、设1?θ和2?θ均是未知参数θ的无偏估计量,且)?()?(2221θθE E >,则其中的统计量 更有效。 13、在参数的区间估计),(21θθ中,当样本容量n 固定时,精度12θθ-提高时,置信度α-1 。 14、设n X X X ,,,21 是来自总体)1,(~μN X 的样本,则μ的置信度为0.95的置信区间为 。 15、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则μ的置

暴雨强度公式参数估计及其应用.

第23卷第1期2000年3月 南京气象学院学报 Jou rnal of N an jing In stitu te of M eteo ro logy . 23N o . 1V o l M ar . 2000 文章编号:100022022(2000 20120063205 暴雨强度公式参数估计及其应用3 顾骏强徐集云陈海燕黄建萍 (浙江省气候中心, 杭州310017 摘要:, 计, 提高了公式参数估计的精度。。关键词:非线性模型; 暴雨强度公式; 中图分类号:P 333. 2A , 它直接影响到排水工程的投资预算 [1] 和可靠性(GBJ 14287 》规定, 在进行城市排水管网设计时, 雨水管。城市排水工程的可靠性与采用的暴雨强度公式有直接的关系, 而排水工程直接影响到城市防灾减灾的功能和城市环境。因此, 编制各地暴雨强度公式具有重要的现实意义。

国家规范给定的暴雨强度公式形式为一非线性模型, 过去对公式中的参数通过经验值、解析图解或摆试法确定, 然后利用线性最小二乘法确定公式中的其他参数[2]。文献[3, 4]利用最优化方法解非线性超定方程组, 也有用加速遗传算法[5]对暴雨强度公式参数估计进行研究, 但具体应用的对象均为暴雨强度公式的参数估计。本文利用最优化问题的求解方案, 较好地解决非线性模型的参数求解问题, 实现的模式参数求解方法具有广泛的适用性。在编程中, 充分考虑计算机数值计算能力, 有效地控制了迭代误差, 提高了暴雨强度公式参数估计精度。 1非线性模型参数估计方法 暴雨强度公式是一非线性模型, 对于非线性系统数值求解通常采用迭代法。非线性方程的一般形式为:给定m 个函数f i (i =1, 2, …, m , f i 包含n 个未知参数变量, 即 f 1(x 1, x 2, …, x n =0 ……n ≤m 。f m (x 1, x 2, …, x n =(1 参数的估计问题, 就是设法确定n 个参数x 1, x 2, …, x n , 使实际上的特性函数f 在Ξ的某一区[Α, Β]上逼近规定的特性函数?(Ξ , 并令其达到指定的精确度Ε, 即 (2 m ax f (x 1, x 2, …, x n ; Ξ -?(Ξ ≤Ε。 Α≤Ξ≤Β 3收稿日期:1999206204; 改回日期:1999211230 基金项目:浙江省重大科研项目(991103364 资助 作者简介:顾骏强, 男, 上海市人, 1962年12月生, 高级工程师。主要研究方向:应用气象, 自然灾害学

相关文档
最新文档