用于威布尔参数估计的高阶统计量

用于威布尔参数估计的高阶统计量
用于威布尔参数估计的高阶统计量

(完整版)统计学习题答案第5章参数估计

第5章 参数估计 ●1. 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。 (1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,允许误差是多少? 解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差 x σσ5=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×0.7906=1.5496。 ●2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。 (3) 假定总体标准差为15元,求样本均值的抽样标准误差; (4) 在95%的置信水平下,求允许误差; (5) 如果样本均值为120元,求总体均值95%的置信区间。 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为 x σσ15=2.1429 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×2.1429=4.2000。 (3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96, 这时总体均值的置信区间为 α/2 x Z 0±4.2=124.2115.8 可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。 ●3.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.2 4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5

双参数威布尔分布函数的确定及曲线拟合(精)

2007.NO.4. CN35-1272/TK 图 1威布尔函数拟合曲线的仿真系统模块 作者简介 :包小庆 (1959~ , 男 , 高级工程师 , 从事可再生能源的研究。 大型风电场的建设不但可以减缓用电短缺情况 , 而且并网后还能为电网提供很大一部分电能。而大型风电场的选址 , 与该地的风速分布情况有关。用于描述风速分布的模型很多 , 如瑞利分布、对数正态分布、 r 分布、双参数威布尔分布、 3参数威布尔分布 , 皮尔逊曲线拟合等。经过大量的研究表明 , 双参数威布尔分布函数更接近风速的实际分布。本文采用 4种方法计算威布尔分布函数的参数 , 并利用计算出的参数确定威布尔分布函数的实际数学模型进行曲线拟合。最后以白云鄂博矿区风电场拟选址为例 , 使用计算机软件 (MATLAB 对该地区风速威布尔分布函数进行曲线拟合 , 得到该地区不同高度的风速分布函数曲线。 1双参数威布尔分布函数的确定 双参数威布尔分布是一种单峰的正偏态分布函数 , 其概 率密度函数表达式为 : p(x=k x " exp-x " (1 式中 :k ———形状参数 , 无因次量 ; c ———

尺度参数 , 其量纲与速度相同。为了确定威布尔分布函数的实际模型 , 需计算出实际情况下对应函数的 2个参数。估算风速威布尔参数的方法很多 , 本文给出4种有效的方法以确定 k 和 c 值。 1.1HOMER 软件法 HOMER 是一个对发电系统优化配置与经济性分析的软件。通过输入 1a 逐时风速数据或者月平均风速数据 , 根据实际情况设置相应参数 , 即可计算得到 k 和c 值 , 此时计算出的 k 和 c 值是计算机系统认为的最佳值。 1.2Wasp 软件法 Wasp 是一个风气候评估、 计算风力发电机组年发电量、风电场年总发电量的软件。通过输入风速统计资料 , 计算机可以直接计算出 k 和 c 值。 1.3最小二乘法 通过风速统计资料计算出最小二乘法拟合直线 y=ax+b 的斜率 a 和截距 b 。由下式确定 k 和 c 的值 : k=b (2 c=esp a (3 1.4平均风速和最大风速估计法 从常规气象数据获得平均风速和时间 T 观测到的 10min 平均最大风速 V m ax , 设全年的平均风速为通过下式计算 k 和 c 值 : k=ln (lnT (4 c=(5

《统计学》名词解释及公式

第1章统计与统计数据 一、学习指导 统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。本章各节的主要内容和学习要点如下表所示。 概念:统计学,描述统计,推断统计。 统计在工商管理中的应用。 统计的其他应用领域。 概念:分类数据,顺序数据,数值型数据。 不同数据的特点。 概念:观测数据,实验数据。 概念:截面数据,时间序列数据。 统计数据的间接来源。 二手数据的特点。 概念:抽样调查,普查。 数据的间接来源。 数据的收集方法。 调查方案的内容。 概念。抽样误差,非抽样误差。 统计数据的质量。 概念:总体,样本。 概念:参数,统计量。

概念:变量,分类变量,顺序变量,数值 型变量,连续型变量,离散型变量。 二、主要术语 1.统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。 2.描述统计:研究数据收集、处理和描述的统计学分支。 3.推断统计:研究如何利用样本数据来推断总体特征的统计学分支。 4.分类数据:只能归于某一类别的非数字型数据。 5.顺序数据:只能归于某一有序类别的非数字型数据。 6.数值型数据:按数字尺度测量的观察值。 7.观测数据:通过调查或观测而收集到的数据。 8.实验数据:在实验中控制实验对象而收集到的数据。 9.截面数据:在相同或近似相同的时间点上收集的数据。 10.时间序列数据:在不同时间上收集到的数据。 11.抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推 断总体特征的数据收集方法。 12.普查:为特定目的而专门组织的全面调查。 13.总体:包含所研究的全部个体(数据)的集合。 14.样本:从总体中抽取的一部分元素的集合。 15.样本容量:也称样本量,是构成样本的元素数目。 16.参数:用来描述总体特征的概括性数字度量。 17.统计量:用来描述样本特征的概括性数字度量。 18.变量:说明现象某种特征的概念。 19.分类变量:说明事物类别的一个名称。 20.顺序变量:说明事物有序类别的一个名称。 21.数值型变量:说明事物数字特征的一个名称。

统计学参数估计练习题

第7章参数估计 练习题 一、填空题(共10题,每题2分,共计20分) 1.参数估计就是用_______ __去估计_______ __。 2. 点估计就是用_______ __的某个取值直接作为总体参数的_______ __。3.区间估计是在_______ __的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减_______ __得到。 4. 如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为_______ __,也成为_______ __。 5.当样本量给定时,置信区间的宽度随着置信系数的增大而_______ __;当置信水平固定时,置信区间的宽度随着样本量的增大而_______ __。 6. 评价估计量的标准包含无偏性、_______ __和_______ __。 7. 在参数估计中,总是希望提高估计的可靠程度,但在一定的样本量下,要提高估计的可靠程度,就会_______ __置信区间的宽度;如要缩小置信区间的宽度,又不降低置信程度,就要_______ __样本量。 8. 估计总体均值置信区间时的估计误差受总体标准差、_______ __和_______ __的影响。 9. 估计方差未知的正态总体均值置信区间用公式_______ __;当样本容量大于等于30时,可以用近似公式_______ __。 10. 估计正态总体方差的置信区间时,用_____ __分布,公式为______ __。 二、选择题(共10题,每题1分,共计10分) 1.根据一个具体的样本求出的总体均值的95%的置信区间 ( )。 A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C.一定包含总体均值 D. 要么包含总体均值,要么不包含总体均值 2.估计量的含义是指( )。 A. 用来估计总体参数的统计量的名称

应用统计学:参数估计习题及答案

简答题 1、矩估计的推断思路如何?有何优劣? 2、极大似然估计的推断思路如何?有何优劣? 3、什么是抽样误差?抽样误差的大小受哪些因素影响? 4、简述点估计和区间估计的区别和特点。 5、确定重复抽样必要样本单位数应考虑哪些因素? 计算题 1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计,并考量估计结果符合什么标准 2、某学校用不重复随机抽样方法选取100名高中学生,占学生总数的10%,学生平均体重为50公斤,标准差为48.36公斤。要求在可靠程度为95%(t=1.96)的条件下,推断该校全部高中学生平均体重的范围是多少? 3、某县拟对该县20000小麦进行简单随机抽样调查,推断平均亩产量。根据过去抽样调查经验,平均亩产量的标准差为100公斤,抽样平均误差为40公斤。现在要求可靠程度为95.45%(t=2)的条件下,这次抽样的亩数应至少为多少? 4、某地区对小麦的单位面积产量进行抽样调查,随机抽选25

公顷,计算得平均每公顷产量9000公斤,每公顷产量的标准差为1200公斤。试估计每公顷产量在8520-9480公斤的概率是多少?(P(t=1)=0.6827, P(t=2)=0.9545, P(t=3)=0.9973) 5、某厂有甲、乙两车间都生产同种电器产品,为调查该厂电器产品的电流强度情况,按产量等比例类型抽样方法抽取样本,资料如下: 试推断: (1)在95.45%(t=2)的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围 (2)以同样条件推断其合格率的可能范围 (3)比较两车间产品质量 6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件,其中合格品190件,要求: (1)计算样本合格品率及其抽样平均误差

统计学——参数估计

第8 讲参数估计 本讲的主要内容 8.1 参数估计的一般问题 8.2 一个总体参数的区间估计 8.3 两个总体参数的区间估计 8.4 样本量的确定 学习目标 1.估计量与估计值的概念 2.点估计与区间估计的区别 3.评价估计量优良性的标准 4.一个总体参数的区间估计方法 5.两个总体参数的区间估计方法 6.样本量的确定方法 8.1 参数估计的一般问题 8.1.1 估计量与估计值 估计量与估计值(estimator & estimated value) 1.估计量:用于估计总体参数的随机变量 如样本均值,样本比例, 样本方差等 例如: 样本均值就是总体均值m 的一个估计量 2.参数用θ表示,估计量用表示 3.估计值:估计参数时计算出来的统计量的具体值 如果样本均值?x=80,则80就是m的估计值 8.1.2 点估计与区间估计 点估计 (point estimate) 1.用样本的估计量的某个取值直接作为总体参数的估计值 例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计 2.无法给出估计值接近总体参数程度的信息 ⑴虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值 ⑵一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量 区间估计 (interval estimate) 1.在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到 2.根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 比如,某班级平均分数在75~85之间,置信水平是95% 区间估计的图示

统计学名词解释

名词解释: 医学统计学:用统计学的原理和方法研究生物医学问题的一门学科。 变量(variable):观察单位的某项特征 变量值(value of variable):变量的观察结果(测量值) 总体(population):是根据研究目的确定的同质的观察单位的全体,确切的说是同质的所有的观察单位某种变量值的集合。 样本(sample)从总体中随机抽取部分由代表性的观察单位,其测量值的集合称为样本。 随机抽样(random sample):按随机化原则从总体中抽取部分观察单位的过程。 同质(homogeneity):是针对被研究指标来讲,其影响因素相同。简单地理解就是指对研究指标影响大约可以控制的主要因素应尽可能相同。 变异(variation):指在自然地状态下,个体测量结果在同质基础上的差异。 等级资料(ordinal data):将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位称为等级资料,如患者的治疗结果可分为治愈,好转,有效,无效,死亡。有序变量(定性变量的一种)。 概率(probability):是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大,0

随机误差(random error):排除了系统误差后的尚存的误差,受多种因素影响,使观察值不按照方向性和系统性而随机的变化,误差变量一般服从正态分布,可以通过统计处理来估计。 系统误差(system error):由于受试对象,研究者,仪器设备,研究方法等非实验因素影响等确定性原因造成,有一定倾向性或规律性的误差,可以避免。 随机变量(random variable):是指取值不能事先确定的观察结果,不能用一个正常数来表示,每个变量的取值服从特定的概率分布。 参数(parameter):根据总体分布特征而计算的总体统计指标。 统计量(statistic):由总体中随机抽取样本而计算的相应样本指标。 频数表(frequency table):将各变量值及其相应的频数列出表格形式,用来表示一批数据各观察值出现的频繁程度。 算术均数(arithmetic mean):描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X表示。 几何均数(geometric mean):描述对数正态分布或数据呈倍数变化资料的水平,记为G. 中位数(median),将一组观察值由小到大排列,n为奇数时取位次居中的变量值,为偶数时,取位次居中的两个变量的平均值。 极差(range):又称全距,为最大值与最小值之差,用于资料的粗略分析,计算简便但稳定性较差。符号R. 百分位数(percentile):将n个观察值从小到大依次排列,再把它们的位次转化为百分位。

相关文档
最新文档