第5章 参数估计基础

第5章 参数估计基础
第5章 参数估计基础

第五章 参数估计基础一、样本均数的抽样分布与抽样误差

内 容

1. 抽样误差和抽样分布

2. 样本均数抽样分布和抽样误差

1. 抽样误差和抽样分布

n误差泛指实测值和真实值之差。按其产生原因与性质分两 大类:系统误差和随机误差。抽样误差是一种随机误差。 n抽样误差

由于生物固有的个体变异,从某一总体中随机抽取一个样 本,所得样本统计量与相应总体参数往往是有差异的,这种 差异称为抽样误差(sampling error)。

n误差产生的原因

n系统误差:由受试对象、研究者、仪器设备、研究方法等确定性 原因造成,有倾向性,可避免。

n随机误差:由多种无法控制的偶然因素引起的,无倾向性,不可 避免。

n抽样误差:产生的根本原因是个体变异、产生的直接原因是抽

样。

n抽样分布

n由于抽样误差存在,从同一总体中随机抽取若干份样本, 所得样本统计量是不一致的,差异无法避免但其存在一定

的分布规律。

n 正态分布总体样本均数抽样分布的电脑试验

n 假定某年某地所有13岁女生的身高服从总体均数为155.4 cm ,总

体标准差为5.3cm 的正态分布 。用计算机从该总体中 随机抽样,每次抽取30例组成一份样本,重复抽样100次,计算

每份样本的平均身高。

(

) 2 155.4,5.3 N 2. 样本均数抽样分布和抽样误差

n电脑试验表明,正态分布总体样本均数抽样分布具有以 下特点:

n样本均数恰好等于总体均数极其罕见;

n样本均数之间存在差异;

n样本均数围绕总体均数,中间多、两边少,左右基本对称,呈 近似正态分布;

n样本均数间的变异小于原始变量值间的变异。

PERCENT

30

x MIDPOINT

0 . 0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1 . 0 1 . 1 1 . 2 1 . 3 1 . 4 1 . 5 1 . 6 1 . 7 1 . 8 1 . 9 2 . 0 2 . 1 2 . 2 2 . 3 2 . 4 2 . 5 2 . 6 2 . 7 2 . 8 2 . 9 3 . 0 3 . 1 3 . 2 3 . 3 3 . 4 3 . 5 3 . 6 3 . 7 3 . 8 3 . 9 4 . 0 4 . 1 4 . 2 4 . 3 4 . 4 4 . 5 4 . 6 4 . 7 4 . 8 4 . 9 5

. 0

n 非正态分布总体样本均数抽样分布的电脑实验

n 图 (a ) 是正偏峰分布原始数据对应的直方图,用计算机随机抽取

样本量分别为5, 10, 30和50的样本各1000份,计算样本均数并绘

制4个直方图。

(a ) 原始数据

n =5

P E RC E N T

0 30 m m MI D P O I NT 0 . 0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1 . 0 1 . 1 1 . 2 1 . 3 1 . 4 1 . 5 1 . 6 1 . 7 1 . 8 1 . 9 2 . 0 2 . 1 2 . 2 2 . 3 2 . 4 2 . 5 2 . 6 2 . 7 2 . 8 2 . 9 3 . 0 3 . 1 3 . 2 3 . 3 3 . 4 3 . 5 3 . 6 3 . 7 3 . 8 3 . 9 4 . 0 4 . 1 4 . 2 4 . 3 4 . 4 4 . 5 4 . 6 4 . 7 4 . 8 4 . 9 5

.

n=10 PERCENT 0

30

mm MIDPOINT

0 . 0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1 . 0 1 . 1 1 . 2 1 . 3 1 . 4 1 . 5 1 . 6 1 . 7 1 . 8 1 . 9 2 . 0 2 . 1 2 . 2 2 . 3 2 . 4 2 . 5 2 . 6 2 . 7 2 . 8 2 . 9 3 . 0 3 . 1 3 . 2 3 . 3 3 . 4 3 . 5 3 . 6 3 . 7 3 . 8 3 . 9 4 . 0 4 . 1 4 . 2 4 . 3 4 . 4 4 . 5 4 . 6 4 . 7 4 . 8 4 . 9 5 . 0 n=30

PERCENT

30 mm MIDPOINT 0 . 0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1 . 0 1 . 1 1 . 2 1 . 3 1 . 4 1 . 5 1 . 6 1 . 7 1 . 8 1 . 9 2 . 0 2 . 1 2 . 2 2 . 3 2 . 4 2 . 5 2 . 6 2 . 7 2 . 8 2 . 9 3 . 0 3 . 1 3 . 2 3 . 3 3 . 4 3 . 5 3 . 6 3 . 7 3 . 8 3 . 9 4 . 0 4 . 1 4 . 2 4 . 3 4 . 4 4 . 5 4 . 6 4 . 7 4 . 8 4 . 9 5 .

n=50 PERCENT 0 30

mm MIDPOINT

0 . 0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8 0 . 9 1 . 0 1 . 1 1 . 2 1 . 3 1 . 4 1 . 5 1 . 6 1 . 7 1 . 8 1 . 9 2 . 0 2 . 1 2 . 2 2 . 3 2 . 4 2 . 5 2 . 6 2 . 7 2 . 8 2 . 9 3 . 0 3 . 1 3 . 2 3 . 3 3 . 4 3 . 5 3 . 6 3 . 7 3 . 8 3 . 9 4 . 0 4 . 1 4 . 2 4 . 3 4 . 4 4 . 5 4 . 6 4 . 7 4 . 8 4 . 9 5 . 0 (d ) n =30 (e ) n =50

(b ) n =5 (c ) n =10

n 中心极限定理表明

n 从正态总体 中随机抽取例数为 n 的多个样本,样本均数

服从正态分布;即使是从偏态总体中随机抽样,当 n 足够大时(如

n >30),样本均数也近似正态分布,且样本均数的均数等于原分

布的均数。

( ) 2 , N m s

n均数抽样误差

n由固然存在的个体变异和抽样造成的样本均数与样本均数 及样本均数与总体均数之间的差异称为均数的抽样误差。

小 结

1. 抽样分布和抽样误差

n样本统计量抽样分布

n误差含义及误差产生原因

2. 样本均数抽样分布和抽样误差

n正态分布总体样本均数抽样分布规律

n非正态分布总体样本均数抽样分布规律

第五章 参数估计基础二、样本频率的抽样分布与抽样误差

内 容

1. 样本均值抽样分布和抽样误差回顾

2. 样本频率抽样分布和抽样误差

1. 样本均值抽样分布和抽样误差 (1)正态分布总体样本均数抽样分布特点

(2)非正态分布总体样本均数抽样分布规律

(3)均值标准误的含义和计算

(1)正态分布总体样本均数抽样分布特点

n样本均数等于总体均数的情况极其罕见; n样本均数之间存在差异;

n样本均数围绕总体均数,呈近似正态分布; n样本均数标准误小于原始变量的标准差。

(2)非正态分布总体样本均数抽样分布规律

n虽然原分布是偏态分布,但当抽取样本量n足够大时(如 n>30) 样本均数也近似正态分布,且样本均数的均数等 于原分布的均数。

(完整版)统计学习题答案第5章参数估计

第5章 参数估计 ●1. 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。 (1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,允许误差是多少? 解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差 x σσ5=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×0.7906=1.5496。 ●2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。 (3) 假定总体标准差为15元,求样本均值的抽样标准误差; (4) 在95%的置信水平下,求允许误差; (5) 如果样本均值为120元,求总体均值95%的置信区间。 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为 x σσ15=2.1429 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×2.1429=4.2000。 (3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96, 这时总体均值的置信区间为 α/2 x Z 0±4.2=124.2115.8 可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。 ●3.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.2 4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5

医学统计学习题参数估计基础

实习六参数估计基础 [实习目的与要求] 1、掌握均数及频率标准误的计算;掌握总体均数95%和99%置信区间的计算及适用条件; 掌握总体概率的95%和99%置信区间的计算及适用条件 2、熟悉t分布的特征。 (一)最佳选择题 1. 表示均数抽样误差大小的统计指标是________。 A. 标准差 B. 方差 C. 均数标准差 D. 变异系数 E. 样本标准误 S表示________。 2. x A. 总体均数 B. 样本均数的标准差 C. 总体均数离散程度 D. 变量x的离散程度 E. 变量x的可靠程度 3. 标准误越大,则表示此次抽样得到的样本频率_________。 A. 系统误差大 B. 可靠程度越大 C. 抽样误差越大 D. 可比性越差 E. 代表性越差 4. 要减小抽样误差,通常的做法是_________。 A. 适当增加样本例数 B. 将个体变异控制在一个范围内 C. 严格挑选观察对象 D. 增加抽样次数 E. 减小系统误差 5. 关于t分布的图形,下述那项是错误的______。 A. 当ν趋于∞时,标准正态分布是t分布的特例 B. 当ν逐渐增大,t分布逐渐逼近标准正态分布 C. ν越小,则t分布的尾部越高 D. t分布是一条以ν为中心左右对称的曲线 E. t分布是一簇曲线,故临界值因自由度的不同而不同 6. 已知某地25岁正常成年男性的平均收缩压为,从该地随机抽取20名25岁正常成年男性,测得其平均收缩压为。与不同,原因是_________。 A. 样本例数太少 B. 抽样误差 C. 总体均数不同 D. 系统误差 E. 个体差异太大 7. 从上题的同一地区中再随机抽取20名8岁男孩,测得其平均收缩压为,标准差为。与不同,原因是________。 A. 样本例数太少 B. 抽样误差 C. 总体均数不同 D. 系统误差 E. 样本均数不可比 8. 用上题的样本,估计该地8岁正常男孩的平均收缩压的95%的置信区间为_______。 A. ±19,2/05.0t? B. ±? C. ±19,2/05.0t?20 D.

第五章参数估计作业

区间估计参数说明 1、从变量窗口中认识各个变量的含义 2、在已编辑好的数据中按Analyze――Descriptive Statistics――Explore,在弹出的窗口中, 左边的上部是各个变量名,右边分为三个部分,第一个是因变量窗口,即Dependent框。 第二个是分组变量窗口,即Factor。比如我们将班上的学生体重做分析,即体重为因变量窗口,性别为分组变量窗口。第三个为选择标识变量,当我们要寻找奇异值,即数值相对较大或者较小的值时,需要对数据标上标签,通常为序号。则要使用该变量值标识各观测值。 3、左边的下部,是Display栏,它分为三个选项:both:输出图形以及描述统计量,此为 系统默认。Statistics:只输出描述统计量。Plots:只输出图形。左边的下部也有三个选项,首先看Statistics,弹出的对话框有四个复选框,第一个为Descriptives,选中它即要求输出基本描述统计量。选择此项将输出平均数、中位数、众数、标准误、方差、极值、峰度、偏度等等。在Confidence intervals for mean均值的置信区间。在参数中键入不同的置信区间,可以得到不同的区间范围。常用的有90%、95%、99%。M-estimators为集中趋势的最大似然比的稳健估计,此项不要求掌握。Outliers 要求输出五个最大、最小值。Percentiles 要求输出百分位数。其次是Plots框,它分为三个部分,第一个为Boxplot 选择框,它要求作出各组因变量的并列箱图。第一项是:因变量按因素水平分组,各组因变量生成并列箱图,可以比较不同水平上的分布情况;第二项是:所有因变量生成一个并列箱图,可在同一水平上比较各因变量值的分布。第二个部分是Descriptive,包括茎叶图和直方图两种,我们选择直方图。下面的Normality plots with tests复选项,输出正态概率与离散正态概率图。Spread vs level with levene test 栏是方差齐次检验结果,不要求掌握。Option按钮,展开后有三个选项,分别表示在分析过程中,剔除带有缺失值的观测量(Exclude cases listwies)在分析中剔除中,不仅剔除缺失值还剔除那些与缺失值有成对关系的观测值(Exclude case pairwise)。分组变量中的缺失值将被单独分为一组。输出频数表时也包括缺失值组,但将标定出分组变量的缺失值(Report values)。 Levene检验:检验两个样本的数据是否具有相等方差时,虽然可以采用多种检测方法,但是多数都是基于数据必须服从正态分布这一假设,否则就失去数据检验的意义。Levene检验则较少依赖于正态性的假设,因而,它是等方差性检验的特别有效的方法。 Spread-level(幅度-水平)检验:幅度-水平图,是指框图的高度与各变量的水平或均值之间的关系。 正态性检验: 1、图示法: 偏态图:可以描绘这些点偏离直线的实际偏差,这种偏离直线的偏差则构成了偏态图。如果样本来自正态总体,这些点应该分布在一条过原点的水平线上,且没有任何模式;如果有一个明显的模式,则意味着总体并非正态分布。 正态概率图:对于正态概率图,每个观察值与其来自正态分布中的期望值组成数据点,这些数据点多数应落在一条直线上。 2、显著性水平检验法:

医学统计学习题 参数估计基础教学提纲

医学统计学习题参数 估计基础

实习六参数估计基础 [实习目的与要求] 1、掌握均数及频率标准误的计算;掌握总体均数95%和99%置信区间的计算 及适用条件;掌握总体概率的95%和99%置信区间的计算及适用条件 2、熟悉t分布的特征。 (一)最佳选择题 1. 表示均数抽样误差大小的统计指标是________。 A. 标准差 B. 方差 C. 均数标准差 D. 变异系数 E. 样本标准误 2. S表示________。 x A. 总体均数 B. 样本均数的标准差 C. 总体均数离散程度 D. 变量x的离散程度 E. 变量x的可靠程度 3. 标准误越大,则表示此次抽样得到的样本频率_________。 A. 系统误差大 B. 可靠程度越大 C. 抽样误差越大 D. 可比性越差 E. 代表性越差 4. 要减小抽样误差,通常的做法是_________。 A. 适当增加样本例数 B. 将个体变异控制在一个范围内 C. 严格挑选观察对象 D. 增加抽样次数 E. 减小系统误差 5. 关于t分布的图形,下述那项是错误的______。 A. 当ν趋于∞时,标准正态分布是t分布的特例 B. 当ν逐渐增大,t分布逐渐逼近标准正态分布 C. ν越小,则t分布的尾部越高 D. t分布是一条以ν为中心左右对称的曲线 E. t分布是一簇曲线,故临界值因自由度的不同而不同 6. 已知某地25岁正常成年男性的平均收缩压为113.0mmHg,从该地随机抽取20名25岁正常成年男性,测得其平均收缩压为119.0mmHg。113.0mmHg与119.00mmHg不同,原因是_________。 A. 样本例数太少 B. 抽样误差 C. 总体均数不同 D. 系统误差 E. 个体差异太大 7. 从上题的同一地区中再随机抽取20名8岁男孩,测得其平均收缩压为90.0mmHg,标准差为9.8mmHg。90.0mmHg与113.0mmHg不同,原因是 ________。 A. 样本例数太少 B. 抽样误差 C. 总体均数不同 D. 系统误差 E. 样本均数不可比

第 5 章 抽样调查及参数估计(练习题)

第五章 抽样调查及参数估计 5.1 抽样与抽样分布 5.2 参数估计的基本方法 5.3 总体均值的区间估计 5.4 总体比例的区间估计 5.5 样本容量的确定 一、简答题 1.什么是抽样推断?用样本指标估计总体指标应该满足哪三个标准才能被认为是优良的估计? 2.什么是抽样误差,影响抽样误差的主要因素有哪些? 3.简述概率抽样的五种方式 二、填空题 1.抽样推断是在 随机抽样 的基础上,利用样本资料计算样本指标,并据以推算 总体数量 特征的一种统计分析方法 。 2.从全部总体单位中随机抽选样本单位的方法有两种,即 重复 抽样和 不重复 抽样。 3.常用的抽样组织形式有 简单随机抽样 、 类型抽样 、等距抽样、 整群抽样 等四种。 4.影响抽样误差大小的因素有总体各单位标志值的差异程度、 抽样单位数的多少 、 抽样方法 和抽样调查的组织形式 。 5.总体参数区间估计必须具备估计值、 概率保证程度或概率度 、 抽样极限误差 等三个要素。 6.从总体单位数为N 的总体中抽取容量为n 的样本,在重复抽样和不重复抽样条件下,可能的样本个数分别是______________和_____________。 7.简单随机_抽样是最基本的抽样组织方式,也是其他复杂抽样设计的基础。 8.影响样本容量的主要因素包括总体各单位标志变异程度_、__允许的极限误差Δ的大小、_抽样方法_、抽样方式、抽样推断的可靠程度F(t)的大小等。 三、选择题 1.抽样调查需要遵守的基本原则是( B )。 A .准确性原则 B .随机性原则 C .代表性原则 D .可靠性原则 2.抽样调查的主要目的是( A )。 A .用样本指标推断总体指标 B .用总体指标推断样本指标 C .弥补普查资料的不足 D .节约经费开支 3.抽样平均误差反映了样本指标与总体指标之间的( B )。 A .实际误差 B .实际误差的平均数 C .可能的误差范围 D .实际的误差范围 4.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是( D ) 。 A .简单随机抽样 B .类型抽样 C .等距抽样 D .整群抽样 5.在其他情况一定的情况下,样本单位数与抽样误差之间的关系是( B )。 A .样本单位数越多,抽样误差越大 B .样本单位数越多,抽样误差越小 C .样本单位数与抽样误差无关 D .抽样误差是样本单位数的10% 6.用简单随机重复抽样方法抽取样本单位,如果要使抽样平均误差降低50%,那么样本n n N B N =!()!n N N A N n =-

第五章参数估计和假设检验Stata实现

第五章参数估计和假设检验的Stata实现本章用到的Stata命令有 例5-1 随机抽取某地25名正常成年男子,测得其血红蛋白含量如下: 146 7 125 142 7 128 140 1 7 144 151 117 118 该样本的均数为137.32g/L,标准差为10.63g/L,求该地正常成年男子血红蛋白含量总体均数的95%可信区间。 数据格式为

计算95%可信区间的Stata命令为: 结果为 该地正常成年男子血红蛋白含量总体均数的95%可信区间为(132.93~141.71) 例5-2 某市2005年120名7岁男童的身高X=123.62(cm),标准差s=4.75(cm),计算该市7岁男童总体均数90%的可信区间。 在Stata中有即时命令可以直接计算仅给出均数和标准差时的可信区间。 结果为: 该市7岁男童总体均数90%的可信区间(122.90~124.34)。 例5-3 为研究铅暴露对儿童智商(IQ)的影响,某研究调查了78名铅暴露(其血铅水平≥40 g/100ml)的6岁儿童,测得其平均IQ为88.02,标准差为12.21;同时选择了78名铅非暴露的6岁儿童作为对照,测得其平均IQ为92.89,标准

差为13.34。试估计铅暴露的儿童智商IQ的平均水平与铅非暴露儿童相差多少,并估计两个人群IQ的总体均数之差的95%可信区间。 本题也可以应用Stata的即时命令: 结果: 差值为4.86,差值的可信区间为0.81~8.90。 例5-4 为研究肿瘤标志物癌胚抗原(CEA)对肺癌的灵敏度,随机抽取140例确诊为肺癌患者,用CEA进行检测,结果呈阳性反应者共62人,试估计肺癌人群中CEA的阳性率。 Stata即时命令为 结果为 肺癌人群中CEA的阳性率为44.28%,可信区间为35.90%~52.82%。 例5-5 某医生用A药物治疗幽门螺旋杆菌感染者10人,其中9人转阴,试估计该药物治疗幽门螺旋杆菌感染者人群的转阴率。 Stata即时命令为

医学统计学习题参数估计基础

医学统计学习题参数估计基 础 -CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

实习六参数估计基础 [实习目的与要求] 1、掌握均数及频率标准误的计算;掌握总体均数95%和99%置信区间的计 算及适用条件;掌握总体概率的95%和99%置信区间的计算及适用条件 2、熟悉t分布的特征。 (一)最佳选择题 1. 表示均数抽样误差大小的统计指标是________。 A. 标准差 B. 方差 C. 均数标准差 D. 变异系数 E. 样本标准误 2. S表示________。 x A. 总体均数 B. 样本均数的标准差 C. 总体均数离散程度 D. 变量x的离散程度 E. 变量x的可靠程度 3. 标准误越大,则表示此次抽样得到的样本频率_________。 A. 系统误差大 B. 可靠程度越大 C. 抽样误差越大 D. 可比性越差 E. 代表性越差 4. 要减小抽样误差,通常的做法是_________。 A. 适当增加样本例数 B. 将个体变异控制在一个范围内 C. 严格挑选观察对象 D. 增加抽样次数 E. 减小系统误差 5. 关于t分布的图形,下述那项是错误的______。 A. 当ν趋于∞时,标准正态分布是t分布的特例 B. 当ν逐渐增大,t分布逐渐逼近标准正态分布 C. ν越小,则t分布的尾部越高 D. t分布是一条以ν为中心左右对称的曲线 E. t分布是一簇曲线,故临界值因自由度的不同而不同 6. 已知某地25岁正常成年男性的平均收缩压为,从该地随机抽取20名25岁正常成年男性,测得其平均收缩压为。与不同,原因是_________。 A. 样本例数太少 B. 抽样误差 C. 总体均数不同 D. 系统误差 E. 个体差异太大 7. 从上题的同一地区中再随机抽取20名8岁男孩,测得其平均收缩压为,标准差为。与不同,原因是________。 A. 样本例数太少 B. 抽样误差 C. 总体均数不同 D. 系统误差 E. 样本均数不可比 8. 用上题的样本,估计该地8岁正常男孩的平均收缩压的95%的置信区间为_______。 t? B. ±? A. ± 19 .0 05 ,2/

参数估计基础.

参数估计基础 抽样研究的目的是用样本信息推断总体特征,即用样本资料计算的统计指标推断总体参数 常用的统计推断方法有参数估计(总体均数和总体概率的估计)和假设检验 内容复习 第6章总体均数估计 抽样分布与抽样误差t分布总体均数及总体概率的估计案例讨论 掌握:均数和率抽样误差的概念;均数和率标准误的意义和计算;总体均数和总体率区间估计的意义、计算及其适用条件。 熟悉:总体均数的点估计;t 0.05,(ν)的概念,标准误和标准差的区别;置信区间与医学参考值范围的区别。复习一些概念 参数(parameter)与统计量(statistics) 参数获取的途径对总体进行研究抽样研究 抽样误差(sampling error) 1.抽样误差的概念:由个体变异产生的,随机抽样引起的样本统计量与总体参数间的差异。(抽样误差=总 体参数-样本统计量) 2.抽样误差产生的原因: 3.抽样误差的特点:随机,不可避免,有规律可循。 4.在大量重复抽样的情况下,可以展示其规律性 第一节抽样分布与抽样误差 一、均数的抽样分布与抽样误差 二、频率的抽样分布与抽样误差 (一)样本均数的抽样分布 1.抽样模拟实验 假定总体:某年某地13岁女学生身高值 X~N(155.4,5.3) 随机抽样:n=30,K=100

将此100个样本均数看成新变量值,则这100个样本均数构成一新分布,绘制直方图。 2.样本均数的抽样分布特点 ●各样本均数未必等于总体均数; ●样本均数之间存在差异; ●样本均数的分布规律:围绕着总体均数155.4cm,中间多,两边少,左右基本对称,服从正态分 布; ●样本均数的变异较原变量的变异减小。 3.抽样误差

参数估计的基础

参数估计基础

抽样研究的目的就是要用样本信息来推断相应总体的特征,这一过程称为统计推断。 统计推断包括两方面的内容:参数估计和假设检验

总体 样本抽取部分观察单位统计量参数 统计推断统计推断 statistical inference μ 如:样本均数样本标准差S 样本率P 如:总体均数总体标准差总体率σ πX 内容: 1.参数估计(estimation of parameters)包括:点估计与区间估计 2. 假设检验(test of hypothesis)

误差:泛指测得值与真值之差,样本指标与总体指标之差。误差按其产生的原因与性质分为两大类(系统误差和偶然误差)。 1.系统误差:由于受试对象、研究者、仪器设备、研究方法、非实验因素影响等确定性原因造成,有一定倾向性或规律性的误差。可以避免。

2.随机测量误差:由于多种无法控制的偶然因素引起,对同一样品多次测量数据的不一致。无倾向性,不可避免。只可控制在一定的范围内。 3.抽样误差:由个体变异产生的、由于抽样而造成的样本统计量与样本统计量及样本统计量与总体参数之间的差异称为抽样误差。无倾向性,不可避免。

均数的抽样误差、总体均数的估计、分布t 1、均数的抽样误差和标准误 抽样试验 以110名20岁健康男大学生的身高作为假设的有限总体,其总体均数,标准差。)(73.172cm =μ) (09.4cm =σ每次随机抽取10个人的身高作为一个样本,记录下数据并计算均数、标准差,再放回重新抽样,共重复100次,求得100个样本均数和标准差,其样本均数列入表3.1。

相关文档
最新文档