第五章参数估计作业
第五章活页习题(1)其他人答案

1第五章 参数估计1.一农场种植苹果用于生产果冻,假设苹果的甜度服从正态分布2(,)N μσ。
随机抽取30个苹果测量其甜度,结果存放在数据ex5_1中。
如需要,保留两位小数(下同)。
(1)用t 统计量计算苹果平均甜度μ的99%置信区间。
(2)将该样本看作大样本,用z 统计量计算苹果平均甜度μ的99%置信区间。
2.X 和Y 分别表示下肢瘫痪和正常成年男子的血液容量(单位ml )。
假设X 服从21(,)N μσ,Y 服从22(,)N μσ。
某医院在1天中对X 做了7次观测,对Y 做了10次观测。
在一周内对X 做了38次观测,对Y 做了31次观测。
数据保存在ex5_2中。
(1)根据1天的资料计算12μμ-的90%置信区间。
2(2)根据1周的资料计算12μμ-的90%置信区间。
3.某学校欲对学生每月消费支出进行调查,从200个班级中随机抽取20个班级作为样本。
(1)登记这20个班级全体同学的月消费支出,数据保存在ex5_3_1。
以95%的置信水平推断学生的平均月消费支出。
(2)在被抽中的每个班级中随机选取30人进行登记,数据保存在ex5_3_2。
以95%的置信水平推断学生平均月消费支出。
34.在一项政治选举中,某候选人在选民中随机调查发现,350名投票者中有200人支持他。
求全部选民中支持他的选民所占比重的置信水平为90%的置信区间。
5.某企业对一批数量为5000件的产品进行质量检验。
过去几次同类调查所得的产品合格率分别为93%、95%和96%。
(1)为了使合格率的误差不超过3%,若利用重复抽样,在99.73%的置信水平下应抽查多少件产品?45(2)为了使合格率的误差不超过3%,若利用不重复抽样,在99.73%的置信水平下应抽查多少件产品?6.数据ex5_6中存放着从某公司所有职工中随机抽取的412人的月工资收入资料。
(1)被调查职工的月平均工资是()元。
A.2198.2 B.2541.1 C.2847.5 D.2961.5(2)被调查职工月工资收入的标准差是()元。
统计第五章练习题

统计第五章练习题部门: xxx时间: xxx整理范文,仅供参考,可下载自行编辑第五章参数估计<一)单项选择题(在下列备选答案中,只有一个是正确的,请将其顺序号填入括号内>1.在抽样推断中,必须遵循( >抽取样本。
①随意原则②随机原则③可比原则④对等原则2.抽样调查的主要目的在于( >。
①计算和控制抽样误差②了解全及总体单位的情况③用样本来推断总体④对调查单位作深入的研究b5E2RGbCAP3.抽样误差是指< )。
①计算过程中产生的误差②调查中产生的登记性误差③调查中产生的系统性误差④随机性的代表性误差4.在抽样调查中( >。
①既有登记误差,也有代表性误差②既无登记误差,也无代表性误差③只有登记误差,没有代表性误差④没有登记误差,只有代表性误差5.在抽样调查中,无法避免的误差是( >。
①登记误差②系统性误差③计算误差④抽样误差6.能够事先加以计算和控制的误差是( >。
①抽样误差②登记误差③系统性误差④测量误差7.抽样平均误差反映了样本指标与总体指标之间的( >。
①可能误差范围②平均误差程度③实际误差④实际误差的绝对值8.抽样平均误差的实质是( >。
①总体标准差②全部样本指标的平均差③全部样本指标的标准差④全部样本指标的标志变异系数p1EanqFDPw9.在同等条件下,重复抽样与不重复抽样相比较,其抽样平均误差( >。
①前者小于后者②前者大于后者③两者相等④无法确定哪一个大10.在其他条件保持不变的情况下,抽样平均误差( >。
①随着抽样数目的增加而加大②随着抽样数目的增加而减小③随着抽样数目的减少而减小④不会随抽样数目的改变而变动DXDiTa9E3d11.允许误差反映了样本指标与总体指标之间的( >。
①抽样误差的平均数②抽样误差的标准差③抽样误差的可靠程度④抽样误差的可能范围12.极限误差与抽样平均误差数值之间的关系为( >。
第五章 区间估计课后练习题目

第五章 区间估计课后练习题目
• 3.一农场种植葡萄以生产果冻,假设葡萄的
甜度为 N(,,2) 服从正态分布 ,从27卡车葡萄
中,随机的抽取样本,每辆车取一个,然后测 量甜度,结果如下: • 16.0 15.2 12.0 16.9 14.4 16.3 15.6 12.9 15.3 • 15.8 15.5 12.5 14.5 14.9 15.1 16.0 12.5 14.3 • 15.4 13.0 12.6 14.9 15.1 15.3 12.4 17.2 14.8 • (1) 求葡萄平均甜度μ 的95%置信区间 • (2)求葡萄平均甜度μ 的给出置信下限的置信水 平为95%的单侧置信区间。
第五章 区间估计课后练习题目
• 4.X 和 Y 分别表示下肢瘫痪和正常成年男 子的血液容量,单位ml,假设 X 服从N(1, 2)
• Y 服从 N(2, 2)对X 做了7次观测,结果是1612, 1352,1456, 1222,1560,1456,1924, 对Y 做了10次观测,1082,1300,1092, 1040,910,1248,1092,1040,1092, 1288。求1 2的95%置信区间。
第五章 区间估计课后练习题目
• 8.某企业对一批产品进行质量检验,这批 产品的总数为5000件,过去几次同类调查 所得的产品合格率为93%、95%和96%,为 了使合格率的允许误差不超过3%,在 99.73%的概率下应抽查多少件产品?
第五章 区间估计课后练习题目
• 9.在一项政治选举中,一位候选人在选民 中随机地做了一次调查,结果是351名投票 者中有185人支持他,求全部选民中支持他 的选民所占比重的95%的近似置信区间。
第五章 参数估计

1
X 2 t n1 n2 2
2
2 Sp
n1
n2
X
1
X 2 z
2
2 S12 S 2 n1 n2
2 Sp
2 2 n1 1S1 n2 1S 2
n1 n2 2
20
例题:
分别在城市1和城市2中随机抽取n1=400, n2=500的职工进行调查,经计算两城市职工的 平均月收入及标准差分别为X1=1650元,
22
思考题:
一个研究机构做了一项调查,以确定稳定的吸 烟者每周在香烟上的消费额。他们抽取49位固 定的吸烟者,发现均值为20元,标准差5元。
1.总体均值的点估计是多少?
2.总体均值μ的95%置信区间是什么?
23
思考题解答:
1.总体均值的点估计是20元。
2.总体均值μ的95%置信区间: 随机变量X表示每周香烟消费额,由题意可知,X=20, S=5,1-α=0.95,α=0.05;n=49 属于大样本,σ 未知以S估计。总体均值μ的95%置信区间为
P z Z z 1 2 2
P L U 1
X P z z 1 2 2 n
Step3:将上面等式进行等价变换即可。
P L U 1
第五章 参数估计
第五章 参数估计
利用样本数据对总体特征进行推断,通常在以下 两种情况下进行:
当总体分布类型已知(如:正态),根据样本数据对 总体分布的未知参数进行估计或检验。参数估 计或参数检验。(如:μ或σ为何?) 当总体分布类型未知或知道很少,根据样本数据 对总体的未知分布的形状或特征进行推断。非参 数检验。(如:是否正态分布?是否随机?)
国开作业实用卫生统计学-第五章 参数估计 自测练习07参考(含答案)

题目:从某地随机抽取10名7岁男童,测得其平均收缩压为90mmHg,标准差为10mmHg,则7岁男童的收缩压的总体均数的95%的置信区间为()
选项A:)
选项A:p接近于1或0时
选项B:样本率不太大时
选项C:样本例数足够大
选项D:np和n(1-p)大于5时
答案:np和n(1-p)大于5时
题目:随机抽取北京8岁男童100名作样本,测得其平就能出生体重为3.20kg,标准差为0.5kg。
则总体均数95%置信区间的公式是()
选项A:)
选项A:是?( C )
选项A:假设检验
选项B:统计描述
选项C:区间估计
选项D:点估计
答案:点估计
题目:以下哪个是标准差的符号?()
选项A:б2
选项B:或 s
答案:б 或 s
题目:评价某人的某项指标是否正常,所用的范围是± Za/2 sp
选项A:对
选项B:错
答案:对
题目:率的标准误的大小表明了从同一总体随机抽样时,样本率与总体率之间的差别大小选项A:对
选项B:错
答案:对
题目:率的标准误越小,说明此次率的抽样误差越小
选项A:对
选项B:错
答案:对
题目:率的标准误用符号sp
选项A:对
选项B:错
答案:对。
卫生统计学七版 第五章参数估计基础电子教案

P0.05
第三节 总体均数及总体概率的估计
一、参数估计的基础理论
参数估计区 点间 估估 计计
对总体参数估计 称的 为范 置围 信区C间( I , co用 nfidenicneterv)al
表示,其置信1度 )为,(一般取置95信 %,度即为取 为0.05,此区
间的较小值称为 限置 ,信 较下 大值称为 限置 。信 一上 般进行双 区侧 间的估计。
卫生统计学七版 第五ຫໍສະໝຸດ 参数估 计基础第一节 抽样分布与抽样误差
一、样本均数的抽样分布与抽样误差
……
x15 .55 1 sx0.9617
样本均数的标准差越,大抽样误差就越大
样本均数的标准差称标为准误
x
n
sx
s n
sx称为标准误估计值,简也称标准误
标准误与标准差成正比 ,与样本含量成反比
标准误越大,抽样误差越大。
2、正态近似法
当已知时X: u
n
当未知但n足够大时X:u0.05
s n
X1.96 s n
或:X1.96s X
例5-3(P95) 某医生于2000年在某市随机抽取90名 19岁的健康男大学生,测量了他们的身高,得样本均数 为172.2cm,标准差为4.5cm,试估计该市2000年19岁健 康男性大学生平均身高的95%置信区间 。
对任意分布,在样本含量足够大时,其样本均数的分布都 近似正态分布,且样本均数的均数等于原分布的均数。
二、样本频率的抽样分布与抽样误差
总体率的标准误:
p
(1 )
n
率的标准误的估计值:
sp
p(1 p) n
标准误大抽样误差就大。
第二节 t分布
一、t分布的概念
应用统计-第05章-参数估计

χ 1-α / 2
χα / 2
2
χ2
第 五 章
27
5.2.3 总体方差的区间估计 总体方差σ2在(1-α)置信水平下的置信区间为:
(n − 1) s 2
2 χα / 2
≤σ 2 ≤
(n − 1) s 2
χ12−α / 2
例5.5
应 用 统 计 第 五 章
28
根据例5.1的数据,以95%的置信水平建立该种食品 重量方差的置信区间。 解:根据样本数据计算的样本标准差为:
(单位:周岁)
36 31 47 44 48 45 44 33 24 40 50 32
试确立投保人年龄90%的置信区间。
应 用 统 计 第 五 章
16
解:已知,n=36,1-α =90%,zα/2=1.645。由 于总体方差未知,但为大样本,可用样本方 差来求总体方差。 根据样本数据计算的样本均值和标准差如下:
10
5.1.3 评价估计量的标准 无偏性(unbiasedness) 无偏性是指估计量抽样分布的数学期望等 于被估计的总体参数。 有效性(effciency) 一个无偏的估计量并不意味着它非常接近 被估计的参数,它还必须与总体参数的离 散程度比较小。对同一总体参数的两个无 偏点估计量,标准差越小的估计量越有效。 相合性(consistency) 相合性是指随着样本容量的增大,点估计 量的值越来越接近被估总体的参数。
o μ – 2.58σx μ – 1.96σx μ – 1.65σx μ
μ + 1.65σx μ + 1.96σx μ + 2.58σx
x
90%的样本 95%的样本 99%的样本
应 用 统 计 第 五 章
8
统计学贾俊平-第五章-参数估计-练习题答案

0.058375,s0.005846, F ?2.464484, F1
0.405764
所以,方差比的置信区间为
4.051926,24.61011
5.10已知置信水平
95%,Z
/2
E1.96,120,E
20
所以,n
z
~Er
138.3,取n=139。
5.11已知
n1n2
n, E 5,112,
215,置信水平1
95%,Z
/2
1.96
所以,n
Z
2 2
1 2
256.7,取
E
n=57。
5.12已知置信水平1
95%,n1
n2n,E=0.05,取1
20.5
Z111212
所以
768.32,取n=769
12的置信区间为八01门2
(2)置信水平195%,
P1P2
0.1 1.96, 0.00096一0.00084
0.0168,0.1832
c
D
S
SI
0- 241609
S1A2
0. 058375
1S2
F0.076457
0- 005846
N
2. 464424
0-405764
1
2置信区间
5.9
Excel得,$0.241609, S20.076457, s;
统计学(第四版)贾俊平 第五章 参数估计 练习题答案
5.1(答案精确到小数点后两位)
(1)已知:n=49,15,
样本均值的标准误差X二=15荷2.14
(2)
已知:置信水平:1
95%,Z2
1.96,
(3)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
区间估计参数说明1、从变量窗口中认识各个变量的含义2、在已编辑好的数据中按Analyze――Descriptive Statistics――Explore,在弹出的窗口中,左边的上部是各个变量名,右边分为三个部分,第一个是因变量窗口,即Dependent框。
第二个是分组变量窗口,即Factor。
比如我们将班上的学生体重做分析,即体重为因变量窗口,性别为分组变量窗口。
第三个为选择标识变量,当我们要寻找奇异值,即数值相对较大或者较小的值时,需要对数据标上标签,通常为序号。
则要使用该变量值标识各观测值。
3、左边的下部,是Display栏,它分为三个选项:both:输出图形以及描述统计量,此为系统默认。
Statistics:只输出描述统计量。
Plots:只输出图形。
左边的下部也有三个选项,首先看Statistics,弹出的对话框有四个复选框,第一个为Descriptives,选中它即要求输出基本描述统计量。
选择此项将输出平均数、中位数、众数、标准误、方差、极值、峰度、偏度等等。
在Confidence intervals for mean均值的置信区间。
在参数中键入不同的置信区间,可以得到不同的区间范围。
常用的有90%、95%、99%。
M-estimators为集中趋势的最大似然比的稳健估计,此项不要求掌握。
Outliers 要求输出五个最大、最小值。
Percentiles 要求输出百分位数。
其次是Plots框,它分为三个部分,第一个为Boxplot 选择框,它要求作出各组因变量的并列箱图。
第一项是:因变量按因素水平分组,各组因变量生成并列箱图,可以比较不同水平上的分布情况;第二项是:所有因变量生成一个并列箱图,可在同一水平上比较各因变量值的分布。
第二个部分是Descriptive,包括茎叶图和直方图两种,我们选择直方图。
下面的Normality plots with tests复选项,输出正态概率与离散正态概率图。
Spread vs level with levene test 栏是方差齐次检验结果,不要求掌握。
Option按钮,展开后有三个选项,分别表示在分析过程中,剔除带有缺失值的观测量(Exclude cases listwies)在分析中剔除中,不仅剔除缺失值还剔除那些与缺失值有成对关系的观测值(Exclude case pairwise)。
分组变量中的缺失值将被单独分为一组。
输出频数表时也包括缺失值组,但将标定出分组变量的缺失值(Report values)。
Levene检验:检验两个样本的数据是否具有相等方差时,虽然可以采用多种检测方法,但是多数都是基于数据必须服从正态分布这一假设,否则就失去数据检验的意义。
Levene检验则较少依赖于正态性的假设,因而,它是等方差性检验的特别有效的方法。
Spread-level(幅度-水平)检验:幅度-水平图,是指框图的高度与各变量的水平或均值之间的关系。
正态性检验:1、图示法:偏态图:可以描绘这些点偏离直线的实际偏差,这种偏离直线的偏差则构成了偏态图。
如果样本来自正态总体,这些点应该分布在一条过原点的水平线上,且没有任何模式;如果有一个明显的模式,则意味着总体并非正态分布。
正态概率图:对于正态概率图,每个观察值与其来自正态分布中的期望值组成数据点,这些数据点多数应落在一条直线上。
2、显著性水平检验法:Shapiro-wilks检验:当均值与方差均未知而必须从数据中估计时使用。
Lilliefors正态检验法:当显著性水平significance<0.05时,固然可以拒绝正态假设。
但是,当样本规模比较大时,任何拟合度的检验,几乎都认为有理由拒绝原假设。
因此难以找到一个服从正态分布的数据。
所以,对于大规模的样本数据,不仅要考察观察值的显著性水平,而且还必须考察其对正态分布的实际偏离程度。
平稳估计量如果我们对数据来源的总体做出某个假定,则将会求出更好的分布位置的估计量,这种估计量称为平稳(或稳健)估计量。
二、修正均值:1、修正均值由于均值受极值影响很大,因此,可以通过去掉一些远离主体数据的极值,进而获得一个分布位置的简单而平稳的估计量。
修正均值的优点:与中位数法一样,此法生成的统计量也不受极值的影响。
与中位数不同的是:它并非仅仅基于位于中央的单一值(奇数)或两个数值(偶数),而是基于位于中央的多个数值。
中位数可作为一个50%的修正平均值。
高于或低于中位数的各占半数的数据将被忽略。
总之,调整后的均值比中位数可更好的描述数据。
M估计修正平均值,是把个案分为两组,一组用来计算均值,另一组则作为比较,然后观测两组频次,并分别赋予其权重1和0,最后计算其加权平均数。
另一种折中的方法,是把极值包括在计算之内,而赋予一个权重较小的。
这种方法可以借助M估计或采用广义极大似然度估计。
所有常用的M估计在赋予权重的时候,观察值离分布中心越远,权重就越小,反之亦然。
常见的M估计有4种:Huber的M估计量、Hampel的M估计量、Tukey的M估计量、Andrew的M估计量。
区间估计作业1Lisa Rae Bock在1994年开办了一家Bock投资服务公司(Bock Investment Services,BIS),旨在给南加利福尼亚货币市场提供咨询服务和指导。
为了给其目前的客户提供更好的服务并吸引新客户,她每周做一次简讯。
为了更好地反映每周对基金管理者电话调查的结果,Lisa正在考虑向简讯中增加一项内容。
为了对提供这种服务的可能性进行调查,以便确定在简讯中包含哪些信息,Lisa选取了45种货币市场基金组成一个简单随机样本,部分数据如下表所示,它们报告了基金的资产、最近7天和最近30天的获益率。
在给基金管理者打电话以获取更多的信息之前,Lisa决定先对已搜集的数据做一些初步分析。
表:Bock投资服务公司问题中所用的数据货币市场基金资产(百万美元)过去7日的获益率(%)过去30日的获益率(%)AmcoreAlger Arch MM/Trust BT Instit Treas Benchmark DirBradfordCapital cash Cash Mgt TrustComposite Cowen StandbyCorlandDeclarationDreyfusElfunFFB Cash Federated Master Fidelity CashFlex-fundFortis Franklin Money Freedom cash Galaxy Money Government Cash Hanover Cash Heritage Cash Infinity/Alpha John Hancock Landmark FundsLiquid cash Mardet Watch Merrill LynchMoney103.9156.7496.5197.82755.4707.61.72707.8122.8694.7217.338.44832.881.7506.2738.713272.8172.8105.6996.81079.0801.4409.4794.31008.353.6226.4481.3388.910.627005.6113.44.104.794.174.374.543.884.294.144.034.253.572.674.014.514.174.414.514.603.873.974.074.113.834.324.083.993.934.284.614.134.244.224.084.734.134.324.473.834.224.043.914.193.512.613.894.414.114.344.424.483.853.924.013.963.824.234.003.913.874.264.644.054.184.20NCC Funds Nationwide Overland Pierpont Money Portico Money Prudential MoneyMart Reserve Primary Schwab Money Smith Barney CashStagecoach Strong Money Transamerica Cash United Cash Woodword Money517.3 291.5 1991.7 161.6 6835.1 1408.0 10531.0 2947.6 1502.2 470.2 175.5 323.7 1330.0 4.22 4.26 4.50 4.28 4.20 3.91 4.16 4.16 4.18 4.37 4.20 3.96 4.24 4.14 4.17 4.40 4.20 4.16 3.86 4.07 4.12 4.13 4.29 4.19 3.89 4.21资料来源:Barron’s ,October 3,19941. 用适当的描述统计量汇总货币市场基金的资产和获益率数据。
2. 求货币市场基金总体的资产均值、最近7天的获益率和最近30天的获益率的95%置信区间估计。
并对该区间估计做出管理上的解释。
3. 从Lisa 该如何在其每周的简讯中使用这些信息的角度上看,你的统计结果能说明什么?4. 为了向客户提供最有用的信息,你建议Lisa 还需要搜集一些其它什么信息? 区间估计作业2谢尔工业公司拟采用一项计算机辅助程序来培训公司的维修支援掌握及其维修的操作,以减少培训工人所需要的时间。
为了评价这种培训方法,生产经理需要对这种程序所需要的平均根据上述资料建立置信度为95%的总体均值的区间估计。
(假定培训时间总体服从正态分布)。
区间估计作业3斯泰特怀特保险公司每年都需对人寿保险单进行审查,现公司抽取36个寿保人作为一个简单随即样本,得到关于、投保人年龄、保费数量、保险单的现金值、残废补偿选择等项目的资料。
为了便于研究,某位经理要求了解寿险投保人总体平均年龄的90%的区间估计。
区间估计作业4为估计两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排12名工人,每个工人组装一件产品所需的时间(分钟)下如表。
假定两种方法组装产品的时间服从正态分布,且方差相等。
试以95%的置信水平建立两种方法组装产品所需平均时间差值的置区间估计作业5沿用前例。
假定第一种方法随机安排12名工人,第二种方法随机安排名工人,即n1=12,n2=8,所得的有关数据如表。
假定两种方法组装产品的时间服从正态分布,且方差不相等。
以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间。