第十章 统计量与参数估计

第十章 统计量与参数估计
第十章 统计量与参数估计

第十章 统计量与参数估计

§10.1 样本与统计量

一. 总体与样本

例1 欲了解一批灯泡的寿命X (小时)的分布情况,只能抽取n 个作破坏性试验,根据试验结果来推断X 的分布。 1.总体与个体

研究对象的全体称为总体。例1中,我们关心的是全体灯泡寿命的分布情况,即寿命X 的所有可能的取值及其概率分布。因此寿命X 是连续的随机变量。一般地把我们关心的随机变量X 称为总体。

组成总体的每个单元称为个体。例1中,我们关心的是灯泡的寿命。所以个体也可理解为总体X 的取值。 2.简单随机抽样

为了使抽样具有充分的代表性,所以要求: (1)每个个体被抽到的机会均等; (2)每次抽取是独立的(共抽取n 次)。

这样的抽样叫做简单随机抽样。通常的抽样都是无放回的,当总体很大时,可以满足独立性。 3.样本

在总体中抽取n 个个体,称为总体的一个样本,记为 ( X 1 , X 2 , … , X n ) ,其中每次抽样X i ( i = 1 , 2 , … , n )也都是随机变量(解释),共n 个随机变量,加上括号,表示样本是一个整体。 4.样本的容量

抽取的个体数n ,称为样本的容量。

5.独立同分布

每次抽取的X i 来自总体,应该与总体X 有相同的分布(概率密度相同),所以说样本是一组具有独立同分布的随机变量。 6.样本观察值(样本值)

样本的测试结果记为 ( x 1 , x 2 ,… , x n ) ,是一组数据,在容易产生误会时,大小写要分清,尤其在作理论分析时,一般都取大写,作为随机变量处理。

二.统计量

1.三个重要统计量

(1)样本均值:∑==n

i i X n X 1

1

(2)样本方差:∑=--=n

i i X X n S 1

22

)(11 (3)样本标准差(又称为样本均方差 ):2S S =

其中X 作为均值可以反映总体X 的均值(不是等同),S 2 是数据与均值偏离值平方的平均,体现样本的离散程度,因而可以反映总体X 的方差。

x 和s (计算值)可以利用函数计算器的统计功能快速得到(可安排多媒体

课件演示)。 2.统计量的概念

统计量是含有样本X 1 , X 2 , … , X n 的一个数学表达式,并且式中不含未知参数,因而可以在得到样本值后立即算出它的数值来。

在抽样之前,统计量的值无法确定,抽样测试之后,可以观察到它的取值,因此统计量是随机变量,是由样本派生出来的随机变量。

三.抽样分布

统计量既然是随机变量,当然有它的概率分布,称为抽样分布。以下仅给出结论,结论都对正态总体而言。

1.样本均值的分布

(1)若总体X ~2(,)N μσ,则i X ~2(,)N μσ(独立同分布),于是作为线性函数

11n

i i X X n ==∑~2,N n σμ?? ? ??

? (2

)特别地,标准化以后,得X U =

~(0,1)N 。

2.t 分布

当总体标准差σ未知时,U 不再是统计量,这时可用样本标准差S 代替,但不再是正态分布,而是一种新的分

X T =

~(1)t n -叫做服从于自由度1-n 的t 分布。它的密度曲线与正态曲

线相类似 (见图8)。 3.2

χ分布

为了将样本方差S 2和总体相比较、联系。构造出

2

2

2

(1)n S χσ-=

~2(1)n χ-,

叫做服从于自由度为1-n 的2

χ分布,也是一种新的分布。其密度曲线 (见图9)在原点右侧,这是因为2

χ统计量是不会出现负值的。

U 、T 、2

χ是继X 、2S 、S 后第二轮复合而成的统计量,可以更有利于

实际的应用。

四.临界值

1.设U ~N (0,1) ,有关U 的概率可查表。如果反过来,已知概率α,求λ使αλ=>)(U P 或αλ-=≤1)(U P ,倒查表得到的λ称为标准正态分布的右侧α临界值,意为右侧的概率为α,又叫α分位点,记为αU (见图10)。

若求使αλ=>)(U P ,则查表得到的是2/αλU =,称为双侧α临界值 (见图11),意为对称两侧的概率之和为α,它们的概率意义分别是

αα=>)(U U P 和

αα=>)(2/U U P 。

比如645.105.0=U ,96.1025.0=U 。

2.t 分布和

2χ分布的右侧临界值记为)(n t α和)(2

n αχ。括号内的n 是自由度,

不要与样本容量相混淆,如602

.2)15(01.0=t ,067.14)7(05.02=χ的概率意义为01.0)6025

.2)15((=>t P 05.0)067.14)7((2=>χP (见图12、13) t 分布表和2χ分布表已直接编为临界值表,不必“倒查表”。

正态分布和t 分布的左侧临界值是对称值αU - 和)(n t α-(左侧概率为α),不必另行查表。

而2χ分布无对称性,左侧临界值是

)(21n αχ-(右侧概率是α-1,左侧概率当然是α)(见图14),需另行查表。

)(2n χ分布的双侧临界值(见图15)是

21()n αχ-(左)和)(2

2

n αχ(右)

。 例2 求满足以下概率式的临界值并给

出对应的记号

(1)05.0))14((2

=<λχP , 则517.0)14(95.02

==χλ;

(2)05.0))8((=<λt P , 则8595.1)8(95.0-=-=t λ; (3)05.0))8((=>λt P , 则3060.2)8(925.0==t λ;

(4)05.0)(=<λU P , 则645.195.0-=-=U λ; (5)05.0)(=>λU P , 则96.1925.0==U λ。

例3 对于查表得到的

7638.2)10(01.0=t 和483.20)10(2

0025=χ,

给出它们的概率意义。

解 01.0)7638

.2)10((=>t P , 01.0)7638.2)10((=-

02.0)7638.2)10((=>t P , 025.0)483.20)10((2=>χP , 975.0)483.20)10((2=<χP 。

§10.2 点估计

一.点估计的概念

总体X 的分布类型往往是已知的,如),(2σμN ,但它的参数不知道,要通过样本来估计,称为点估计。

二.样本数字特征法

用样本的均值、方差来估计总体的均值、方差是很自然的,即

11?n i i X X n μ===∑,2221

1?()1n i i S X X n σ===--∑,?S σ= 这里在字母上加一个“帽子”是为了表明这仅仅是估计值而非准确值。这样的估计方法称为样本数字特征法。

例1 某果园有1000株果树,在采摘前欲估计果树的产量,随机抽选了10株,产量(公斤)分别为 :

161, 68, 45, 102, 38, 87, 100, 92, 76, 90

假设果树的产量服从正态分布,试求果树产量的均值与标准差的估计值,并估计一株果树产量超过100公斤的概率。

解 利用计算器的统计功能,可计算得到产量均值9.85?==x μ

公斤,标准差22.34?==S σ

公斤。于是 3409.0)41.0(122.349.851001)100(=Φ-=??

?

??-Φ-=>X P

即一株果树产量超过100公斤的概率为0.34 。

三.估计量及其评选标准

用来估计未知参数的统计量(如X 、2

S )称为估计量。一般的提法是:设θ

是总体X 的未知参数,找一个统计量(表达式)),,,(??21n

X X X θθ=来估计θ,即以θ?的观测值作为θ的估计值,则称θ?为θ的估计量。这里θ是未知的但客观存在的固定常数,不是随机变量,而θ?是随样本值而变动的,是随机变量。估计量不是唯一的,可以通过多种途径和方法去寻找、构造,如矩估计法、最大似然估计法等,应该制定一套评判标准来评价它们的优劣。

(1)无偏性

设θ?是θ的估计值,若θθ=)?(E ,则称θ?是θ的无偏估计量。其统计意义是:

θ?是随机变量,它的波动中心(均值)等于θ,即经过多次抽样,θ?的观察值将

围绕着θ变动,没有“系统”误差,当然是较好的。

X 和2S 都分别是总体均值μ,总体方差2

σ的无偏估计,其中μ=)(X E 显

然,而2

2)(σ=S E 的推导复杂,S 2 的表达式中,分母是1-n 而不是n ,正是

为了满足无偏性。

(2)有效性

对于多个无偏估计量,方差小的波动小,稳定性好。即方差)?(θ

D 越小越好,设θθθ==)?()?(21

E E (都是无偏估计),若)?()?(21θθD D <,则称1?θ比2

?θ有效。 X 是的所有无偏估计中最有效的。

§10.3 区间估计

一.置信度与置信区间

有了点估计,还要进一步作误差估计,数理统计中的误差估计必然具有概率特征,即要用概率去描述,要与概率相联系。设θ是未知参数,希望确定一个区间( a , b ) ,使它包含θ的把握很大,写成概率式,即 αθ-=<<1)(b a P 。取

05.0=α时,把握是0.95%。α往往事先取定,α-1称为置信度。( a , b ) 称为参数θ的α-1置信区间,a 称为置信下限,b 称为置信上限。

二.正态总体的区间估计

直接求置信区间难度较大,实际求解时,往往从已知的统计量入手。比如统

计量(U X μ=-~(0,1)N 分布已知,如果总体标准差σ已知,那么关于U 的不等式变形可得到关于μ的不等式,所以只需求 A , B ,使

α-=<<1)(B U A P 即可。满足此式的区间很多,其中“区间居中”是效果最好的,所谓“区间居中”是指区间左侧和右侧的概率相等,都等于2α。因为正态分布有对称性,区间居中的概率公式是{}αλ-=<1U P ,于是可确定2/αλU =,将不等式2/2/ααU U U <<-变形可得

22U U X X ααμ-<<+

(1)正态总体方差2

σ已知时,均值μ的置信区间 按上面的公式,置信区间是

2U ,U X X αα?

-+ ?

注意:σ已知时,应借助于U 统计量,要查正态分布表;置信区间有两个端点,所以要找双侧临界值(下标带有2/α)

例2 设总体X ~(,0.09)N μ,测得n = 4 的样本观测值为:12.6,13.4,12.8,13.2,求μ的0.95置信区间。

解 05.0=α,3.0=σ已知,采用U 统计量,查表得96.1025.0=U ,计算

13=x ,所以置信限为

94.2134

3.096.113025

.0±=?

±=±n

U x σ

置信区间为( 12.706 , 13.294 )。

(2)正态总体方差2

σ未知时,均值μ的置信区间

σ未知,以S 代替,得到t 统计量,要查t 分布表;置信区间公式类似为

???

?

??-+--n S n t X n S n t X )1(,)1(22αα 例3 例2中设X ~2(,)N μσ,2

σ 未知,求μ的置信区间(取05.0=α)。

解 计算得13=x ,3651.0=S 。σ未知,采用t 统计量,查表得

1824.3)14(025.0=-t ,所以置信限为

581.0134

3651.01824.313)

3(025.0±=?

±=±n

t x σ

置信区间为( 12.419 , 13.581 )。

例3的信息量比例2少(σ未知),在同样的置信度下置信区间比较宽,精度比较小是很自然的。

(3)正态总体方差2

σ及标准差σ的置信区间

2χ统计量就是为提取2σ的信息而设计的,所以借助于2χ统计量,由概率式}{αχ-=<<12b a P 及区间居中原理。可得21(1)a n αχ-=-,

2

(1)b n αχ=-,利用不等式

2

2

2122

(1)(1)(1)n S n n ααχ

χσ---<

<-

变形,得到2σ的置信区间是

2222212(1)(1),χ(1)χ(1)n S n S n n αα-??

-- ? ?--??

。 σ的置信区间,只需将端点开平方即可

σ<< 例4 设零件长度)(mm X ~2(,)N μσ,抽取n = 16件零件测量,经计算得

087.12=x ,00507.02=s S 2 = 0.00507,求零件长度与标准差的置信区间

(05.0=α)。

解 σ未知,求μ的置信区间应采用t 统计量,查表得t 0.025(15)=2.1315,置

信限为

0.02512.087 2.131512.0870.038x t ±=±=± 均值μ的置信区间为( 12.049 , 12.125 )。

σ的置信区间,采用2χ统计量,查表得262.6)15(2975.0=χ,

488.27)15(2025..0=χ,2σ的置信区间为

??

?

????262.600507.015,488.2700507.015

开方后即标准差σ的置信区间:( 0.0526 , 0.1102 )

三.置信度的选择

对于同一个样本,信息量是固定的,于是会出现“有得必有失”的局面:如果提高置信度,就会降低估计精度(置信区间变宽);反之,想提高估计精度,就需降低置信度。如果希望两者都提高,则只有增加样本容量,即增加信息量。

在做区间估计时,首先要选择合适的统计量(三种情形),这不仅关系到查哪一张表,用哪一个置信区间公式的问题,还为下一节学习假设检验打下必要的基础。

(完整版)统计学习题答案第5章参数估计

第5章 参数估计 ●1. 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。 (1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,允许误差是多少? 解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差 x σσ5=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×0.7906=1.5496。 ●2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。 (3) 假定总体标准差为15元,求样本均值的抽样标准误差; (4) 在95%的置信水平下,求允许误差; (5) 如果样本均值为120元,求总体均值95%的置信区间。 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为 x σσ15=2.1429 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×2.1429=4.2000。 (3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96, 这时总体均值的置信区间为 α/2 x Z 0±4.2=124.2115.8 可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。 ●3.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.2 4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5

统计学第七章、第八章课后题答案

统计学复习笔记 第七章参数估计 一、思考题 1.解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2.简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3.怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4.解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以的概率覆盖总体参数。 5.简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 (z 2 )2 2其中: E z n n E22 其中: E z 2 n 2. 样本量n 与置信水平1- α、总体方差、估计误差E之间的关系为与置信水平 成正比,在其他条件不变的情况下,置信水平越大,所

第五章+统计学教案(假设检验)

第五章+统计学教案(假设检验)参数估计和假设检验是统计推断的两个组成部分,它们分别从不同的角度利用样本信息对总体参数 进行推断。前者讨论的是在一定的总体分布形式下,借助样本构造的统计量,对总体未知参数作出估计 的问题;后者讨论的是如何运用样本信息对总体未知参数的取值或总体行为所做的事先假定进行验证, 从而作出真假判断。通俗地、简单地说,前者是利用样本信息估计总体参数将落在什么范围里;而后者 则是利用样本信息回答总体参数是不是会落在事先假定的某一个范围里。 通过本章学习,要求学生在充分理解有关抽样分布理论的基础上,理解掌握假设检验的有关基本概 念;明确在假设检验中可能犯的两种错误,以及这两种错误之间的联系;熟练掌握总体均值和总体成数 的检验方法,主要是 Z 检验和 t 检验;对于非参数的检验,也应有所了解,包括符号检验、秩和检验与游程检验等。 2 一、假设检验概述与基本概念 1、假设检验概述 2、假设检验的有关基本概念 二、总体参数检验 1、总体平均数的检验 2、总体成数的检验

3、总体方差的检验 三、总体非参数检验 1、符号检验 2、秩和检验 3、游程检验 一、假设检验的有关基本概念; 二、总体平均数与总体成数的检验; 三、非参数检验; 一、假设检验的基本思路与有关概念; 二、两类错误的理解及其关系; 一、假设检验概述 假设检验:利用统计方法检验一个事先所作出的假设的真伪,这一假设称为统计假设,对这一假设 所作出的检验就是假设检验。 基本思路:首先,对总体参数作出某种假设,并假定它是成立的。然后,根据样本得到的信息(统 计量),考虑接受这个假设后是否会导致不合理的结果,如果合理就接受这个假设,不合理就拒绝这个 假设。 所谓合理性,就是看是否在一次的观察中出现了小概率事件。 小概率原理:就是指概率很小的事件,在一次试验中实际上是几乎不可能出现。这种事件可以称其 为“实际不可能事件”。 二、假设检验的基本概念

应用统计学:参数估计习题及答案

简答题 1、矩估计的推断思路如何?有何优劣? 2、极大似然估计的推断思路如何?有何优劣? 3、什么是抽样误差?抽样误差的大小受哪些因素影响? 4、简述点估计和区间估计的区别和特点。 5、确定重复抽样必要样本单位数应考虑哪些因素? 计算题 1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计,并考量估计结果符合什么标准 2、某学校用不重复随机抽样方法选取100名高中学生,占学生总数的10%,学生平均体重为50公斤,标准差为48.36公斤。要求在可靠程度为95%(t=1.96)的条件下,推断该校全部高中学生平均体重的范围是多少? 3、某县拟对该县20000小麦进行简单随机抽样调查,推断平均亩产量。根据过去抽样调查经验,平均亩产量的标准差为100公斤,抽样平均误差为40公斤。现在要求可靠程度为95.45%(t=2)的条件下,这次抽样的亩数应至少为多少? 4、某地区对小麦的单位面积产量进行抽样调查,随机抽选25公

顷,计算得平均每公顷产量9000公斤,每公顷产量的标准差为1200公斤。试估计每公顷产量在8520-9480公斤的概率是多少?(P(t=1)=0.6827, P(t=2)=0.9545, P(t=3)=0.9973) 5、某厂有甲、乙两车间都生产同种电器产品,为调查该厂电器产品的电流强度情况,按产量等比例类型抽样方法抽取样本,资料如下: 试推断: (1)在95.45%(t=2)的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围 (2)以同样条件推断其合格率的可能范围 (3)比较两车间产品质量 6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件,其中合格品190件,要求: (1)计算样本合格品率及其抽样平均误差

统计学答案第七章

1 估计量的含义是指()。 A.用来估计总体参数的统计量的名称 B.用来估计总体参数的统计量的具体数值 C.总体参数的名称 D.总体参数的具体数值 2 在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与总体参数的离差越小越好。这种评价标准称为()。 A.无偏性 B.有效性 C.一致性 D.充分性 3 根据一个具体的样本求出的总体均值的95%的置信区间()。 A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C.一定包含总体均值 D.要么包含总体均值,要么不包含总体均值 4 无偏估计是指()。 A.样本统计量的值恰好等于待估的总体参数 B.所有可能样本估计值的数学期望等于待估总体参数 C.样本估计值围绕待估总体参数使其误差最小 D.样本量扩大到和总体单元相等时与总体参数一致 5 总体均值的置信区间等于样本均值加减边际误差,其中的边际误差等于所要求置信水平的临界值乘以()。 A.样本均值的抽样标准差 B.样本标准差 C.样本方差 D.总体标准差 6 当样本量一定时,置信区间的宽度()。 A.随着置信系数的增大而减小 B.随着置信系数的增大而增大 C.与置信系数的大小无关 D.与置信系数的平方成反比 7 当置信水平一定时,置信区间的宽度()。 A.随着样本量的增大而减小 B.随着样本量的增大而增大 C.与样本量的大小无关 D.与样本量的平方根成正比 8 一个95%的置信区间是指()。 A.总体参数有95%的概率落在这一区间内 B.总体参数有5%的概率未落在这一区间内 C.在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数 D.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数

统计学 第四版 第七章答案

第四章 抽样分布与参数估计 7.2 某快餐店想要估计每位顾客午餐的平均花费金额。在为期3周的时间里选取49名顾客 组成了一个简单随机样本。 (1)假定总体标准差为15元,求样本均值的抽样标准误差。 x σ= = =2.143 (2)在95%的置信水平下,求边际误差。 x x t σ?=?,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ?=?2x z ασ=?0.025x z σ=?=1.96×2.143=4.2 (3)如果样本均值为120元,求总体均值 的95%的置信区间。 置信区间为: (),x x x x -?+?=()120 4.2,120 4.2-+=(115.8,124.2) 7.4 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。 要求: 大样本,样本均值服从正态分布:2,x N n σμ?? ??? 或2 ,s x N n μ?? ??? 置信区间为: x z x z αα ?-? +? ? (1)构建μ的90%的置信区间。 2z α=0.05z =1.645,置信区间为:()81 1.645 1.2,81 1.645 1.2-?+?=(79.03,82.97) (2)构建μ的95%的置信区间。 2z α=0.025z =1.96,置信区间为:()81 1.96 1.2,81 1.96 1.2-?+?=(78.65,83.35) (3)构建μ的99%的置信区间。 2z α=0.005z =2.576,置信区间为:()81 2.576 1.2,81 2.576 1.2-?+?=(77.91,84.09) 7.7 某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取 36 解:

统计学原理课后习题答案 第五章 抽样及参数估计

统计学原理课后习题答案 第五章 抽样及参数估计 1.①由题意可知本题属于:纯随机重复抽样下的总体比例区间估计。 已知:n=1000,828 82.8%1000 p = =,(Z)195.45%F α=-= ,查表得/2=2Z α 由于不知总体标准差,用样本的标准差代替: p 82.8%282.8% 2.4%Z α±=±? =± 即:80.4%P 85.2%≤≤ 所以该城市拥有彩电家庭比例的置信区间为80.4%—85.2%。 ②由题意可知本题属于:重复抽样时比例的必要抽样数目。 已知: 82.8%p =,5%p ?= ,(Z)199.73%F α=-= ,查表得/2=3Z α 由于不知总体标准差,用样本的标准差代替: 222 2 (1P) 382.8%(1-82.8%)5130.05 p z P n -??= =≈? 2.由题意可知本题属于:纯随机重复抽样下的总体平均数的抽样极限误差 已知:n=100,=3x ,=0.8σ ,(Z)195%F α=-= ,查表得/2=1.96Z α /2 = 1.960.16Z α?=?= 分钟 3.(1) 已知:n=150,123 82%150 p = =,(Z)199.73%F α=-= ,查表得/2=3Z α 由于不知总体标准差,用样本的标准差代替: p 82%382%9.41%Z α±=±? =± 即:72.59%P 91.41%≤≤ (2)已知:n=150,=2x ,=0.75σ ,(Z)199.73%F α=-= ,查表得/2=3Z α

/2 0.75 2320.2x Z αμ=±=±?=± 分钟 即:1.8 2.2μ≤≤ 4. 已知: 200σ=,30z ?= ,(Z)195%F α=-= ,查表得/2=1.96Z α 则:22 222 2 1.9620017130 z z n σ?==≈? 户 (1)如上图 (2)40名职工的平均考核成绩为3070 40 76.75xf x f = = =∑ 样本的方差为2 2 ()4777.5 s 122.54x x f f -= = =∑∑ (Z)195%F α=-= ,查表得到/2 1.96Z α= /2 76.75 1.911.07 676.75 3.43s x Z α±=±?=± 即在95%的概率保证度下,该企业工人的平均考核成绩在73.32到80.18直接。 (3)已知:n=40,36 90%40 p = =,(Z)195%F α=-= ,查表得/2=1.96Z α 由于不知总体标准差,用样本的标准差代替:

统计学第七章、第八章课后题答案.doc

统计学复习笔记 第七章 一、 思考题 1. 解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2. 简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3. 怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4. 解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。 5. 简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=

统计学答案解析最新版本

统计学课本课后作业题(全) 题目: 第1章:P11 6,7 第2章:P52 练习题3、9、10、11 第3章:P116思考题12、14 练习题16、25 第4章:P114 思考题6,练习题2、4、6、13 第5章:P179 思考题4、练习题3、4、6、11 第6章:P209 思考题4、练习题1、3、6 第7章:P246思考题1、练习题1、7 第8章:P287 思考题4、10 练习题2、3 第一章 6..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体;最近的一个集装箱内的全部油漆; (2)描述研究变量;装满的油漆罐的质量; (3)描述样本;最近的一个集装箱内的50罐油漆; (4)描述推断。50罐油漆的质量应为4.536×50=226.8 kg。 7.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求:答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第二章 3.某百货公司连续40天的商品销售额如下(单位:万元):

统计学参数估计练习题

第7章参数估计 练习题 一、填空题(共10题,每题2分,共计20分) 1.参数估计就是用_______ __去估计_______ __。 2. 点估计就是用_______ __的某个取值直接作为总体参数的_______ __。3.区间估计是在_______ __的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减_______ __得到。 4. 如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为_______ __,也成为_______ __。 5.当样本量给定时,置信区间的宽度随着置信系数的增大而_______ __;当置信水平固定时,置信区间的宽度随着样本量的增大而_______ __。 6. 评价估计量的标准包含无偏性、_______ __和_______ __。 7. 在参数估计中,总是希望提高估计的可靠程度,但在一定的样本量下,要提高估计的可靠程度,就会_______ __置信区间的宽度;如要缩小置信区间的宽度,又不降低置信程度,就要_______ __样本量。 8. 估计总体均值置信区间时的估计误差受总体标准差、_______ __和_______ __的影响。 9. 估计方差未知的正态总体均值置信区间用公式_______ __;当样本容量大于等于30时,可以用近似公式_______ __。 10. 估计正态总体方差的置信区间时,用_____ __分布,公式为______ __。 二、选择题(共10题,每题1分,共计10分) 1.根据一个具体的样本求出的总体均值的95%的置信区间 ( )。 A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C.一定包含总体均值 D. 要么包含总体均值,要么不包含总体均值 2.估计量的含义是指( )。 A. 用来估计总体参数的统计量的名称

统计学第七章、第八章课后题答案

统计学复习笔记 第七章 参数估计 一、 思考题 1. 解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2. 简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3. 怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4. 解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。 5. 简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 2. 样本量n 与置信水平1-α、总体方差 、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=

统计学第四版第七章答案

第四章 抽样分布与参数估计 某快餐店想要估计每位顾客午餐的平均花费金额。在为期3周的时间里选取49名顾客组成 了一个简单随机样本。 (1)假定总体标准差为15元,求样本均值的抽样标准误差。 x σ= = = (2)在95%的置信水平下,求边际误差。 x x t σ?=?,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ?=?x z ασ=?0.025x z σ=?=×= (3)如果样本均值为120元,求总体均值 的95%的置信区间。 置信区间为: (),x x x x -?+?=()120 4.2,120 4.2-+=(,) 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。 要求: 大样本,样本均值服从正态分布:2,x N n σμ?? ???:或2,s x N n μ?? ??? : 置信区间为: 22x z x z αα?-+ ? (1)构建μ的90%的置信区间。 2z α=0.05z =,置信区间为:()81 1.645 1.2,81 1.645 1.2-?+?=(,) (2)构建μ的95%的置信区间。 2z α=0.025z =,置信区间为:()81 1.96 1.2,81 1.96 1.2-?+?=(,) (3)构建μ的99%的置信区间。 2z α=0.005z =,置信区间为:()81 2.576 1.2,81 2.576 1.2-?+?=(,) 某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取 36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 解:

统计学(第四版)贾俊平 第五章 参数估计 练习题答案

统计学(第四版)贾俊平第五章参数估计练习题答案 5.1(答案精确到小数点后两位) (1)已知:n=49,15σ=, 样本均值的标准误差X σ==(2)已知:置信水平:2 195%, 1.96 Z α α-==, 估计误差E=2 15 1.96 4.207 Z α== (3)已知120,X =置信水平:2 195%, 1.96Z αα-==,E=4.20 置信区间为()2 120 4.20115.80,124.20X Z α±=±= 5.2(答案精确到小数点后两位) (1)置信区间为2 8900 1.96(8646.97,9153.03)X Z α±=±= (2)置信区间为2 8900 1.96(8815.48,8984.52)X Z α±=±= (3)置信区间为2 8900 1.65(8760.55,9039.45)X Z α±=±= (4)置信区间为2 8900 2.58(8681.95,9118.05)X Z α±=±= 5.3 (1) 表5.3—1置信水平90%上网时间置信区间报告 上网时间

(2) (3)

5.4(答案精确到小数点后两位) (1)已知N=500,n=50,132n = A. 传统方法:32 0.6450 p == 比例置信区间为0.64(0.51,0.77)p Z ±=±= B. 现代方法:322 0.63504 p +==+ 比例置信区间为0.63(0.50,0.76)p Z ±=±= (2)已知0.8p =0.1≤ 得到:16n ≥ 5.5 (1)

5.6已知22 12121214,7,53.2,43.4,96.8,102.0n n X X s s ======, (1)置信水平195%α-=, 12μμ-置信区间为()(()122 1.86,17.74X X t v α -±= (2)置信水平199%α-=, 12μμ-置信区间为()(()122 0.19,19.41X X t v α -±= 5.7

统计学课件 第七章 参数估计

统计学
STATISTICS (第三版 第三版)
第 7 章 参数估计
统计学
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院

统计学
STATISTICS (第三版 第三版)
第 7 章 参数估计
§7.1 参数估计的一般问题 §7.2 一个总体参数的区间估计 §7.3 样本量的确定
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院

统计学
STATISTICS (第三版 第三版)
学习目标
1. 估计量与估计值的概念 2. 点估计与区间估计的区别 3. 评价估计量优良性的标准 4. 一个总体参数的区间估计方法 5. 样本量的确定方法
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院

统计学
STATISTICS (第三版 第三版)
§7.1 参数估计的一般 问题
7.1.1 估计量与估计值 7.1.2 点估计与区间估计 7.1.3 评价估计量的标准
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院

统计学
STATISTICS (第三版 第三版)
估计量与估计值
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院

统计学
STATISTICS (第三版 第三版)
估计量与估计值
(estimator & estimated value)
1. 估计量:用于估计总体参数的随机变量 – 如样本均值,样本比例, 样本方差等 – 例如: 样本均值就是总体均值μ 的一个估计量
? 表示 2. 参数用θ 表示,估计量用 θ
3. 估计值:估计参数时 计算出来的统计量的
具体值
– 如果样本均值 ?x =80,则80就是μ的估计值
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院

《统计学》名词解释及公式

第1章统计与统计数据 一、学习指导 统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。本章各节的主要内容和学习要点如下表所示。 概念:统计学,描述统计,推断统计。 统计在工商管理中的应用。 统计的其他应用领域。 概念:分类数据,顺序数据,数值型数据。 不同数据的特点。 概念:观测数据,实验数据。 概念:截面数据,时间序列数据。 统计数据的间接来源。 二手数据的特点。 概念:抽样调查,普查。 数据的间接来源。 数据的收集方法。 调查方案的内容。 概念。抽样误差,非抽样误差。 统计数据的质量。 概念:总体,样本。 概念:参数,统计量。

概念:变量,分类变量,顺序变量,数值 型变量,连续型变量,离散型变量。 二、主要术语 1.统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。 2.描述统计:研究数据收集、处理和描述的统计学分支。 3.推断统计:研究如何利用样本数据来推断总体特征的统计学分支。 4.分类数据:只能归于某一类别的非数字型数据。 5.顺序数据:只能归于某一有序类别的非数字型数据。 6.数值型数据:按数字尺度测量的观察值。 7.观测数据:通过调查或观测而收集到的数据。 8.实验数据:在实验中控制实验对象而收集到的数据。 9.截面数据:在相同或近似相同的时间点上收集的数据。 10.时间序列数据:在不同时间上收集到的数据。 11.抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推 断总体特征的数据收集方法。 12.普查:为特定目的而专门组织的全面调查。 13.总体:包含所研究的全部个体(数据)的集合。 14.样本:从总体中抽取的一部分元素的集合。 15.样本容量:也称样本量,是构成样本的元素数目。 16.参数:用来描述总体特征的概括性数字度量。 17.统计量:用来描述样本特征的概括性数字度量。 18.变量:说明现象某种特征的概念。 19.分类变量:说明事物类别的一个名称。 20.顺序变量:说明事物有序类别的一个名称。 21.数值型变量:说明事物数字特征的一个名称。

统计学——参数估计

第8 讲参数估计 本讲的主要内容 8.1 参数估计的一般问题 8.2 一个总体参数的区间估计 8.3 两个总体参数的区间估计 8.4 样本量的确定 学习目标 1.估计量与估计值的概念 2.点估计与区间估计的区别 3.评价估计量优良性的标准 4.一个总体参数的区间估计方法 5.两个总体参数的区间估计方法 6.样本量的确定方法 8.1 参数估计的一般问题 8.1.1 估计量与估计值 估计量与估计值(estimator & estimated value) 1.估计量:用于估计总体参数的随机变量 如样本均值,样本比例, 样本方差等 例如: 样本均值就是总体均值m 的一个估计量 2.参数用θ表示,估计量用表示 3.估计值:估计参数时计算出来的统计量的具体值 如果样本均值?x=80,则80就是m的估计值 8.1.2 点估计与区间估计 点估计 (point estimate) 1.用样本的估计量的某个取值直接作为总体参数的估计值 例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计 2.无法给出估计值接近总体参数程度的信息 ⑴虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值 ⑵一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量 区间估计 (interval estimate) 1.在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到 2.根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 比如,某班级平均分数在75~85之间,置信水平是95% 区间估计的图示

《统计学》课后练习题答案

第一章统计学及基本概念 1 第二章数据的收集与整理 4 第三章统计表与统计图7 第四章数据的描述性分析 9 第五章参数估计 12 第六章假设检验 17 第七章方差分析 21 第八章非参数检验24 第九章相关与回归分析27 第十章多元统计分析 31 第十一章时间序列分析35 第十二章指数38 第十二章指数38 第十三章统计决策42 第十四章统计质量管理45 第一章统计学及基本概念 1.1 统计的涵义(统计工作、统计资料和统计学) 1.2 统计学的内容(统计学分类:理论统计学和应用统计学;描述统计学与推断统计学) 1.3 统计学的发展史(学派与主要代表人物) 1.4 数据类型(定类、定序、定距和定比;时间序列、截面数据和面板数据;绝对数、相对数、平均数) 1.5 变量:连续与离散;确定与随机 1.6 总体、样本与个体 1.7 标志、指标及指标体系 1.8 统计计算工具 习题 一、单项选择题 1. 推断统计学研究()。(知识点:1.2 答案:D) A.统计数据收集的方法B.数据加工处理的方法 C.统计数据显示的方法D.如何根据样本数据去推断总体数量特征的方法 2. 在统计史上被认为有统计学之名而无统计学之实的学派是()。(知识点:1.3 答案:D) A.数理统计学派B.政治算术学派C.社会统计学派D.国势学派 3. 下列数据中哪个是定比尺度衡量的数据()。(知识点:1.4 答案:B) A.性别B.年龄C.籍贯D.民族 4. 统计对现象总体数量特征的认识是()。(知识点:1.6 答案:C) A.从定性到定量B.从定量到定性C.从个体到总体D.从总体到个体 5. 调查10个企业职工的工资水平情况,则统计总体是()。(知识点:1.6 答案:C) A.10个企业 B.10个企业职工的全部工资 C.10个企业的全部职工 D.10个企业每个职工的工资

统计学参数估计练习题

统计学参数估计练习题 SANY标准化小组 #QS8QHH-HHGX8Q8-GNHHJ8-HHMHGN#

第7章参数估计 练习题 一、填空题(共10题,每题2分,共计20分) 1.参数估计就是用_______ __去估计_______ __。 2. 点估计就是用_______ __的某个取值直接作为总体参数的_______ __。3.区间估计是在_______ __的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减_______ __得到。 4. 如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为_______ __,也成为_______ __。 5.当样本量给定时,置信区间的宽度随着置信系数的增大而_______ __;当置信水平固定时,置信区间的宽度随着样本量的增大而_______ __。 6. 评价估计量的标准包含无偏性、_______ __和_______ __。 7. 在参数估计中,总是希望提高估计的可靠程度,但在一定的样本量下,要提高估计的可靠程度,就会_______ __置信区间的宽度;如要缩小置信区间的宽度,又不降低置信程度,就要_______ __样本量。 8. 估计总体均值置信区间时的估计误差受总体标准差、_______ __和_______ __的影响。 9. 估计方差未知的正态总体均值置信区间用公式_______ __;当样本容量大于等于30时,可以用近似公式_______ __。 10. 估计正态总体方差的置信区间时,用_____ __分布,公式为______ __。 二、选择题(共10题,每题1分,共计10分) 1.根据一个具体的样本求出的总体均值的95%的置信区间 ( )。 A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C.一定包含总体均值 D. 要么包含总体均值,要么不包含总体均值 2.估计量的含义是指( )。 A. 用来估计总体参数的统计量的名称

第章统计学参数估计练习题

第7 章参数估计 练习题 一、填空题(共10题,每题2分,共计20分) 1 ?参数估计就是用______ _去估计________ _ 。 2?点估计就是用______________ 的某个取值直接作为总体参数的 ____________ 。 3?区间估计是在____________ 的基础上,给出总体参数估计的一个区间范围,该区间通常 由样本统计量加减 __________ 得到。 4. ____________ 如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为,也成为 ____________ 。 5 ?当样本量给定时,置信区间的宽度随着置信系数的增大而_____________ ;当置信水平固定时,置信区间的宽度随着样本量的增大而 ____________ 。 6. 评价估计量的标准包含无偏性、________ __ 和 _______ __ 。 7. 在参数估计中,总是希望提高估计的可靠程度,但在一定的样本量下,要提高估计的可 靠程度,就会 ____________ 置信区间的宽度;如要缩小置信区间的宽度,又不降低置信程 度,就要 ___________ 样本量。 8. 估计总体均值置信区间时的估计误差受总体标准差、____________ 和___________ 的影响。 9. ___________________________________________________ 估计方差未知的正态总体均值置信区间用公式__________________________________________ ;当样本容量大于等于30时,可以用近似公式 ____________ 。 10. 估计正态总体方差的置信区间时,用___________ 分布,公式为 __________ 。 二、选择题(共10题,每题1分,共计10分) 1 ?根据一个具体的样本求出的总体均值的95%勺置信区间()。 A. 以95%勺概率包含总体均值 B. 有5%勺可能性包含总体均值 C. 一定包含总体均值 D. 要么包含总体均值,要么不包含总体均值 2. 估计量的含义是指()。 A. 用来估计总体参数的统计量的名称

大学统计学第七章练习题与答案

第7章 参数估计 练习题 7.1 从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。 (1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,边际误差是多少? 解:⑴已知25,40,5===x n σ 样本均值的抽样标准差79.04 10 40 5≈= = = n x σ σ ⑵已知5=σ,40=n ,25=x ,4 10= x σ,%951=-α 96.1025.02 ==∴Z Z α 边际误差55.14 10 * 96.1≈==n Z E σ α 7.2 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。 (1) 假定总体标准差为15元,求样本均值的抽样标准 误差; (2) 在95%的置信水平下,求边际误差; (3) 如果样本均值为120元,求总体均值μ的95%的置 信区间。 解.已知.根据查表得2/αz =1.96

(1)标准误差: 14.249 15== = n X σ σ (2).已知2/αz =1.96 所以边际误差=2/αz * =n s 1.96* 49 15=4.2 (3)置信区间:)(2.124,8.11596.149 151202 =*± =±n s Z x α 7.3 从一个总体中随机抽取100=n 的随机样本,得到104560=x ,假定总体标准差85414=σ,构建总体均值μ的95%的置信区间。 96.12 =?Z 144.16741100 85414* 96.12 ==? ?n Z σ 856.87818144.16741104560.2 =-=-?n Z x σ 144 .121301144.16741104560. 2 =+=+?n Z x σ 置信区间:(87818.856,121301.144) 7.4 从总体中抽取一个100=n 的简单随机样本,得到81=x ,12=s 。 (1) 构建μ的90%的置信区间。 (2) 构建μ的95%的置信区间。 (3) 构建μ的99%的置信区间。 解;由题意知100=n , 81=x ,12=s . (1)置信水平为%901=-α,则645.12 =αZ . 由公式n s z x ? ±2 α974.181100 12645.181±=? ±= 即(),974.82,026.79974.181=±

(完整版)统计学习题答案第5章参数估计

第5章 参数估计 ? 1.从一个标准差为 5的总体中抽出一个容量为 40的样本,样本均值为 25。 (1) 样本均值的抽样标准差(T x 等于多少? (2) 在95%的置信水平下,允许误差是多少? 解:已知总体标准差b =5,样本容量n =40,为大样本,样本均值 x =25, (2)已知置信水平1 - a =95%,得Z a /2 =1.96 , ? 2?某快餐店想要估计每位顾客午餐的平均花费金额,在为期 3周的时间里选取 49名顾客 组成了一个简单随机样本。 (3) 假定总体标准差为15元,求样本均值的抽样标准误差; (4) 在95%的置信水平下,求允许误差; (5) 如果样本均值为120元,求总体均值 95%的置信区间。 解:(1)已假定总体标准差为 b =15元, (2)已知置信水平1 - a =95%,得Z a /2 =1.96 , (3)已知样本均值为 x =120元,置信水平1- a =95%,得 乙/2 =1.96 , 可知,如果样本均值为 120元,总体均值95%的置信区间为(115.8 , 124.2 )元。 ? 3.某大学为了解学生每天上网的时间,在全校 7500名学生中采取不重复抽样方法随机抽 取36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.2 4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 29 35 2.4 05 36 2.5 (1 )样本均值的抽样标准差 =0.7906 于是,允许误差是 E = Z a /2 b ,n =1.96X 0.7906= 1.5496。 则样本均值的抽样标准误差为 (T 15 CT - = ----- = ------- =2.1429 x ..n 49 于是,允许误差是 E = Z a /2 =1.96X 2.1429=4.2000。 这时总体均值的置信区间为 Z a /2 =120± 4.2= 124.2 115.8

第六章 从样本统计量估计整体参数

第六章从样本统计量估计整体参数 学习要点 第一节点估计 第二节区间估计 第三节总体均数的估计 第四节其他总体参数的估计 本章小结 学习要点 掌握推断统计的内容和前提条件 理解统计估计的原理,掌握统计估计的方法 能够运用总体均数估计的方法解决实际问题 第一节点估计 当总休平均数或比例未知时,我们可以直接把样本平均数或比例用作它的估计值。由于样本统计量为数轴上的一个点,所以称为“点估计值” 。 科学研究不仅需要对事物特征作出一般性的描述,而且更要根据样本提供的信息去推测相应总体的情况,统计内容中的推断统计则是专门研究如何用样本去推断总体的方法。 一、什么是推断统计 一般情况下,样本统计量是不会和相应的总体参数完全相同的,两者多少都会有一定的差距,但是如果用无限多个样本的统计量来估计总体参数,平均估计误差将会等于0。 具有这一特征的统计量就无偏估计值。 例如,用样本平均数估计总体平均数时,总会有些误差,在有些样本中,它可能会大于总体平均数,而在另一些样本中它又可能会小于总体平均数,而且对于不同的样本估计误差的大小也是不同的,但是无限多个样本平均数的平均估计误差为0。换句话说,样本平均数的平均数将会等于总体平均数。 推断统计就是指由样本资料去推测相应总体情况的理论与方法。也就是由部分推全体,

由已知推未知的过程。 推断统计根据推测的性质不同而分为参数估计和假设检验两方面。参数估计(parameter estimation)就是用样本去估计相应总体的状况,其具体方法有点估计和区间估计。假设检验(hypothesis test)的主要用途是对出现差异的两个或多个现象或事物进行真实性情况的检验,又称统计检验(statistical test)。在检验中又根据是否需要依赖于对总体分布形态和总体参数检验的假设而分为参数检验和非参数检验。参数检验法在检验时对总体分布和总体参数σ)有所要求,而非参数检验法在检验时则不依赖于总体的分布形态和总体参数的(μ,2 情况。参数检验法主要有Z检验、t检验、F检验和q检验等,非参数检验(non-parameter test)主要有χ2检验、符号检验法、符号等级检验法、秩和检验、中位数检验等。 二、统计推断的基本问题 没有系统学过统计学的人往往有一种误解,以为只要搜集了数据资料,就可以用统计方法来处理数据。殊不知统计学是建立在概率论基础上的,而概率论是专门研究随机事件的。因此,在做统计推断之前必须考虑你所获得的资料是否能够用统计的方法来分析。通常,进行统计推断时应首先考虑以下三个方面的问题。 一是关于统计推断的基本前提。统计推断的前提是随机抽样。因此当我们利用样本统计量进行总体推断时,首先要了解抽样的方式,即了解样本是如何得来的,是随机抽取的,还是人为抽取的。随机抽样的均等性和独立性,避免了入样个体只来自总体的某一部分,从而也就避免了样本的偏倚性。可以说,样本的抽取直接关系着统计研究结果的科学性。 二是样本的规模与样本的代表性。抽样研究需要有一定的样本规模,而样本要具有代表性也需要有一定的样本规模来保证,以减少抽样误差。一般来说,在其它条件相同的情况下,样本越小,抽样的误差越大;样本越大,抽样的误差就越小。当样本增至包括总体的全部个n=)时,抽样的误差为0。因此,只要条件允许,尽可能地采用大样本,以增强体(即N 样本对总体的代表性和可靠性。值得注意的样本规模和样本代表性是建立在随机抽样基础之上的,否则即使样本再大也是无意义的。 三是统计推断的错误要有一定限度。统计推断是在特定的时间、空间和条件下得出的结论,加上抽样误差的影响,在用样本推测总体时总会犯一定的错误。这种错误在统计推断中是不可避免的,也是允许的。不过这种错误要有一定的限度,超过一定限度的错误是不允许的。统计推断中允许犯错误的限度是用小概率事件来表示。 第二节区间估计 一、参数估计的定义 所谓参数估计就是根据样本统计量去估计相应总体的参数。譬如我们可以根据样本均数 σ),根据样本(X)去估计总体的均数(μ),根据样本方差(2S)去估计总体方差(2 的相关系数(r)去估计总体相关系数(ρ)等等。

相关文档
最新文档