第五章 抽样与抽样分布

第五章  抽样与抽样分布
第五章  抽样与抽样分布

第五章抽样与抽样分布

第一节抽样的基本概念

一、几个基本概念

1、目标总体和抽样总体

目标总体就是研究对象的全体。抽样总体是指从中抽取样本的总体。二者理应一致,但实际中有时难以保证。

2、抽样单元和抽样框

抽样总体的具体表现就是抽样框,通常是一份包含所有抽样单元的名单,好的抽样框应该尽可能多地提供与研究目标有关的辅助信息。抽样单元是构成抽样框的基本单位,可以是一个个体,也可以包含若干个个体,还可以分级。分级情况下,总体由若干个较大规模的抽样单元组成,为初级单元,每个初级单元又包含若干个规模较小的单元,为二级单元,以此类推。抽取哪一级,就需要有哪一级的抽样框。

3、抽样误差和非抽样误差

抽样误差是抽取样本的随机性造成的样本值和总体值之间的差异。只要采用抽样调查,抽样误差就不可避免,但可通过增大样本量来减小误差。非抽样误差是由于其他多种原因引起的样本值和总体值之间的差异。

三、抽样方案设计

1、抽样设计步骤:

明确调查目的,确定研究对象,确定目标量;

明确总体及抽样单元;(根据总体的定义,收集一份全部个案的名单)

对主要目标量的精度提出要求(误差控制在多大范围内);

选择抽样方法;

根据抽样方法、精度要求等确定样本量,并估计抽样误差;

制定具体步骤。

2、设计原则

(1)随机性原则——总体中所有个体被抽中机会相等。

(2)抽样效果最佳原则——在固定费用下,抽样误差最小;在要求精度下,费用最少。

第二节抽样方法

一、随机抽样

1、简单随机抽样:最基本的抽样方法,最符合随机原则,每个个体都有同样的被抽中概率。是其它复杂抽样设计的基础。使用随机数表。

2、分层抽样:将总体按照某些特征分成若干个层,在每一层当中独立抽取

若干子样本。要求组内同质性强,组间差异大。由于在每层中都抽取出一些样本,样本具有较好的均匀性,代表性更强。

3、整群抽样:先将总体划分为若干群,然后以群为初级抽样单元,从中随即抽取n个群,对抽中的裙内的所有次级单元都进行调查。要求群内差异大,群间差异小。组织上方便,但抽样单元过于集中,抽样误差最大。

4、系统抽样:按照某种顺序给总体中的N个单元编号,然后随机抽取一个编号作为样本的第一个单元,其它单元则按照某种确定的规则抽取。最常见的是等距抽样,按照相等的距离抽取样本。尽可能按照与调查项目有关的变量的大小顺序进行排序总体单元,类似于分层抽样,这样抽取出的样本分布均匀;或者随机排序;要尽量缩小各个等距组内的方差,增大等距组间的方差,否则抽出的样本有偏(每一组内都服从同样的规律)。

5、PPS抽样:概率比例抽样,是一种多阶段抽样,每一阶段都可视为整群抽样,每一个抽中的群继续被整群抽样,直到抽样的单元满足要求,成为基本的调查单元。PPS抽样的优点是每个群被抽中的概率与其规模成正比,规模大的抽样概率大,但是最终会实现每个个体具有相同抽样概率,保证估计的无偏性。

二、非随机抽样法(没有样本框)

1、目的抽样

由研究者根据自己的主观判断选择代表性个案。

2、偶遇抽样

常见于市场调查,街访。

3、定额抽样

根据总体的某些特征分组,然后用目的抽样或偶遇抽样来选择。代表性高于前两种方法。

非随机抽样优点在于简便,代价小,故常用于探索性或试点研究。缺点是不能推断总体。

第三节抽样分布

一、抽样分布的概念

抽取到不同的样本,会导致样本统计量的不同取值。所以要抽取大量样本,计算出各个样本统计量出现的可能性,得到各个样本统计量的概率分布,才能判断和比较哪个样本量比较合适。

样本统计量的抽样分布:由n个样本的各观察值计算出的统计量的概率分布。例1:从某个班100位学生中抽取4位学生,计算身高(μ=169, =6.4),来估计全班平均身高,假设抽取了成千上万个样本,得到了如下结果:

为了区分X的标准差和X的标准差,X的标准差通常称为标准误差(SE)。

可以发现,样本均值抽样分布成正态分布,X有时大于有时小于总体均值,平均来看趋于μ。X的期望值正好等于估计目标μ。总体标准差 是X的标准误差SE的2倍。为什么样本均值的波动小于观察值X的波动?这是取平均数的结果。通过取平均数,样本均值围绕目标的波动就会小。

样本容量越大,X的标准误差就越小,分布的形状就越窄,波动越小,样本均值就是μ的更可靠的估计。

当总体为偏态分布时,样本均值的概率分布是否服从正态分布取决于样本量。当n等于5时,样本均值抽样分布开始向正态分布发展,n=30时各种样本均值抽样分布无差别,基本形成正态分布。

二、样本均值的抽样分布

1、样本均值抽样分布的特征

A抽样分布的中心就是原总体中心,数学上可以证明:X的期望值=μ;

B抽样分布的标准误差比总体标准差小,样本量越大,标准误差越小,数学

上可以证明:标准误差(SE)=σ

C正态总体产生正态抽样分布;非正态总体,随着样本量的增加,样本均值抽样分布也会近似变成正态。

这三点即独立同分布中心极限定理。

例2:几年前台湾一项调查显示,台湾民众月收入近似成正态分布,均值为13100台币,标准差为8750元,求:

1)随机抽取一人,收入超过18430元的概率?

2)抽取一个10人样本,平均收入超过18430元的概率?

解:1)Z= Xμ

σ

-

=(18430-13100)/8750=0.608

Pr(X>18430)=Pr(Z>0.608)≈0.2709≈27%

2)样本均值成正态分布,E(X)=13100,SE=σ=8750/ 2767。对样

本均值进行标准化:Z= Xμ

σ

-

=(18430-13100)/2767=1.92

Pr(X>18430)=Pr(Z>1.92)≈0.0274≈3%

可见,一个人收入超过18430元的机会较大,但10个人的平均收入超过18430元的机会则很小。

例3:假定某班级男生平均身高169cm,标准差为10.2cm,如果抽取一个n=100的随机样本,那么样本均值在μ±2之内的机会是多少?

解:样本均值的期望值=169,标准误差SE=σ=1.02,求样本均值在167-171

之间的概率,可先求X>171的概率。Z= Xμ

σ

-

=(171-169)/1.02=1.96

Pr(X>171)=Pr(Z>1.96)=0.025。利用正态分布的对称性,X>171和X<169的概率相等,所以Pr(167<X<171)=1-2×0.025=95%

练习题:一架电梯极限负重1000公斤,一般可容纳13人。假定电梯的所有乘客平均体重70公斤,标准差12公斤。那么一个13个人的随机样本总重量超过极限负重的概率是多少?

解:原提问可以转化为:13人样本的平均体重超过1000/13=76.92的概率是多少?人们的体重服从正态分布,期望值=70,SE=3.33,Z=(76.92-70) /3.33=2.08

Pr(X>76.92)=Pr(Z>2.08)=0.00188≈2%

2、不放回抽样的抽样分布

中心极限定理的前提是每次抽样的独立性,如果采取不放回抽样,则不再适用。但不放回抽样会使抽样分布波动小,标准误差变小。于是将中心极限定理作修改,使其对于不放回抽样也适用。不放回抽样的标准误差计算公式:

/修正系数

当总体远远大于样本数时,则缩减因子几乎为1,可忽略。

三、样本比例的抽样分布

假定总体只有两种特征,分别赋值1和0,将想要研究的特征赋值为1。

例4:某市育龄妇女生育意愿普查,65%的赞成“只生一个孩子”,35%不赞成或不表态。赞成为1,否则为0,总体分布如下:

求:1)总体均值、总体方差、总体中赞成的比例;2)随机抽取10位育龄妇女,得到样本值为1、0、0、1、1、1、0、1、1、1,求样本均值、样本中赞成比例。解:1)

总体均值=0.65,正好是总体中赞成比例,方差=0.2275 =0.35×0.65。

2)样本均值=7/10=0.7,样本中赞成比例=7/10=0.7

样本均值等于样本中赞成的比例。将这个结果推广到一般情况。对于任何一个可以分为两种特征的总体,见下表,

则总体均值μ=总体比例π;总体标准差σ=

处理比例的巧妙办法就是引入0-1变量(哑变量),规定总体中具有某种特征的个体为1,否则就为0,总体中对应于1的比例就是该变量的均值,样本中含1的个体比例就是样本均值。

把比例看作均值就可以用样本均值抽样分布原理来处理。同时,对于大样本

来说,P的抽样分布近似正态。所以,P的期望值=π;P的标准误差

例5:学校选人大代表,结果有60%的选民投了我院院长而当选。假定选举之前有人做了预测,抽取了一个n=30的随机样本进行民意测验,如果样本中只有半数一下的比例支持院长,那么会得出院长失败的结果,显然这一预测是一个倒霉的预测。那么,抽取到以上样本的概率是多少?即错误预测的机会多少?解:用p表示样本中支持院长的比例,要计算p 小于50%的概率。根据中心极

限定理,p的期望值=π=0.6;。将p=0.5标准化:Z=(P-π)/SE=(0.5-0.6)/0.0894=-1.12

Pr(p <0.5)=Pr(Z <-1.12)=0.1314≈13%

所以,预测错误的机会比较大,因为样本量不够大。如果将样本量增到100,错误概率为2%。 四、样本方差的抽样分布

由样本方差的所有可能取值形成的概率分布,称为样本方差的抽样分布。 设随机变量x 1,x 2,x 3…..x i 相互独立且服从同一正态分布,则将这些随机变量标准化,再计算它们的平方和,得到卡方值,服从于自由度为n-1的卡方分布:

2χ=2222312(

)(

)(

).....(

)i x x x x μ

μ

μ

μ

σ

σ

σ

σ

----++++=

2

2

1

1

()

k

i

i x μσ=-∑

进一步整理得2

χ=

2

2

(1)n s σ

-~2

χ(n-1)

2χ分布的特点:2χ分布的变量值始终为正;2χ分布的形状取决于自由度大小,通常

为不对称的右偏分布,随着自由度增大而逐渐趋于对称;2

χ分布的期望值E(2

χ)=n ,方差=2n ;2

χ分布具有可加性,若U 和V 是两个独立的2

χ分布随机变量2

χ(n 1),2

χ(n 2),则U+V 服从于自由度为n 1+ n 2的卡方分布。

n=1 n=10 n=20 n=4

统计学习题第五章_抽样与抽样估计答案.doc

第五章抽样与抽样估计复习题 一、填空题 1 、在实际工作中,人们通常把n≥ 30 的样本称为大样本,而把n<30 的样本称为小样本。 2 、在抽样估计中,常见的样本统计量有样本均值、样本比例、样本标准差或样本方差以及它们的函数。 3 、在研究目的一定的条件下,抽样总体是唯一确定的,而样本则有许多个。 4 、在抽样调查中,登记性误差和系统性误差都可以尽量避免,而抽样误差则是不可避免的,但可以计算并加以控制。 5 、在抽样估计中,抽样估计量是指用于估计总体参数的样本指标(统计量),评价估计量优劣的标准有无偏性、有效性和一致性。 二、选择题 单选题: 1 、在其它条件不变的情况下,要使抽样平均误差为原来的1/3 ,则样本单位数必须 ((2)) ( 1)增加到原来的 3 倍(2)增加到原来的9 倍 ( 3)增加到原来的 6 倍(4)也是原来的1/3 2、在总体内部情况复杂,且各单位之间差异程度大,单位数又多的情况下,宜采用 ((3)) ( 1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 3、某厂产品质量检查,确定按5%的比率抽取,按连续生产时间顺序每20 小时抽 1 小时的全部产进行检验,这种方式是((4)) ( 1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 4、其它条件一定,抽样推断的把握程度提高,抽样推断的准确性就会((2)) ( 1)提高(2)降低(3)不变(4)不一定降低 5、在城市电话网的100 次通话中,通话持续平均时间为 3 分钟,均方差为分钟,则概 率为时,通话平均持续时间的抽样极限误差为((2)) ( 1)(2)(3)(4) 6、假定11 亿人口大国和100 万人口小国的居民年龄变异程度相同,现在各自用重复 抽样方法抽取本国人口的1%计算平均年龄,则平均年龄抽样平均误差((3))( 1)两者相等(2)前者比后者大(3)前者比后者小(4)不能确定大小 多选题: 1 、降低抽样误差,可以通过下列那些途径((2)(4)(5)) (1)降低总体方差(2)增加样本容量。 (3)减少样本容量(4)改重复抽样为不重复抽样 (5)改简单随机抽样为类型抽样 2 、抽样推断中的抽样误差((1)(5)) (1)是不可避免要产生的 (2)是可以通过改进调查方法来消除的 (3)只有调查后才能计算 (4)即不能减少,也不能消除 (5)其大小是可以控制的 3 、抽样极限误差((1)(2)( 4))

样本及抽样分布知识讲解

第六章 样本及抽样分布 【内容提要】 一、简单随机样本与统计量 1. 总体 用来表征某一随机试验的数量指标X ,其概率分布称为总体的分布。 2. 简单随机样本 在相同条件下,对总体X 进行n 次独立的重复观察,将所得结果12,,...,n X X X 称为从总体X 中抽取的容量为n 的简单随机样本,试验结束后,可得一组数值12,,...,n x x x ,称其为 12,,...,n X X X 的观察值。 注:若12,,...,n X X X 为总体X 的简单随机样本,则12,,...,n X X X 相互独立,且与总体X 同分布。 3. 统计量 设12,,...,n X X X 为总体X 的简单随机样本,12(,,...,)n T g X X X =为样本12,,...,n X X X 的实值函数,且不含任何未知参数,则称12(,,...,)n T g X X X =为一个统计量,将样本值12,,...,n x x x 代入后算出的函数值12(,,...,)n t g x x x =称为该统计量的值。 注:设12,,...,n X X X 为总体X 的简单随机样本,12,,...,n x x x 为相应的样本值,则常用的统计量有: 4. 经验分布函数 设12,,...,n X X X 为总体X 的简单随机样本,12,,...,n x x x 为相应的样本值,将样本值 按由小到大的顺序重新编号12,1r x x x r n ***<

第五章 抽样分布

第四章抽样与抽样分布 例1:从某年级1000位学生中抽取4位学生,计算身高(μ=169, =6.4),来估计全年级平均身高,假设抽取了成千上万个样本,得到如下结果: 例2:几年前台湾一项调查显示,台湾民众月收入近似成正态分布,均值为13100台币,标准差为8750元,求: 1)随机抽取一人,收入超过18430元的概率? 2)抽取一个10人样本,平均收入超过18430元的概率? 例3:假定某班级男生平均身高169cm,标准差为10.2cm,如果抽取一个n=100的随机样本,那么样本均值在μ±2之内的可能性是多少? 例4:一架电梯极限负重1000公斤,一般可容纳13人。假定电梯的所有乘客平均体重70公斤,标准差12公斤。那么一个13个人的随机样本总重量超过极限负重的概率是多少? 例5:某市育龄妇女生育意愿普查,65%的赞成“只生一个孩子”,35%不赞成或不表态。设生育态度X:赞成为1,否则为0。求:1)总体均值、总体方差、总体中赞成的比例;2)随机抽取10位育龄妇女,得到样本值为1、0、0、1、1、

1、0、1、1、1,求样本均值、样本中赞成比例。 解:1)计算见下表 2)样本均值=7/10=0.7,样本中赞成比例=7/10=0.7 例6:学校选人大代表,结果有60%的选民投了我院院长而当选。假定选举之前有人做了预测,抽取了一个n=30的随机样本进行民意测验,如果样本中只有半数一下的比例支持院长,于是得出院长失败的结果,显然这一预测是一个倒霉的预测。那么,抽取到以上倒霉样本的概率是多少呢?即错误预测的可能性是多少?如果将样本量增到100,再计算错误概率。 例7:某中学学生男女人数相同,现随机从中抽取15名学生,问男生人数大于10的概率是多少? 四、样本方差的抽样分布 设随机变量x 1,x 2,x 3…..x i 相互独立且服从同一正态分布,则将这些随机变量标准化,再计算它们的平方和,得到卡方值2χ,其服从于自由度为n-1的卡方分布: 2χ=2222312( )( )( ).....( )i x x x x μ μ μ μ σ σ σ σ ----++++= 2 2 1 1 () k i i x μσ=-∑ 分子分母同乘n-1,进一步整理得2 χ=2 2 (1)n s σ-~2χ(n-1) 练习题: 1、某专业学生的年龄分布是右偏的,均值为22,标准差为4.45,如果采用重复抽样的方法从该专业学生中抽取容量为100的样本,则样本均值的抽样分布为? 2、从均值为50,标准差为5的正态总体中抽取容量为25的样本,则样本均值超过51的概率为? 3、某企业声明企业人均收入为5500元,标准差为550元。如果随机抽取16位员工,则平均收入落在5400-5600元的概率是? 4、样本量为10的样本均值方差为12,则总体的方差为? 5、总体均值为3.1,标准差为0.8,从该总体中随机抽取容量为36的样本,样本

样本及抽样分布

第六章样本及抽样分布 【基本要求】1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】4学时 【授课内容】 §6.0 前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 §6.1 随机样本 1

一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X可能取值的全体组成的集合等同起来。 定义1:把研究对象的全体(通常为数量指标X可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X的分布的研究,所谓总体的分布也就是数量指标X的分布,因此,X的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体X。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。 例1:考察一块试验田中小麦穗的重量: X=所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2

第五章 抽样估计学习指导

第五章 抽样估计学习指导 一、判断题×√ 1.抽样估计是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免地会产生误差,这种误差的大小是不能进行控制的.( ) 2.从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本.( ) 3.在抽样估计中,作为推断的总体和作为观察对象的样本都是确定的.唯一的.( ) 4.优良估计的无偏性是指:所有可能的样本平均数的平均数等于总体平均数.( ) 5.抽样成数的特点是,样本成数越大,则成数方差越大.( ) 6.在总体方差一定的条件下,样本单位数越多,则抽样平均误差越大.( ) n x σ μ= 7.抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度.( )

8.抽样误差即代表性误差和登记性误差,这两种误差都是不可避免的.( ) 9.在其他条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度.( ) 10.在简单随机抽样中,如果重复抽样的抽样极限误差增加40%,其他条件不变,则样本单位数只需要原来的一半左右.( ) 11.抽样平均误差反映抽样的可能误差范围,实际上每次的抽样误差可能大于抽样平均误差,也可能小于抽样平均误差.( ) 12.样本单位数的多少与总体各单位标志值的变异程度成反比,与抽样极限误差范围的大小成正比.( ) 二.单项选择题 1.抽样调查的主要目的是( ). A.用样本指标来推算总体指标 B.对调查单位做深入研究 C.计算和控制抽样误差 D.广泛运用数学方法 2.抽样调查所必须遵循的基本原则是( ). A.准确性原则 B.随机性原则 C.可靠性原则 D.灵活性原则

习题六 样本及抽样分布.

习题六样本及抽样分布 一、填空题 1.设来自总体的一个样本观察值为:2.1,5.4,3.2,9.8,3.5,则样本均值 = 4.8 ,样本方差 =; 2.在总体中随机地抽取一个容量为 36 的样本,则均值落在4与6之间的概率 = 0.9332 ; 3.设某厂生产的灯泡的使用寿命 (单位:小时,抽取一容量为9的样本,得到 ,则; 4.设为总体的一个样本,则 0.025 ; 5.设为总体的一个样本,且服从分布,这里, ,则1/3 ; 6.设随机变量相互独立,均服从分布且与分别是来自总体的简单随机样本,则统计量服从参数为 9 的 t 分布。 7.设是取自正态总体的简单随机样本且 ,则 0.05 , 0.01 时,统计量服从分布,其自由度为 2 ;

8.设总体 X 服从正态分布,而是来自总体的简单随机样 本,则随机变量 服从 F 分布,参数为 10,5 ; 9.设随机变量则 F(n,1 ; 10.设随机变量且,A为常数,则 0.7 二、选择题 1.设是来自总体的简单随机样本,是样本均值, 记 则服从自由度的分布的随机变量是( A ); A. B. C. D. 2.设是经验分布函数,基于来自总体的样本,而是总体的分布函数,则下列命题错误的为,对于每个给定的( B ) A.是分布函数 B.依概率收敛于 C.是一个统计量 D.其数学期望是

3.设总体服从0-1分布,是来自总体的样本,是样本均值,则下列各选项中的量不是统计量的是( B ) A. B. C. D. 4.设是正态总体的一个样本,其中已知而未知,则下列各选项中的量不是统计量的是( C )。 A. B. C. D. 5.设和分别来自两个正态总体和的样本,且相互独立,分别为两个样本的样本方差,则服从的统计量是( B ) A. B. C. D. 6.设是正态总体的一个样本,和分别为样本均值和样本方差,则下面结论不成立的有( D ) A.相互独立; B.与相互独立; C.与相互独立D.与相互独立。

第六章 样本及抽样分布

第六章样本及抽样分布 【授课对象】理工类本科二年级 【授课时数】4学时 【授课方法】课堂讲授与提问相结合 【基本要求】1、理解总体、个体和样本的概念; 2、了解经验分布函数和直方图的作法,知道格林汶科定理; 3、理解样本均值、样本方差和样本矩的概念并会计算; 4、理解统计量的概念,掌握几种常用统计量的分布及其结论; 5、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布,F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【授课内容及学时分配】 §6.0 前言5分钟前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象的统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 §6.1 随机样本25分钟一、总体与样本

1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究华北工学院男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。 但在数理统计里,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X (可以是向量)和该数量指标X 在总体的分布情况。在上述例子中X 是表示灯泡的寿命或男大学生的身高和体重。在实验中,抽取了若干个个体就观察到了X 的这样或那样的数值,因而这个数量指标X 是一个随机变量(或向量),而X 的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X 可能取值的全体组成的集合等同起来。我们对总体的研究,就是对相应的随机变量X 的分布的研究,所谓总体的分布也就是数量指标X 的分布,因此,X 的分布函数和数字特征分别称为总体的分布函数和数字特征。 定义1:把研究对象的某项或几项数量指标的值的全体称为总体; 总体中的每个元素称为个体。 根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。 Ex 1:考察一块试验田中小麦穗的重量: X =所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 对应的分布: +∞<<= ≤= ≤=? ∞ --- x N dt e x x P x F x t 0),(~21 }{)(22)(2 2σμσ πξσμ总麦穗数的麦穗数重量 Ex 2:考察一位射手的射击情况: X =此射手反复地无限次射下去所有射击结果全体; 每次射击结果都是一个个体(对应于靶上的一点) 个体数量化???=未中射中 01x 1在总体中的比例p 为命中率

(完整版)样本及抽样分布.doc

第六章样本及抽样分布 【基本要求】 1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布—— 2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】 4 学时 【授课内容】 §6.0前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一 门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性; 而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的 一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来 选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理 统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 § 6.1随机样本 1

一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是 个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每 个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几 项数量指标 X ( 可以是向量 ) 和该数量指标X在总体的分布情况。在上述例子中 X 是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X 的这样或那样的数值,因而这个数量指标X 是一个随机变量(或向量),而 X 的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标 X 可能取值的全体组成的集合等同起来。 定义 1:把研究对象的全体(通常为数量指标X 可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X 的分布的研究,所谓总体的分布也就是数量指 标 X 的分布,因此, X 的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体 X 。根据总体中所包括个体的总数,将总体分为:有限总体 和无限总体。 例 1:考察一块试验田中小麦穗的重量: X =所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2

第 5 章 抽样调查及参数估计(练习题)

第五章 抽样调查及参数估计 5.1 抽样与抽样分布 5.2 参数估计的基本方法 5.3 总体均值的区间估计 5.4 总体比例的区间估计 5.5 样本容量的确定 一、简答题 1.什么是抽样推断?用样本指标估计总体指标应该满足哪三个标准才能被认为是优良的估计? 2.什么是抽样误差,影响抽样误差的主要因素有哪些? 3.简述概率抽样的五种方式 二、填空题 1.抽样推断是在 随机抽样 的基础上,利用样本资料计算样本指标,并据以推算 总体数量 特征的一种统计分析方法 。 2.从全部总体单位中随机抽选样本单位的方法有两种,即 重复 抽样和 不重复 抽样。 3.常用的抽样组织形式有 简单随机抽样 、 类型抽样 、等距抽样、 整群抽样 等四种。 4.影响抽样误差大小的因素有总体各单位标志值的差异程度、 抽样单位数的多少 、 抽样方法 和抽样调查的组织形式 。 5.总体参数区间估计必须具备估计值、 概率保证程度或概率度 、 抽样极限误差 等三个要素。 6.从总体单位数为N 的总体中抽取容量为n 的样本,在重复抽样和不重复抽样条件下,可能的样本个数分别是______________和_____________。 7.简单随机_抽样是最基本的抽样组织方式,也是其他复杂抽样设计的基础。 8.影响样本容量的主要因素包括总体各单位标志变异程度_、__允许的极限误差Δ的大小、_抽样方法_、抽样方式、抽样推断的可靠程度F(t)的大小等。 三、选择题 1.抽样调查需要遵守的基本原则是( B )。 A .准确性原则 B .随机性原则 C .代表性原则 D .可靠性原则 2.抽样调查的主要目的是( A )。 A .用样本指标推断总体指标 B .用总体指标推断样本指标 C .弥补普查资料的不足 D .节约经费开支 3.抽样平均误差反映了样本指标与总体指标之间的( B )。 A .实际误差 B .实际误差的平均数 C .可能的误差范围 D .实际的误差范围 4.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是( D ) 。 A .简单随机抽样 B .类型抽样 C .等距抽样 D .整群抽样 5.在其他情况一定的情况下,样本单位数与抽样误差之间的关系是( B )。 A .样本单位数越多,抽样误差越大 B .样本单位数越多,抽样误差越小 C .样本单位数与抽样误差无关 D .抽样误差是样本单位数的10% 6.用简单随机重复抽样方法抽取样本单位,如果要使抽样平均误差降低50%,那么样本n n N B N =!()!n N N A N n =-

统计学习题第五章_抽样与抽样估计答案

一、填空题 1、在实际工作中,人们通常把 n≥30 的样本称为大样本,而把 n<30 的样本称为小样本。 2、在抽样估计中,常见的样本统计量有样本均值、样本比例、样本标准差或样本方差以及它们的函数。 3、在研究目的一定的条件下,抽样总体是唯一确定的,而样本则有许多个。 4、在抽样调查中,登记性误差和系统性误差都可以尽量避免,而抽样误差则是不可避免的,但可以计算并加以控制。 5、在抽样估计中,抽样估计量是指用于估计总体参数的样本指标(统计量),评价估计量优劣的标准有无偏性、有效性和一致性。 二、选择题 单选题: 1、在其它条件不变的情况下,要使抽样平均误差为原来的1/3,则样本单位数必须 ((2)) (1)增加到原来的3倍(2)增加到原来的9倍 (3)增加到原来的6倍(4)也是原来的1/3 2、在总体内部情况复杂,且各单位之间差异程度大,单位数又多的情况下,宜采用 ((3)) (1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 3、某厂产品质量检查,确定按5%的比率抽取,按连续生产时间顺序每20小时抽1 小时的全部产进行检验,这种方式是((4)) (1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 4、其它条件一定,抽样推断的把握程度提高,抽样推断的准确性就会((2)) (1)提高(2)降低(3)不变(4)不一定降低 5、在城市电话网的100次通话中,通话持续平均时间为3分钟,均方差为分钟,则概率为时,通话平均持续时间的抽样极限误差为((2)) (1)(2)(3)(4)

6、假定11亿人口大国和100万人口小国的居民年龄变异程度相同,现在各自用重复抽样方法抽取本国人口的1%计算平均年龄,则平均年龄抽样平均误差((3))(1)两者相等(2)前者比后者大(3)前者比后者小(4)不能确定大小 多选题: 1、降低抽样误差,可以通过下列那些途径((2)(4)(5)) (1)降低总体方差(2)增加样本容量。 (3)减少样本容量(4)改重复抽样为不重复抽样 (5)改简单随机抽样为类型抽样 2、抽样推断中的抽样误差((1)(5)) (1)是不可避免要产生的 (2)是可以通过改进调查方法来消除的 (3)只有调查后才能计算 (4)即不能减少,也不能消除 (5)其大小是可以控制的 3、抽样极限误差((1)(2)(4)) (1)是所有可能的样本指标与总体指标之间的误差范围 (2)也叫允许误差(3)与所做估计的概率保证程度成反比 (4)通常用来表示抽样结果的精确度 4、影响样本容量的因素有((1)(2)(3)(4)(5)) (1)总体方差 (2)所要求的概率保证程度 (3)抽样方法 (4)抽样的组织形式 (5)允许误差法范围的大小 5、不重复抽样的抽样平均误差((2)(4)) (1)总是大于重复抽样的抽样平均误差

第5章 样本及抽样分布课后习题答案(高教出版社,浙江大学)

第5章 样本及抽样分布 1,设总体X 服从均值为1/2的指数分布,4321,,,X X X X 是来自总体的容量为4的样本,求 (1)4321,,,X X X X 的联合概率密度;(2)}2.17.0,15.0{21<<<x ,所以 (1) 联合概率密度为)()()()(),,,(43214321x f x f x f x f x x x x g = )(2432116x x x x e +++-=,(0,,,4321>X X X X ) (2)2 1,X X 的联合概率密度为) (2212x x e +-,所以 ????----== <<<<2 .17 .0221 5 .01215.02 .17 .021222121 2 1224}2.17.0,15.0{dx e dx e dx dx e X X P x x x x ))((4.24.121------=e e e e (3),21)(41)(41==∑=i i X E X E 16 1 2141)(161)(2 41=? ?? ???==∑=i i X D X D ; (4)4 1 )()()(2121==X E X E X X E ,(由独立性) ]4 1)()([21]41[21])5.0[()(])5.0([22 2222221221+-=+-= -=-X E X E X X E X E X E X X E 8 1]412141[21]4121)()([212 222=-??? ??+=+-+=X E X D ; (5)2 2 22 12122212141)()()(])[()(?? ? ??-=-=X E X E X X E X X E X X D 16 3161)4141)(4141(161)]()()][()([222121=-++=- ++=X E X D X E X D 。

样本与抽样分布

第六章样本与抽样分布 §6.1 数理统计的基本概念 一.数理统计研究的对象 例:有一批灯泡,要从使用寿命这个数量指标来看其质量,设寿命用X表示。 (1)若规定寿命低于1000小时的产品为次品。此问题是求P(X 1000)=F(10000),求F(x)? (2)从平均寿命、使用时数长短差异来看其质量,即求E(x)?、D(x)?。 要解决二个问题

1.试验设计抽样方法。 2.数据处理或统计推断。 方法具有“从局部推断总体”的特点。 二.总体(母体)和个体 1.所研究对象的全体称为总体,把组成总体的每一个对象成员(基本单元)称为个体。 说明: (1)对总体我们关心的是研究对象的某一项或某几项数量指标(或属性指标)以及他们在整体中的分布。所以总体是个体的数量指标的全体。 (2)为研究方便将总体与一个R.V X

对应(等同)。 a.总体中不同的数量指标的全体, 即是R.V.X的全部取值。 b.R.V X的分布即是总体的分布 情况。 例:一批产品是100个灯泡,经测试其寿命是: 1000小时1100小时 1200小时 20个30个50个 X 1000 1100 1200 P 20/100 30/100

50/100 (设X表示灯泡的寿命)可知R.V.X的分布律, 就是总体寿命的分布,反之亦然。 常称总体X,若R.VX~F(x),有时也用F(x)表示一个总体。 (3)我们对每一个研究对象可能要观测两个或多个数量指标,则可用多维随机向量(X,Y,Z, …)去描述总体。 2.总体的分类 有限总体 无限总体

三.简单随机样本. 1.定义6.1 :从总体中抽得的一部分个体组成的集合称为子样(样本),取得的个体叫样品,样本中样品的个数称为样本容量(也叫样本量)。每个样品的测试值叫观察值。 取得子样的过程叫抽样。 样本的双重含义: (1)随机性: 用(X 1,X 2, ……X n) n维随机向量表 示。 X i表示第i个被抽到的个体,是随机变量。(i=1,2,…n)

第五章抽样推断习题答

第五章抽样推断习题 一、一、单项选择题: 1、抽样推断的主要目的是(③)。 ①对调查单位作深入研究②计算和控制抽样误差 ③用样本指标来推算总体指标④广泛运用数学方法 2、抽样调查与典型调查的主要区别是(④)。 ①所研究的总体不同②调查对象不同 ③调查对象的代表性不同④调查单位的选取方式不同 3、样本是指(④)。 ①任何一个总体②任何一个被抽中的调查单位 ③抽样单元④由被抽中的调查单位所形成的总体 4、抽样误差是指(③)。 ①在调查过程中由于观察、测量等差错所引起的误差 ②在调查中违反随机原则出现的系统误差 ③随机抽样而产生的代表性误差④人为原因所造成的误差 5、抽样极限误差是(②)。 ①随机误差②抽样估计所允许的误差的上下界限 ③最小抽样误差④最大抽样误差 6、抽样平均误差就是(④)。 ①样本的标准差②总体的标准差 ③随机误差④样本指标的标准差 7、抽样估计的可靠性和精确度(②)。 ①是一致的②是矛盾的 ③成正比④无关系 8、在简单随机重复抽样下,欲使抽样平均误差缩小为原来的三分之一,则样本容量应(①)。 ①增加8倍②增加9倍 ③增加1.25倍④增加2.25倍 9、当有多个参数需要估计时,可以计算出多个样品容量n,为满足共同的要求,必要的样本容量一般应是(②)。 ①最小的n值②最大的n值 ③中间的n值④第一个计算出来的n值 10、抽样时需要遵循随机原则的原因是(③)。

①可以防止一些工作中的失误②能使样本与总体有相同的分布 ③能使样本与总体有相似或相同的分布④可使单位调查费用降低 二、多项选择题: 1、抽样推断的优点(①②③④)。 ①时效性强②更经济③能够控制抽样估计的误差 ④适用范围广⑤无调查误差 2、抽样推断适用于(①②③④⑤)。 ①具有破坏性的场合②用于时效性要求强的场合 ③对于大规模总体和无限总体的场合进行调查 ④用于对全面调查的结果进行核查和修正 ⑤不必要进行全面调查,但又需要知道总体的全面情况时 3、抽样推断中哪些误差是可以避免的(①②④)。 ①调查性误差②因抽样破坏随机原则而造成的系统性偏差 ③抽样误差④因抽样破坏随机原则而造成的方向性偏差 4、区间估计的要素是(①③④)。 ①点估计值②样本的分布③估计的可靠度 ④抽样极限误差⑤总体的分布形式 5、影响必要样本容量的因素主要有(①②③⑤)。 ①总体的标志变异程度②允许误差的大小③重复抽样和不重复抽样 ④样本的差异程度⑤估计的可靠度 三、填空题 1、抽样推断就是根据()的信息去研究总体的特征。 2、样本单位选取方法可分为()和()。 3、对于简单随机抽样,总体中的每个单位被抽中的概率为()。 4、区间估计时,既要考虑极限误差的大小,即估计的()问题,又要考虑估计的()问题。 四、简答题 1、什么是抽样推断?抽样推断有哪几方面的特点? 2、抽样推断与典型调查相比有何不同? 五、计算题 1、为检查某批电子元件的质量,随机抽取1%的产品,将测得结果整理成如下表的形式:

第六章 样本及抽样分布.

第六章样本及抽样分布 §1总体与样本 从理论上讲,对随机变量进行大量的观测,被研究的随机变量的概率特征一定能显现出来,可是实际进行的观测次数只能是有限的,有时甚至是少量的。因此,我们关心的问题就是怎样有效地利用收集到的有限的资料,尽可能地对被研究的随机变量的概率特征作出精确而可靠的结论. 我们把被研究的对象的全体称为总体(或母体),而把组成总体的各个元素称为个体。代表总体的指标是一个随机变量,所以总体就是指某个随机变量可能取的值的全体。 从总体中抽取一个个体,就是对代表总体的随机变量进行一次试验(或观测),得到的一个试验数据(或观测值)。从总体中抽取一部分个体,就是对随机变量进行若干次试验(观测)。 从总体中抽取若干个个体的过程称为抽样。抽样结果得到的一组试验数据(观测值),称为样本(或子样);样本中所含个体的数量称为样本容量。 从总体中抽取样本,一般总是假设满足下述两个条件: (1)随机性为了使样本具有充分的代表性,抽样必须是随机的,应使总体中的每一个个体都有同等的机会被抽取到,通常可以用编号抽签的方法或利用随机数表来实现。 (2)独立性各次抽样必须是相互独立的,即每次抽样的结果既不影响其它各次抽样的结果,也不受其它各次抽样结果的影响。 这种随机的、独立的抽样方法称为简单随机抽样,由此得到的样本称为简单随机样本。 例如,从总体中进行放回抽样,显然是简单随机抽样,得到的样本就是简单随机样本。 从有限总体(即其中只含有有限多个个体的总体)中,进行不放回抽样,虽然不是简单随机抽 样,但是若总体容量很大而样本容量较小(,则可以近似地看作是放回抽样,因而也就可以近似地看作是简单随机抽样,得到的样本可以近似地看作是简单随机样本。 今后,凡是提到抽样与样本,都是指简单随机抽样与简单随机样本。 从总体中抽取容量为n的样本,就是对代表总体的随机变量随机地、独立地进行n次试验(观测),每次试验的结果可以看作是一个随机变量,n次试验的结果就是n个随机变量 。 这些随机变量相互独立,并且与总体服从相同的分布。设得到的样本观测值分别是 ,

统计学第五章课后题及答案解析

第五章 练习题 一、单项选择题 1.抽样推断的目的在于() A.对样本进行全面调查B.了解样本的基本情况 C.了解总体的基本情况D.推断总体指标2.在重复抽样条件下纯随机抽样的平均误差取决于() A.样本单位数B.总体方差 C.抽样比例D.样本单位数和总体方差 3.根据重复抽样的资料,一年级优秀生比重为10%,二年级为20%,若抽样人数相等时,优秀生比重的抽样误差() A.一年级较大B.二年级较大 C.误差相同D.无法判断 4.用重复抽样的抽样平均误差公式计算不重复抽样的抽样平均误差结果将()A.高估误差B.低估误差 C.恰好相等D.高估或低估 5.在其他条件不变的情况下,如果允许误差缩小为原来的1/2 ,则样本容量() A.扩大到原来的2倍B.扩大到原来的4倍 C.缩小到原来的1/4D .缩小到原来的1/2 6.当总体单位不很多且差异较小时宜采用() A.整群抽样B.纯随机抽样 C.分层抽样D.等距抽样 7.在分层抽样中影响抽样平均误差的方差是() A.层间方差B.层内方差 C.总方差D.允许误差二、多项选择题 1.抽样推断的特点有() A .建立在随机抽样原则基础 上 B.深入研究复杂的专门问 题 C .用样本指标来推断总体指 标 D.抽样误差可以事先计算 E .抽样误差可以事先控制 2.影响抽样误差的因素有() A .样本容量的大小B.是有限总体还是无限总 体 C .总体单位的标志变动度D.抽样方法 E .抽样组织方式 3.抽样方法根据取样的方式不同分为() A .重复抽样 B .等距抽样 C .整群抽样 D .分层抽样 E .不重复抽样 4.抽样推断的优良标准是() A .无偏性 B .同质性 C .一致性 D .随机性 E .有效性 5.影响必要样本容量的主要因素有() A . 总体方差的大小B.抽样方法

(完整word版)习题六样本及抽样分布

习题六 样本及抽样分布 一、填空题 1.设来自总体X 的一个样本观察值为:2.1,5.4,3.2,9.8,3.5,则样本均值 = 4.8 ,样本方差 =22.716; 2.在总体~(5,16)X N 中随机地抽取一个容量为 36 的样本,则均值X 落在4与6之间的概率 = 0.9332 ; 3. 设某厂生产的灯泡的使用寿命2~(1000,)X N σ (单位:小时),抽取一容量为9的样本,得到940,100x s ==,则(940)P X <= ; 4.设127,,...,X X X 为总体2 ~(0,0.5)X N 的一个样本,则7 21 (4)i i P X =>=∑ 0.025 ; 5.设126,,...,X X X 为总体~(0,1)X N 的一个样本,且cY 服从2χ分布,这里, 22123456()()Y X X X X X X =+++++,则c =1/3 ; 6.设随机变量,X Y 相互独立,均服从2(0,3)N 分布且129,,...,X X X 与129,,...,Y Y Y 分 别是来自总体,X Y 的简单随机样本,则统计量U =服从参数为 9 的 t 分布。 7.设1234,,,X X X X 是取自2~(0,2)X N 正态总体的简单随机样本且 22!234(2)(34),Y a X X b X X =-+-,则a = 0.05 ,b = 0.01 时,统计量Y 服从 2χ分布,其自由度为 2 ; 8.设总体 X 服从正态分布2~(0,2)X N ,而1215,,...,X X X 是来自总体的简单随机 样本,则随机变量 22 110 22 1115...2(...) X X Y X X ++=++ 服从 F 分布,参数为 10,5 ; 9.设随机变量21 ~()(1),,X t n n Y X >=则~Y F(n,1) ; 10.设随机变量~(,)X F n n 且()0.3P X A >=,A 为常数,则1 ()P X A > = 0.7 二、选择题 1.设12,,...,n X X X 是来自总体2(,)N μσ的简单随机样本,X 是样本均值, 记22222 21 23111 111(),(),(),11n n n i i i i i i S X X S X X S X n n n μ====-=-=---∑∑∑ 2 241 1(),n i i S X n μ==-∑则服从自由度1n -的t 分布的随机变量是T =( A ); A . B C D 2.设()n F x 是经验分布函数,基于来自总体X 的样本,而()F x 是X 总体的 分布函数,则下列命题错误的为,对于每个给定的,()n x F x ( B ) A .是分布函数 B .依概率收敛于()F x C .是一个统计量 D .其数学期望是()F x

样本及抽样分布讲解学习

样本及抽样分布

第六章样本及抽样分布 【基本要求】1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】4学时 【授课内容】 §6.0 前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。

§6.1 随机样本 一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X可能取值的全体组成的集合等同起来。 定义1:把研究对象的全体(通常为数量指标X可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X的分布的研究,所谓总体的分布也就是数量指标X的分布,因此,X的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体X。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。 例1:考察一块试验田中小麦穗的重量:

@2-第6章 统计量及其抽样分布 练习题

第六章 统计量及其抽样分布 练习题 一、填空题(共10题,每题2分,共计20分) 1.简单随机抽样样本均值X 的方差取决于_________和_________,要使X 的标准差降低到原来的50%,则样本容量需要扩大到原来的_________倍。 2. 设1217,,,X X X L 是总体(,4)N μ的样本,2S 是样本方差,若2()0.01P S a >=, 则a =____________。 3.若(5)X t :,则2X 服从_______分布。 4.已知0.95(10,5) 4.74F =,则0.05(5,10)F 等于___________。 5.中心极限定理是说:如果总体存在有限的方差,那么,随着_________的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于_____________。 6. 总体分布已知时,样本均值的分布为_________抽样分布;总体分布未知,大样本情况下,样本均值的分布为_________抽样分布。 7. 简单随机样本的性质满足_________和_________。 8.若(2,4)X N :,查分布表,计算概率(X 3)P ≥=_________。若(X )0.9115P a ≤=,计算a =_________。 9. 若12~(0,2),~(0,2),X N X N 1X 与2X 独立,则2212X X +()/2服从______分布。 10. 若~(16,4)X N ,则5X 服从___________分布。 二、选择题(共10题,每题1分,共计10分) 1.中心极限定理可保证在大量观察下 ( ) A . 样本平均数趋近于总体平均数的趋势 B . 样本方差趋近于总体方差的趋势 C . 样本平均数分布趋近于正态分布的趋势 D. 样本比例趋近于总体比例的趋势

相关文档
最新文档