第五章 抽样分布

合集下载

chapter5 抽样分布.

chapter5 抽样分布.
并且X1,X2 相互独立,则X1+X2 ~2(n1+n2)
2分布表及有关计算
(1)构成 P{2(n)<λ}=p,已知n,p可查表求得λ;
(2)有关计算
P 2 (n) p



2 p
(n)
上侧分位数
λ
2分布的极限分布
• 2分布的极限分布是正态分布
5.3.2 t分布
f (t)
1、定义 若X~2(n1),Y~2(n2) ,X,Y独立,则
F

X Y
n1 n2
~
F (n1,
n2 )
称为第一自由度为n1 ,第二自由度为n2的F—分布, 其概率密度为
h(
y)


(
n1
2
n
2
)(n1
/
(
n1 2
)(
n2 2
)(1

0,
n2
n1 n2
) y n1 / 2
lim f (t) (t)
1
t2
e 2 , x
n
2

t分布表及有关计算
上侧分位数:
P{t(n)>λ}=p
双侧分位数:
p
P{|t(n)|>λ}=2p,λ=tp(n)
t1 p (n)
t p (n)
t1 p (n) t p (n)
t分布的极限分布是正态分布
5.3.3 F分布
分层抽样的适用情形
分层随机抽样是判断抽样和随机抽样相结合的一种混合型抽样 方法。 分层抽样适宜于由差异较大的单位所组成的总体。它将分组法 与随机原则结合起来,减少了各组内标志值的差异程度,使各组都有 抽取样本单位的机会,有利于提高样本的代表性,能得到比简单抽样 更为准确的结果,因此在实际工作中应用较广泛。

曾五一《统计学导论》配套题库【章节题库】第五章 抽样分布与参数估计 【圣才出品】

曾五一《统计学导论》配套题库【章节题库】第五章 抽样分布与参数估计 【圣才出品】

12.样本均值的抽样标准差 x ,( ).
A.随着样本量的增大而变小 B.随着样本量的增大而变大
5 / 30
圣才电子书 十万种考研考证电子书、题库视频学习平台

C.与样本量的大小无关
D.大于总体标准差
【答案】A
【解析】根据样本均值的抽样分布可知,样本均值抽样分布的标准差 x
D.服从 2 分布
【答案】B
【解析】当 n 比较大时,样本均值的抽样分布近似服从正态分布。题中 n 36 30 为
大样本,因此样本均值的抽样分布近似服从正态分布。
5.估计量的含义是指( )。 A.用来估计总体参数的统计量的名称
2 / 30
圣才电子书 十万种考研考证电子书、题库视频学习平台

圣才电子书 十万种考研考证电子书、题库视频学习平台

第五章 抽样分布与参数估计
一、单项选择题 1.抽样分布是指( )。 A.一个样本各观测值的分布 B.总体中各观测值的分布 C.样本统计量的分布 D.样本数量的分布 【答案】C 【解析】统计量是样本的函数,它是一个随机变量。样本统计量的分布称为抽样分布。
2.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布, 其分布的均值为( )。
A.
B. X C. 2
2 D.
n 【答案】A
【解析】根据中心极限定理,设从均值为 ,方差为 2 的任意一个总体中抽取样本量 为 n 的样本,当 n 充分大时,样本均值的抽样分布近似服从均值为 ,方差为 2 n 的正
n
,样本
量越大,样本均值的抽样标准差就越小。
13.在用正态分布进行置信区间估计时,临界值 1.645 所对应的置信水平是( )。 A.85% B.90% C.95% D.99% 【答案】B 【解析】置信水平是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在

抽样与抽样分布(试题及答案)

抽样与抽样分布(试题及答案)

第五章抽样与抽样分布一、单项选择题(以下每小题各有四项备选答案,其中只有一项是正确的。

)1.抽样推断的主要目的是( )。

A.用统计量来推算总体参数B.对调查单位作深入研究C.计算和控制抽样误差D.广泛运用数学方法[答案] A[解析] 抽样调查是指从总体中按随机原则抽取部分单位作为样本,进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法,因此,抽样推断的主要目的是用已知的统计量来推算未知的总体参数。

2.抽样调查中,无法消除的误差是( )。

A.抽样误差B.责任心误差C.登记误差D.系统性误差[答案] A[解析] 抽样误差是指在遵循了随机原则的条件下,不包括登记误差和系统性误差在内的,用样本指标代表总体指标而产生的不可避免的误差。

3.在其他条件相同的情况下,重复抽样的抽样平均误差和不重复抽样相比,( )。

A.前者一定小于后者B.前者一定大于后者C.两者相等D.前者可能大于,也可能小于后者[答案] B[解析] 以抽样平均数的抽样平均误差为例进行说明:在重复抽样条件下,抽样平均数的平均误差的计算公式:;在不重复抽样条件下,抽样平均数的平均误差的计算公式:。

因为,故。

4.拟分别对甲、乙两个地区大学毕业生在试用期的工薪收入进行抽样调查。

据估计甲地区大学毕业生试用期月工薪的方差要比乙区高出一倍。

在样本量和抽样方法相同的情况下,甲区的抽样误差要比乙区高( )。

A.41.4% B.42.4% C.46.8% D.48.8%[答案] A[解析] 假设乙地区的大学毕业生试用期月工薪的方差为σ2,甲地区的大学毕业生试用期月工薪的方差为2σ2,则:,那么,在样本量和抽样方法相同的,情况下,甲区的抽样误差要比乙区高=41.4%。

5.对某天生产的2000件电子元件的耐用时间进行全面检测,又抽取5%进行抽样复测,资料如表5-1所示。

表5-1耐用时间(小时) 全面检测(支) 抽样复测(支)3000以下3000~4000 4000~5000 50600990230505000以上总计36020018100规定耐用时间在3000小时以下为不合格品,则该电子元件合格率的抽样平均误差为( )。

第五章 抽样法

第五章 抽样法

抽样的作用

抽样调查能够解决全面调查无法或难以解决的问
题。

抽样调查可以补充和订正全面调查的结果。
抽样调查方法可以用于生产过程中产品质量的检
查和控制。 抽样调查方法可以用于对总体的某种假设进行检 验,以判断这种假设的真伪,决定行动的取舍。

抽样中的几个基本术语
总体(Population):调查研究的事物或现象的全体 个体(Item unit):组成总体的每个元素
一、抽样的概念、特点、作用 二、抽样中的基本术语 (一)总体和样本 (二)参数和统计量 (三)样本容量和样本个数 (四)重复抽样和不重复抽样 (五)概率抽样与非概率抽样 (六)抽样框 三、抽样误差
抽样的概念 特点
(一)概念 抽样调查是按照随机原则从全部研究对象中抽取 一部分单位进行观察,并依据获得的数据对全部研 究对象的数量特征做出具有一定可靠性的估计和判 断.达到对现象总体认识的一种方法. (二)特点 它是按照随机原则从总体中抽取样本。 它是由部分推算整体的一种方法。 它是运用概率估计的方法。 抽样误差可事先计算并加以控制。
抽样中的几个基本术语
X
i 1 N
总体均值
X
i
N

X F
i 1 K i
K
i
F
i 1
i
标准差

X
N i 1
i
X
2
N

X
K i 1
i K
X Fi
i
2
F
i 1
抽样中的几个基本术语
总体方差
2
( X i X )2
i 1
N
N

( X i X ) 2 Fi

统计学中的抽样分布基本理论

统计学中的抽样分布基本理论

统计学中的抽样分布基本理论统计学是一门广泛应用于各个领域的学科。

在许多领域都需要数据支撑决策,统计学是收集、分析和解释数据的科学。

而抽样分布的基本理论则是统计学中最为基础且至关重要的概念之一。

什么是抽样分布?抽样分布指的是在总体中选取一定数量样本的情况下,样本所呈现的分布情况。

这个分布被称为抽样分布。

抽样分布正是在原本无法得出准确结果时,在对样本进行检测和分析加以处理得出的模拟分布情况。

抽样分布的定义我们假设样本是从一个总体中随机抽取的,这个总体具有一个概率分布,并且每个样本都独立地从该概率分布中抽取。

根据中心极限定理,当样本数量足够大时,样本均值的分布将会近似正态分布,均值为总体均值,标准差为总体标准差除以样本量的平方根。

这个近似于正态分布的抽样分布称为样本均值的抽样分布。

抽样分布中的t分布因为在实际应用中,样本的真实总体均值和总体标准差都是为了推断或预测总体特征,而在抽样时这些特征是不确定的,所以会有一定误差。

这时我们便需要用到其它类型的抽样分布。

t分布就是这样一种抽样分布方式,它在样本量较小时,比正态分布更适用。

它类似于正态分布,但在小样本情况下,会有更宽的尾部和更高的峰值。

t分布具有参数自由度 (df) ,其在自由度越大时,越接近于正态分布。

当自由度大于30时,两者基本一致。

了解抽样分布形式和方法对于进行更高质量的统计分析意义重大。

在统计中,我们总是使用概率论和数理统计中的一些基本思想来尽可能减少污染。

特别是在数据采集的实际工作中,数据样本的选取是统计分析的重要基础之一,样本均值的分布越正常,那么就可以推断出样本中的点集越正常。

抽样分布是推断总体、检验总体分布、总体均值、总体比率、总体标准差等经典统计问题的基础。

社会学 抽样调查法

社会学 抽样调查法
富兰克林·罗斯福&阿尔夫·兰登 富兰克林·罗斯福最终以61%选票当选 《文学文摘》却预测罗斯福43%,相反,预
测兰登57% 1938年美国《文学文摘》杂志倒闭
此前《文学文摘》杂志已经成功预测 了1920、1924、1928和1932年的总统选举, 并且都一直沿用根据电话簿和车牌登记名 单来编制抽样框。而在1936年,因严重的 经济萧条,很多中产阶级沦为贫民。
二、概率抽样具Biblioteka 方法1.简单随机抽样随机数表抽样 (节选) 任意抽取法 抽签法
随机数表号码 100973 375420 084226 990190 128079 660657 310601 852697 635733 990164
选用号码 1009 3754 0842
1280
3106
东北区:黑龙江、吉林、辽宁 西北区:陕西、甘肃、宁夏、青海、新疆 华北区:内蒙古、河北、山西、北京、天津 华东区:山东、安徽、江西、江苏、浙江、
福建、上海 中南区:河南、湖南、湖北、广东、广西、
海南
西南区:四川、重庆、云南、贵州、西藏
城市选择
选中的6个省(区)中,分别选取其省会城市 和在该城市附近的中小城市1个。加上原本的 3个直辖市,一共15个城市。
几个概念
概率 就是事件发生频率所接近的固定数值,它是 相应事件发生的可能性大小的一个客观、定量的度 量。
“大数定律” 又称为“大数法则”或“平均法则”, 是概率论主要法则之一。它的意义是:在随机事件 的大量重复出现中,往往呈现几乎必然的规律,这 类规律就是大数法则。
例如,根据大数定律,乘飞机出事故的概率大约为 十万分之二。
第二步
在每一所抽中的小学里,再按简单随 机抽样的方式抽取高、低年级各一个。

统计学(李荣平)2014-5

统计学(李荣平)2014-5

P{t>tα(n)}= h(t;n)dt
t (n)
的数tα(n)为t(n)分布的上α分为点。 例:查表求:t0.05(8), t0.95(8)
o
t (n)
第一节 抽样分布
(三)F 分布
设 U ~ 2(n1 ),V ~ 2(n2 ), 且设 U,V 独立,则称随机变量
F U / n1 V / n2
保证质量,规定σ≤0.6mm时,认为生产过程处于良好控制
状态。为此,每隔一定时间抽取20个零件作为一个样本,并
计算样本方差S2。若P{S2≥c } ≤0.01(此时σ=0.6mm),
则认为生产过程失去控制,必须停产检查,问:
(1)C为何值时,S2≥c的概率才小于或等于0.01? (2)若取得的一个样本的标准差S=0.84,生产过程是
第五章 抽样分布与参数估计

第一节 抽样分布
要 内
第二节 参数点估计

第三节 区间估计
第一节 抽样分布
一、随机样本
总体与个体:试验全部可能的观测值叫总体;试验的 每一个观测值叫个体。
样本容量与样本个数:样本中包含的单位数叫样本容 量;从一个总体中可能抽取多少个样本叫样本个数。
总体容量:总体中所包含的个体数。 有限总体和无限总体:总体容量可数的称有限总体, 不可数的称无限总体。 重置抽样(重复抽样)和无重置抽样(不重复抽样)
X
1 n
n i 1
Xi
为样本均值;称统计量
S 2
1 n1
n i1
(Xi
X )2
为 样本方差 ,称统计量 S
S2
1n
( X X ) 2 为样本标准差 ;统计量
n 1 i1 i

概率论与数理统计第五章2

概率论与数理统计第五章2
tα (n)
分布的上 分位数或上侧临界值, 的数tα(n)为t分布的上α分位数或上侧临界值, 其几何意义见图5-7. 其几何意义见图
标准正态分布的分位数
在实际问题中, 在实际问题中, α常取0.1、0.05、0.01. 常用到下面几个临界值: 常用到下面几个临界值:
u0.05 =1.645, , u0.05/2=1.96, ,
u0.01 =2.326 u0.01/2=2.575
数理统计中常用的分布除正态分布外, 数理统计中常用的分布除正态分布外,还有 三个非常有用的连续型分布, 三个非常有用的连续型分布,即
定理5.1 定理5.1
设(X1,X2,…,Xn)为来自正态总体 X~N( ,σ 2)的样本,则 的样本, ~ (1) 样本均值 X与样本方差S 2相互独立; 相互独立; n (2)
(n 1)S
2
σ
2
=
∑(X X)
i =1 i
2
σ
2
~ χ (n 1)
2
(5.8)
与以下补充性质的结论比较: 与以下补充性质的结论比较: 性质 设(X1,X2,…,Xn)为取自正态总体
上侧临界值. 如图. 上侧临界值 如图
概率分布的分位数(分位点) 概率分布的分位数(分位点) 定义 对总体X和给定的α (0<α<1),若存在xα, α 分布的上侧 分位数或 上侧α 使P{X≥xα} =α, 则称xα为X分布的上侧α分位数或 α y α o xα x
P{X≥xα} =α α
∫ xα
其中Sn
(5.10)
=
2 (n1 1)S1
2 2 S1、S2 分别为两总体的样本方差 分别为两总体的样本方差.
n1 + n2 2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四章抽样与抽样分布
例1:从某年级1000位学生中抽取4位学生,计算身高(μ=169, =6.4),来估计全年级平均身高,假设抽取了成千上万个样本,得到如下结果:
例2:几年前台湾一项调查显示,台湾民众月收入近似成正态分布,均值为13100台币,标准差为8750元,求:
1)随机抽取一人,收入超过18430元的概率?
2)抽取一个10人样本,平均收入超过18430元的概率?
例3:假定某班级男生平均身高169cm,标准差为10.2cm,如果抽取一个n=100的随机样本,那么样本均值在μ±2之内的可能性是多少?
例4:一架电梯极限负重1000公斤,一般可容纳13人。

假定电梯的所有乘客平均体重70公斤,标准差12公斤。

那么一个13个人的随机样本总重量超过极限负重的概率是多少?
例5:某市育龄妇女生育意愿普查,65%的赞成“只生一个孩子”,35%不赞成或不表态。

设生育态度X:赞成为1,否则为0。

求:1)总体均值、总体方差、总体中赞成的比例;2)随机抽取10位育龄妇女,得到样本值为1、0、0、1、1、
1、0、1、1、1,求样本均值、样本中赞成比例。

解:1)计算见下表
2)样本均值=7/10=0.7,样本中赞成比例=7/10=0.7
例6:学校选人大代表,结果有60%的选民投了我院院长而当选。

假定选举之前有人做了预测,抽取了一个n=30的随机样本进行民意测验,如果样本中只有半数一下的比例支持院长,于是得出院长失败的结果,显然这一预测是一个倒霉的预测。

那么,抽取到以上倒霉样本的概率是多少呢?即错误预测的可能性是多少?如果将样本量增到100,再计算错误概率。

例7:某中学学生男女人数相同,现随机从中抽取15名学生,问男生人数大于10的概率是多少?
四、样本方差的抽样分布
设随机变量x 1,x 2,x 3…..x i 相互独立且服从同一正态分布,则将这些随机变量标准化,再计算它们的平方和,得到卡方值2χ,其服从于自由度为n-1的卡方分布:
2χ=2222312(
)(
)(
).....(
)i x x x x μ
μ
μ
μ
σ
σ
σ
σ
----++++=
2
2
1
1
()
k
i
i x μσ=-∑
分子分母同乘n-1,进一步整理得2
χ=2
2
(1)n s σ-~2χ(n-1)
练习题:
1、某专业学生的年龄分布是右偏的,均值为22,标准差为4.45,如果采用重复抽样的方法从该专业学生中抽取容量为100的样本,则样本均值的抽样分布为?
2、从均值为50,标准差为5的正态总体中抽取容量为25的样本,则样本均值超过51的概率为?
3、某企业声明企业人均收入为5500元,标准差为550元。

如果随机抽取16位员工,则平均收入落在5400-5600元的概率是?
4、样本量为10的样本均值方差为12,则总体的方差为?
5、总体均值为3.1,标准差为0.8,从该总体中随机抽取容量为36的样本,样本
均值落在2-3.3之间的概率是?
6、某类球员的平均年薪为150万元,标准差为80万元,如果随机抽取100名球员,计算他们的平均年薪,超过100万元的概率为:()
A 0.2375 B近似等于0 C近似等于1 D 0.7357
7、正态总体均值为17,标准差为10,从总体中抽取一个容量为25的随机样本,样本均值的抽样分布为()
A N(17,4)
B N(10,2)
C N(17,2)
D N(10,1)
8、假设总体比例为0.4,采用重复抽样方法从中抽取一个容量为100的简单随机样本,则样本比例的分布为?
9、假设总体服从卡方分布,从该总体中抽取容量为100的样本,则样本均值的抽样分布()
A服从卡方分布B近似正态分布C二项分布 D F分布。

相关文档
最新文档