统计学课件 第四章 抽样分布作业

合集下载

统计学-抽样分布与抽样方法

统计学-抽样分布与抽样方法
重复抽样的特点: ①在重复抽样的过程中,被抽取的总体单位总数始终
保持不变,每一次抽样中各总体单位被抽到的机会 都相同,每次抽样结果相互独立。 ②每一总体单位都有被重复抽取的可能。
5.2 抽样调查的方法
一、两种抽样方式(续):
(2)不重复抽样 ——也称不放回抽样,指被抽到的单位不再放回总
体,每次仅在余下的总体单位中抽取下一个样本的 抽样方法。 特点: ①任一总体单位都不会被重复抽到; ②每次抽样结果都受到以前各次抽取结果的影响,因 此各次抽取结果是不独立的; ③可以一次抽取所需要的样本单位数。 ❖ 在实际应用中通常采用的都是不重复抽样方法。
总体
群1
群2
…… 群k
个体1 个体2 个体3 个体4 个体5 个体6
5.2 抽样调查的方法
3.整群抽样
❖特点:
▪ 抽样时只需群的抽样框,可简化工作量 ▪ 调查的地点相对集中,节省调查费用,方便
调查的实施 ▪ 当群中的元素差异性大时,整群抽样得到的
结果比较好。在理想状态下,每一群是整个 总体小范围内的代表。如对人口普查资料进 行复查,就采用整群抽样的方式。
5.1 抽样调查的概念、特点和作用
五、全及总体和抽样总体 ❖全及总体,简称总体,是指所要认识对象的全
体,是许多同质性单位的集合。通常用大写字 母N来表示(容量)。 ❖抽样总体,简称样本,是从全及总体中随机抽 取出来,代表全及总体部分单位的集合。通常 用小写字母n来表示(容量) 。
▪ 样本容量(Sample size):样本中所含个体的数量。分为 大样本(>30)、小样本(<30)。
▪ 样本个数:又称为样本可能数目。是指从一个总体中可以 抽取的样本个数。
5.2 抽样调查的方法

统计学(抽样估计)

统计学(抽样估计)
2
第四章第一节
二、抽样调查的特点
➢按随机原则抽取调查单位; ➢要抽取足够多的调查单位;
基本原则
➢可从数量上推断总体
基本目的及任务
➢要运用概率估计的方法
➢抽样调查中所产生的抽样误差可以事先计算
并加以控制。
科学性体现
3
第四章第一节
三、抽样调查的使用范围 ➢ 有些事情在测量或实验时有破坏性,不可能进行
1、用样本标准差替代总体标准差。大样本情况下,可 以直接用样本标准差S代表代表总体标准差;在小样
本的情况下,则采用样本修正标准差 S *来代替。
S* (xi x)2 n 1 S n n 1
2、用以前(近期)的总体标准差或同类地区的总体标 准差来代表所研究的标准差。若同时有多个可供参 考的数值时,应选择其中最大者。对于成数P,应选 最接近0.5的比率。
up
P(1 P)(重复) n
up
P(1 n
p)
(
N N
n 1
)或up
ux
σ 2 (N n)或 n N1
ux
σ 2 (1 n )(不重复) nN
P(1 P) (1 n )(不重复)
n
N
26
第四章第三节
注意:在上述公式中, 或 P(1 P)总体标准差,但
是实际中这两个数据却是未知的。计算抽样平均误 差时通常采用以下替代方法。
进行检验,来判断这种假设的真伪,以决定取舍
4
第四章第一节 四、抽样估计的一般步骤 1、设计抽样方案 2、抽取样本单位 3、搜集样本资料 4、整理样本资料 5、推断总体指标
5
第四章第二节 第二节 调样调查的基本概念及理论依据 一、全及总体和抽样总体(教材没有) ➢ 全及总体-简称总体(N):研究对象的全 体 (唯一确定) ✓ 变量总体 :各单位可用数量标志计量 A 有限总体:变量值有限 B 无限总体:变量值无限,分为可列或连续 ✓ 属性总体 :各单位用品质标志描述

统计学之抽样与抽样分布

统计学之抽样与抽样分布

的抽样分布
统计推断的过程
• 总体均值
m=?
• 从总体中抽取 • 样本容量为 n 的样本
• 用 作为m 的点估计
• 计算样本平均值
的抽样分布
的抽样分布是指所有可能的样本平均值 的概率分 布
的期望值
E( ) = = 总体平均值
的抽样分布
的标准差

有限总体
无限总体
• 当 n/N < .05时,可以将一个有限总体看作是无限
统计学之抽样与抽样分 布
2020年4月29日星期三
Chapter 7
抽样和抽样分布
本章主要内容
简单随机抽样 点估计 抽样分布 样本平均值 的抽样分布 样本比例 的抽样分布 抽样方法
•n = 100
•n = 30
统计推断
统计推断的目的是利用样本的信息推断总体的信息 总体是指感兴趣的所有元素的集合 样本是总体的一个子集 通过样本统计量对总体参数进行估计 只要抽样方法恰当,通过样本统计量可以对总体参数 进行很好的估计
也就是说,样本平均值在总体平均值+/-10分范围内的 概率为0.5036
•面积 = 2(.2518) = .5036
• 的抽样分布
•980 •990•1000
的抽样分布
的抽样分布是指所有可能的样本比例 的概率分布 的期望值
p = 总体比例
的抽样分布
的标准差 有限总体
无限总体
• 也称为样本比例的标准误
总体

称为有限总体校正因子.
• 也称为样本均值的标准误
的抽样分布
中心极限定理:只要样本容量足够大 (n > 30),不管总 体服从什么分布,样本平均值 都可以认为近似服从 正态分布。

统计学抽样分布

统计学抽样分布

常见的样本统计量
X
X
i 1
n
i
Xf f
P n1 n
n
n

S2
X
i 1
i X
n 1
X X f
2
f 1
S S2
假如抽取30名,得到样本平均数、标准差和成数是
x 1554420 x
n 30 s ( x x) 2 n 1 p 19 / 30 0.63
p
(1 ) N n
n ( N 1
)
与样本均值分布的方差一样,对于无限总体进行不重复 抽样时,可以按重复抽样来处理。
附注:正态分布理论与中心极限定理
1、正态分布的密度函数
f ( x)
1
式中 x 为正态分布的平均数, 是它的标 准差。这两个参数决定正态分布密度函 ( x, 2 ) 数的形状。也可简记为N
1
2
3
4
1.0 1.5 2.0 2.5 3.0 3.5 4.0
X
= 2.5
σ2 =1.25
X 2.5
2 X 0.625
显然,不同的样本对应着不同的样本统计量,而由于 样本抽取的随机性,样本统计量即为一种随机变量。 一般地,样本统计量的可能取值及其取值概率,形成 其概率分布,统计上称为抽样分布(sampling distribution)。 ▲正是抽样分布及其特征使得用样本统计量估计总 体参数的“精确程度”能够给予概率上的描述。 ▲由于样本统计量的随机性及其抽样分布的存在,同 样可计算其均值、方差、标准差等数字特征来反映该 分布的中心趋势和离散趋势。
结论:
1、样本平均数的期望值
由于不同的样本可得到不同的样本均值,因此, 考察样本均值的期望就显得非常重要。 用 x 表示样本均值的期望值,X 表示总体均值, 可证明在简单随机抽样中。

统计学作业

统计学作业

习题二(第四章—第六章)第四章:1、一组数据的分布特征可以从哪几个方面进行测度?答:一组数据的分布特征可以从以下三个方面进行测度:集中趋势的测度(众数、中位数、分位数、均值、几何平均数、切尾均值)离散程度测度(极差、内距、方差和标准差、离散系数)偏态与峰度测度(偏态及其测度、峰度及其测度)2、标准分数有哪些用途?答:标准分数给出了一组数据中各数值的相对位置。

在对多个具有不同量纲的变量进行处理时,常需要对各变量进行标准化处理。

它还可以用来判断一组数据是否有离群数据。

3、一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序如下:2 4 7 10 10 10 12 12 14 15(1)计算汽车销售量的众数、中位数和平均数;(2)根据定义公式计算四分位数;(3)计算销售量的标准差。

第四章统计数据的概括性描述4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下: 2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。

(2)根据定义公式计算四分位数。

(3)计算销售量的标准差。

(4)说明汽车销售量分布的特征。

解:(1)(2)(3)列1平均9.6 标准误差 1.318248中位数 10 众数 10标准差 4.168666 方差 17.37778 峰度 -0.25089 偏度 -0.69343区域 13 最小值 2 最大值 15 求和 96 观测数 10 最大(1) 15 最小(1) 2 1/4位数 7.75 2/4位数 10 3/4位数12第四章统计数据的概括性描述4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下: 2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。

答:中位数 10 众数 10平均 9.6(2)根据定义公式计算四分位数。

(04)第4章+抽样与抽样分布

(04)第4章+抽样与抽样分布

4-6
统计学
STATISTICS
例题分析
♦ 假定我们刚刚已取了飞机制造所用的铆钉的25个 假定我们刚刚已取了飞机制造所用的铆钉的25个
一组的样本。检测铆钉的抗剪强度,破坏每个铆 钉所需的力是响应变量。对这组样本,可以求得 各种描述性的测量(均值、方差等)。 ♦ 然而,我们的感兴趣的是总体,并不是样本自身。 被测试的铆钉在测试时已被破坏,不能再用在飞 机的制造上,所以我们肯定不能测试所有的铆钉。 我们必须从这组样本或几组这样的样本来决定总 体的某些特性。 ♦ 因此,我们必须设法推断信息,也即基于样本的 观测结果作出总体的推断
(例题分析) 例题分析)
计算出各样本的均值,如下表。 计算出各样本的均值,如下表。并给出样本均 值的抽样分布
4 - 32
样本均值的抽样分布
统计学
STATISTICS
(例题分析) 例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 设一个总体,含有4个元素(个体) 数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总 个个体分别为x 体的均值、 体的均值、方差及分布如下 总体分布
4 - 17
统计学
STATISTICS
分层抽样
分层抽样
统计学
STATISTICS
(stratified sampling) sampling)
♦ 分层抽样:在抽样之前先将总体的单位按 分层抽样:
某种特征或某种规则划分为若干层(类), 然后从不同的层中独立、随机地抽取一定 数量的单位组成一个样本,也称分类抽样 数量的单位组成一个样本,也称分类抽样 sampling) (stratified sampling) ♦ 在分层或分类时,应使层内各单位的差异 尽可能小,而使层与层之间的差异尽可能 大

第四章 抽样与抽样分布习题及答案

第四章 抽样与抽样分布习题及答案
答案:对
5.参数是总体的某种特征值,而统计量是一个不含未知参数的样本函数。
答案:对
6.在计算样本容量时,成数方差P(1-P)在完全缺乏资料的情况下,可用成数方差P(1-P)的极大值0.5 0.5来代替。
答案:对
A.前者高说明后者小
B.前者高说明后者大
C.前者变化而后者不变
D.两者没有关系
答案:a
6.在简单随机重复抽样下,欲使抽样平均误差缩小为原来的三分之一,则样本容量应( )。
A.增加8倍
B.增加9倍
C.增加倍
D.增加2.25倍
答案:b
7.当总体单位数较大时,若抽样比为51%,则对于简单随机抽样,不重复抽样的平均误差约为重复抽样的( )。
3.抽样极限误差是( )。
A.调查性误差
B.一定可靠程度下的抽样误差可能范围
C.最小抽样误差
D.等于抽样平均误差
答案:b
4.在其它条件相同的情况下,重复抽样的抽样平均误差和不重复抽样的相比( )。
A.前者一定大于后者
B.前者一定小于后者
C.两者相等
D.前者可能大于、也可能小于后者
答案:a
5.抽样推断的精确度和极限误差的关系是( )。
抽样与抽样分布习题及答案
单选题
1.抽样调查抽选样本时,遵循的原则是( )。
A.随机原则
B.同质性原则
C.系统原则
D.主观性原则
答案:a
2.抽样误差是指( )。
A.在调查过程中由于观察、测量等差错所引起的误差
B.在调查中违反随机原则出现的系统误差
C.随机抽样而产生的代表性误差
D.人为原因所造成的误差
答案:c
A.51%
B.49%

统计学习题(抽样分布、参数估计)

统计学习题(抽样分布、参数估计)

统计学习题(抽样分布、参数估计)练习题第1章绪论(略)第2章统计数据的描述2.1某家商场为了解前来该商场购物的顾客的学历分布情况,随机抽取了100名顾客。

其学历表示为:1.初中;2.高中/中专;3.大专;4.本科及以上学历。

调查结果如下:4222434414 2244432422 3121441424 2332134344 3312424324 2322212244 2123333334 2343313232 4313434214 2242334121(1)制作一张频数分布表。

(2)绘制一张条形图,反映学历分布。

2.2为了解某电信客户对该电信公司的服务的满意度情况,某调查公司分别对两个地区的电信用户在以下五个方面对受访用户的满意情况进行了问卷调查得到的数据如下(表中数据为平均满意度打分,从1分到10分满意度依次递增):地区企业形象客户期望质量感知价值感知客户总体满意度A 8.269504 7.51773 9.2624117.9148948.411348B 7.447368 8.3684218.9736848.1052637.394737试用条形图反映将两地区的满意度情况。

2.3下面是一个班50个学生的经济学考试成绩:88569179699088718279 988534744810075956092 83646569996445766369 6874948167818453912484628183698429667594(1)对这50名学生的经济学考试成绩进行分组并将其整理成频数分布表,绘制直方图。

(2)用茎叶图将原始数据表现出来。

2.4如下数据反映的是某大学近视度数的情况,共120名受访同学,男女同学各60名。

男149 161761821310 80 951081414 0 144145151515161681882121 0 21211052121211116817521 0 356462121212121312121 0 2121212121375375383838 8 45566065120 30120 7521女120 3334537437538700 90700 60141516212121211517170 0 0 0 0 0 0 0 5 521 0 1752121214043451217517 8 181818518519195196202021 0 21212121212121333335 0 3636363840474865055(1)按近视度数分别对男女学生进行分组。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(4)从一个全及总体中可以抽取一系列样本,所以() A.样本指标的数值不是唯一确定的 B.样本指标是样本变量的函数 C.总体指标是随机变量 D.样本指标是随机变量 E.样本指标数值随着样本的不同而不同

4-5
(5)影响抽样数目(样本容量)的因素有( )
A.允许误差范围 B.抽样指标的大小 C.抽 样方法
4-1
3.从一个正态总体中抽取一个随机样本, n = 25 ,其均值为50 ,标准差 s = 8。建立总体 均值m 的95%的置信区间。
4.某企业在一项关于职工流动原因的研究中, 从 该 企 业 前 职 工 的 总 体 中 随 机 选 取 了 200 人 组成一个样本。在对其进行访问时,有140 人说他们离开该企业是由于同管理人员不能 融洽相处。试对由于这种原因而离开该企业 的人员的真正比例构造95%的置信区间。
补充作业
1.某种零件长度服从正态分布,从该批产品中 随机抽取9件,测得其平均长度为21.4 mm。
已知总体标准差 =0.15mm,试建立该种零
件平均长度的置信区间,给定置信水平为 0.95。 2. 某大学从该校学生中随机抽取100人,调查 到他们平均每天参加体育锻炼的时间为26分 钟。试以95%的置信水平估计该大学全体学 生平均每天参加体育锻炼的时间(已知总体 方差为36分钟2)。
量值“1” C.总体所有单位都只具有某属性——只运用变
量值“0” D.所计算的方差为0 E.所计算的方差为0.25
4-7
计算: 9.从某大公司的10000女工中随机抽取100名,调查 她们每天家务劳动时间,资料如下:
每天家务劳动小时数
1 以下 1——2 2——3 3——4 4——5 5——6
合计
女工人数
4-3
7.选择:
(1)假定样本容量增加50%。则重复抽样平均误差:
(甲)为原来的一半;(乙)为原来的81.6%。
在重复抽样时,为使误差减少50%,则样本容量:
(丙)应增加三倍;(丁)应增加四倍。( )
A.甲丙 B.甲丁 C.乙丙 D.乙丁
(2)抽样估计中的抽样误差( )
A.是不可避免的 避免的
B.可以通过改进调查方法
试对以上资料计算: (1)
3
平均2 30
(2)每天家务劳动2——5小
8
时女工的比重、比重方差、
1
均方差系数。)
100
(3)试对公司女工每天平均家务劳动时间和每天家务劳动2——5 小时女工比重做点估计。
(4)在重复抽样条件下,.以95.45%的置信度来估计公司女工平均 每天家务劳动时间的区间估计。
(5)在不重复抽样条件下,以Z=1的概率度估计该公司女工每天家 务劳动时间2——5小时的比重区间,指出这种区间的可信程度。
4-8
10.一家公司随机抽取了100个坏帐,经计算,其平均 余额为5570元,样本标准差为725元,试以90%的概 率保证程度估计该公司的平均坏帐余额区间。
另一家公司也为估计坏帐而抽出了100个坏帐, 这些坏帐的标准差为285.3。如今公司希望坏帐极限 误差不超过35元,置信度95%,则应抽取多少份坏帐?
4-2
5.一家广告公想估计某类商店去年所花的平均 广告费用有多少。经验表明,总体方差约为 1800000元2。如置信度取95%,并要使估 计 处 在 总 体 平 均 值 附 近 500 元 的 范 围 内 , 这 家广告公司应抽多大的样本?
6.一家市场调研公司想估计某地区有彩色电视 机的家庭所占的比例。该公司希望对比例p的 估计误差不超过0.05,要求的可靠程度为 95%,应抽多大容量的样本(没有可利用的 p估计值)。
C.是可以运用数学公式计算的
D.误差大小是可以加以控制的 E. 包含了登记性误差
4-4
(3)抽样推断的置信度、概率度和精确度关系表现在( A.概率度增大,估计的可靠性也增大 B.概率度增大,估计的精确度下降 C.概率度缩小,估计的精确度也缩小 D.概率度缩小,估计的可靠性也增大 E.估计的可靠性增大,估计的精确度也增大
D.总体标志变异程度 E.概率保证程度
(6)从生产线上每隔1小时随机抽取10分钟的产品进 行检验,这种方式属于( )
A.等距抽样
B.类型抽样
C.整群抽样
D.简单随机抽样
4-6
(7) 是非标志不存在变异时,意味着:( ) A.各标志值(1或0)遇到同样的成数(0.5) B.总体所有单位都只具有某属性——只运用变
4-9
相关文档
最新文档