统计学 第六章
统计学第六章抽样调查

Part
05
系统抽样技术
系统抽样原理及步骤
• 系统抽样原理:系统抽样是一种等距抽样方法,它首先确定一个抽样间隔,然后在总体中按照这个间隔进行抽 样。这种方法适用于总体单位排列有序且周期性变化的情况。
系统抽样原理及步骤
01
系统抽样步骤
02
确定总体范围和抽样框;
03
计算抽样间隔,确定样本量;
系统抽样原理及步骤
01
03 02
分层标准选择与确定方法
• 以调查对象的某些自然特征或社会特征作 为分层标准。
分层标准选择与确定方法
专家判断法
依靠专家经验判断选择合 适的分层标准。
数据分析法
通过对历史数据或相关数据的 分析,找出影响调查指标的主 要因素,作为分层标准。
试验法
通过试验确定不同分层标准 对调查结果的影响程度,选 择最优的分层标准。
缺点
由于样本可能被重复抽取,导致样本的代表性降 低。
缺点
操作相对复杂,需要记录已经抽取过的样本。
简单随机抽样优缺点分析
操作简单
简单随机抽样的操作过程相对简单,易于理解和实施。
等概率原则
保证了每个单位被抽中的机会相等,避免 具有代表性:当样本量足够大时,简单随机抽样可以获得具有代表性的样本。
整群抽样优缺点比较
• 适用于某些特定情况:对于某些总体分布不均匀或难以划分的情况,整群抽样 可能更为适用。
整群抽样优缺点比较
抽样误差较大
01
由于是以群为单位进行抽样,可能导致抽样误差较大。
样本代表性不足
02
如果群的划分不合理或随机性不足,可能导致样本代表性不足。
对群内个体差异考虑不足
03
统计学第六章

N
i
X
N
第 i 个单位 的变量值
总体单 位总数
总体算术 平均数
【例A】某售货小组5个人,某天的销售额分别为440元、480元、 520元、600元、750元,求该售货小组销售额的平均差。
解:
X
N
440 480 520 600 750 2790 558 元 5 5
i
A D
X X
(二)变量与算术平均数计算的方差小于变量与任何其他常 数的方差 (三)两个独立随机变量和的方差,等于这两个随机变量方 差的和 2 2 2
( x y ) x y
(四)变量线性变换的方差等于变量的方差乘以变量系数的 平方 2 2 2
y a bx, y b x
第二节 全距、分位差和平均差 一、全距 指所研究的数据中,最大值与最小值之差, 又称极差。
R X max X min
最大变量值或最 高组上限或开口 组假定上限 最小变量值或最 低组下限或开口 组假定下限
【例A】某售货小组5人某天的销售额分别为 440元、480元、520元、600元、750元,则
4. 反映了中间50%数据的离散程度;
5. 不受极端值的影响;
甲城市家庭对住房状况评价的频数分布 甲城市 回答类别 户数 (户) 非常不满意 不满意 一般 满意 非常满意 24 108 93 45 30 累计频数 24 132 225 270 300 —
解:设非常不满意为 1,不满意为2, 一般为 3, 满意为 4, 非常满 意为5 。 已知
一、离中趋势的涵义 指总体中各单位标志值背离 离中趋势 分布中心的规模或程度,用 标志变异指标来反映。
反映统计数据差异程度的综 合指标,也称为标志变动度
统计学第六章课后题及答案解析

第六章一、单项选择题1.下面的函数关系是( )A现代化水平与劳动生产率 B圆周的长度决定于它的半径C家庭的收入和消费的关系 D亩产量与施肥量2.相关系数r的取值范围( )A -∞< r <+∞B -1≤r≤+1C -1< r < +1D 0≤r≤+13.年劳动生产率x(干元)和工人工资y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平均( )A增加70元 B减少70元 C增加80元 D减少80元4.若要证明两变量之间线性相关程度高,则计算出的相关系数应接近于( )A +1B -1C 0.5D 15.回归系数和相关系数的符号是一致的,其符号均可用来判断现象( )A线性相关还是非线性相关 B正相关还是负相关C完全相关还是不完全相关 D单相关还是复相关6.某校经济管理类的学生学习统计学的时间(x)与考试成绩(y)之间建立线性回归方程ŷ=a+bx。
经计算,方程为ŷ=200—0.8x,该方程参数的计算( )A a值是明显不对的B b值是明显不对的C a值和b值都是不对的D a值和b值都是正确的7.在线性相关的条件下,自变量的均方差为2,因变量均方差为5,而相关系数为0.8时,则其回归系数为:( )A 8B 0.32C 2D 12.58.进行相关分析,要求相关的两个变量( )A都是随机的 B都不是随机的C一个是随机的,一个不是随机的 D随机或不随机都可以9.下列关系中,属于正相关关系的有( )A合理限度内,施肥量和平均单产量之间的关系B产品产量与单位产品成本之间的关系C商品的流通费用与销售利润之间的关系D流通费用率与商品销售量之间的关系10.相关分析是研究( )A变量之间的数量关系 B变量之间的变动关系C变量之间的相互关系的密切程度 D变量之间的因果关系11.在回归直线y c=a+bx,b<0,则x与y之间的相关系数 ( )A r=0B r=lC 0< r<1D -1<r <012.当相关系数r=0时,表明( )A现象之间完全无关 B相关程度较小C现象之间完全相关 D无直线相关关系13.下列现象的相关密切程度最高的是( )A某商店的职工人数与商品销售额之间的相关系数0.87B流通费用水平与利润率之间的相关系数为-0.94C商品销售额与利润率之间的相关系数为0.51D商品销售额与流通费用水平的相关系数为-0.8114.估计标准误差是反映( )A平均数代表性的指标 B相关关系的指标C回归直线方程的代表性指标 D序时平均数代表性指标二、多项选择题1.下列哪些现象之间的关系为相关关系( )A家庭收入与消费支出关系 B圆的面积与它的半径关系C广告支出与商品销售额关系D商品价格一定,商品销售与额商品销售量关系2.相关系数表明两个变量之间的( )A因果关系 C变异程度 D相关方向 E相关的密切程度3.对于一元线性回归分析来说( )A两变量之间必须明确哪个是自变量,哪个是因变量B回归方程是据以利用自变量的给定值来估计和预测因变量的平均可能值C可能存在着y依x和x依y的两个回归方程D回归系数只有正号4.可用来判断现象线性相关方向的指标有( )A相关系数 B回归系数 C回归方程参数a D估计标准误5.单位成本(元)依产量(千件)变化的回归方程为y c=78- 2x,这表示( ) A产量为1000件时,单位成本76元B产量为1000件时,单位成本78元C产量每增加1000件时,单位成本下降2元D产量每增加1000件时,单位成本下降78元6.估计标准误的作用是表明( )A样本的变异程度 B回归方程的代表性C估计值与实际值的平均误差 D样本指标的代表性7.销售额与流通费用率,在一定条件下,存在相关关系,这种相关关系属于( ) A完全相关 B单相关 C负相关 D复相关8.在直线相关和回归分析中( )A据同一资料,相关系数只能计算一个B据同一资料,相关系数可以计算两个C据同一资料,回归方程只能配合一个D据同一资料,回归方程随自变量与因变量的确定不同,可能配合两个9.相关系数r的数值( )A可为正值 B可为负值 C可大于1 D可等于-110.从变量之间相互关系的表现形式看,相关关系可分为( )A正相关 B负相关 C直线相关 D曲线相关11.确定直线回归方程必须满足的条件是( )A现象间确实存在数量上的相互依存关系B相关系数r必须等于1C y与x必须同方向变化D现象间存在着较密切的直线相关关系12.当两个现象完全相关时,下列统计指标值可能为( )A r=1B r=0C r=-1D S y=013.在直线回归分析中,确定直线回归方程的两个变量必须是( )A一个自变量,一个因变量 B均为随机变量C对等关系 D一个是随机变量,一个是可控制变量14.配合直线回归方程是为了( )A确定两个变量之间的变动关系 B用因变量推算自变量C用自变量推算因变量 D两个变量都是随机的15.在直线回归方程中( )A在两个变量中须确定自变量和因变量 B一个回归方程只能作一种推算C要求自变量是给定的,而因变量是随机的。
统计学第六章抽样和抽样分布

2021/3/4
统计学第六章抽样和抽样分布
4
一、总体与样本
▪ 把握两个问题: ▪ 1、总体和总体参数; ▪ 2、样本和样本统计量。
2021/3/4
统计学第六章抽样和抽样分布
5
1、总体与总体参数
(1)总体:指根据研究目的确定的所 要研究的同类事物的全体,是所要说 明其数量特征的研究对象。按所研究 标志性质不同,分为变量总体和属性 总体,分别研究总体的数量特征和品 质特征。 构成总体的个别事物(基本单元 )就是总体单位,也称个体。总体单 位的总数称为总体容量,记作N。
缺点:受主观影响易产生倾向性误差; 不能计算、控制误差,无法说明调查结果 的可靠程度。
抽样一般都是指概率抽样。
2021/3/4
统计学第六章抽样和抽样分布
15
2、重复抽样和非重复抽样
(1)重复抽样:又称重置抽样,是指从总体 中抽出一个样本单位,记录其标志值后,又将 其放回总体中继续参加下一轮单位的抽取。特 点是:第一,n个单位的样本是由n次试验的结 果构成的。第二,每次试验是独立的,即其试 验的结果与前次、后次的结果无关。第三,每 次试验是在相同条件下进行的,每个单位在多 次试验中选中的机会(概率)是相同的。在重复 试验中,样本可能的个数是 N n ,N为总体单位 数,n为样本容量。
2021/3/4
统计学第六章抽样和抽样分布
16
2、重复抽样和非重复抽样
(2)非重复抽样:又称为不重置抽样,即每次从
总体抽取一个单位,登记后不放回原总体,不参加下
一轮抽样。下一次继续从总体中余下的单位抽取样本
。特点是:第一,n个单位的样本由 n 次试验结果构成
统计学第六章抽样和抽样分 布
第六章 抽样与抽样分布
统计学 第六章 统计指数

K p
p1
q0
2
q1
p0
q0
q1 2
p1 q0 q1 p0 q0 q1
Kq
q1
p0
2
p1
q0
p0 p1 2
q1 p0 p1 q0 p0 p1
将例1资料带入公式,可得:
k p
p1q0 p0q0
p1q1 26120 38600 64720 108.59% p0q1 23800 35800 59600
在选择指数形式时,主要考虑指数的经济意义,还要考虑 实际编制工作的可能性及对指数分析性质的特殊要求。
(一)工业生产指数 编制过程:
首先,对各种工业产品分别制定相应的不变价格标准,记为P0 然后,逐项计算各种产品的不变价格产值,加总起来就得到全部工 业产品的不变价格总产值 最后将不同时期的不变价格总产值加以对比,就得到相应时期的工 业生产指数
与马埃公式一样,虽然从数量上不偏不倚,但缺乏经济意义,所 用资料较多,计算困难。
是对拉氏指数和帕氏指数直接进行平均(型交叉)的结果,公式 为:
kp
p1q0
p1q1
p0 q0
p0 q1
kq
q1 p0
q1 p1
q0 p0
q0 p1
将例1资料带入公式,可得:
k p
p1q0 p0q0k p
统计学第6章统计量及其抽样分布

均值的标准差
3
0.43(年 )
X n 49
X ~N(10, 0.432)
_
P (X _9)1P (X _9)1P (X 109 10)
0.43 0.43
=1-Φ(-2.33)= Φ(2.33)=0.9901
整理ppt
12
练习题
某类产品的抗拉强度服从正态分布,平均 值为99.8公斤/平方厘米,标准差为5.48公斤/平 方厘米,从这个总体抽出一个容量为12的样本, 问这一样本的平均值介于98.8公斤/平方厘米和 100.9公斤/平方厘米之间的概率有多大。
1.从一个总体中随机抽出容量相同的各种样本, 从这些样本计算出的某统计量所有可能值的概 率分布,称为这个统计量的抽样分布。
2. 设X1,X2,…,Xn是取自总体X的样本,样本
均值
_
X
1 n
n i 1
Xi
,所有可能样本的均值
_
X
构成
的概率分布即为样本均值的抽样分布。
整理ppt
3
【例】设一个总体,含有4个元素(个体),即
第六章 统计量及其抽样分布
整理ppt
1
6.1 统计量
1. 统计量的形成
抽样
样本 构造函数
2. 统计量是样本X1,X2……Xn的一个函数 3. 统计量不依赖任何未知参数
4. 将一组样本的具体观测值代入统计量函 数,可以计算出一个具体的统计量值。
整理ppt
2
6.2 样本均值的抽样分布 和中心极限定理
第二个观察值
1
2
3
4
.3 P ( x )
1
1.0 1.5 2.0 2.5 .2
2
1.5 2.0 2.5 3.0
统计学第六章构成因素分析法

(Y1
Y2
Yt )
t
Yi
i 1
3. 有了t+1的实际值,便可计算出的预测误差为
et1 Yt1 Ft1
4. t+2期的预测值为
Ft2
t
1
1
(Y1Biblioteka Y2 Yt Yt1)
t
1 1
t 1
Yi
i1
简单平均法
(特点)
1. 适合对较为平稳的时间序列进行预测,即当 时间序列没有趋势时,用该方法比较好
– 加法模型 Yi=Ti+Si+Ci+Ii
四 平稳序列的分析和预测
一.简单平均法 二.移动平均法
简单平均法
(simple average)
1. 根据过去已有的t期观察值来预测下一期的数值
2. 设时间序列已有的其观察值为 Y1、Y2、… 、Yt,
则t+1期的预测值Ft+1为
1
1t
Ft 1
t
1. 趋势方程中的两个未知常数 a 和 b 按最小 二乘法(Least-square Method)求得
– 根据回归分析中的最小二乘法原理 – 使各实际观察值与趋势值的离差平方和为最小 – 最小二乘法既可以配合趋势直线,也可用于配
合趋势曲线
2. 根据趋势线计算出各个时期的趋势值
线性模型法
(a 和 b 的求解方程)
1. 根据最小二乘法得到求解 a 和 b 的标准方程为
Y na bt tY at bt 2
解得:b
ntY tY
nt 2 t2
a Y bt
2. 预测误差可用估计标准误差来衡量
统计学6

6 - 33
经济、管理类 基础课程
统计学
三、样本方差的分布
6 - 34
经济、管理类 基础课程
统计学
(一)样本方差的分布
设总体服从正态分布N 设总体服从正态分布N ~ (µ,σ2 ), X1,X2,… ,Xn为来自该正态总体的样本,则样本方差 为来自该正态总体的样本, s2 的分布为
(n −1)s
2
2. 3.
,则
Z=
X −µ
令 Y = Z 2 ,则 Y 服从自由度为1的χ2分布,即 服从自由度为1 分布,
σ
~ N(0,1)
Y ~ χ (1)
2
4.
当总体 X ~ N(µ,σ 2 ) ,从中抽取容量为n的样本,则 从中抽取容量为n的样本,
样 本 6 - 10
经济、管理类 基础课程
(三)抽样分布
(sampling distribution) distribution)
统计学
1. 样本统计量的概率分布 2. 是一种理论概率分布 3. 随机变量是 样本统计量
样本均值, 样本均值, 样本比例,样本方差等
4. 结果来自容量相同的所有可能样本 结果来自容量相同的所有可能样本 5. 提供了样本统计量长远我们稳定的信息,是进 行推断的理论基础,也是抽样推断科学性的重 要依据
总体分布、样本分布、抽样分布
三、渐进分布和近似分布
6-3
经济、管理类 基础课程
统计学
一、统计量
(一)统计量的概念 • 是样本的特征值 • 设X1 , X2 ,…, Xn是从总体中抽取的容量 为n的一个样本,如果由此样本构造一 个函数T 个函数T( X1 , X2 ,…, Xn ),不依赖于 任何未知参数,则称函数T 任何未知参数,则称函数T( X1 , X2 ,…, Xn )是一个统计量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
按指标值的变化形态分类
1. 平稳序列(stationary series)
– 基本上不存在趋势的序列,各观察值基本上 在某个固定的水平上波动
– 或虽有波动,但并不存在某种规律,而其波 动可以看成是随机的
2. 非平稳序列 (non-stationary series)
a
a
0 1 2 3 4 5 6 7t
-3 -2 -1 0 1 2 3
取时间数列中间项为原点
t 0
当t = 0时,有
y na bt ty at bt2
y na ty b t2
b
nty t y nt2 (t)2
a y bt
b
ty t2
a y y n
N为奇数时,令t = …,-3,-2,-1,0,1,2,3, …
3. 将远期的数值和近期的数值看作对未来同等 重要,从预测角度看,近期的数值要比远期 的数值对为来有更大的作用。因此简单平均 法预测的结果不够准确
移动平均法
(moving average)
1. 对简单平均法的一种改进方法 2. 通过对时间序列逐期递移求得一系列平均
数作为趋势值或预测值 3. 有简单移动平均法和加权移动平MSE) 来衡量
误差平方和 MSE 误差个数
简单移动平均法
(特点)
1. 将每个观察值都给予相同的权数 2. 只使用最近期的数据,在每次计算移动平均值时,
移动的间隔都为k 3. 主要适合对较为平稳的时间序列进行预测 4. 应用时,关键是确定合理的移动间隔长度
– 对于同一个时间序列,采用不同的移动步长预测的准 确性是不同的
1. 根据最小二乘法得到求解 a 和 b 的标准方程为
Y na bt tY at bt 2
解得:b
ntY tY
nt 2 t2
a Y bt
2. 预测误差可用估计标准误差来衡量
sY
n
(Yi Yˆi )2
i 1
nm
m为趋势方程中未知常数的个数
求解a、b的简捷方法
y
y
yˆ a bt
N为偶数时,令t = …,-5,-3,-1,1,3,5, …
非线性趋势分析和预测
二次曲线
(second degree curve)
1. 现象的发展趋势为抛物线形态
2. 一般形式为 Yˆt a bt ct 2
– 加法模型 Yi=Ti+Si+Ci+Ii
四 平稳序列的分析和预测
一.简单平均法 二.移动平均法
简单平均法
(simple average)
1. 根据过去已有的t期观察值来预测下一期的数值
2. 设时间序列已有的其观察值为 Y1、Y2、… 、Yt,
则t+1期的预测值Ft+1为
1
1t
Ft 1
t
(Y1
Y2
Yt )
t
Yi
i 1
3. 有了t+1的实际值,便可计算出的预测误差为
et1 Yt1 Ft1
4. t+2期的预测值为
Ft2
t
1
1
(Y1
Y2
Yt
Yt1)
t
1 1
t 1
Yi
i1
简单平均法
(特点)
1. 适合对较为平稳的时间序列进行预测,即当 时间序列没有趋势时,用该方法比较好
2. 如果时间序列有趋势或有季节变动时,该方 法的预测不够准确
平滑法、线性模型法等 4. 时间序列的主要构成要素
线性模型法
(线性趋势方程)
• 线性方程的形式为
Yˆt a bt
▪ Yˆt —时间序列的趋势值 ▪ t —时间标号 ▪ a—趋势线在Y 轴上的截距 ▪ b—趋势线的斜率,表示时间 t 变动一个
单位时观 察值的平均变动数量
线性模型法
(a 和 b 的最小二乘估计)
▪ 有趋势的序列
• 线性的,非线性的
▪ 有趋势、季节性和周期性的复合型序列
时间序列的构成要素
(1)长期趋势(T) (2)季节变动(S) 可解释的变动 (3)循环变动(C) (4)不规则变动(I) —不可解释的变动
趋势、季节、周期、随机性
1. 趋势(trend)
– 呈现出某种持续向上或持续下降的状态或规律
– 选择移动步长时,可通过试验的办法,选择一个使均 方误差达到最小的移动步长。
移动平均法的特点
移动平均对数列具有平滑修匀作用,移动项 数越多,平滑修匀作用越强; 由移动平均数组成的趋势值数列,较原数列 的项数少, 局限:不能完整地反映原数列的长期趋势, 不便于直接根据修匀后的数列进行预测。
确定移动间隔
一般应选择奇数项进行移动平均; 若原数列呈周期变动,应选择现象的 变动周期作为移动的时距长度。
五 有趋势序列的分析和预测
一.线性趋势分析和预测 二.非线性趋势分析和预测
线性趋势
(linear trend)
1. 现象随着时间的推移而呈现出稳定增 长或下降的线性变化规律
2. 由影响时间序列的基本因素作用形成 3. 测定方法主要有:移动平均法、指数
1. 趋势方程中的两个未知常数 a 和 b 按最小 二乘法(Least-square Method)求得
– 根据回归分析中的最小二乘法原理 – 使各实际观察值与趋势值的离差平方和为最小 – 最小二乘法既可以配合趋势直线,也可用于配
合趋势曲线
2. 根据趋势线计算出各个时期的趋势值
线性模型法
(a 和 b 的求解方程)
– 也称不规则波动(Irregular variations) – 除去趋势、周期性和季节性之后的偶然性波动
时间序列的构成模型
1. 时间序列的构成要素分为四种,即趋势(T)、 季节性或季节变动(S)、周期性或循环波动 (C)、随机性或不规则波动(I)非平稳序列
2. 时间序列的分解模型
– 乘法模型 Yi=Ti×Si×Ci×Ii
简单移动平均法
(simple moving average)
1. 将最近k期的数据加以平均作为下一期的预测值
2. 设移动间隔为 K(1<k<t),则t期的移动平均值
为
Yt
Ytk1 Ytk2 k
Yt1 Yt
3. t+1期的简单移动平均预测值为
Ft 1
Yt
Ytk 1
Ytk2 k
Yt1
2. 季节性(seasonality)
▪ 也称季节变动(Seasonal fluctuation) ▪ 时间序列在一年内重复出现的周期性波动
3. 周期性(cyclity)
– 也称循环波动(Cyclical fluctuation) – 围绕长期趋势的一种波浪形或振荡式变动
4. 随机性(random)