统计学第六章ppt
合集下载
金融统计学第六章商业银行统计精品PPT课件

响赢利水平的因素进行分析预测; (3)真实评价银行面对的风险水平,预测可
能对银行风险造成冲击的变量走势; (4)满足中央银行的监管要求; (5)银行客户重要情况的调查分析;
08.10.2020
6
四、商业银行资产与负债的分类
资产分类
1、流动资产:包括现金、存放中央银行款项、 存放同业款项、拆放同业、短期贷款、应收 账款、坏帐准备、贴现、短期投资、一年内 到期的长期投资;
第六章 商业银行统计
教学课件
2008.10
08.10.2020
1
第一节 商业银行统计概述
08.10.2020
2
一、商业银行主要业务和职能
商业银行的主要业务包括:
负债业务:吸收资金业务;
资产业务:将负债业务获得的资金加以运用,从而取得收 益的业务(现金业务、放款业务、投资业务、贴现业务和 固定资产业务);
业务经营数据:资产负债表、损益表、信贷 收支表;
金融市场和同业数据:货币供应量、利率环 境、汇率环境、同业竞争数据;
宏观经济数据:GDP、物价水平、投资水平、 消费、就业等;
专门调查所得数据。
08.10.2020
5
三、商业银行统计的任务
(1)客观、及时地反映经营运作情况; (2)评价、分析银行的赢利能力并对可能影
4、未分配利润:商业银行利润尚未分配的部分,等于可供分 配的利润扣除盈余公积之后的余额。
08.10.2020
9
第二节 商业银行收益统计
08.10.2020
10
收益分析的数据主要来自损益表,通过对损 益表的分析,了解商业银行的经济效益和盈 亏情况,分析利润增减变化的原因,为经营 决策提供依据。
损益表是用来反映一家银行在报告期收入、 支出、税金、利润等情况的报告。
能对银行风险造成冲击的变量走势; (4)满足中央银行的监管要求; (5)银行客户重要情况的调查分析;
08.10.2020
6
四、商业银行资产与负债的分类
资产分类
1、流动资产:包括现金、存放中央银行款项、 存放同业款项、拆放同业、短期贷款、应收 账款、坏帐准备、贴现、短期投资、一年内 到期的长期投资;
第六章 商业银行统计
教学课件
2008.10
08.10.2020
1
第一节 商业银行统计概述
08.10.2020
2
一、商业银行主要业务和职能
商业银行的主要业务包括:
负债业务:吸收资金业务;
资产业务:将负债业务获得的资金加以运用,从而取得收 益的业务(现金业务、放款业务、投资业务、贴现业务和 固定资产业务);
业务经营数据:资产负债表、损益表、信贷 收支表;
金融市场和同业数据:货币供应量、利率环 境、汇率环境、同业竞争数据;
宏观经济数据:GDP、物价水平、投资水平、 消费、就业等;
专门调查所得数据。
08.10.2020
5
三、商业银行统计的任务
(1)客观、及时地反映经营运作情况; (2)评价、分析银行的赢利能力并对可能影
4、未分配利润:商业银行利润尚未分配的部分,等于可供分 配的利润扣除盈余公积之后的余额。
08.10.2020
9
第二节 商业银行收益统计
08.10.2020
10
收益分析的数据主要来自损益表,通过对损 益表的分析,了解商业银行的经济效益和盈 亏情况,分析利润增减变化的原因,为经营 决策提供依据。
损益表是用来反映一家银行在报告期收入、 支出、税金、利润等情况的报告。
统计学第六章抽样和抽样分布

2021/3/4
统计学第六章抽样和抽样分布
4
一、总体与样本
▪ 把握两个问题: ▪ 1、总体和总体参数; ▪ 2、样本和样本统计量。
2021/3/4
统计学第六章抽样和抽样分布
5
1、总体与总体参数
(1)总体:指根据研究目的确定的所 要研究的同类事物的全体,是所要说 明其数量特征的研究对象。按所研究 标志性质不同,分为变量总体和属性 总体,分别研究总体的数量特征和品 质特征。 构成总体的个别事物(基本单元 )就是总体单位,也称个体。总体单 位的总数称为总体容量,记作N。
缺点:受主观影响易产生倾向性误差; 不能计算、控制误差,无法说明调查结果 的可靠程度。
抽样一般都是指概率抽样。
2021/3/4
统计学第六章抽样和抽样分布
15
2、重复抽样和非重复抽样
(1)重复抽样:又称重置抽样,是指从总体 中抽出一个样本单位,记录其标志值后,又将 其放回总体中继续参加下一轮单位的抽取。特 点是:第一,n个单位的样本是由n次试验的结 果构成的。第二,每次试验是独立的,即其试 验的结果与前次、后次的结果无关。第三,每 次试验是在相同条件下进行的,每个单位在多 次试验中选中的机会(概率)是相同的。在重复 试验中,样本可能的个数是 N n ,N为总体单位 数,n为样本容量。
2021/3/4
统计学第六章抽样和抽样分布
16
2、重复抽样和非重复抽样
(2)非重复抽样:又称为不重置抽样,即每次从
总体抽取一个单位,登记后不放回原总体,不参加下
一轮抽样。下一次继续从总体中余下的单位抽取样本
。特点是:第一,n个单位的样本由 n 次试验结果构成
统计学第六章抽样和抽样分 布
第六章 抽样与抽样分布
江西财经大学统计学课件第六章抽样分布

第六章 抽样和抽样分布
STAT
[例]某养猪场共有存栏生猪10万头,现欲了解这批生猪的平均 毛重及健康比例。调查者按随机原则从中抽取了100头生猪进行 调查,以计算其平均毛重和健康比例。
(一)总体参数:反映总体特征的变量。
X P N 1 2 (X )2
N
N
N
(二)样本统计量:反映样本特征的变量。任何样本的函数, 只要不包含总体的未知参数,都称为统计量。样本的随机性决 定统计量的随机性(统计量是随机变量)。
x1
x1 E(x)
N n x2 E(x) x2 E(x)xi E(x) ?
x 总 总个 离 = 数 差 [xi M E(x)]
理论公 x 式 [xi: M E(x)2 ]
第六章 抽样和抽样分布
STAT
[计算] N=3人,(A,B,C)=(1,2,3) n=2
x
[xi
E(x)]0 M
STAT
5. 抽样分布:样本统计量的所有可能取值及其出现概率的分
布。 →理论分布
抽样分布的形成:
样本及样本平均数
抽样分布的影响因素:总体分布、 样 本
样本容量、抽样方法、抽样组织形
A ,A
式、统计量构造
A,B A,C
B ,A
[例] n=2,计算样本平均年龄。
B ,B
样本平均年龄的抽样分布
B ,C C ,A
x 1 1.5 2 2.5 3
C ,B
P 1/9 2/9 3/9 2/9 1/9 C , C
x
x
1, 1 1
1 , 2 1 .5
1, 3 2
2 , 1 1 .5
2, 2 2
2 , 3 2 .5
3, 1 2
STAT
[例]某养猪场共有存栏生猪10万头,现欲了解这批生猪的平均 毛重及健康比例。调查者按随机原则从中抽取了100头生猪进行 调查,以计算其平均毛重和健康比例。
(一)总体参数:反映总体特征的变量。
X P N 1 2 (X )2
N
N
N
(二)样本统计量:反映样本特征的变量。任何样本的函数, 只要不包含总体的未知参数,都称为统计量。样本的随机性决 定统计量的随机性(统计量是随机变量)。
x1
x1 E(x)
N n x2 E(x) x2 E(x)xi E(x) ?
x 总 总个 离 = 数 差 [xi M E(x)]
理论公 x 式 [xi: M E(x)2 ]
第六章 抽样和抽样分布
STAT
[计算] N=3人,(A,B,C)=(1,2,3) n=2
x
[xi
E(x)]0 M
STAT
5. 抽样分布:样本统计量的所有可能取值及其出现概率的分
布。 →理论分布
抽样分布的形成:
样本及样本平均数
抽样分布的影响因素:总体分布、 样 本
样本容量、抽样方法、抽样组织形
A ,A
式、统计量构造
A,B A,C
B ,A
[例] n=2,计算样本平均年龄。
B ,B
样本平均年龄的抽样分布
B ,C C ,A
x 1 1.5 2 2.5 3
C ,B
P 1/9 2/9 3/9 2/9 1/9 C , C
x
x
1, 1 1
1 , 2 1 .5
1, 3 2
2 , 1 1 .5
2, 2 2
2 , 3 2 .5
3, 1 2
统计学 第六章 统计指数

•不变价格事实上只是一段时间不变,随着经济增长和价格水平的变化,不 变价格也要不定期地变化。 •我国曾经使用过1952年、1957年、1965年、1970年、1980年、1990年和 2000年不变价格 •当不变价格发生变化时,采用两个不同时期的不变价格计算的工业总产出 进行对比,就要消除不变价格变动的影响。
K p
p1
q0
2
q1
p0
q0
q1 2
p1 q0 q1 p0 q0 q1
Kq
q1
p0
2
p1
q0
p0 p1 2
q1 p0 p1 q0 p0 p1
将例1资料带入公式,可得:
k p
p1q0 p0q0
p1q1 26120 38600 64720 108.59% p0q1 23800 35800 59600
在选择指数形式时,主要考虑指数的经济意义,还要考虑 实际编制工作的可能性及对指数分析性质的特殊要求。
(一)工业生产指数 编制过程:
首先,对各种工业产品分别制定相应的不变价格标准,记为P0 然后,逐项计算各种产品的不变价格产值,加总起来就得到全部工 业产品的不变价格总产值 最后将不同时期的不变价格总产值加以对比,就得到相应时期的工 业生产指数
与马埃公式一样,虽然从数量上不偏不倚,但缺乏经济意义,所 用资料较多,计算困难。
是对拉氏指数和帕氏指数直接进行平均(型交叉)的结果,公式 为:
kp
p1q0
p1q1
p0 q0
p0 q1
kq
q1 p0
q1 p1
q0 p0
q0 p1
将例1资料带入公式,可得:
k p
p1q0 p0q0k p
K p
p1
q0
2
q1
p0
q0
q1 2
p1 q0 q1 p0 q0 q1
Kq
q1
p0
2
p1
q0
p0 p1 2
q1 p0 p1 q0 p0 p1
将例1资料带入公式,可得:
k p
p1q0 p0q0
p1q1 26120 38600 64720 108.59% p0q1 23800 35800 59600
在选择指数形式时,主要考虑指数的经济意义,还要考虑 实际编制工作的可能性及对指数分析性质的特殊要求。
(一)工业生产指数 编制过程:
首先,对各种工业产品分别制定相应的不变价格标准,记为P0 然后,逐项计算各种产品的不变价格产值,加总起来就得到全部工 业产品的不变价格总产值 最后将不同时期的不变价格总产值加以对比,就得到相应时期的工 业生产指数
与马埃公式一样,虽然从数量上不偏不倚,但缺乏经济意义,所 用资料较多,计算困难。
是对拉氏指数和帕氏指数直接进行平均(型交叉)的结果,公式 为:
kp
p1q0
p1q1
p0 q0
p0 q1
kq
q1 p0
q1 p1
q0 p0
q0 p1
将例1资料带入公式,可得:
k p
p1q0 p0q0k p
统计学第6章统计量及其抽样分布

均值的标准差
3
0.43(年 )
X n 49
X ~N(10, 0.432)
_
P (X _9)1P (X _9)1P (X 109 10)
0.43 0.43
=1-Φ(-2.33)= Φ(2.33)=0.9901
整理ppt
12
练习题
某类产品的抗拉强度服从正态分布,平均 值为99.8公斤/平方厘米,标准差为5.48公斤/平 方厘米,从这个总体抽出一个容量为12的样本, 问这一样本的平均值介于98.8公斤/平方厘米和 100.9公斤/平方厘米之间的概率有多大。
1.从一个总体中随机抽出容量相同的各种样本, 从这些样本计算出的某统计量所有可能值的概 率分布,称为这个统计量的抽样分布。
2. 设X1,X2,…,Xn是取自总体X的样本,样本
均值
_
X
1 n
n i 1
Xi
,所有可能样本的均值
_
X
构成
的概率分布即为样本均值的抽样分布。
整理ppt
3
【例】设一个总体,含有4个元素(个体),即
第六章 统计量及其抽样分布
整理ppt
1
6.1 统计量
1. 统计量的形成
抽样
样本 构造函数
2. 统计量是样本X1,X2……Xn的一个函数 3. 统计量不依赖任何未知参数
4. 将一组样本的具体观测值代入统计量函 数,可以计算出一个具体的统计量值。
整理ppt
2
6.2 样本均值的抽样分布 和中心极限定理
第二个观察值
1
2
3
4
.3 P ( x )
1
1.0 1.5 2.0 2.5 .2
2
1.5 2.0 2.5 3.0
卫生统计学课件_第六章_假设检验

16
公式:t
自由度:对子数 - 1
适用条件:两组配对计量资料。 例题:p. 34, 例8
三、两个小样本均数比较的 t 检验
▲目的:由两个样本均数的差别推断两样本
所代表的总体均数间有无差别。 ▲计算公式及意义: t 统计量: 自由度:n1 + n2 –2
18
▲ 适用条件:
(1)已知/可计算两个样本均数及它们的标准差 ;
38
(2)当不能拒绝
II 类错误的概率 β 值的两个规律:
1. 当样本量一定时, α 愈小, 则 β 愈大,反之…; 2.当 α 一定时, 样本量增加, β 减少.
39
4. 正确理解P值的意义, P值很小时“拒绝H0 ”,P值的
大小不要误解为总体参数间差异的大小; 拒绝H0 只是说 差异不为零。 统计学中的差异显著或不显著,和日常生活中所说的差 异大小概念不同. (不仅区别于均数差异的大小,还区别 于均数变异的大小)
统计推断
用样本信息推论总体特征的过程。
包括:
参数估计: 运用统计学原理,用从样本计算出来的统计
指标量,对总体统计指标量进行估计。
假设检验:又称显著性检验,是指由样本间存在的差
别对样本所代表的总体间是否存在着差别做出判断。
第一节
▲显著性检验;
假设检验
▲科研数据处理的重要工具;
▲某事发生了:
是由于碰巧?还是由于必然的原 因?统计学家运用显著性检验来 处理这类问题。
45
41
是非判断: ( )1.标准误是一种特殊的标准差,其 表示抽样误差的大小。 ( )2.N一定时,测量值的离散程度越 小,用样本均数估计总体均数的抽样误差 就越小。 ( )3.假设检验的目的是要判断两个样 本均数的差别有多大。
公式:t
自由度:对子数 - 1
适用条件:两组配对计量资料。 例题:p. 34, 例8
三、两个小样本均数比较的 t 检验
▲目的:由两个样本均数的差别推断两样本
所代表的总体均数间有无差别。 ▲计算公式及意义: t 统计量: 自由度:n1 + n2 –2
18
▲ 适用条件:
(1)已知/可计算两个样本均数及它们的标准差 ;
38
(2)当不能拒绝
II 类错误的概率 β 值的两个规律:
1. 当样本量一定时, α 愈小, 则 β 愈大,反之…; 2.当 α 一定时, 样本量增加, β 减少.
39
4. 正确理解P值的意义, P值很小时“拒绝H0 ”,P值的
大小不要误解为总体参数间差异的大小; 拒绝H0 只是说 差异不为零。 统计学中的差异显著或不显著,和日常生活中所说的差 异大小概念不同. (不仅区别于均数差异的大小,还区别 于均数变异的大小)
统计推断
用样本信息推论总体特征的过程。
包括:
参数估计: 运用统计学原理,用从样本计算出来的统计
指标量,对总体统计指标量进行估计。
假设检验:又称显著性检验,是指由样本间存在的差
别对样本所代表的总体间是否存在着差别做出判断。
第一节
▲显著性检验;
假设检验
▲科研数据处理的重要工具;
▲某事发生了:
是由于碰巧?还是由于必然的原 因?统计学家运用显著性检验来 处理这类问题。
45
41
是非判断: ( )1.标准误是一种特殊的标准差,其 表示抽样误差的大小。 ( )2.N一定时,测量值的离散程度越 小,用样本均数估计总体均数的抽样误差 就越小。 ( )3.假设检验的目的是要判断两个样 本均数的差别有多大。
统计学第六章 研究变量的关系:相关与回归

• 例:
第三节 简单线性回归:推断
• 前两节从数据分析的角度对数据之间关系 的模式进行搜寻,如果将可观察的数据作 为总体的一个样本,搜寻到的模式就是总 体变量关系的一种估计,由此需要统计推 断方法来估计与检验此种关系。 • 推断问题开始于对总体模型的假定,本节 仅限于一个解释变量与一个响应变量线性 关系的研究,这被称为简单线性回归或一 元线性回归。
• 最小二乘回归特点:
第二节 数值型数据之间关系研究:相关与回归
• 可决系数R-squared: 表示在响应变量的总变动中能被回归方程解 释的百分比,用来描述直线关系的强度。 在一元线性回归中,其值等于相关系数的 平方。
第二节 数值型数据之间关系研究:相关与回归
• 残差(residuals):
回归线是解释变量与响应变量之间线性关系整体模 式的数学模型,研究与整体模式的偏差也是很重 要的。
第二节 数值型数据之间关系研究:相关与回归
残差图:
第二节 数值型数据之间关系研究:相关与回归
• 回归中的异常观测点和有影响的观测点
第二节 数值型数据之间关系研究:相关与回归
• 小心使用相关与回归方法:
第二节 数值型数据之间关系研究:相关与回归
• 例:
第二节 数值型数据之间关系研究:相关与回归
第一节 分类数据之间关系研究:列联表
模型2:检验独立性
Model for Examining Independence in Two-Way Tables Select an SRS of size n from a population. Measure two categorical variables for each individual. The null hypothesis is that the row and column variables are independent. The alternative hypothesis is that the row and column variables are dependent. CASE7.2
统计学6

6 - 33
经济、管理类 基础课程
统计学
三、样本方差的分布
6 - 34
经济、管理类 基础课程
统计学
(一)样本方差的分布
设总体服从正态分布N 设总体服从正态分布N ~ (µ,σ2 ), X1,X2,… ,Xn为来自该正态总体的样本,则样本方差 为来自该正态总体的样本, s2 的分布为
(n −1)s
2
2. 3.
,则
Z=
X −µ
令 Y = Z 2 ,则 Y 服从自由度为1的χ2分布,即 服从自由度为1 分布,
σ
~ N(0,1)
Y ~ χ (1)
2
4.
当总体 X ~ N(µ,σ 2 ) ,从中抽取容量为n的样本,则 从中抽取容量为n的样本,
样 本 6 - 10
经济、管理类 基础课程
(三)抽样分布
(sampling distribution) distribution)
统计学
1. 样本统计量的概率分布 2. 是一种理论概率分布 3. 随机变量是 样本统计量
样本均值, 样本均值, 样本比例,样本方差等
4. 结果来自容量相同的所有可能样本 结果来自容量相同的所有可能样本 5. 提供了样本统计量长远我们稳定的信息,是进 行推断的理论基础,也是抽样推断科学性的重 要依据
总体分布、样本分布、抽样分布
三、渐进分布和近似分布
6-3
经济、管理类 基础课程
统计学
一、统计量
(一)统计量的概念 • 是样本的特征值 • 设X1 , X2 ,…, Xn是从总体中抽取的容量 为n的一个样本,如果由此样本构造一 个函数T 个函数T( X1 , X2 ,…, Xn ),不依赖于 任何未知参数,则称函数T 任何未知参数,则称函数T( X1 , X2 ,…, Xn )是一个统计量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2018/6/4
统计学院
3
第六章 抽样和抽样分布
STAT
第一节 抽样及抽样组织形式 [例] 某养猪场共有存栏肉猪10000头,现欲了解这批肉猪平 均每头毛重,如果将每头肉猪都过秤去秤而获取数据将是 不合算的。我们可以按照“等机会原则” 从中抽出100头 肉猪称其重量,计算这100头猪的平均每头毛重,以达到我 们期望的目的。 本例中存栏肉猪10000头组成的总体,则称为全及总体, 它是指在统计抽样中所要了解的研究对象整体,又称为母 体,当我确定了研究目标时,它具有惟一性。一般全及总 体的单位总数用N表示,称作总体容量。
统计学院
7077434431 1422890012 0874321123 0437575967 2132577995 4365789796 4358650841 9343252534 4387670769 4637567488 2365879048 8765980234 1268803235 9323314766 2366897431 . . .
14
第六章 抽样和抽样分布
3.重置(复)抽样与不重置(复)抽样
(1)重置(复)抽样:也称放回抽样,抽样安排为对每次被抽 到的单位经登记后再放回总体,重新参与下一次抽选的抽样方法 。在每次的抽取中样本单位被抽中的概率都相等。统计中称这样 的抽样为相互独立的试验。
(2)不重置(复)抽样:也称不放回抽样,抽样安排为对被 抽到的单位登记后不再放回总体的抽样方法。
2018/6/4
统计学院
9
第六章 抽样和抽样分布
统计上讲的抽样一般都是指随机抽样(概率抽样)
STAT
二、抽样推断的特点
1 .是非全面调查 与普查的区别; 2 .按随机原则抽取样本 与典型调查和重点调查的区别; 3 .根据样本指标推断总体指标与重点调查的区别; 4 .抽样误差可以事先计算与控制与典型调查的区别。
2018/6/4
统计学院
6
第六章 抽样和抽样分布
STAT
非概率抽样也叫非随机抽样,是根据经验或判断从总体中选 取若干单位构成样本。如重点调查、典型调查(属于一种判断 抽样)、方便抽样、配额抽样等。非概率抽样难免掺杂调查者 的主观偏见,存在系统性误差、不可以计算和控制抽样误差、 不可以说明估计结果的可靠程度。
统计学院
17
第六章 抽样和抽样分布
为了便于抽取样本单位,一般在明确抽样框的条件下,对总体 的每个单位都要编号,然后用抽签式或利用《随机数字表》进行 抽取。 例如:N=500 n=10 编码从1-500号
在随机数表中随意点二个数字,假设得到4行,34列。则选取 的号码从这个被选中的数开始,由于500是个三位数,则小于或 等于500的连续三位数即为中选号码。见表中所示。
2018/6/4 统计学院 4
第六章 抽样和抽样分布
STAT
[例] 某养猪场共有存栏肉猪10000头,现欲了解这批肉猪平均每 头毛重(设为 ),如果将每头肉猪过秤去秤而获取数据将是不 合算的。我们可以按照“等机会原则” 从中抽出100头称其重量, 计算出这100头猪的平均毛重(假定平均每头95.5kg),以达到我们 期望的目的。 本例中所抽出的100头肉猪组成的总体,则称为样本总体,它是 指在统计抽样中按照“等机会原则” 从全及总体的N(10000)中 抽出的部分单位(每个单位称作样本单位)所组成的整体,简称样 本,又称子样。一般样本总体的单位总数用n(100)表示,称作样 本容量。样本总体则不具惟一性,它的可能个数与N、n及抽样 方法有关。通常n<30称为小样本,n≥30称为大样本,在抽样调 查中取大或小样本会直接影响到抽样分布的特征。
1287087765 2136217721 9878764346 4890832769 2164896589 6476793243 4387005345 2164878454 2176590879 2167608965 3254776907 3243700435 2187799990 1358787008 2125749768 . . .
第六章 抽样和抽样分布
本章重点: 1.简单随机抽样; 2. x 的抽样分布; 3. p 的抽样分布; 4.其他组织形式的抽样; 5.正态分布原理。 本章难点: 抽样分布原理。
STAT
2018/6/4
统计学院
1
第六章 抽样和抽样分布
统计实例(Statistics in Practice)
我国某家用电器公司是国内空调最大的生产厂家之一,2004 年时其空调年销售就已达到700万台,销售额为120亿元。这家低 调、在外界看来有些神秘的家电企业,尽管不作声张,极少炒作 ,甚至喊出“不想做行业老大”的话,之后3年来却成长势头迅 猛,增长率一直40%以上,赢利率极高。为了避免当今家用电器 行业低价利薄的局面,实现多条腿走路,以在新一轮竞争中保持 优势,该电器集团决策人又提出了进军汽车行业的战略目标。为 此他要求公司营销部对国际国内各大汽车生产厂家生产能力、销 售额、营利能力、市场占有率等方面作调查分析。 作为公司营销部负责人来说,他必须思考怎样去采集汽车生 产厂家的这些经济机密数据?获得这些数据后,应采用什么方法 作数据分析与推断。这必然会用到统计推断的知识。
2018/6/4
统计学院
10
第六章 抽样和抽样分布
三、抽样推断的作用
STAT
1 .对某些社会现象不可能或不必要进行全面调查,但又必 须了解其全面情况时,可采用抽样推断。(如:破坏性检验、 无限总体、家计调查等等); 2 .与全面调查比较,省时、省力、省费用、时效性高; 3 .可用抽样推断资料对全面调查资料加以补充或修正; 4 .可用于工业生产过程中的质量控制。
2018/6/4
统计学院
13
第六章 抽样和抽样分布
名称 单位数 平均数 成数 方差 标准差 总体参数 N
X N
STAT
样本统计量 n
x x n
s2
P=N1/N
2 ( X X ) 2 N
p=n1/n ( x x ) 2 n 1 s
2018/6/4
统计学院
抽签 编号 摇号 产生样本 随机数字表
2018/6/4
统计学院
16
第六章 抽样和抽样分布
其样本抽取过程按总体为有限和无限的不同加以区别 1.有限总体抽样 从容量为N的有限总体中进行抽样,如果容量为n的每个可能 样本被抽到的可能性相等,则称被抽的样本为简单随机样本。
2018/6/4
2018/6/4 统计学院 8
第六章 抽样和抽样分布
STAT
2.滚雪球抽样:先找少量或个别的调查对象进行访问,然后 通过他(她)们再去寻找新的调查对象,依此类推,就像滚雪 球一样越来越大,直至达到调查目的为止。 滚雪球适用于总体的个体信息不充分或难以获得,不能使用 其他抽样方法抽取样本的调查研究。对于具有特殊癖好、同性 恋者、乞丐、吸毒者、爱滋病患者等特殊群体的调查尤为适用。
9424252386 4879903443 2177609554 2148797544 7537697997 1254876987 6743219845 3248906034 0765433245 8707867698 7694432767 9094232155 0232337932 0362212379 3478794235 . . .
2018/6/4
统计学院
20
第六章 抽样和抽样分布
六、点估计
点估计就是用样本估计量的一个具体观测值直接作为总体的未 知参数的估计值的方法。 如上例中随机抽取的100头肉猪的平均毛重(95.5kg)可作为 10000头肉猪平均毛重 的点估计值
常用的估计量有: (1)样本平均数
(2)样本方差 S 2为总体方差 的估计量; (3)样本成数 p为总体成数 P 估计量。
2018/6/4
统计学院
11
第六章 抽样和抽样分布
四、统计抽样的几个基本概念
1.全及总体和样本总体
全及总体:研究对象全体,又称母体。容量用N表示。具备 惟一性。
样本总体:按随机原则从总体中抽出的部分单位的全体, 简称样本,被抽出的每个单位称样本单位。容量用n表示。样 本不具惟一性。
2018/6/4
2018/6/4 统计学院 2
第六章 抽样和抽样分布
从这一章开始便进入推断统计学的学习内容,它会节省人们 的时间和财物来达到认识对象的最佳限度。 现实世界包含的素材集合非常庞大,从中提取需要的信息 非常困难。如: •选民人数:每个候选人的支持率是多少? •产品:不合格率是多少? •环境:污染程度如何? •市场:品种、价格、质量状况、购买力等情况的了解。 在这一章里,你将会了解到样本是怎样抽取的,样本统计 量是怎样分布的,如何根据样本统计量对总体参数做估计。
19
第六章 抽样和抽样分布
2.无限总体抽样 在实际应用中,若总体单位数很多,要逐一编号是难以办到 的,特别是有些现象,事前也不可能编号(如一些连续大量正 在生产的产品) 因此我们定义:被研究的总体中所涉及某一正在进行的过程 使得不可能列出总体中的所有元素,则可视为无限总体。 无限总体抽样条件:同一总体 相互独立
2018/6/4
统计学院
第六章 抽样和抽样分布
随机数字表
9745238942 1276465909 9874763642 2659305984 1676587006 0377797684 9877808423 2778006869 2133768790 8262130892 3286548900 8084634212 4332657790 7963645324 9087434329 . . .
2018/6/4
统计学院
7
第六章 抽样和抽样分布
STAT
附:1.方便抽样:又称任意抽样、偶遇抽样,是指样本的选定 完全根据调查人员的方便来决定。调查对象的选取常常是因为 他们恰好在恰当的时间、恰当的地点出现。如: (1)没有认定调查对象身份的商场拦截式访问; (2)利用客户的名单(名片、往来信件等方式获得)进行 调查; (3)访问大街上的人们; (4)利用学生、社会组织的成员或工厂机关的职工作为调 查对象; (5)报纸、杂志上填好、寄回的调查。 实施方便抽样时,样本单位一个一个地抽取,直到满足样本 容量要求为止。这种抽样方法的一个基本原则是假定总体的特 性是相同的。方便抽样一般只用于市场预调查和试探性调查。